[論文介紹] Branch-Train-MiX: Mixing Expert LLMs into a Mixture-of-Experts LLM 來自 Meta FAIR 的 BTX:更有效率的訓練 LLM 精通各項領域 Apr 24.15 min read.論文介紹
2022 AACL Tutorial: Recent Advances in Pre-trained Language Models 近幾年 Pre-trained Language Model 的發展 Jul 1.15 min read.深度學習核心觀念