[論文介紹] Branch-Train-MiX: Mixing Expert LLMs into a Mixture-of-Experts LLM 來自 Meta FAIR 的 BTX:更有效率的訓練 LLM 精通各項領域 Apr 24.15 min read.論文介紹
LLM Fine-Tuning: Reinforcement Learning from Human Feedback 理解 ChatGPT 的關鍵訓練階段:RLHF Feb 27.20 min read.深度學習核心觀念