Machine Learning

[論文介紹] HuatuoGPT-o1, Towards Medical Complex Reasoning with LLMs

理解如何針對 Specific Domain 訓練 o1 模型！

Jan 31．12 min read．論文介紹

article thumbnail

[論文介紹] HuggingGPT: Solving AI Tasks with ChatGPT and its Friends in Hugging Face

必讀 LLM Single Agent 方法, HuggingGPT!

Jan 27．8 min read．論文介紹

article thumbnail

[論文介紹] RAFT: Adapting Language Model to Domain Specific RAG

透過 Irrelevant Document 來訓練 RAG-LLM

Oct 31．15 min read．論文介紹

article thumbnail

[論文介紹] REPLUG: Retrieval-Augmented Black-Box Language Models

RAG on Block-Box LLM，針對 Inference 與 Training 的簡單優化

Oct 31．13 min read．論文介紹

article thumbnail

[論文介紹] Cambrian-1: A Fully Open, Vision-Centric Exploration of Multimodal LLMs

徹底了解如何訓練出具有良好「視覺能力」的 Vision-Language Model

Jul 29．30 min read．論文介紹

article thumbnail

[論文介紹] Better & Faster Large Language Models via Multi-token Prediction

誰說 LLM 一定要一次預測一個 Token，預測多個不行嗎？

Jul 18．8 min read．論文介紹

article thumbnail

[論文介紹] Tuning LayerNorm in Attention: Towards Efficient Multi-Modal LLM Finetuning

只訓練不到 1% 的參數，就能夠讓 LLM 變成 Multimodal LLM

Jul 8．8 min read．論文介紹

article thumbnail

[論文介紹] ChatEval: Towards Better LLM-Based Evaluators Through Multi-Agent Debate

LLM Agent 是什麼？Agent 之間如何進行 Debate 來完成任務？

Jun 23．15 min read．論文介紹

article thumbnail