共 2 个相关资源
jingyaogong/minimind 是极简 GPT 训练教程,用最少代码从零实现并训练一个 26M 参数语言模型,约 2 小时完成全流程,是学习 LLM 原理的最佳实战项目。
清华 IIIS 与蚂蚁集团联合开源的 LLM 强化学习训练系统,全异步架构较同步方案提速 2.77 倍,支持 GRPO/PPO/DAPO 等算法,专攻数学推理和 Agent 任务。