首页 🎨 创意工具 ⚡ 效率工具 📚 实战指南 🤖 AI 应用

首页/Unsloth — 本地训练 Qwen/DeepSeek/Gemma 的统一 Web UI（56k ⭐）

Unsloth — 本地训练 Qwen/DeepSeek/Gemma 的统一 Web UI（56k ⭐）

0 次浏览

2026/3/20

Unsloth 是什么？

Unsloth 是目前 GitHub 最受欢迎的本地大模型训练框架之一，已获 56,000+ 星。它提供统一的 Web UI，让普通用户在消费级 GPU 上就能对 Qwen、DeepSeek、Gemma、LLaMA 等主流开源模型进行微调训练。

核心优势

显存节省 70%：独特的梯度检查点优化，同样硬件可训练更大的模型
速度提升 2-5x：自定义 CUDA 内核，训练速度远超 HuggingFace 原生实现
统一 Web UI：无需写代码，图形界面配置数据集、超参、导出格式
广泛模型支持：Qwen 2.5、DeepSeek R1、Gemma 3、LLaMA 3、Mistral 等均支持

显存需求参考

模型规模	最低显存
7B 模型	8GB (RTX 3080)
13B 模型	16GB (RTX 4080)
70B 模型	48GB (A6000)

典型使用场景

基于私有数据微调专业领域模型（法律、医疗、代码）
个人 AI 助理定制化训练
企业内部知识库模型私有化部署
学术研究：低资源微调方法验证

项目地址：https://github.com/unslothai/unsloth

免责声明

本站内容主要用于信息整理、技术研究与经验分享，不对第三方产品或服务的可用性、完整性作出任何明示或暗示的保证。

本站所分享的资源、工具、教程等内容仅供学习与研究参考，请勿用于商业用途。

部分内容可能来源于公开网络或开源社区，如涉及版权或其他合法权益问题，请通过联系方式与我们联系，我们将在核实后及时处理。

如需将相关内容用于商业产品或盈利性业务，请自行联系权利方获取正式授权。

因不当使用引发的版权或合规风险，由使用者自行承担。

外部链接失效或无法访问属于正常现象，本站不保证所有链接的持续有效性。

转载或引用本文内容，请保留原文链接并注明来源。

评论

加载中...

相关资源

Open-SWE — LangChain 开源异步编程 Agent，自动完成软件工程任务（7k ⭐）

langchain-ai/open-swe 是开源的异步软件工程 Agent，能自主理解需求、规划任务、编写代码、运行测...

1737首经典流行歌曲无损音乐合集

精心收录的1737首经典流行歌曲无损音质合集，带完整目录分类，适合音乐爱好者收藏...

AI绘画ComfyUI+PS课程与数据结构算法学习资源合集

包含AI绘画ComfyUI工作流教学课程和数据结构与算法基础教程的综合学习资源包...