首页 🎨 创意工具 ⚡ 效率工具 📚 实战指南 🤖 AI 应用

首页/Unsloth — 本地训练 Qwen/DeepSeek/Gemma 的统一 Web UI（56k ⭐）

Unsloth — 本地训练 Qwen/DeepSeek/Gemma 的统一 Web UI（56k ⭐）

0 次浏览

2026/3/20

Unsloth 是什么？

Unsloth 是目前 GitHub 最受欢迎的本地大模型训练框架之一，已获 56,000+ 星。它提供统一的 Web UI，让普通用户在消费级 GPU 上就能对 Qwen、DeepSeek、Gemma、LLaMA 等主流开源模型进行微调训练。

核心优势

显存节省 70%：独特的梯度检查点优化，同样硬件可训练更大的模型
速度提升 2-5x：自定义 CUDA 内核，训练速度远超 HuggingFace 原生实现
统一 Web UI：无需写代码，图形界面配置数据集、超参、导出格式
广泛模型支持：Qwen 2.5、DeepSeek R1、Gemma 3、LLaMA 3、Mistral 等均支持

显存需求参考

模型规模	最低显存
7B 模型	8GB (RTX 3080)
13B 模型	16GB (RTX 4080)
70B 模型	48GB (A6000)

典型使用场景

基于私有数据微调专业领域模型（法律、医疗、代码）
个人 AI 助理定制化训练
企业内部知识库模型私有化部署
学术研究：低资源微调方法验证

项目地址：https://github.com/unslothai/unsloth

免责声明

本站内容主要用于信息整理、技术研究与经验分享，不对第三方产品或服务的可用性、完整性作出任何明示或暗示的保证。

本站所分享的资源、工具、教程等内容仅供学习与研究参考，请勿用于商业用途。

部分内容可能来源于公开网络或开源社区，如涉及版权或其他合法权益问题，请通过联系方式与我们联系，我们将在核实后及时处理。

如需将相关内容用于商业产品或盈利性业务，请自行联系权利方获取正式授权。

因不当使用引发的版权或合规风险，由使用者自行承担。

外部链接失效或无法访问属于正常现象，本站不保证所有链接的持续有效性。

转载或引用本文内容，请保留原文链接并注明来源。

评论

加载中...

相关资源

Nango - AI 驱动的开源 API 集成中间件

开源 API 集成中间件，提供数百个预置 API、托管 OAuth 和 AI 自动生成集成代码，替代昂贵的企业级集成方案...

Cloudflare Agents - AI智能代理构建与部署平台

Cloudflare推出的AI代理开发框架，支持构建智能邮箱助手等AI应用，数据本地处理，无需第三方服务器...

FinceptTerminal - 开源金融终端

开源版彭博终端，提供AI投研代理、深度财报分析和多源市场情报的企业级金融数据工具...