共 2 个相关资源
Ollama is the easiest way to automate your work using open models, while keeping your data safe.
突破显存限制,在单张 4GB GPU 上运行 70B 参数大模型推理,让消费级显卡也能跑大模型。