2025年8月5日,openAI 宣布推出全新开放权重大语言模型系列 GPT-OSS,这是自 GPT-2 以来该机构首次发布支持本地部署的模型权重。
新系列包括两个版本:轻量的 GPT-OSS-20B 和高性能的 GPT-OSS-120B,均采用 Mixture-of-Experts(MoE)架构,在保持生成能力的同时显著降低计算资源消耗。
相比传统闭源模型,GPT-OSS 系列具备更强的开放性与可控性。两款模型均采用 Apache 2.0 许可协议,允许自由下载、部署、微调及商用,降低了中小企业与开发者进入大模型生态的门槛。
官方数据显示,GPT-OSS-120B 在 MMLU、HumanEval、HealthBench 等基准测试中表现接近 openAI 内部的 o4-mini(GPT-4-mini)模型,同时原生支持 最长128K tokens 的上下文输入,适用于法律、金融、教育等需要处理超长文本的场景。轻量版本 GPT-OSS-20B 可在 16GB 内存设备上运行,面向本地 Agent、私有助手等轻量级生成任务。
此外,GPT-OSS 模型支持包括 函数调用、结构化输出、Python执行与Web浏览 在内的 Agentic 能力,具备作为下一代本地智能体基础模型的潜力。
目前,两款模型已在 Hugging Face 正式上线,开发者可访问下方链接获取权重与使用文档: