OpenAI 发布 GPT-5.5:人工智能将越来越多地为我们工作
GPT-5.5 代表了基于代理的人工智能领域的一项重大进步。该模型能够理解任务的整体背景,规划多个步骤,使用不同的工具,并自行验证结果,而无需用户控制每个步骤。
人工智能作为数字任务执行者
最大的飞跃体现在计算机工作方面。GPT-5.5 可以帮助编写和纠错代码、查找信息、分析数据以及创建文档和电子表格。OpenAI 强调,用户还可以将更繁琐复杂的任务交给该模型,因为它能够将任务分解成多个步骤并最终得出结果。
尤其值得一提的是它与 Codex 工具的集成,该工具每周已被约 400 万开发者使用。据 OpenAI 称,GPT-5.5 在编程方面可以达到经验丰富的工程师的水平,因为它能更好地理解系统结构、识别错误并预测代码更改的后果。
测试结果证实了这一进展。在 Terminal-Bench 2.0 基准测试中,该模型取得了 82.7 % 的成绩,显著高于上一代模型和同类竞品模型。即使在解决实际编程任务时,该模型也能在一次尝试中独立完成超过一半的用例。
拓展到科学和商业领域
然而,GPT-5.5 的进步并不仅限于编程领域。它也越来越多地被用作科学研究和商业流程的工具。该模型可以帮助生成假设、进行数据分析和解释结果,从而为在研究环境中应用开辟了新的可能性。
该公司强调,该模型还能提高日常工作效率。OpenAI 内部已有超过 85 名 % 员工使用该模型,实现分析、报告和其他复杂任务的自动化。
迈向“超级应用”
GPT-5.5 也是 OpenAI 更广泛战略中的重要一步,该战略旨在将 ChatGPT、Codex 和其他 AI 功能整合到一个单一平台——所谓的“超级应用”中。其目标是创建一个通用工具,能够涵盖用户和企业的大部分数字化工作。
公司管理层强调,这标志着一种全新的计算机工作方式的开始,用户不再控制每一步,而是定义目标,由人工智能负责实现。
发展速度加快,竞争加剧
GPT-5.5 的发布距离上一版本仅几周时间,这表明人工智能行业的发展速度显著加快。OpenAI 面临着来自竞争对手的压力,尤其是 Anthropologie 和 Google,它们也在积极开发先进的模型。
与此同时,该公司也十分重视安全性。GPT-5.5 包含了迄今为止最严格的保护机制,尤其是在网络安全和生物应用等领域。
GPT-5.5 不仅仅是模型的升级,更标志着一种更广泛的转变:人工智能正在成为积极的工作执行者。






















