Anthropic 发布 Opus 4.8 和新的动态工作流工具
此次加速发布正值领先的人工智能供应商之间竞争日益激烈之际。OpenAI 近期推出了 GPT-5.5 和新的 Codex 功能,Google 也推出了 Gemini 3.5 Flash。Anthropic 显然不想在最强大模型的竞争中落后。
Anthropic公司不仅强调Opus 4.8在标准基准测试中取得的更佳成绩,还着重指出其对不完整或不确定数据的处理能力有所提升。该公司表示,该模型更倾向于指出缺失的信息、结果的不确定性或潜在的分析问题,而不是在缺乏充分依据的情况下给出过于肯定的答案。
这是一个重要的变化,因为许多生成式人工智能的用户经常批评所谓的幻觉——即模型给出令人信服但却不正确的答案的情况。
首批用户之一是投资巨头 Bridgewater Associates,该公司指出 Opus 4.8 能够更频繁地指出其他模型通常会忽略的输入数据和分析结果中的问题。
除了模型之外,Anthropic 还推出了一项名为“动态工作流”的新功能,目前该功能处于研究阶段。该系统允许将复杂任务拆分给大量并行的 UI 代理(或称子代理)执行。它不再使用单个模型来解决整个任务,而是将工作分解成多个部分,由多个代理同时执行。
Anthropic 以大型软件系统的迁移为例,指出 Claude Code 与 Opus 4.8 可以管理涉及数十万行代码的项目。
这是迈向基于代理的人工智能的又一步,在这种人工智能中,模型不再只是回答问题,而是独立执行更大的项目。
尽管发布了新款产品,Anthropic 仍未正式推出其最先进的型号 Mythos。该公司一个月前启动了一项有限的试用活动,但出于对网络安全和潜在滥用的担忧,Anthropic 采取了额外的安全措施,并推迟了更大规模的发布。
该公司在最新公告中表示,Mythos产品可能很快将面向更广泛的用户群体开放。公告称,安全措施的研发工作正在快速推进,Mythos系列产品有望在未来几周内上市。
Opus 4.8 的发布印证了人工智能行业的一个更广泛的趋势。OpenAI、谷歌和 Anthropologie 之间的竞争不再仅仅集中在答案的质量上,而是集中在模型独立执行复杂任务的能力上。
新型模型越来越多地扮演着数字协作者的角色,他们可以规划工作、使用工具、验证结果并与其他代理人协作。






















