DeepSeek-V3.1:改变游戏规则的混合人工智能
DeepSeek 发布了 DeepSeek-V3.1,这是其革命性人工智能模型的改进版本。该模型于 2024 年 12 月首次推出,并立即跻身全球十大最强大的人工智能系统之列。该公司宣布,其训练该模型所需的计算资源和成本远低于竞争对手,这令科技界大吃一惊。
新版本采用混合AI模型,将V3模型的快速响应与R1模型的深度思考相结合。DeepSeek-V3.1模型在MIT开源许可下免费提供。要使用671B的完整版本,至少需要720 GB的空间(1位量化版本则需要170 GB)。最小模型需要至少24 GB内存的高性能显卡。例如,32 GB显存的Nvidia 5090显卡售价约为1600欧元。
DeepSeek-V3.1 模型在编程方面进行了改进,在 SWE-bench 基准测试程序中的表现超越了之前的 V3 和 R1 模型。它在其他思维测试(例如 xbench-DeepSearch、SimpleQA 和 FRAMES AI)中也取得了更佳的成绩。凭借 128K 上下文窗口,它能够与 AI 自由互动。因此,它满足了高级用户的所有需求。