8月19日晚间,DeepSeek 官方宣布线上模型版本已升级至 V3.1,最显著的改进是上下文长度拓展至 128K,相当于可处理 10万至13万汉字 的超长文本,适用于长文档分析、代码库理解及多轮对话场景。
用户现可通过官网、App 或微信小程序体验新版本,API 接口调用方式保持不变,开发者无需额外调整即可无缝切换。
此次升级并非大版本迭代,而是对 V3模型的优化。测试显示,V3.1在多步推理任务中的表现较前代提升 43%,尤其在数学计算、代码生成和科学分析等复杂任务中准确性更高。同时,模型“幻觉”(生成不实信息)的情况减少 38%,输出可靠性显著增强。此外,V3.1还优化了多语言支持,尤其提升了对亚洲语言及小众语种的处理能力。
尽管 V3.1带来重要改进,但用户更期待的下一代大模型 DeepSeek-R2 仍未明确发布时间。此前市场传闻 R2将于 8月15日至30日 发布,但接近 DeepSeek 的知情人士表示,该消息不属实,官方目前无具体发布计划。有外媒报道称,R2的延迟可能与训练过程中遇到的硬件问题(如芯片供应受限)有关。
DeepSeek 的更新节奏显示,R2发布前可能会先推出 V4模型。不过,官方一贯保持低调,强调“做完了就会发布”,未回应任何市场推测。
体验地址:https://chat.deepseek.com/