讯飞星火 X1 升级版模型宣布上线：整体效果对标 OpenAI o3 等国内外一流大模型

感谢IT之家网友华南吴彦祖的线索投递！

IT之家 7 月 25 日消息，科大讯飞今日发布公告，宣布基于全国产算力训练的深度推理大模型 —— 讯飞星火 X1 升级版正式上线。

此次升级，星火 X1 在多个任务上持续进步，综合能力再升级，特别是在翻译、推理、文本生成、数学、多语言上效果亮眼。

同时，在幻觉治理方面，对于大模型自身生成内容是否符合客观事实的事实性幻觉治理，以及在用户给定额外参考资料时大模型回复是否忠于原文的忠实性幻觉治理两方面均取得明显进步，显著提高了大模型行业落地应用的可靠性。

这是一次全面的跃升：
综合能力大幅提升。整体效果对标 OpenAI o3 等国内外一流大模型最新版本效果，在翻译、推理、文本生成、数学等方面保持领先。
幻觉治理取得显著进步。幻觉问题是掣肘大模型落地应用的关键问题，升级后的星火 X1 在幻觉治理方面领先业界主流模型。
多语言能力已覆盖 130 + 语种。为世界提供全栈自主可控大模型底座的“第二种选择”。
基于星火 X1 底座的语音同传大模型在翻译效果、实时响应、语音听感、专业精深等方面大幅跃升，持续行业领先。
得益于星火 X1 模型的升级，教育、医疗、企业应用、代码、科研等行业大模型和智能体也取得了新的进步，在复杂行业场景任务上进一步解决用户关键刚需。
星火 X1 最新升级的能力可直接在讯飞星火网页版和 App 进行体验，全新 API 已同步上线讯飞开放平台。

测试方面，今年 6 月，在国内大模型挑战全国高考数学一卷的评测中，星火 X1-0420 版本突破了 140 分。本次升级，数学能力再次精进。

科大讯飞表示，它采用了业界首创基于文本自适应调度的流式语音合成技术，让“译”与“说”无缝耦合，在语音听感上的自然度、拟人度和舒适度显著跃升。

在翻译效果上，基于内容完整度、信息准确度、语言质量等多方面主客观评价计算翻译综合质量得分（分值 0~100 分），新版本同传大模型效果较 2025 年 1 月首发版本提升 20%，特别是有效消除了传统同传的碎片化割裂感，在多人会议等复杂场景中英双向翻译得分可达 80 分以上，单人演讲翻译得分超 90 分。

新模型还具备智能双语识别功能，能够自动识别中英文混合发言并实时切换翻译方向。在双边会议、国际商务洽谈等中英交替的场景中，参会者可以随时用母语发言，有效避免了因语言切换操作而造成的交流中断。最新语音同传大模型已经在讯飞双屏翻译机 2.0、讯飞 AI 录音笔、讯飞同传等产品中全面上线。