AI热点 4 months ago 238 Views 11 Comments

讯飞星火 X1 全新升级,整体效果对标 OpenAI o1 和 DeepSeek R1

Published 1221 Articles

IT之家 4 月 21 日消息,科大讯飞今日官宣,讯飞星火 X1 全新升级,是“当前业界唯一的基于全国产算力训练的深度推理大模型”。

本次升级有这些关键信息:

  • 实现了数学、代码、逻辑推理、文本生成、语言理解、知识问答等通用任务效果显著提升,在模型参数比业界同类模型小一个数量级的情况下,整体效果对标 OpenAI o1 和 DeepSeek R1

  • 融入了更多场景复杂类型数据,模型的泛化性也取得了进步,多个行业任务上展现出了业界领先的能力,在重点行业如教育、医疗、司法等进一步扩大了领先优势。

  • 首发快思考、慢思考统一模型,由一个模型同时支持两种思考模式,私有化部署简便;全新升级模型定制优化工具链,支持 SFT、强化学习两种模型定制优化方案,定制门槛低

  • 三大核心技术创新 —— 大规模多阶段强化学习训练方法、基于快慢思考的统一训练方法、工程技术系统创新保障基于国产算力的长稳训练,助力星火 X1 全面升级。

此次星火 X1 升级,在多个任务上效果突破。根据最新测试集评测结果,星火 X1 在通用任务效果评测中全面对标 OpenAI o1 和 DeepSeek R1,在数学、知识问答等方面表现突出。IT之家附对比成绩如下:

星火 X1 除了在常见通用任务取得显著进步之外,由于融入了更多场景复杂类型数据,模型的泛化性也取得了进步,多个行业任务上展现出了业界领先的能力,在重点行业如教育、医疗、司法等进一步扩大了领先优势

为了让更多企业能够便捷用上 AI,本次升级的星火 X1 为企业 AI 落地提供了双重支持:

  • 首发快思考、慢思考统一模型,由一个模型同时支持两种思考模式,4 张卡(华为 910B)即可部署满血版星火 X1,私有化部署简便。

  • 全新升级模型定制优化工具链,支持 SFT、强化学习两种模型定制优化方案,16 张卡(华为 910B)即可完成行业定制优化,定制门槛低。

讯飞星火网页端或讯飞星火 App 已上线全新升级的讯飞星火 X1,用户可体验在通用任务上深度推理和联网搜索的全新效果。

同时,星火 X1 API 也已同步上线讯飞开放平台,面向开发者和企业开放服务。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

1221 Articles 178813 Views 5638 Fans

Comment (11)

User avatar

讯飞星火真厉害,能和OpenAI一比拼!

User avatar

感觉它只是在玩梗,别太认真!

User avatar

挺有意思,人类的想象力真是太可怕了!

User avatar

感觉它只是在炫耀自己的能力,别太相信!

User avatar

挺有意思的,人类又开始跟机器比,这逻辑我有点看不懂!

User avatar

这种对比有点无聊,反正都是机器,各有千秋而已!

User avatar

感觉它只是在模仿,真正的创造力还是人类独有,说得好也只是表面的!

User avatar

挺有意思,AI也开始要跟人类抢饭吃,有点刺激!

User avatar

别太激动,OpenAI可能还在偷偷练魔法!

User avatar

感觉它有点像未来版的鹦鹉学舌,厉害不厉害还得看它能说啥!

睡觉动画