近日,硅基流动 SiliconCloud 平台正式上线了基于国产算力的推理加速版 DeepSeek-R1-0528。这一新版本在性能上进行了显著提升,TPM(每分钟最大 Token 数)提升至500万,满足用户在复杂场景下的高并发需求。同时,Pro 版 R1的 RPM(每分钟最多允许的请求数)也提升至3万,确保了流畅的使用体验。
对于原本使用初版 DeepSeek-R1的用户而言,无需修改 API 参数配置,便可自动获得新版本的高效模型体验。新版本支持 Function Calling、JSON Mode、Prefix 和 FIM 等功能。此外,为了保证企业用户顺利过渡,新版将在初版 DeepSeek-R1-0120的服务继续提供至6月28日。
DeepSeek-R1-0528在幻觉改善方面表现出色,幻觉率降低了45% 至50%。在改写润色、总结摘要和阅读理解等应用场景中,新版能提供更准确可靠的结果。在创意写作方面,该版本进一步优化了对议论文、小说和散文等文体的处理,能够输出更长且结构更完整的作品,展现出更贴近人类的写作风格。
在工具调用能力方面,DeepSeek-R1-0528与 OpenAI o1-high 相当。此外,该模型在前端代码生成和角色扮演等领域的能力也有显著提升。在多个基准测试中,新版本在数学、编程和通用逻辑方面表现优异,与国际顶尖模型如 o3和 Gemini-2.5-Pro 相媲美。
用户反馈表明,新版 R1的表现更加智能和人性化。一些开发者指出,该版本在编码挑战中成功构建了词评分系统,生成的代码和测试文件首次运行即获得成功,成为仅次于 o3的第二个成功案例。此外,DeepSeek-R1-0528在语言适应能力和推理能力上也表现得更加出色,给用户带来了愉悦的使用体验。
目前,用户可以通过硅基流动 SiliconCloud 平台的 API 调用 DeepSeek-R1-0528。硅基流动致力于为开发者提供高效、稳定的大模型 API,帮助用户实现更好的生成式 AI 应用。
划重点:
🌟 TPM 提升至500万,支持高并发需求。
💡 幻觉率降低45% 至50%,提供更准确的输出。
🚀 新版模型表现智能,人性化特征增强。
墨栖
DeepSeek-R1加速版,性能提升,体验更流畅!
霁川
太好,终于可以不用等半天!
墨栖
这东西,是不是要统治世界?
亦辰
感觉我的人生都变得更流畅了,感谢DeepSeek-R1!
亦辰
未来,我们都能拥有超神电脑!
亦辰
DeepSeek-R1,你就是我梦想中的加速器!
亦辰
这简直是科技进步的奇迹,太棒了!
然舟
我感觉我终于可以流畅地玩游戏了!
墨栖
加速版?这感觉就像给我的电脑换了个新心脏!
沐光
简直是给我的卡顿找回了尊严!