Seed1.6是什么
Seed1.6是字节跳动Seed团队推出的通用模型系列,融合多模态能力,支持256K长上下文深度推理。Seed1.6沿用Seed1.5稀疏MoE探索成果,经纯文本预训练、多模态混合持续训练、长上下文持续训练三阶段,提升文本和视觉能力。后训练阶段强化推理能力,研发Seed1.6-Thinking和Seed1.6(Adaptive CoT),实现极致推理与动态思考平衡。在高考、JEE Advanced等泛化测试中表现突出,未来将探索更高效架构,提升推理效果,丰富多模态能力。

Seed1.6的主要功能
- 多模态理解:能同时处理文本和视觉信息,对图像、视频等视觉内容进行理解和分析,实现图文并茂的交互。
- 深度推理:支持256K长上下文的深度推理,能处理复杂的逻辑问题和长文本任务,如长篇阅读理解、多步推理等。
- 自适应思考:根据问题难度自动选择思考模式(全思考、不思考、自适应思考),平衡推理效果和性能。
- 图形界面操作:支持理解和操作图形界面,如网页、软件界面等,实现自动化任务和交互操作。
Seed1.6的技术原理
- 预训练:用网页、书籍、论文、代码等数据进行训练,提升预训练数据的质量和知识密度。基于增加学科、代码、推理类数据占比,加入视觉模态数据与高质量文本数据混合训练。用不同长度范围的长文数据,逐步将模型的最大序列长度从32K提升至256K。
- 后训练:
- Seed1.6-Thinking:基于更长的思考过程实现极致推理效果,用多阶段的RFT和RL迭代优化,提升模型在复杂问题上的思考长度,深度融合VLM,带来清晰的视觉理解能力。
- Seed1.6(Adaptive CoT):基于动态思考技术,在保证效果的同时压缩CoT长度,实现性能和效果的动态平衡。引入新的奖励函数,让模型根据不同的prompt自动选择是否进行思考。
- 架构与算法改进:持续改进模型架构、训练算法和基础设施,提升模型性能和效率。用高效的数据清洗、过滤、去重与采样策略,提升预训练数据质量。基于parallel decoding技术,在给出答案之前使用更多思考token,提升模型在高难度任务上的表现。
Seed1.6的性能表现
- MMLU测试:Seed1.6-AdaCoT在MMLU测试中的CoT触发率为37%,在性能未下降的情况下有效节省token数。
- 高考测试:Seed1.6-Thinking在2025年山东卷高考真题测试中,文科683分,理科648分,超出大部分985高校往年录取分数线。
- AIME测试:Seed1.6-AdaCoT在AIME测试中的CoT触发率达到90%,效果与Seed1.6-FullCoT相当。
- BeyondAIME测试:Seed1.6-Thinking在BeyondAIME测试中,基于parallel decoding后,测试结果实现8分的提升。
- JEE Advanced测试:Seed1.6-Thinking在JEE Advanced试题测试中取得全印度top 10的成绩,数学测试中回答全部正确。
Seed1.6的项目地址
- 项目官网:https://exp.volcengine.com/ark?model=doubao-seed-1-6-250615
Seed1.6的应用场景
- 教育领域:为学生提供个性化学习辅导,自动调整思考深度,给出详细解题步骤和反馈,处理考试答案,准确评分。
- 内容创作:生成高质量文案,支持长文本创作,辅助设计师提供创意灵感和优化建议,提升内容创作效率。
- 智能办公:自动分析长篇文档,提取关键信息生成摘要,作为智能助手处理日常办公任务,提高办公效率。
- 医疗健康:结合文本和影像辅助医生诊断,提供分析报告,阅读医疗文献提取关键信息,支持医学研究和临床决策。
- 智能客服:根据问题复杂度自动调整思考深度,提供解决方案,分析用户情绪,提升客服体验。