苹果研究破解 AI“英语口音”难题，提升多语言自然性

发布了 1221 文章

IT之家 5 月 17 日消息，苹果与多国高校及研究院联合发布最新成果，揭示了大语言模型存在的“英语思维定式”问题，并提出创新解决方案。IT之家注意到，科研人员中不乏中国学者的存在。

研究人员针对非英语语种输出中普遍存在的语法与词汇偏差问题展开了深度剖析，测试覆盖中文、法语、英语（基于维基百科）语料。

测试发现，即使专为中文优化的 Qwen 模型，其母语表现仍落后人类水平；Meta 的 Llama 3.1 综合表现最佳，但自然度仍存在显著差距；所有模型在非英语输出中均残留英语语法结构。

换句话说，即使模型在用中文或法语进行对话，但它仍在用英语进行“思考”，而且非英语输出仍然遵循类似英语的语法和词汇模式。

针对大语言模型的遣词造句，研究团队提出两项量化指标：

词汇自然性（Lexical Naturalness）：评估 LLM 用词是否符合母语习惯
句法自然性（Syntactic Naturalness）：检验 LLM 语句是否贴合本土语法

为了缩小差距，研究人员通过“回译法”自动生成训练样本，将人工撰写的流畅中文内容先翻译成英文，再逆向翻译成带有 "翻译腔" 的“反面”样本。利用这类对比数据训练模型加强自然表达能力，在保持基准性能的前提下显著改善语言输出质量。

论文地址：

https://arxiv.org/abs/2410.15956

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

登录账号

苹果研究破解 AI“英语口音”难题，提升多语言自然性

评论 (0)

文章章节

推荐文章

何必DiT！字节首次拿着自回归，单GPU一分钟生成5秒720p视频

用户破8亿！GPT-5.1来了，表情包含量可自定义

发布即开放：百度猎户座葫芦里卖的什么药？

李飞飞的世界模型来了！一句话生成3D世界，AI 真的开始理解现实了

速抢（2核2G）77元/年香港免备案服务器

腾讯总裁剧透微信搭载智能体！阿里和谷歌也都开始互相伤害了

AIGC大模型能力提升10倍！安谋科技Arm China掏出最强NPU IP大招

小鹏物理AI的尽头，是马斯克的现金流

热门标签

热门作者

AI中国

钛媒体APP

IT之家

人人都是产品经理

AIbase基地

登录账号

苹果研究破解 AI“英语口音”难题，提升多语言自然性

评论 (0)

文章章节

推荐文章

何必DiT！字节首次拿着自回归，单GPU一分钟生成5秒720p视频

用户破8亿！GPT-5.1来了，表情包含量可自定义

发布即开放：百度猎户座葫芦里卖的什么药？

李飞飞的世界模型来了！一句话生成3D世界，AI 真的开始理解现实了

速抢（2核2G）77元/年香港免备案服务器

腾讯总裁剧透微信搭载智能体！阿里和谷歌也都开始互相伤害了

AIGC大模型能力提升10倍！安谋科技Arm China掏出最强NPU IP大招

小鹏物理AI的尽头，是马斯克的现金流

热门标签

热门作者

AI中国

钛媒体APP

IT之家

人人都是产品经理

AIbase基地

为您推荐