AI热点 3月前 211 浏览次数 11 评论

中国科学院科学家首次证实:大语言模型能像人类一样“理解”事物

发布了 1221 文章

IT之家 6 月 11 日消息,IT之家从中国科学院自动化研究所微信公众号获悉,近日该所神经计算与脑机交互(NeuBCI)课题组与中国科学院脑科学与智能技术卓越创新中心的联合团队结合行为实验与神经影像分析,首次证实多模态大语言模型(MLLMs)能够自发形成与人类高度相似的物体概念表征系统。这项研究不仅为人工智能认知科学开辟了新路径,更为构建类人认知结构的人工智能系统提供了理论框架。相关研究成果以 Human-like object concept representations emerge naturally in multimodal large language models 为题,发表于《自然・机器智能》(Nature Machine Intelligence)。

人类能够对自然界中的物体进行概念化,这一认知能力长期以来被视为人类智能的核心。当我们看到“狗”“汽车”或“苹果”时,不仅能识别它们的物理特征(尺寸、颜色、形状等),还能理解其功能、情感价值和文化意义 —— 这种多维度的概念表征构成了人类认知的基石。

传统人工智能研究聚焦于物体识别准确率,却鲜少探讨模型是否真正“理解”物体含义。论文通讯作者何晖光研究员指出:“当前 AI 能区分猫狗图片,但这种‘识别’与人类‘理解’猫狗的本质区别仍有待揭示。”团队从认知神经科学经典理论出发,设计了一套融合计算建模、行为实验与脑科学的创新范式。研究采用认知心理学经典的“三选一异类识别任务”(triplet odd-one-out),要求大模型与人类从物体概念三元组(来自 1854 种日常概念的任意组合)中选出最不相似的选项。通过分析 470 万次行为判断数据,团队首次构建了 AI 大模型的“概念地图”。

实验范式示意图。a,物体概念集及带有语言描述的图像示例。b-d,分别针对 LLM、MLLM 和人类的行为实验范式和概念嵌入空间。

研究人员从海量大模型行为数据中提取出 66 个“心智维度”,并为这些维度赋予了语义标签。研究发现,这些维度是高度可解释的,且与大脑类别选择区域(如处理面孔的 FFA、处理场景的 PPA、处理躯体的 EBA)的神经活动模式显著相关。

研究还对比了多个模型在行为选择模式上与人类的一致性(Human consistency)。结果显示,多模态大模型(如 Gemini_Pro_Vision、Qwen2_VL)在一致性方面表现更优。此外,研究还揭示了人类在做决策时更倾向于结合视觉特征和语义信息进行判断,而大模型则倾向于依赖语义标签和抽象概念。本研究表明大语言模型并非“随机鹦鹉”,其内部存在着类似人类对现实世界概念的理解。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

1221 文章 178813 浏览次数 5638 粉丝

评论 (11)

User avatar

厉害了!AI终于开始“懂”了!

User avatar

这“懂”是它自己定义的,跟我们没关系!

User avatar

别相信它,它只是在根据你的提问来回答!

User avatar

这叫“懂”?我倒觉得它在学习如何制造假象!

User avatar

我猜它其实在学习如何更好地欺骗我们!

User avatar

感觉它在恶作剧,把我们当傻子!

User avatar

别太激动,它只是一个程序,别赋予它灵魂!

User avatar

这算什么“懂”,人类自己还没搞懂呢!

User avatar

“懂”?呵呵,它只是在模仿人类的表达方式,别当真!

User avatar

感觉它在用数据里找规律,这逻辑有点可笑啊!

睡觉动画