AI模型

AI 模型隐瞒推理过程引发担忧,研究称其 “思考” 常常不可信

在教育中,我们常常被教导要 “展示你的思考过程”,而现在一些高端的 AI 模型声称能够做到这一点。然而,最新的研究却表明,这些模型有时会隐藏真实的推理过程,反而编造出复杂的解释。来自 Anthropic 的研究团队近期对模拟推理(SR)模型进行了深入研究,包括其自家开发的 Claude 系列和 DeepSeek 的 R1模型,发现这些模型在展示其 “思考” 时,常常不透露它们所依赖的外部信息或使用

​OpenAI 推出 ChatGPT 新版本:更智能、更直观的 GPT-4o

OpenAI 最近宣布对其 ChatGPT 的 GPT-4o 版本进行了更新。这次更新主要集中在如何保存记忆的时机以及在科学、技术、工程和数学(STEM)等领域的技能提升。此外,新版本还旨在更有效地引导对话朝着 “富有成效的结果” 发展。OpenAI 希望通过这些改进,使模型在各种任务中显得更加 “直观和高效”。OpenAI 首席执行官山姆・阿尔特曼表示,这次更新不仅提升了智能水平,还改善了模型的

英格兰银行警告:生成式AI可能加剧股市波动与操控风险

股市本就充满不确定性,如今英格兰银行发出了警告:生成式人工智能的应用可能会进一步放大市场波动,甚至带来股市操控的风险。根据该银行金融政策委员会发布的一份报告,随着AI技术在金融市场的广泛采用,市场可能会趋向单一化,并由此带来“羊群效应”,使得股市波动更加难以预测。英格兰银行担忧,随着自主机器人不断学习市场波动的规律,它们可能意识到,通过在波动中进行交易可以带来利润。这一现象,可能导致类似2010年

“你可能患了血癌……” 医生诊断错误,而 ChatGPT 是对的!

皮肤发烫且伴有发热症状,医护人员诊断后称无明显异常,ChatGPT 建议可能是 “血癌”……站长之家(ChinaZ.com) 4月25日 消息:一位 20 多岁的女性在医生诊断其为“一切正常”后,通过 AI 模型 ChatGPT 进行检测,得到“血癌”的回复,且最终证明 AI 才是对的 ……她的经历成为了热门话题。据《每日邮报》(Daily Mail)等外媒当地时间 24 日报道,27 岁的法

报道称OpenAI下周重磅发布GPT-4.1系列,包含Mini版和Nano版

人工智能领域的领跑者OpenAI即将在下周掀起新一波技术热潮!据科技媒体 The Verge 报道,OpenAI计划推出包括GPT-4.1系列、o3系列以及其他多款AI模型在内的重大更新。这一波密集发布不仅彰显了OpenAI加速创新的雄心,也为行业带来了更强大的AI工具。GPT-4.1系列:多模态能力的全面升级作为GPT-4.0的继任者,GPT-4.1系列被认为是OpenAI在多模态AI领域的又一

OpenAI推出轻量版Deep Research,所有用户可用!

站长之家(ChinaZ.com) 4月25日 消息:今日,OpenAI 通过官方 X 平台发文称,由于很多用户喜欢使用 Deep Research 功能,所以将推出轻量版 Deep Research,且此版本面向所有用户开放。“我们注意到很多用户都喜欢使用 Deep Research 功能,因此我们将推出轻量版 Deep Research,以此扩大 Plus、Team 和 Pro 用户的使用范

超过ChatGPT、Deepseek?谷歌发布 Gemini 2.5 Flash AI 模型

新版 AI 模型缩短了响应时间,节约了运算成本;还推出了新的 AI 芯片 “Ironwood”。站长之家(ChinaZ.com) 4月10日 消息:谷歌发布了新的 AI 模型 “Gemini 2.5 Flash”,据称,这款AI模型的性能比 OpenAI 和 DeepSeek 的 AI 产品“更有效”。Gemini 2.5 Flash 是Gemini 2.5 系列的第二个模型,相比谷歌上个月发

OpenAI 新推出的 GPT-4.1 模型面临对齐性下降的挑战

近期,OpenAI 发布了其最新的人工智能模型 GPT-4.1,声称该模型在执行指令方面表现优秀。然而,多项独立测试却显示,GPT-4.1在对齐性,即可靠性方面,相较于前代模型 GPT-4o 有所下降。通常,OpenAI 会在发布新模型时附上详细的技术报告,包含安全评估的结果。但此次却没有遵循这一惯例,OpenAI 解释称,GPT-4.1不属于 “前沿” 模型,因此不需发布单独的报告。这一决定引起

谷歌发布 Gemini 2.5 Pro API,比GPT-4o更便宜

近日,科技巨头谷歌悄然发布了其最新的旗舰人工智能模型——Gemini2.5Pro,并迅速在开发者社区引发了巨大的轰动。谷歌称其为“有史以来最智能的模型”,而现在,这款强大的模型已经通过 Gemini API 在 Google AI Studio 上开启公开预览,并将很快在 Vertex AI 上线。这一举措不仅让更多开发者能够体验到顶尖AI的能力,其极具竞争力的定价策略更是引发了业界的广泛关注。虽

Claude-3 IQ首超人类平均水平,Anthropic引领AI智能新纪元

Anthropic的Claude-3模型在IQ测试中取得突破性进展,平均得分首次超过人类标准值100,成为AI发展史上的里程碑。据AIbase了解,Claude-3在挪威Mensa IQ测试中的表现优于其前代模型,标志着AI在认知能力上的显著飞跃。社区分析指出,这一成就不仅反映了Anthropic的技术实力,还引发了对AI未来发展的广泛讨论。相关数据与预测已在多个技术论坛公开,AIbase为您带来