o3模型 - AI中国

o3模型基准测试分数仅为10%，远低于OpenAI宣传的25%

AI热点 1年前

o3模型基准测试分数仅为10%，远低于OpenAI宣传的25%

这并不意味着 OpenAI 在说谎！站长之家(ChinaZ.com) 4月21日消息:OpenAI 的新 AI 模型 o3 在第一方和第三方基准测试结果上存在差异，这也引发了人们对该公司透明度和模型测试实践的质疑。去年 12 月， OpenAI 的 o3 模型首次亮相，当时，该公司宣称这款模型能够解答 FrontierMath（一组极具挑战性的数学问题）中超过 25% 的题目 —— 这个成绩

站长之家

站长之家

319 0

OpenAI o3 模型运行成本飙升：单次任务费用从 3000 美元涨至 30000 美元

AI热点 1年前

OpenAI o3 模型运行成本飙升：单次任务费用从 3000 美元涨至 30000 美元

近日，Arc Prize Foundation 对 OpenAI 的 o3“推理” 人工智能模型的运行成本进行了大幅度修订，令人瞩目的是，单次任务的费用从最初的3000美元骤升至30000美元。这一变化让许多人意识到，最先进的 AI 模型在执行特定任务时所需的高昂费用，已成为行业一个不容忽视的挑战。回顾去年12月，OpenAI 推出了 o3模型，并与 ARC-AGI 的开发者紧密合作，展示了这一模

AI中国

AI中国

433 0

多模态大模型视觉推理能力评估:o3 仅得 25.8% 分数

AI热点 1年前

多模态大模型视觉推理能力评估:o3 仅得 25.8% 分数

近日，由清华大学、腾讯混元、斯坦福大学及卡耐基梅隆大学的研究团队联合发布了一项新评估基准 ——RBench-V，专门针对多模态大模型的视觉推理能力进行测试。该基准的推出，旨在填补当前评估体系中对模型视觉输出能力的空白，以便更全面地了解现有模型的性能。RBench-V 基准测试包含803道题目，涉及多个领域，包括几何与图论、力学与电磁学、多目标识别和路径规划等。与以往只要求文字回答的评估不同，这次评

AI中国

AI中国

389 0

AI热点 1年前

OpenAI发布o3、o4 mini模型，实现“看图说话”，糊图也行！

“这是OpenAI迄今最强、最智能的模型。”OpenAI 发布了能够识别、分析草图、图表、海报等信息的推理专用AI模型……站长之家(ChinaZ.com) 4月17日消息:OpenAI 当天宣布正式推出具备图像识别能力的主力推理专用 AI 模型 “o3” 以及轻量化模型 “o4 mini”。其中，o3 是 OpenAI 去年首次公开的推理模型 o1 的后续产品。在此之前的今年 1 月，Ope

站长之家

站长之家

328 0

DeepSeek 全新开源R1-0528 模型登场，性能媲美 OpenAI o3 模型

AI热点 1年前

DeepSeek 全新开源R1-0528 模型登场，性能媲美 OpenAI o3 模型

今天凌晨，知名的开源大模型平台 DeepSeek 发布了其最新版本 R1（0528），引起了广泛关注。此次发布没有附带详细说明，DeepSeek 选择了 “悄然” 开放模型，预计后续会发布模型卡，进一步介绍其功能。据悉，R1-0528版本的性能在著名代码测试平台 Live CodeBench 上的测试结果显示，其表现与 OpenAI 最新的 o3模型相当。很多网友对此表示期待，纷纷对新版本进行了测

AI中国

AI中国

366 0

外媒：ChatGPT新模型 o4 mini 的“AI幻觉率”高达48%

AI热点 1年前

外媒：ChatGPT新模型 o4 mini 的“AI幻觉率”高达48%

性能是提升了些，但，“胡说八道”的能力提升得更快，直接登顶……站长之家(ChinaZ.com) 4月21日消息:最近，OpenAI 发布了他们最新的推理型 AI 模型 “o3” 和 “o4 mini” ，它们虽然具备了比上一代更强大的性能，但 AI 幻觉却变得更严重了 —— AI 幻觉是指生成型人工智能编造出实际并不存在的信息，并将其当作事实呈现的现象。据海外 IT 专业媒体 TechCru

站长之家

站长之家

434 0

热门标签

机器人开发运势西弗吉尼亚大学嵌入模型 Runway 文字生成图片潘辉燕经济升级 TripletTransformer AI识谣

热门作者

作者头像

AI科技前沿

102篇文章

作者头像

机器学习笔记

87篇文章

作者头像

AI绘画大师

64篇文章

热门阅读

1

在线克隆人声、文本转语音免费的ai语音生成器有哪些软件？8 款免费中文 AI 合成声音软件推荐

1570 阅读

2

免费AI换脸软件有哪些？6 个免费AI换脸工具和软件推荐

1562 阅读

3

ai模拟自己声音唱歌，5款精选AI翻唱生成器推荐

1551 阅读

4

6 款 AI 角色扮演软件推荐，跟虚拟好友一起聊天对话

1526 阅读

5

一键生成PPT软件有哪些？推荐14款国产AI智能生成PPT工具

1447 阅读

6

6种AI声音克隆工具，听说还有99%的人不知道（建议收藏）

1417 阅读

7

即梦AI绘画教程，解决AI生成图片人物一致性

1396 阅读

8

如何用免费AI工具让一张人物照片开口说话唱歌？用这个ai工具就能完成

1375 阅读

9

速抢（2核2G）77元/年香港免备案服务器

1286 阅读

10

【靠AI变现】Deepseek+SD做大尺度擦边女，详细生涩图接单教学分享！未成年勿学，成年必看来财特快，渠道合规！

1146 阅读

11

用ai就能让古人跳起健身操，即梦AI生成爆款短视频教程

1069 阅读

12

7款免费的AI视频生成工具，助你轻松打造专业影片

994 阅读

13

智能识别图片内容软件有哪些？6款支持AI图片识别工具推荐，可查人脸、动植物、建筑、文字、原图

970 阅读

14

用豆包做育儿短视频，这个成语故事动画片教程3分钟教会你

969 阅读

15

做AI视频，你一定要知道这10款爆火的AI视频工具

962 阅读

16

AI 视频剪辑软件哪个好？9款优秀的AI视频工具推荐

931 阅读

17

ai视频生成动画，6 款免费AI动画视频生成工具推荐

927 阅读

18

免费制作自己的口播3D卡通虚拟数字人，手把手教你用AI做一个数字人教程

878 阅读

19

人物一致性提示词怎么写？即梦AI视频生成保持人物形象一致的方法

876 阅读

20

推荐9款好用的AI换脸工具，用AI换脸一键生成

850 阅读