微软 Edge 浏览器免费上线 Copilot Vision 功能,AI 助手可实时解读屏幕内容 80 0 IT之家 4 月 17 日消息,微软人工智能首席执行官穆斯塔法・苏莱曼今天在 Bluesky 上宣布,微软的人工智能助手功能“Copilot Vision”现在可以在 Edge 浏览器中免费使用,该功能可以解读屏幕上的内容并帮助用户使用应用程序。据IT之家了解,“Copilot Vision”是一种“基于语音的体验”,用户可以通过语音指令与之交互。苏莱曼表示,当用户启用该功能时,“Copilot
AI搜索引擎 语言模型 Search-R1 Huggingface UIUC联手谷歌发布Search-R1 大模型学会边查百度边答题 80 0 最近AI圈炸出一项黑科技——让语言模型学会自己上网查资料!不仅考试分数暴涨41%,还解锁了"边推理边搜索"的究极形态。今天带你们围观这场学术界的"作弊式进化",看完保证你想给自家AI办张网吧会员卡!论文地址:https://arxiv.org/abs/2503.09516代码地址:https://top.aibase.com/tool/search-r1huggingface 主页:https:/
# AI工具 # AI项目和框架 GPT-image-1 – OpenAI 推出的最新图像生成模型 80 0 GPT-image-1是什么GPT-image-1是OpenAI推出的原生多模态图像生成模型,基于API向开发者开放使用。模型根据文本提示和图像生成高质量、专业级的图像,支持多种风格和自定义功能,如图像质量、尺寸、格式、压缩程度等。模型广泛应用在创意设计、电商、教育、营销等领域,例如将草图转化为图形、生成产品展示图、创建品牌视觉资产等。目前已经被包括 Adobe、Figma 在内等主流创意平台
KreaStage AI 3D场景生成 图片到3D转换 Krea发布全新工具Krea Stage:从图片到3D场景:一键构建沉浸式世界 80 0 在人工智能技术持续突破的浪潮中,Krea再度以创新之姿引领行业。4月10日,Krea正式发布全新工具Krea Stage,为3D场景创作和视频生成带来革命性体验。这一工具以其强大的AI能力,让用户能够从单一图片生成可编辑的3D场景,并确保跨媒介内容的一致性,为创作者提供了前所未有的灵活性和效率。以下是AIbase对这一前沿技术的深度解读。从图片到3D场景:一键构建沉浸式世界Krea Stage的核
AI模型 链式思维 Claude 模拟推理 AI 模型隐瞒推理过程引发担忧,研究称其 “思考” 常常不可信 80 0 在教育中,我们常常被教导要 “展示你的思考过程”,而现在一些高端的 AI 模型声称能够做到这一点。然而,最新的研究却表明,这些模型有时会隐藏真实的推理过程,反而编造出复杂的解释。来自 Anthropic 的研究团队近期对模拟推理(SR)模型进行了深入研究,包括其自家开发的 Claude 系列和 DeepSeek 的 R1模型,发现这些模型在展示其 “思考” 时,常常不透露它们所依赖的外部信息或使用
MiniMax MiniMax-Text-01 MiniMax-VL-01 国产AI大模型 国家超算互联网平台上线MiniMax国产AI大模型,助力AI开源生态与智能交互新发展 80 0 中国人工智能产业正在加速迈向全球舞台。AIbase从社交媒体获悉,国家超算互联网平台已正式上线MiniMax稀宇科技的国产AI大模型,包括MiniMax-Text-01和MiniMax-VL-01,并入驻超算互联网AI开源社区。与此同时,MiniMax的ChatBot对话服务也同步接入平台,为用户提供高效的智能交互体验。以下是AIbase对这一重大进展的深度报道,解析其技术亮点、生态意义及未来影响
WhiskAnimate GoogleOneAIPremium AI创作工具 Veo2 Google Whisk新增Whisk Animate功能,Veo 2赋能图像转视频创作 80 0 人工智能驱动的创作工具正在不断革新内容生产方式。AIbase从社交媒体获悉,Google Whisk近期迎来重大更新,新增Whisk Animate功能,允许用户将生成图片转化为由Veo2驱动的动态视频。这一功能需订阅Google One AI Premium会员方可使用,为创意专业人士和AI爱好者提供了全新的视频创作途径。以下是AIbase对Whisk Animate的深度解析,探索其功能亮点、
百度端到端语音语言大模型发布,成本宣称最高降 90% 80 0 IT之家 3 月 31 日消息,在今日的百度 AI DAY 上,百度发布首个基于全新互相关注意力(Cross-Attention)的端到端语音语言大模型,宣布实现超低时延与超低成本,在电话语音频道的语音问答场景中,调用成本较行业均值下降约 50%-90%。当日,文小言宣布品牌焕新,率先接入该模型,还带来多模型融合调度、图片问答等功能升级。接入该模型后,文小言不仅能支持更拟真的语聊效果,而且支持重
Lp-Convolution AI视觉 机器视觉 卷积神经网络(CNN) AI视觉革命!受人脑启发的新技术让机器“看”得更准、更高效 80 0 <meta charset="utf-8"/><meta content="width=device-width, initial-scale=1.0" name="viewport"/><title>AI视觉革命!受人脑启发的新技术让机器“看”得更准、更高效</title>告别传统死板的方形“滤镜”,一种名为Lp-Convolution的新AI技术
Lyft 推出 AI 助手,助力司机优化收入 80 0 Lyft 最近推出了一款名为 “收益助手” 的人工智能聊天工具,旨在帮助司机优化他们的行驶时间。这款工具可以根据司机所处的地点、机场航班到达情况或当地活动信息,制定出高效的工作计划。Lyft 的司机体验执行副总裁杰里米・伯德在接受《The Verge》采访时透露,该工具目前处于早期访问阶段,司机们需要加入候补名单才能使用。一旦获得访问权限,司机就可以利用收益助手进行规划,该工具不仅能提供详细的时间
非营利机构警告:类伴侣型 AI 应用对儿童青少年存在“不可接受的风险” 81 0 IT之家 4 月 30 日消息,近日非营利性媒体监督机构“常识媒体”(Common Sense Media)发布了一份报告,指出类伴侣型人工智能(AI)应用对儿童和青少年构成了“不可接受的风险”,并建议家长不要让未成年人使用此类应用。“常识媒体”为各种媒体内容提供年龄分级,以指导家长判断其是否适合儿童使用。IT之家注意到,这份报告的发布背景是去年发生的一起诉讼事件。一名 14 岁男孩自杀身亡,其
MCP社区 开源平台 智能体工具 支付宝MCP 支付宝被AI接管,一句话运营小红书!国内最大MCP社区来了,开发者狂欢 81 0 声明:本文来自于微信公众号新智元,授权站长之家转载发布。MCP玩家,又新增一员!这次还是全开源开放的!今天,中国第一开源社区魔搭ModelScope重磅上线「MCP广场」,国内最大MCP中文社区真的来了。近1500多款热门MCP同时登陆,覆盖了搜索、地图、支付、开发者工具等前沿领域。值得一的是,支付宝、MiniMax明星MCP服务更是独家首发。接下来,我们演示下如何在Cline这样的智能体工具
人工智能(AI) AI技术 数字化转型 全球AI市场 联合国警告:未来AI技术将影响全球40%工作岗位,加剧国家间不平等 81 0 联合国贸易和发展机构(UNCTAD)发布了一份引人注目的报告,指出人工智能(AI)技术在未来将可能影响全球40% 的工作岗位。该报告预计,到2033年,全球 AI 市场的价值将达到4.8万亿美元,规模与德国的经济体量相当。然而,尽管 AI 技术有潜力提升生产力和推动数字化转型,但其带来的经济利益目前仍然集中在少数地区和企业手中。图源备注:图片由AI生成,图片授权服务商Midjourney报告中特别
BabelDOC AI翻译 PDF翻译工具 开源工具 BabelDOC横空出世:开源PDF翻译神器 81 0 近日,一款名为BabelDOC的开源PDF翻译工具正式亮相,以其强大的功能和灵活的配置迅速成为AI翻译领域的焦点。据AIbase了解,BabelDOC不仅能够保留PDF文档的原始排版,还支持双语对照、批量处理,并兼容多种AI模型,堪称目前最出色的PDF翻译解决方案之一。这一工具的发布,为学术研究、跨国交流和多语言文档处理提供了全新的智能选择。功能强大:一键生成双语PDFBabelDOC的核心亮点在
AI建站工具 WordPress 一句话建站 AI驱动的极简体验 WordPress AI建站工具震撼上线:一句话打造专属网站,零门槛! 81 0 近日,全球领先的内容管理系统WordPress推出了一款全新的AI建站工具,彻底颠覆了传统网站创建的复杂流程。据AIbase了解,这款工具允许用户通过简单的一句话描述即可生成个性化网站,无需任何编程经验或设计技能。从博客到电商平台,这一工具的发布为个人用户和小型企业提供了快速建站的智能解决方案。一句话建站:AI驱动的极简体验WordPress的这款AI建站工具以其极简操作成为亮点。用户只需输入一句
Gemini 谷歌 视频分析 AI 谷歌 Gemini 推出视频分析功能,能准确识别视频拍摄场所 81 0 近日,科技媒体 Android Authority 报道称,谷歌最新的 Gemini 聊天机器人引入了一项引人注目的新功能 —— 视频分析。用户现在可以轻松上传视频并提问,Gemini 会基于视频内容进行智能分析,回答相关问题。这一创新功能无疑为视频内容的处理带来了新的可能性,吸引了广大用户的关注。在测试中,Gemini 展现出了惊人的能力。通过分析视频中的建筑风格和地理线索,AI 能够准确判断出