阿里开源多模态模型Qwen2.5-Omni:显存大幅降低暴降 50% 125 0 在开源大模型的竞争中,阿里巴巴推出了其最新的多模态模型 Qwen2.5-Omni-3B。这款模型的显著特点是显存使用减少了50%,在同等处理能力下,更加适合普通消费者的 GPU 设备。这一创新标志着阿里在多模态人工智能领域的进一步突破。Qwen2.5-Omni 是一款端到端的多模态模型,能够同时处理文本、图像、音频和视频等多种信息类型。得益于其独特的 “Thinker-Talker” 架构,模型能
微软 Win11 Copilot 应用新功能:文件搜索与视觉助手开启测试 125 0 感谢IT之家网友 EdgeOS 的线索投递!IT之家 4 月 9 日消息,在微软公司成立 50 周年之际,该公司在纪念活动上宣布了 Windows 11 系统中 Copilot 应用的新功能,并且这些功能目前已经向 Windows Insider 计划的用户开放公测。对于美国地区的 Windows Insider 计划成员来说,现在可以体验到 Copilot 文件搜索和 Copilot 视觉助
人工智能助力自闭症群体:社交障碍的“解码器” 125 0 随着人工智能技术的迅猛发展,AI应用正成为自闭症群体克服社交障碍的重要工具。根据美国疾控中心(CDC)的数据显示,当前美国有超过500万成年人被诊断为自闭症。这一群体通常在解读暗示性言语、非言语交流以及理解复杂社交情境方面面临挑战,而AI的介入为他们提供了前所未有的支持。AI工具帮助自闭症群体理解社交规则34岁的加拿大自闭症教师Theron Pierce在经历突然失业后,发现了一款名为Autist
昆仑万维开源 SkyReels-V2 模型,开启生成“无限时长”视频时代 125 0 IT之家 4 月 21 日消息,昆仑万维今日正式发布并开源 SkyReels-V2—— 全球首个使用扩散强迫(Diffusion-forcing)框架的无限时长电影生成模型,其通过结合多模态大语言模型(MLLM)、多阶段预训练(Multi-stage Pretraining)、强化学习(Reinforcement Learning)和扩散强迫(Diffusion-forcing)框架来实现协同优
新创公司Cheehoo推出AI动画工具,助力艺术家与创作者 125 0 近日,一家名为 Cheehoo 的新兴科技娱乐公司在 beta 版中正式上线,旨在利用人工智能技术革新动画制作。该公司的创始团队由多位行业内知名人士组成,包括前梦工厂动画总裁 Chris deFaria、前苹果科学家及 AI / 机器学习专家 Dr. Hubert Tsai 和 Dr. Wei-Cheng Kuo,以及 Rideback 的联合首席执行官 Michael LoFaso 和 Jona
北美网约车巨头 Lyft 推出“AI 收益助手”:可帮司机“赚更多钱” 125 0 IT之家 4 月 30 日消息,据外媒 The Verge 今日报道,北美网约车巨头 Lyft 推出了一款名为“Earnings Assistant(收益助手)”的 AI 聊天工具,帮助司机更高效地安排上路时间。同时,司机可借助这款工具,结合机场抵达时间和本地活动等信息,制定自己的接单计划。该媒体报道称,“收益助手”可以向司机提供如何赚更多钱的建议,可以询问如何根据机场到达、当地活动等实时数据“
AI 数学推理新王:英伟达发布两款 OpenMath-Nemotron 模型,刷新 AIME 准确率纪录 125 0 IT之家 4 月 25 日消息,科技媒体 marktechpost 今天(4 月 25 日)发布博文,报道称英伟达专为数学推理设计,发布 OpenMath-Nemotron-32B 和 OpenMath-Nemotron-14B-Kaggle 两款先进 AI 模型。数学推理一直是 AI 领域的巨大挑战。传统的语言模型擅长生成流畅文本,却在解决复杂数学问题时显得力不从心,这些问题不仅需要理解抽象
AI 搜索企业 Perplexity:公司资金充裕,2028 年前无 IPO 规划 125 0 IT之家 4 月 1 日消息,AI 搜索企业 Perplexity 联合创始人兼首席执行官 Aravind Srinivas 当地时间 3 月 28 日在 Reddit 发帖回应了网友近期对该企业状况和产品的关切。在财务方面,他表示 Perplexity 目前资金充裕,收入正处于上升轨道,没有在 2028 年前进行 IPO 计划;此前推出的 Auto 自动选择模型搜索模式不是为了节约成本,而是为
ArmHoldings Alphawave SerDes AI处理器 Arm 放弃收购 Alphawave,探索新战略以抢占 AI 芯片市场份额 124 0 软银旗下的 Arm Holdings近期考虑收购英国半导体 IP 供应商 Alphawave,以提升其在人工智能(AI)处理器领域的竞争力。Arm 特别看中了 Alphawave 的 SerDes 技术,这一技术对于需要在芯片之间进行快速数据传输的 AI 应用至关重要,尤其在 ChatGPT 等系统中扮演关键角色。然而,尽管进行了初步谈判,Arm 最终决定不再继续推进收购计划。图源备注:图片由AI
通义千问 Qwen2.5-Omni HuggingFace 端到端全模态大模型 阿里通义千问 Qwen2.5-Omni 登顶全球开源模型榜单 124 0 全球最大的 AI 开源社区 Hugging Face 发布了最新的大模型榜单,阿里巴巴的通义千问所推出的端到端全模态大模型 Qwen2.5-Omni 成功登顶,成为全球开源模型中的领军者。此次排名中,Qwen2.5-Omni 凭借其强大的性能和多模态能力,战胜了其他众多优秀的模型,位列榜首。紧随其后的是 DeepSeek-V3-0324和群核的 SpatialLM-Llama-1B,这两个模型在功
数字生命 秘塔AI 关税问题 特朗普言论 说个抽象的事,你现在可以在秘塔AI搜索里上课了。 124 0 声明:本文来自于微信公众号数字生命卡兹克,授权站长之家转载发布。给我整不会了。周末我本来在用秘塔AI搜关税的问题,特朗普一天一个说法,又说关税要结束了。然后,意外的发现,秘塔上了一个非常有意思的功能。“今天学点啥”。。。说实话,在进入到这个页面的瞬间,我以为我跳到不知道哪去了,直到看到秘塔左上角的logo还在,我才确定,这是他们的新功能。它的功能大概就是,把一份文件或者一个链接,变成一个像是B
百度发布高说服力数字人,可在电商直播领域带来超越真人体验 124 0 IT之家 4 月 25 日消息,今日在百度 Create 大会现场,百度创始人李彦宏发布了高说服力数字人,即声形超拟真、内容更专业、互动更灵活的数字人,能在电商直播、游戏、消费等领域带来超越真人的体验。李彦宏指出,高说服力数字人超越真人主要归功于百度慧播星背后的“剧本生成”能力,实现口播脚本与数字人表情、语气、动作的高度融合,以及顺畅的情绪转折和动作切换,表现“超拟真”。另外,高说服力数字人还具
蚂蚁数科发布金融智能体开发平台Agentar 内测上线超百个金融MCP服务 124 0 4月29日,在数字中国建设峰会期间,蚂蚁数科正式对外发布智能体开发平台Agentar,为金融机构提供一站式、全栈的智能体开发工具,助力金融机构高效打造能够自主决策、可信可靠的金融智能体应用,加速AI技术从“辅助工具”真正成为驱动体验变革、效率跃升的“生产力引擎”。随着生成式AI的快速发展,行业大模型及智能体应用正在重塑金融服务。然而,大模型训练成本高昂难以在普惠场景中规模化复制;金融行业数据的高敏
人工智能 语音转录 OpenAI 技术趋势 AI日报:OpenAI发布三个新语音模型;快手搜索全面接入DeepSeek R1;Claude上线联网搜索功能 124 0 欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、OpenAI推全新语音转录模型gpt-4o-transcribe,语音转文字准确率飙升OpenAI重磅推出了三款新语音模型,分别为:gpt-4o-transcribe,gpt-
我国首个通用人工智能大型社会模拟器发布:可精准推演社会运行规律 124 0 IT之家 3 月 30 日消息,据《科技日报》报道,在昨日的 2025 中关村论坛年会通用人工智能论坛上,我国首个通用人工智能大型社会模拟器正式发布,意味着交通等相关领域的管理与决策有了预演模型。IT之家从报道中获悉,“大型社会模拟器”是一个社会级智能体学习和实践的仿真模拟平台,可利用多智能体价值观建模和数字孪生技术精准推演社会运行规律,模拟不同社会决策的长远影响,为政府决策提供前瞻性预演。据北
Kimina-Prover Qwen2.5-72B 大规模强化学习 数学定理证明 月之暗面Kimi开源数学定理证明模型Kimina-Prover 124 0 Kimi 技术团队近日发布了 Kimina-Prover 预览版的技术报告,并开源了1.5B 和7B 参数的模型蒸馏版本、用于数据生成的 Kimina-Autoformalizer-7B 模型以及修订过的 miniF2F 基准测试数据集。Kimina-Prover 是由 Numina 和 Kimi 团队联合研发的一款数学定理证明模型,它在形式化定理证明领域采用了一种新颖的、由推理驱动的探索范式,