马斯克:将出现新方案实现自动驾驶 仅需摄像头和AI芯片

站长之家(ChinaZ.com) 4月15日 消息:当地时间4月14日,特斯拉首席执行官埃隆·马斯克在社交媒体透露,公司即将推出基于纯AI技术的全自动驾驶(FSD)解决方案。该方案完全依赖摄像头与特斯拉自主研发的AI芯片,并由其AI软件驱动,与特斯拉长期坚持的“纯视觉自动驾驶”技术路线一致。特斯拉近期通过官方X账号发布视频,展示其德克萨斯工厂内FSD无监督技术的应用场景。视频中,新款Model

8.8英寸小钢炮!联想拯救者最强性能AI手游平板官宣:5月见

快科技4月15日消息,今天官方发文宣布,将于5月召开联想天禧AI生态春季新品”发布会,除了此前已经曝光过的联想moto razr 至尊AI小折叠、edge系列手机之外,还有全新平板。官方号称新品是联想拯救者系列最强性能AI手游平板,应该是加入了全新的AI技术,暂不确定是否延续Y700的命名。从官方公布的外观图来看,新机整体继承了此前多款的外观,后摄从两颗变成一颗,但似乎尺寸更大一些。整机依然是

Suno AI即将推出V4.5版本:音乐生成技术再升级

人工智能音乐生成平台Suno AI即将推出其V4.5版本。这一消息引发了音乐创作者与科技爱好者的广泛关注,预示着Suno在音乐生成领域的又一次技术飞跃。V4.5版本:更精细的音乐控制与音质提升社交媒体上的消息显示,Suno V4.5将为用户提供更强大的音乐生成控制功能。与之前的V4版本相比,V4.5有望解决先前版本中音乐轻浮感过重的问题,进一步优化音质表现。开发团队针对音频生成的细节进行了改良,特

谷歌Gemini聊天机器人全新升级:支持多图上传和图像编辑功能

近日,谷歌的 Gemini 聊天机器人迎来了重要更新,新增了多图上传功能,这一功能目前已经向部分用户开放。以往,用户只能上传单张图片,但现在在 Gemini2.0Flash 模型的支持下,部分用户已经能够在网页端同时上传多张图片。值得注意的是,该功能尚不支持免费账户,且在某些付费高级账户中也没有完全开放。这种分阶段推出的策略可能是为了逐步评估用户的反馈。除了多图上传,谷歌还在更新中加入了 AI 图

对话智源研究院王仲远:做具身智能的“安卓系统”,而非专用的“iOS”

大模型的发展正在遭遇瓶颈。随着互联网文本数据被大规模消耗,基于数字世界训练的AI模型性能提升速度明显放缓。与此同时,物理世界中蕴藏着数字世界数百倍甚至千倍的多模态数据,这些数据远未被有效利用,成为AI发展的下一个重要方向。在2025北京智源大会上,智源研究院发布了“悟界”系列大模型,试图推动AI从数字世界迈向物理世界,实现所谓的物理AGI。这一系列包含原生多模态世界模型Emu3、脑科学多模态通用

Meta Llama4强势登场,却在长上下文任务中翻车

一项新的独立评估显示,Meta 最新推出的 Llama4模型——Maverick 和 Scout 在标准测试中表现出色,但在复杂长上下文任务中表现欠佳。根据人工智能分析的“智能指数”,Maverick 得分49分,领先 Claude3.7Sonnet(得分未具体列出),但落后于 Deepseek V30324(53分);Scout 得分36分,与 GPT-4o-mini 相当,优于 Claude3

Anthropic 开源“思维追踪”工具,可视化揭秘 AI 内部逻辑

IT之家 5 月 30 日消息,Anthropic 昨日(5 月 29 日)发布博文,宣布推出“思维追踪”(Circuit Tracer)开源工具,以图形化方式,追踪并展示 AI 大语言模型的内部思维过程。该工具通过构建“归因图”(Attribution Graph),帮助研究者可视化模型内部运作,并支持交互式探索。这一项目由 Anthropic Fellows 程序的参与者与专注 AI 解释性

清华与星动纪元联合发布首个 AIGC 机器人大模型 VPP

近日,清华大学叉院的 ISRLab 与北京星动纪元科技有限公司携手推出了首个 AIGC(人工智能生成内容)机器人大模型 ——VPP(视频预测策略)。这一创新成果在2025年国际机器学习大会(ICML2025)上荣获 Spotlight 论文奖,显示出其在全球 AI 研究领域的前沿地位。AIGC 技术近年来迅速崛起,从生成式文本模型到视频生成技术,其应用范围不断扩大。而 VPP 的诞生标志着这一技术

亚马逊推新一代AI语音模型Nova Sonic,捕捉语气、语调变化和节奏

亚马逊近日推出了一款新型 AI 语音模型 ——Nova Sonic,旨在提升其语音助手 Alexa + 的性能。Nova Sonic 被设计用于本地处理语音并生成自然流畅的回复,标志着亚马逊在语音识别技术领域的又一次突破。Nova Sonic 采取了一种全新的整合方式,将语音理解和生成的能力统一到一个模型中。这一创新不仅简化了语音应用的开发过程,还能根据语音输入的声学背景(如语调和风格)来调整生成

Meta Ray-Ban智能眼镜全面推送实时翻译功能,支持离线使用

Meta公司近日宣布,其Ray-Ban Meta智能眼镜的实时翻译功能已正式向全球用户开放。此前,这一功能仅限于部分市场的早期测试用户。此次全面推出意味着用户可以在多种场景下,享受到更加便捷的语言转换体验,尤其是能够在无网络的环境下,突破语言障碍。根据Meta的官方消息,Ray-Ban Meta智能眼镜的实时翻译功能现已覆盖全球销售市场,支持英语、法语、意大利语和西班牙语四种语言的实时双向翻译。用

Claude4来袭!Anthropic推出"业界最强"AI模型,编程能力全面超越竞争对手

在首届开发者大会上,Anthropic推出了两款声称"业界最强"的AI模型,加剧了与OpenAI和谷歌的竞争Anthropic在周四举行的首届开发者大会上正式发布Claude4模型系列,包括Claude Opus4和Claude Sonnet4两款新模型。该公司声称这些模型在多项流行基准测试中达到业界领先水平,专门针对编程任务进行了优化。产品特性与定价策略新发布的Claude4系列具备分析大型数据

韵达股份新动作:成立“韵耀科技”公司,发力机器人与AI硬件领域

近日,深圳市韵耀科技有限公司正式成立,标志着作为物流巨头的韵达股份正积极拓展其业务版图至智能化领域。工商信息显示,深圳市韵耀科技有限公司的法定代表人为徐建根,注册资本为100万元人民币。该公司的经营范围广泛,重点聚焦于机器人与人工智能相关产业,具体包括服务消费机器人制造、工业机器人安装与维修、智能机器人销售、工业机器人销售、人工智能硬件销售以及人工智能公共数据平台等。通过股权穿透图可知,深圳市韵耀

百度飞桨框架 3.0 正式版发布,五大特性专为大模型设计

IT之家 4 月 3 日消息,百度本月发布飞桨框架 3.0 正式版,五大特性专为大模型设计。作为大模型时代的 Infra“基础设施”,深度学习框架的重要性愈发凸显,大模型训练、推理等任务都离不开深度学习框架的优化与支撑。飞桨框架 3.0 号称从设计理念上实现了从底层硬件适配到顶层开发体验的全面进化,IT之家附具体介绍如下:飞桨提出的“动静统一自动并行”技术,大幅降低大模型开发训练成本,让算法创新

Veo 2重磅登陆Gemini API:AI视频生成革命正式启航

近日,谷歌旗下人工智能团队宣布,其备受瞩目的视频生成模型Veo2正式通过Gemini API向开发者开放。这一消息迅速在科技圈掀起热潮,标志着AI视频生成技术迈入了全新的发展阶段。据悉,从即日起,凡是启用计费功能并达到Tier1及以上级别的开发者,均可通过API调用Veo2,体验其强大的文本到视频(Text-to-Video)和图像到视频(Image-to-Video)生成能力。这一举措不仅为开发

广州出现AI洗头店:19元一次 13分钟全自动洗护

快科技4月14日消息,据国内媒体报道,近期广州出现不少AI洗头店”,通过全自动设备为顾客提供智能化头部洗护服务。和理发店洗头感受类似,顾客只需要躺到床上即可,而且还升级了按摩床。将头发放到清理箱内就能清洗,可选速洗、普通、加时、淋水、养护等模式及低、中、高力度,还能根据发长选长发或短发模式。机器会借助红外感应定位头部,配合多角度出水口,在运作的过程中不断调节方位,以达到全方位冲洒、清洁头皮,约

全国首个开源鸿蒙智慧楼宇样板点发布:自动调节灯光空调,访客轨迹实时追踪

IT之家 4 月 29 日消息,在今日的第八届数字中国建设峰会期间,福州市城乡建总集团有限公司(以下简称“城乡建总”)与深圳开鸿数字产业发展有限公司(以下简称“深开鸿”)联合打造的全国首个基于开源鸿蒙的智慧楼宇样板点在福州建总大厦正式发布。这一项目以“让建筑成为可进化的智慧有机生命体”为目标,通过开源鸿蒙技术重构楼宇管理模式。深开鸿介绍称,城乡建总与深开鸿深度合作,以开源鸿蒙技术为核心、以“开鸿