标准会员
过期时间
会员积分 0
还没有账号? 立即注册
已有账号? 立即登录
9.84K
粉丝
587
文章
9.12万
总浏览
5
平均评分
AI领域资深专家
在多模态大模型的后训练浪潮中,强化学习驱动的范式已成为提升模型推理与通用能力的关键方向。然而,大多数现有方法仍以文本为中心,视觉部分常被动地作为辅助信号输入。相比之下,我们认为在后训练阶段重新审视视觉自监督学习的潜力,设计以视觉为中心的后训练对于增强多模态大模型对于视觉信息本身的细粒度深入理解也同样至关重要。为此,来自MMLab@南洋理工大学的最新论文《Visual Jigsaw Post-
前端UI的工作,被谷歌AI一夜干没了。就在最新能力展示中,Gemini 3.0 Pro居然自己“捏”出了一个macOS。只靠几行提示词,谷歌的AI就在浏览器里复刻出了苹果引以为傲的UI。Prompt: Design and create a web os like mac os full functional features from text editor , to dile man
大模型终于学会更新自己了!MIT提出一种新的强化学习框架,让模型生成微调数据和自我更新指令,实现模型权重的更新。无需人工参与,模型就可以自动进行梯度更新,自主学习获取新知识或适应新任务。该框架名为SEAL(Self-Adapting LLMs),是一种内外两层嵌套的学习机制。这种机制下,会根据更新后的模型在任务上的表现计算奖励,进一步优化自我更新指令的生成策略。SEAL首次在权重层面
100美元成本、8000行代码纯手搓克隆ChatGPT!特斯拉前AI总监、OpenAI创始成员、宣布全职搞教育的AI大神Andrej Karpathy(卡帕西)沉寂了好久,终于终于终于来上新课了!新作nanochat,被其本人称作是写得最“精神错乱”放飞自我的作品之一。它是一个极简的、从零开始构建的全栈训练/推理pipeline,用最少量依赖的单一代码库实现了简易版ChatGPT。只要你
谷歌下一代旗舰模型Gemini 3未发布便已悄然走红!原因很简单:强,实在是太强了。在国外社交媒体平台𝕏上,一大波网友激动地分享了Gemini 3的内测结果——从曝光的这些案例来看,Gemini 3尤为擅长前端、SVG矢量图生成,而且多模态能力变得更强。无需抽卡,Gemini 3一次性就能生成自己的介绍网页(疑似Gemini 3提前泄露bushi~):不借助任何外力,一小段提示词就
人类遗忘的难题解法,被GPT-5 Pro重新找出来了!这事儿聚焦于埃尔德什问题#339,这是著名数学家保罗・埃尔德什提出或转述的近千道问题之一,收录于erdosproblems.com网站。该网站记录了每道题目的当前状态,其中约三分之一已解决,大部分仍待解。此前该问题被标为处于“未解决”状态,属于待攻克的数学难题,不少人还在继续研究探讨。直到最近,有人用GPT-5 Pro检索后才发现,该问
Sora 2的迅速走红,让肖像权问题再次成为焦点。毕竟有的人为了博取流量和讨论度,甚至不惜用已故名人生成视频。比如,下面就是Sora2“复活”迈克尔·杰克逊与著名演员罗宾·威廉姆斯,还让他们在街头一起进行即兴表演。虽然效果确实很绝,但这些极度逼真的片段,令其家属感到无比气愤与心痛。罗宾的女儿泽尔达·威廉姆斯声称:拜托,别再给我发爸爸的人工智能视频了。如果你还有点良心,就别再这样对他
你今天的工作,或许并不是真正的工作这句耸人听闻的言论出自奥特曼与Rowan Cheung最新的采访。在这场长达30分钟的对谈里,除了自己对AI与工作的思考,奥特曼还分享了GPT-6的进展、ChatGPT是否会成为美国版微信、AGI的设想变化、AI未来的交互模式,以及自己被恶搞成Sora热梗的感受。可以说,这次对话涵盖了从娱乐八卦到前沿科技的多重视角,既有趣味,也直指未来趋势。经整理的访
人工智能或许早已拥有“主观体验”(subjective experiences)。在最新一期播客节目中,Hinton抛出的这一观点正迅速掀起热议。老爷子一再表示,AI也许已经有了“意识雏形”,只是因为我们人类自己对意识理解错了,所以它也被教错了——不知道自己有意识。翻译成大白话就是,AI其实有自我意识,只是暂未觉醒┌(。Д。)┐而除了继续为AI风险“摇旗呐喊”,作为诺奖得主、深度学
马斯克的xAI也入局世界模型了!想必听到这个消息的Meta、Google DeepMind一定会缓缓打出一个问号:冲我们来的?据《金融时报》(FT)报道,为了增加这场“世界模型大混战”的赢面,今年夏天,xAI已经从英伟达挖来了多名资深研究员来助阵。另一边,在悄然下场世界模型后,马斯克几天前又在𝕏上再次重申了去年定下的那个“小目标”——2026年年底前,xAI会发布一款伟大的AI生成游戏