AI人物 9小时前 73 浏览次数 0 评论

18岁天才少年,登上Nature封面!

新智元
新智元

发布了 391 文章

编辑:KingHZ 好困

【新智元导读】DeepSeek-R1荣登Nature封面,成为史上首个经严格同行评议的大模型。年仅18岁的天才少年涂津豪作为作者之一,以实习生身份参与其中,他的故事从高中生到Nature作者,堪称励志传奇。

DeepSeek登上Nature封面,DeepSeek-R1成为史上第一个经过严格同行评议的大模型。

梁文锋作为唯一通讯作者发了Nature,自然是名声鹊起,一夜刷屏。

不过,在一众作者中,Jinhao Tu的现在的通信地址竟是所中学,他是谁?到底什么来头?

有媒体发现Jinhao Tu就是涂津豪——

DeepSeek的实习生、建平中学国际部的毕业生、威斯康星大学麦迪逊分校2029届本科生、2024阿里数赛AI赛道全球第一名获得者。

2025年1月 - 2025年2月,在DeepSeek实习了两月,恰好赶上了DeepSeek团队在研究推理模型R1。

于是,年仅18的涂津豪成为这次Nature封面文章的作者之一。

之后,他还在腾讯做过实习生,主要研究推理模型的高级自主能力(agentic ability)。

去年,还是高中生涂津豪已出圈:获得了2024阿里数赛AI赛道全球第一名,还通过神级提示词工程把Claude 3.5改造成推理模式


神级提示:Claude 3.5变「OpenAI o1」


简单来说,这个提示词能让Claude 3.5 像o1那样思考,但思维过程更细腻、更有人情味。

它甚至模仿o1的思考方式,你还可以根据需要展开或折叠其思考过程。

有了这个提示词,Claude 3.5变得异常强大。它的智力、准确度和拟人化程度都得到了巨大提升。

这让人震惊:17岁的少年,真是望尘莫及。

Claude本身已经很强了,而涂津豪想为它注入一种类似o1的人类化思考模式。

涂津豪:思考模型是好模型

他的灵感起源于人类的「意识流」。

于是,他写出了第一版思维链提示词。

然后,他把提示词输入Claude,让模型给出建议。

就这样重复了80多次,不断优化、不断打磨——最终版Thinking Claude来了。

上下滑动查看

把这个提示词发送给Claude后,你就可以问它任何问题了。

虽说,能看到Thinking Claude的思考过程,本身很酷。

但他也意识到,不是人人都想在屏幕上看到这些冗余的细节。

他想完全复刻o1,因此又加上了「展开/折叠」的功能。

凭借Claude的强大性能,结合Thinking Claude思维模式的加持,再配上强大的Artifacts功能,称它为「完全体o1」也绝不为过。

在GitHub上,他开源了相关项目,斩获15k多星。

开源链接:https://github.com/richards199999/Thinking-Claude

关于AGI的思考


在个人博客上,他发表了关于安全和AGI的一些思考。

他真心相信,像对齐、训练后的安全这样的措施是人类生命的守护者。

它们可以为模型容量、为内部的「魔王」设置一个护栏;就像把模型锁在笼子里,人类可以从外面研究它,而不让它伤害我们。

而关于AGI,他认为相当抽象。「通用」的边界究竟在哪里?就连Anthropic提出的ASL分类标准都显得模糊。

他认为实现AGI并不意味着需要打造一个在所有领域都超越人类的系统,而是需要创造出在大多数领域超过普通人类水平的AI。

但在此之前,必须确保AI系统能够真正理解:

  • 谜语
  • 笑话
  • 网络梗图
  • 成语典故
  • 特定文化背景的内容

这些看似不重要的能力,恰恰能反映模型最基础且关键的语言理解水平。

现有的语言模型本质上是下一个词预测系统,除非真正理解文字背后的模式,否则无法准确处理上述内容。

如果模型在词预测方面表现出色,或真正领悟了文字背后的奥秘,那么它很可能具备全面的强大能力。


95后罗福莉

现在是独立研究者


论文中还有一位作者——罗福莉,也曾在去年12月引发过全网的热议。

当时,有传闻称「小米开出了高达千万级的薪酬,挖她去AI大模型团队」。

不过,从论文上看,她目前的身份是一位「独立研究者」。

虽然去向成迷,但罗福莉在学术领域的表现,却是实打实地亮眼。

根据公开资料,她此前在北京师范大学获得计算机学士学位,并在北京大学计算语言学研究所获得计算语言学硕士学位。

她在AI国际顶会ACL上,曾一次性发表了8篇论文(其中2篇为第一作者),提出的词义消歧方法和文本风格转换框架在业界引发轰动。

随后的职业生涯,同样一路高歌猛进:

  • 2019年加入阿里达摩院后,主导了多语言预训练模型VECO的开发
  • 2022年加入DeepSeek,并参与了DeepSeek-Coder、DeepSeek-V2、DeepSeek-Coder-V2、DeepSeek-V3、DeepSeek-R1等几乎所有重要项目的研发

从谷歌学术主页可以看到,她所参与论文的被引数已高达10140次。

新智元

新智元

391 文章 56839 浏览次数 69870 粉丝

评论 (0)

睡觉动画