谷歌工程副总裁、Gemini模型联合负责人诺姆·沙泽尔(Noam Shazeer)在社交平台宣布,将离开工作多年的谷歌,加入人工智能领域另一家头部企业OpenAI,担任新设立的架构研究负责人一职。这一消息引发行业广泛关注,毕竟沙泽尔是现代人工智能领域关键技术Transformer架构的核心作者之一。
沙泽尔的职业生涯与谷歌有着千丝万缕的联系,堪称一段充满波折的“缘分”。2000年12月,他加入谷歌,成为公司早期软件工程师团队中的一员,参与的重要项目之一是改进谷歌搜索的拼写纠错系统。不过,他的兴趣并不局限于搜索领域,对人工智能的探索热情始终未减。2009年,沙泽尔曾短暂离开谷歌,几年后因一次偶然的契机,在谷歌总部与杰夫·迪恩(Jeff Dean)及早期谷歌大脑团队成员共进午餐时,被深度学习领域的研究氛围重新吸引,于2012年再次回归谷歌。
回归后的沙泽尔迎来了职业生涯的重要转折点。2017年,他与阿什什·瓦斯瓦尼(Ashish Vaswani)、尼基·帕尔马尔(Niki Parmar)等七位研究者共同发表了论文《Attention Is All You Need》,提出了Transformer架构。这一架构的提出,彻底改变了人工智能领域的发展轨迹,从GPT到Claude,从Gemini到几乎所有主流大模型,其底层结构都离不开Transformer,沙泽尔也因此成为现代人工智能发展史上的关键人物。
除了Transformer架构,沙泽尔在人工智能领域还有诸多重要贡献。他很早就开始推动稀疏混合专家模型(MoE)的发展,这种模型的核心思想是根据不同输入调用不同“专家”模块,在扩大模型容量的同时有效控制计算成本,如今已成为大模型扩展和效率优化的重要方向。
2021年,沙泽尔与谷歌同事丹尼尔·德弗雷塔斯(Daniel De Freitas)离开谷歌,创办了Character.AI。据传,此次离开的导火索是谷歌拒绝公开发布他们参与开发的一款聊天机器人Meena。这款产品旨在让AI能够围绕广泛话题展开自然对话,沙泽尔曾在内部备忘录中预测,这类聊天机器人有可能取代谷歌搜索,创造数万亿美元的收入。然而,谷歌出于安全性和公平性风险的考虑,并未选择发布它。这一决定对于沙泽尔来说,无疑是一个巨大机会的错失,最终促使他离开谷歌,投身创业。
Character.AI在沙泽尔的带领下迅速崛起。2023年3月,该公司完成1.5亿美元融资,估值达到10亿美元,其主打产品是各种可对话的AI角色,用户可以与实用助手、虚构人物甚至名人形象进行聊天互动。
或许是意识到沙泽尔团队在聊天机器人领域的技术价值,2024年,谷歌与Character.AI达成一项特殊交易。谷歌不仅获得了Character.AI的部分技术授权,还将沙泽尔、丹尼尔·德弗雷塔斯以及部分研究团队带回谷歌DeepMind。为了达成这笔交易,谷歌付出了约27亿美元的代价,沙泽尔也因持有Character.AI股份,在此次交易中获得了数亿美元的收益。回归谷歌后,沙泽尔加入Gemini核心领导层,担任谷歌工程副总裁、Gemini模型联合负责人,参与谷歌最重要的大模型研发工作。
然而,不到两年时间,沙泽尔再次做出职业选择,离开谷歌加入OpenAI。OpenAI首席研究官马克·陈(Mark Chen)表示,沙泽尔将担任新的架构研究负责人,这一岗位聚焦于前沿模型竞争中最底层的问题。近年来,大模型行业单纯依靠扩大预训练规模的边际收益逐渐下降,Transformer架构的短板也开始显现。例如,模型在长上下文处理中虽能检索信息,但并不等同于真正拥有记忆能力;思维链虽能提升模型推理能力,但本质上是昂贵的补丁。谷歌DeepMind的论文《The Topological Trouble With Transformers》也指出,纯前馈Transformer在动态状态追踪上存在结构性短板。
在此背景下,行业逐渐形成共识,下一代模型不能仅仅是更大的Transformer,而需要具备更强的计算组织能力、状态维护能力以及在推理过程中更新对世界表示的能力。沙泽尔的加入,对于OpenAI来说意义重大。他拥有丰富的经验,涵盖Transformer、MoE、大规模训练、高效解码、对话模型、基础模型工程等多个领域,并且在谷歌这种超大规模系统中积累了多年的架构直觉。这些经验将有助于OpenAI在前沿模型研发中,从“小实验”走向“大系统”,将有潜力的结构放大到真实训练系统里,转化为成本优势,打开下一代能力。
沙泽尔的离开对谷歌而言无疑是一大损失。谷歌拥有强大的研究团队、完善的工程体系、先进的TPU和数据中心以及庞大的产品入口,但在AI行业窗口期极短的当下,谨慎的决策风格可能导致机会的流失。而OpenAI在面对Anthropic等竞争对手的压力下,正积极补强人才。此次沙泽尔的加入,将助力OpenAI在模型底层能力上进一步提升,在激烈的市场竞争中争取领先地位。























