色诺芬笔记 色诺芬笔记
未分类 尚无浏览 2 分钟阅读

从爆亏千亿到史诗翻身——Gemini的逆袭之路

目录

一、本期核心人物

  • 德米斯·哈萨比斯:被称作“AI界奥本海默”,天赋型研究者,DeepMind创始人,Google DeepMind CEO,是Gemini逆袭的核心主导者。
  • 杰夫·迪恩:谷歌元老,原Google Brain掌舵人,后辞去管理职位转任首席科学家,回归技术研发。
  • 拉里·佩奇、谢尔盖·布林:谷歌创始人,在谷歌AI危机时被请回,助力内部重组。
  • 诺姆·沙泽尔:Transformer署名作者,被哈萨比斯以27亿美金请回,重新设计Gemini核心注意力机制。

二、关键时间线

  1. 2010年:哈萨比斯在伦敦创立DeepMind,使命是“先解决智能本身,再用它去解决其他一切问题”。
  2. 2013年:DeepMind的AI无预设规则自学雅达利《打砖块》并实现自动连击,被谷歌创始人拉里·佩奇看中。
  3. 2014年:谷歌以6.5亿美金收购DeepMind,哈萨比斯为DeepMind争取到伦敦总部、独立伦理委员会等主权独立条件。
  4. 2014-2023年(9年):DeepMind与Google Brain形成对立,陷入长期内耗。
  5. 2022年11月:ChatGPT发布,两个月用户破亿,直接威胁谷歌搜索广告帝国。
  6. 2023年2月:谷歌仓促推出Bard迎战GPT,宣传片中答错詹姆斯·韦伯望远镜基础问题,市值一夜蒸发1000亿美元。
  7. 2023年4月20日:Google Brain与DeepMind正式合并为Google DeepMind,哈萨比斯出任CEO,原Bard更名为Gemini。
  8. 后续:Gemini凭借核心技术突破,实现对GPT的技术碾压,成为谷歌AI核心及苹果AI底座。

三、核心内容拆解

1. 哈萨比斯的初心与DeepMind的诞生

哈萨比斯是天赋型选手,4岁学棋两周出师;12岁国际象棋比赛失利后,萌生“人类脑力不应被无意义消耗”的想法。2010年创立DeepMind后,2013年凭借AI自学《打砖块》的成果获得谷歌关注,2014年接受谷歌收购,核心诉求是借助谷歌的海量AI训练数据,推进自身AI研究。

2. 谷歌内部9年内斗:两大AI团队的对立

谷歌原本想让DeepMind(哈萨比斯主导)与Google Brain(杰夫·迪恩主导)“赛马”,却引发严重内耗,核心矛盾集中在三点:

  • 技术层面:双方各建代码库,参数互不互通,重复实验造成资金浪费;
  • 算力层面:Google Brain掌控TPU芯片集群,DeepMind使用算力需层层申请,限制研发进度;
  • 理念层面:DeepMind侧重AGI(通用人工智能)研究,认为Google Brain过于实用主义;Google Brain则认为DeepMind的研究对公司财报无实质贡献。

即便AlphaGo 4:1击败李世石让哈萨比斯声名大噪,Google Brain推出Transformer架构,双方依旧势均力敌,哈萨比斯始终没有产品发布、算力调配的实权。

3. 危机爆发:ChatGPT来袭与Bard的致命翻车

2022年11月ChatGPT的发布,打破了谷歌在AI领域的优势,其两个月破亿的用户增长,直接威胁谷歌核心的搜索广告业务,谷歌拉响红色警报。

为应对危机,谷歌在2023年2月仓促推出Bard迎战GPT,但在官方宣传片中,Bard答错了詹姆斯·韦伯望远镜的基础问题,引发舆论猛烈抨击,发布会结束后,谷歌市值一夜蒸发1000亿美元。

与此同时,OpenAI持续快速迭代,微软追加100亿美元投资,谷歌AI落后成为行业公认事实,其内部长期的技术内耗也被推到风口浪尖。

4. 破局关键:谷歌的内部整合与权力重构

为扭转颓势,谷歌启动关乎未来十年的架构重组,四大举措实现破局:

  • 创始人回归:CEO皮查伊请回隐退的拉里·佩奇和谢尔盖·布林,其中布林亲自参与工程开发,凝聚公司团队士气;
  • 团队合并:2023年4月20日,Google Brain与DeepMind正式合并为Google DeepMind,哈萨比斯出任CEO,原Bard更名为Gemini(双子星),寓意两大团队彻底融合;
  • 利益平衡:哈萨比斯获得谷歌AI资源的终极调配权,杰夫·迪恩辞去管理职位,转任首席科学家,专注技术研发,化解内部矛盾;
  • 重金揽才:哈萨比斯以27亿美金请回被谷歌赶走的Transformer署名作者诺姆·沙泽尔,其重新设计的Gemini核心注意力机制,让模型在低算力下实现比GPT更快更准的表现。

5. Gemini的三大核心技术命脉:实现技术碾压

哈萨比斯为Gemini定下三大核心技术,成为其击败GPT的关键,也是逆袭的核心支撑:

  • 树搜索强化学习:沿用AlphaGo的核心打法,AI会先构思多个答案版本,筛选逻辑最通顺、无漏洞的答案输出,在数学、编程等逻辑型任务上表现远超GPT;
  • 原生多模型:区别于行业内“先学文字,再学视听”的传统模式,Gemini从研发初期就基于YouTube视频、谷歌图片、网页文本等混合数据训练,可实现看图、听声、读字的无缝切换,跨界能力领先行业;
  • 自研TPU芯片:算力是AI研发的核心支撑,谷歌从2015年起自主研发AI芯片,Gemini落地时已用上第五代TPU,实现模型与算力的自主掌控;而OpenAI的算力仍依赖英伟达,存在供应与技术双重限制。

6. 逆袭成果

凭借内部的彻底整合的核心技术的精准突破,Gemini实现了对GPT的史诗级碾压,不仅成为谷歌自身的AI核心,更成功成为苹果AI的底座,帮助谷歌从AI赛道的落后者,重新夺回行业王座,完成了从爆亏千亿到史诗翻身的逆袭。

四、本期关键亮点

  • 谷歌AI的低谷:2023年因Bard翻车,市值一夜蒸发1000亿美元,陷入内耗与外部竞争的双重危机;
  • 逆袭的核心:并非单纯的技术突破,而是内部团队整合、权力重构+精准的技术布局双重作用的结果;
  • Gemini的核心优势:三大核心技术形成壁垒,尤其在逻辑任务、跨界能力、算力自主上领先GPT;
  • 关键人物的作用:哈萨比斯的战略主导、诺姆·沙泽尔的技术支撑,以及创始人回归的助力,缺一不可。

五、相关关键词

Gemini、谷歌、DeepMind、哈萨比斯、Google Brain、AI逆袭、GPT、Bard、TPU芯片、Transformer、AGI

https://www.xiaoyuzhoufm.com/episode/699112bca22480add62c3ef6

从爆亏千亿到史诗翻身,Gemini是怎么杀回王座的?
https://www.douyin.com/video/7606302545245392170

Gemini 3登顶,一文快速看懂谷歌AI如何逆风翻盘 | 巴伦精选

过去三年,谷歌的AI故事堪称一部跌宕起伏的“逆袭”故事。

从2022年底ChatGPT掀起的行业地震,到2023年Bard的“翻车”危机,再到今天Gemini 3的绝地反击。人们不禁好奇,这家科技巨头在AI浪潮中经历了怎样的卧薪尝胆,才成就了今天的蝶变?

在Gemini 3发布震动行业的日子,我们一起来回顾谷歌的逆袭之路。

谷歌AI大事记

2023年:危机与觉醒

2022年11月30日,OpenAI发布ChatGPT的那一刻,谷歌总部陷入罕见的集体焦虑。这款基于Transformer架构的聊天机器人,以近乎“人类化”的对话能力迅速引爆全球,而谷歌引以为傲的LaMDA模型却因“幻觉问题”和商业化迟缓陷入被动。

12月,谷歌启动代号“代码红”的紧急计划,抽调100名工程师组成“Bard突击队”,目标是在100天内推出对标产品。时任搜索业务副总裁的Sissie Hsiao带领团队打破部门壁垒,整合搜索、Assistant和DeepMind资源,甚至临时调用数据中心极限算力。

次年2月,谷歌仓促推出基于LaMDA的聊天机器人Bard,在演示中误称“詹姆斯·韦伯望远镜拍摄首张系外行星照片”,导致Alphabet股价单日暴跌8%,市值蒸发超1000亿美元,这一事件成为谷歌AI战略滞后的公开警示,暴露了其在产品化与危机公关上的双重短板。

4月,DeepMind与Google Brain合并面对OpenAI的强势冲击,谷歌将两大核心AI团队DeepMind(强化学习与多模态研究)与Google Brain(Transformer架构与基础设施)合并为Google DeepMind(GDM),由戴密斯·哈萨比斯(Demis Hassabis)担任CEO,杰夫·迪恩(Jeff Dean)转任首席科学家,此次整合终结了内部资源分散与技术路线竞争,为Gemini模型的集中研发铺平道路。

8个月后,Gemini 1.0发布首个原生多模态模型,在57项MMLU测试中90%超越人类专家,支持文本、图像、音频、视频交互,但其初期因“过度多样化”策略引发市场疑虑,股价波动幅度达12%,被质疑技术路线过于激进。

2024年:迎头赶上

2月,Bard正式更名Gemini,原Bard团队并入GDM,标志着其AI品牌向Gemini系列集中。同步推出的Gemini Advanced(19.99美元/月),支持代码编写、数据分析等复杂任务,首月付费用户突破500万,其API调用量在OpenRouter平台占比达35%,超越Claude 3和GPT-4。

5月,Veo 3视频模型发布,对标Sora,支持1080p分辨率、60秒动态生成,画面细节与物理模拟能力接近OpenAI Sora,其音画同步技术被《好莱坞报道》评价为“突破影视制作传统流程”。

12月,Gemini 2.0发布。轻量级模型Gemini 2.0 Flash免费开放,API调用量反超Claude 3和GPT-4,集成“深度研究”功能,支持长文本解析与多步骤推理,在LeetCode编程测试中准确率较GPT-4提升18%,开发者生态初具规模。

2025年:全面反扑

3月,Gemini 2.5 Pro登顶LMSYS Chatbot Arena榜单,评分超越GPT-4o和Claude 3 Opus,同时制霸文本、视觉、Web开发三大榜单,被称“三连冠”,其数学推理能力在国际数学奥林匹克竞赛(IMO)中以35分(满分42分)超越GroK 4和OpenAI o3。

5月,I/O大会上发布Gemini 2.5 Pro,集成“深度研究”功能,上线249.99美元/月的“Google AI Ultra”订阅,含高级工具调用权限,同时推出AI眼镜原型Project Aura,其端侧计算能力支持实时AR导航与多语言翻译,被视为消费级AI硬件的里程碑。 

9月,搜索上线“AI模式”支持多模态查询(文字+拍照+语音),直接生成包含行程、费用、用户评价的“一站式答案”,搜索广告收入同比增长10.4%,用户平均查询时长从15秒延长至42秒,证明AI对核心业务的重塑能力。

11月,谷歌再次抛出重磅炸弹。Gemini 3 pro在数学、推理、多模态与Agent工具指标等多维度关键指标上全面超越同级别竞品,引发了行业巨震。OpenAI CEO奥特曼罕见发推表示祝贺。 

至此,谷歌完成了从追赶者到领跑者的逆袭之路。

谷歌AI的组织、人才与投入

谷歌在模型上的戏剧性逆袭的背后,是其重大组织架构调整、激进人才策略与巨额研发投入的胜利。

首先,从2023年至今,谷歌AI板块架构经历了从分散到集权的巨大变化。

2023年4月之前,谷歌的AI板块还是DeepMind与Google Brain两个独立团队的双轨制架构,人才与算力都分散在两支团队,因此形成的开发重叠与算力浪费引发了巨大争议。4月,两支团队正式合并,成立GDM,哈萨比斯任CEO,迪恩升任首席科学家,专注基础研究,原Brain团队负责工程落地,DeepMind团队主攻算法创新,形成“基础研究-产品开发”双螺旋结构。

2024年2月,brad团队正式并入GDM,同时更名Gemini,形成GDM的第三极力量。搜索与广告业务高管Raghavan升任CTO,强化技术-产品协同,设立“AI作战室”实时同步模型性能数据,高管每日晨会汇报进度,决策链条缩短至48小时。

“三国归晋”的局面,不但集中了谷歌的所有研发力量和资源,同时形成了算力—算法—应用的生态闭环,也在品牌上将所有谷歌AI的产品线统一到了Gemini,这也极大程度地提升了市场对于谷歌AI生态的认同。后期全球多家科技巨头都效仿其品牌统一与生态协同的AI生态策略。

另一方面,谷歌的AI生态的逆袭也离不开三位关键人。

首先是DeepMind创始人哈萨比斯,他主导了Gemini战略,并用“科学发现驱动产品”的理念重塑谷歌AI文化;第二位当属谷歌的首席科学家迪恩,他推动Transformer架构优化,并主导制定《AI负责任开发白皮书》;另一位则是2025年空降的首席AI架构师。

还有就是科雷·卡武克乔格鲁(Koray Kavukcuoglu),曾主导Meta MLC研究,推动Gemini与TPU深度绑定,其“硬件—模型协同设计”方法论降低训练能耗25%。

以三位核心关键人为核心,谷歌在挖人和薪酬设计的动作上也非常激进。2024年,以200万美元的签字费和0.8%的公司期权,从Open AI挖角洛根·基尔帕特里克(Logan Kilpatrick,Gemini开发者生态负责人)和诺姆·沙齐尔(Noam Shazeer,Gemini技术联合负责人),一度成为当时最大手笔的挖角动作。

另外,据公开信息显示,谷歌给团队内的顶尖科学家们开出的平均薪资高达200-300万美元(含股票),高于微软、Meta的平均薪资水平约20%-30%,核心团队还可获0.5%-2%公司期权。大手笔的薪酬体系无疑为谷歌AI的快速崛起打下了坚实的人才基础。 

而高薪的另一面,也是谷歌抛弃了一贯的轻松工作文化,转而加入了“内卷”文化的极大牺牲。有媒体报道称,Bard团队每周工作90小时,推行“996敏捷开发”机制,而且还有30%的淘汰率考核。2024年,谷歌甚至因为高压的工作环境引发员工抗议“过度加班”,硅谷工会发起“AI劳工权益运动”。谷歌被迫调整弹性工作制,增设“心理健康日”。 

除了大刀阔斧的架构调整和激进的人才策略,谷歌在研发费用上的不计成本也成为行业难以复制的壁垒。

2023年谷歌财报数据显示全年支出315亿美元,三方机构Counterpoint报告显示其中AI相关占比6.8%,仅21.4亿美元;2024年财报数据显示支出525亿美元,三方机构LESG(路浮特)报告显示AI相关占比55%,约290亿美元;2025年,根据第二季度财报电话会议记录预测,全年支出预期900亿美元,AI相关占比约65%,预计约585亿美元。

以2024年的数据横向比较,据The information报道数据,Open AI全年支出约75亿美元;而eMarket数据显示,Meta的支出约为100亿美元。相比之下,谷歌遥遥领先的投入也注定了在AI生态上的一骑绝尘的发展速度。

结语 

从Bard的惨败到Gemini的登顶,谷歌证明了自己AI策略的有效性,极大地激励了科技大厂在AI上继续坚定地投入。但面对OpenAI的激进创新、Meta的开源围剿,谷歌能否守住王座,仍取决于其后持续投入的能力与“生态开放性”的建设。正如《麻省理工科技评论》所言:“谷歌从未真正失去AI领导权,它只是需要一场漂亮的翻身仗来证明自己。”而Gemini 3的横空出世,或许只是这场战役的一个节点而已。(作者|陶天宇,编辑|李程程)

钛媒体APP

2025-11-19 20:41发布于湖北钛媒体APP官方账号
https://news.qq.com/rain/a/20251119A06LUQ00

0

  1. 此文章尚无评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注