

不到一个礼拜,接连两位分量级职工齐离开了谷歌。
前有Google DeepMind工程副总裁诺姆·沙泽尔(Noam Shazeer),后有AlphaFold中枢负责东谈主约翰·江珀(John Jumper)。
讲真是,我很难不怀疑谷歌当前“出BUG”了。
从Gemini 3问世,到当前齐当年泰半年了,谷歌照旧只须分手不大的Gemini 3.1。你再望望Anthropic这边,半年前还只是Opus 4.5,当前Fable 5齐停用一个得体拜了。
不单是模子掉队,产物也随着掉队。如今简直所有的AI公司齐在发力AI Agent,OpenAI有Codex,Anthropic有Claude Code。
Fable 5加握下的Claude Code,当前齐能自主修bug,自动轮回跑测试直到全绿,还能从诡计稿顺利生成分娩代码,临了封装成完好的软件。
而谷歌这边,只须一个拿不入手的Antigravity 2.0,不仅效用倒霉,使用体验也说来话长,网上对这个产物只须一派骂声。
说到这里就不得不提一件事,伯克希尔从2025年就启动建仓谷歌,到了2026年第一季度,伯克希尔把谷歌的握仓又加了224%。
2026年6月1日,伯克希尔以定向增发的神志向谷歌母公司Alphabet再投了100亿好意思元。
难谈这回巴菲特真是看走眼了?
01
谷歌的全栈上风怎么没了?
2025年11月18日,谷歌发布了Gemini 3。皮查伊切身出来站台,说这是谷歌“最智能的模子”,领有全球最顶尖的推理才智,多模态聚会,还有代码生成才智。
于是在统一天,谷歌还放出了另外两样东西:一个是Google Antigravity,堪称“agent-first”的开垦平台;一个是Nano Banana Pro,它是谷歌此前爆火的文生图模子Nano Banana的威力加强版。
其时的谷歌有多吓东谈主?这样说吧,在谷歌这场产物发布会兑现后两个礼拜,奥特曼向OpenAI里面发出“Code Red(红色警报)”备忘录,称ChatGPT的产物体验与质地上风正在被谷歌快速追近,因此全公司暂停所有其他业务,聚会全员干涉到ChatGPT当中。
奥特曼操心的不单是这三个产物,而是谷歌的全栈上风。
在硬件上,谷歌有自研的TPU芯片。谷歌从2015年就启行为念TPU,到今天如故到了第七代Ironwood,一颗芯片顶当年四颗的算力,液冷散热,一个pod塞进去9216颗芯片,提供42.5 ExaFlops的算力。
和英伟达那种通用的GPU不同,TPU是挑升为AI推理任务进行过优化的,资本低,何况性能更好。
再往上一层是DeepMind。
2023年4月,谷歌把Google Brain和DeepMind合并成了一个单元。此前,这两家天然是统一家公司,但耐久以来是两套体系、两套文化,Brain偏产物和交易化,DeepMind偏耐久探求。
合并之后,哈萨比斯长入带队,杰夫·迪恩(Jeff Dean)退居首席科学家。也等于说,谷歌的“傍边脑”合一了。
不竭往上,还有一层好多东谈主容易忽略的东西:进口。谷歌不是只须模子,它有Chrome、Android、YouTube、Google Maps、Gmail、Google Workspace、Google Search。
这些东西加起来,日活几十亿。全全国莫得任何一家AI公司领有这个量级的用户。它能通过进口去铺产物,再用这些老到的产物拿到用户响应,加速所有这个词产物的开垦迭代。
比如用户在哪一步退出了,哪种才智被反复调用,哪些生成放手被用户改掉了或者顺利烧毁了,哪些功能造成了留存,哪些场景出现无数报错和投诉。

就拿Nano Banana来说。
这个产物天然体量终点小,可是它其实是通过谷歌的全栈,领有我方一个完好飞轮。
Nano Banana刚刚在LM Arena一类的盲测环境里走红后,谷歌作念的第一件事等于把它坐窝上线到Gemini App、AI Studio、Gemini API当中,以致连挑升面向企业的Vertex AI也没放过。
用户不仅能通过各式产物感受Nano Banana,谷歌还能用这些产物采集响应,这也等于为什么Nano Banana产物迭代速率那么快,碾压GPT-4o的作图才智。
那为什么到当前,谷歌的全栈上风没了呢?
文生图是一个低风险、短链路、放手坐窝可见的产物。
用户输入一句话,几十秒后获得一张图,不平静就重来,平静就共享。它不需要耐久回想,也不需要调用器具权限,更不需要为一次装假承担施行后果。
可是Agent不一样。它不是“给用户一个放手”,它是要绝对预防进用户的责任环境,握续读取高下文、调用器具、实行操作,并对临了的放手负责。
Nano Banana的奏凯并不成完全复刻到Agent了。
当产物需要跨模子、权限、实行环境、企业系统和耐久背负时,谷歌那套本来雄伟的全栈才智,启动显理解相助不起来的问题。
02
谷歌真确的病是组织架构太零星
如果你去翻谷歌的开垦者产物线,你会发现一个很诡异的抖擞。谷歌同期有好几个器具,齐在帮你用AI写代码,产物功能简直齐访佛了。
Gemini CLI,一个号令行器具,不错查代码库、生成期骗、自动实行复杂经过,2025年底随Gemini 3沿途推出。到了2026年6月,谷歌发了个公告:Gemini CLI行将被Antigravity CLI取代。
Jules,一个异步编码Agent,Google Labs出品,定位是自动帮你修bug、写测试、提Pull Request。它不需要你盯着看,2026年世界杯官网你把任务扔给它,它我方克隆仓库、写代码、开PR,干已矣见知你。
Code Assist,Google Cloud旗下的企业级编程助手,装在VS Code和JetBrains里用,收费22.8到54好意思元一个用户一个月。Firebase Studio,浏览器里的全栈开垦责任台,内置了Gemini,也能帮你生成代码。
然后是耐久扶不上墙的Antigravity,前文也提到了,2026年5月I/O大会上又发了个2.0版块,分了桌面App、CLI、SDK、Managed Agents、企业层五块。
它们齐在作念统一件,但它们是不同团队作念的,有不同的品牌名,有不同的进口,有不同的收费格式,以致有的在彼此替代。
这种情况根蒂就不叫产物线丰富,这叫糟践算力。
这件事的根源其实是在组织架构层面。
谷歌的AI Agent有关才智,被拆分在至少几个互不统属的组织手里。每个组织有我方的KPI,沉寂的陈述线。

比如Google DeepMind,它管的是模子在benchmark上的分数能不成压过GPT和Claude。DeepMind的奏凯是“咱们作念出了最强的模子”。
它根蒂不体恤用户在Antigravity里完成一个确切项观点奏凯率是若干。
到了Google Labs部门,它只管这个东西酷不酷,能不成在酬酢媒体上激发探求。
Google Labs的产物有CC(Gmail里的AI助理)、Project Genie(无穷全国生成)、Pomelli(AI营销器具)、Opal(天然话语作念小期骗),以及Jules。
实验跑已矣,热渡当年了,团队可能去作念下一个实验了,它不会对产物进行耐久追究。
Google Cloud和Vertex AI管的是模子能不成通过API调用,企业能不成采购,权限和合规有莫得秘密,Agent能不成部署到分娩环境。
Antigravity更惨,它是从Google DeepMind里面走出来的,当前归Google Labs追究。可是又必须接入Google Cloud的权限、部署和合规体系。
是以谁也不会对它负责,就这样摆烂。
你可能会问了,那到皮查伊这关可怎么办?
DeepMind说,咱们的模子又刷榜了。Labs说,Jules在酬酢采集上又有10万转发了。然后Google Cloud那边说,Agent Engine又签了若干个企业客户。Gemini App说,这个月的DAU稳住了。Search说,AI Overviews用户破20亿。
各人的饭碗齐保住了,却临了留给Antigravity一地鸡毛。
但莫得东谈主能回应一个最肤浅的问题:一个开垦者,今天应该用谷歌的哪一个器具来完成他的责任?如果他当前用的是Codex或者Claude Code,谷歌准备用哪个产物把他抢过来?
03
评测赢了,不等于任务真是委派了
谷歌当前所有的叙事齐只围绕着评分,但当前各人早就不迷信benchmark了,能委派任务的才是好模子。
模子在benchmark上分数高,比如它推理题能答对,代码能生成,图像能看懂,多轮对话能保握连贯。
这些测试时时是在受控环境下进行的。单轮或有限轮次,输入输出干净,不需要操作外部器具,不需要科罚权限,不需要万古辰握续运行。
失败了的进展是什么?谜底不合。最坏的放手,等于重来一遍。
可是到了任务委派这块,模子的价值变了。
用户把一个确切的责任扔给AI,到临了拿到了一个能用的放手,中间的链条其实口舌常长的。
什么叫“确切的责任”?是“这个项观点支付模块有个bug,请定位、建筑、测试、提交PR”。它触及多个要津,可能要花几十分钟以致几个小时,中间需要调用Git、末端、浏览器、文献系统、API,每一步齐有失败的可能。
失败了的进展是什么?不是谜底不合,而是代码改坏了、权限控不住了、经过卡死了、环境崩了、用户不知谈从何处规复。
2026世界杯中国线上平台我举个例子。
假定一个模子在单步判断上的正确率如故有95%,看起来很强;但一个确切开垦任务若需要连气儿完成20个枢纽要津,全部不出错的概率只须0.95^20,约等于36%。
哪怕单步正确率进步到98%,20步全程奏凯完成的概率也只须约67%。
是以Agent产物真确的护城河,不是把benchmark再刷高两分,而是给装假规复、情景保存、权限阐述、东谈主工接受、回滚和放手考据作念出可靠机制。

可是Antigravity齐2.0了,照旧莫得类似且完好的机制。
你去读Gemini 3的官方博文,皮查伊切身写的发轫,背面随着的全是benchmark对比表。
可是你当前如果去看OpenAI和Anthropic对于新模子的官方博文,里面足够是各式客户对模子的评价。
不是说benchmark没用。benchmark天然灵验,它是一个尺子。但如果一个Agent产物的全部叙事齐围绕benchmark伸开,那就讲明这个模子如实干不了活。
谷歌不可能烧毁AI Agent,因为这个板块真是太赢利了,不信你望望友商们就懂了。
2026年2月,OpenAI的Codex,沉寂桌面App上线后首周下载量超过100万。只是过了两个月,Codex周活用户就达到了400万
Claude Code就更毋庸说了,Anthropic在2月份的融资材料中就示意,该产物的年化收入如故松弛了20亿好意思元。
Antigravity 2.0发了一个多月了,当前通达它的官网,你会发现照旧莫得企业版的订价。
Claude Code不错通过Claude Team按东谈主头付费,Codex不错走GPT Business或者ChatGPT Enterprise,一样是按东谈主头收费。
到了谷歌这里,企业若是思用Antigravity 2.0,你只可走Gemini Enterprise Agent,它会支柱你一些额度让你拿手上玩玩,并不成像OpenAI和Anthropic那样,把它变成一个收费的产物。
是以我猜沙泽尔和江珀离开谷歌2026年世界杯官网,省略亦然因为对这家公司失望了。