铭鸿体育资讯网

谷歌TPU十年逆袭:从“不可能任务”到AI巨头的核心底气 谁能想到?一个靠广

谷歌TPU十年逆袭:从“不可能任务”到AI巨头的核心底气


谁能想到?一个靠广告躺着赚钱的软件公司,居然花十几年死磕芯片,造出了一颗不进手机、不进电脑,却撑起半个AI时代的“隐形王者”!阿尔法狗击败李世石、柯洁,Gemini大模型惊艳亮相,谷歌搜索精准匹配,背后都有它的身影——这就是谷歌TPU,一颗从“不可能任务”里闯出来的AI芯片,见证了谷歌从软件巨头到AI硬核玩家的蜕变。


时间拉回2012年,彼时大模型还未问世,人工神经网络刚在科技圈兴起,谷歌大脑的“谷歌猫”项目让人们首次看到AI的潜力:海量视频喂养下,模型竟能自主识别猫。但喜悦过后,一个难题摆在眼前:如果把神经网络应用到语音搜索,仅用户每天3分钟的使用量,就需要谷歌数据中心算力翻倍,投入上百亿美元扩建机房,显然得不偿失。


当时,英伟达GPU已是AI算力的“屠龙刀”,价格疯涨、一卡难求,几乎所有公司都在跟风采购。但谷歌却偏要另辟蹊径,选择了一条最难走的路——自研AI芯片。没人看好这个决定,因为谷歌给芯片团队定下的KPI近乎离谱:从零开始,15个月内造出性能比GPU高10倍的芯片,这在芯片行业几乎是不可能完成的任务。


谷歌的聪明之处,在于没有跟风做“更强的GPU”,而是跳出通用计算的框架,聚焦AI最核心的矩阵乘法运算,打造专用集成电路——TPU。


如果说CPU是全能特级厨师,GPU是擅长批量作业的普通厨师,那TPU就是一台专门切羊肉的机器,不追求全能,却能把核心任务做到极致。其灵魂设计“脉动阵列”,像一条高效生产线,数据无需频繁访问内存,层层接力运算,让能效比实现质的飞跃。


功夫不负有心人,谷歌仅用15个月就造出初代TPU,在推理任务上比当时的NVIDIAK80GPU快15.3倍,能效比高出29倍;比HaswellCPU快29。2倍,能效比高出83倍,成功扛起谷歌内部多项AI业务的负载。


随后十年,TPU不断迭代升级:第二代加入训练能力,引入BF16数据格式,该格式后来成为AI训练的行业标准之一;第三代扩大规模,加入水冷技术;第四代引入光路交换,提升灵活性;第五代拆分效率版和性能版,适配不同需求;最新的第七代更是专为智能体AI设计,单芯片BF16算力达4614TFLOPS,支持192GBHBM内存。


如今,TPU早已不是谷歌内部的“秘密武器”,而是成为数百亿美元量级的核心业务。Meta官宣投10亿美元采购,Anthropic计划通过博通投入210亿美元购买100万块TPUv7p,苹果的部分AI模型据传考虑采用TPU训练部署方案。


这颗曾被视为“玩票”的芯片,如今成为科技巨头摆脱英伟达依赖的关键。谷歌用十年证明,真正的AI霸权,从来不是靠采购别人的“武器”,而是手握自己造的“底气”,而TPU,就是谷歌在AI底层话语权争夺中,最锋利的筹码。