科技财经时报2026年04月23日 11:23消息,谷歌云Next大会发布TPU突破内存墙,OCS与液冷技术引关注。
当地时间周三,美国云服务巨头谷歌云在2026年Next大会上发布了一项旨在推动企业工作流程全面转向智能体的“代理式企业”(AgenticEnterprise)技术体系,包括第八代TPU、智能体软件平台等系列前沿创新。

发布会伊始,谷歌首席执行官皮查伊在一段预先录制的视频中再次强调了资本支出的大幅增加,表示今年将投入1750亿至1850亿美元,这一数字是2022年310亿美元的近6倍。

皮查伊指出,谷歌已正式进入“智能体工作流程”阶段。截至2026年4月,这家科技巨头已有75%的新增代码由AI生成(并经过工程师审阅和批准),这一比例较去年秋天的50%有了明显提升。 从当前的发展趋势来看,AI在软件开发中的角色正在加速深化。这种变化不仅反映了技术能力的提升,也意味着企业对自动化工具的信任度在不断提高。然而,尽管AI生成代码的比例持续上升,人工审核仍然是确保质量和安全的关键环节。这表明,AI虽强大,但尚未完全取代人类在复杂系统中的判断与决策作用。未来,如何平衡AI效率与人工监督,将成为科技公司需要持续探索的重要课题。

随后发布会进入正题。

在VertexAI平台的基础上,谷歌云周三推出了Gemini Enterprise代理平台,该平台专为构建、扩展、管理及优化AI代理而设计,是一个全面的解决方案。该平台整合了原有的模型选择、模型构建和AI代理创建功能,并新增了代理集成、开发运维、任务调度和安全性等新特性。

谷歌的第八代张量处理单元(TPU)继此前引发资本市场高度关注后,于周三早些时候正式拆分为两款不同的芯片,分别为面向AI模型训练的TPU8t和适用于推理任务的TPU8i。这一调整反映出谷歌在AI硬件布局上的进一步细化,旨在提升不同应用场景下的性能表现与效率。从技术演进角度看,这种分拆有助于企业更精准地匹配算力需求,也为开发者提供了更灵活的选择空间。

谷歌高级副总裁Amin Vahdat在介绍中提到,目前单个TPU8t集群的规模已扩展至9600枚芯片,配备2PB的共享高带宽内存,芯片间的互联带宽相比上一代提升了整整一倍。这一架构可提供121ExaFlops的算力,使最复杂的模型能够通过统一的超大规模内存池进行计算。
除了原始算力外,TPU 8t还有一整套可靠性、可用性与可维护性(RAS)能力的设计,包括覆盖数万枚芯片的实时遥测监控、在不中断任务运行的情况下自动检测并绕过故障的ICI互联链路,以及能够在无需人工干预的前提下围绕故障自动重构硬件拓扑结构的光路电路交换(OCS)技术。
整体而言,TPU 8t阵列的计算性能较上一代Ironwood几乎提升了3倍,每瓦性能提升至最多两倍。
TPU8i是谷歌在“突破内存墙”方面的重要成果。为防止处理器处于空闲等待状态,TPU8i配置了288GB高带宽内存(HBM)和384MB片上SRAM——这一容量是前代产品的三倍,从而确保模型的活跃工作集能够完全在芯片内部运行。
“内存墙”指的是当芯片无法以足够快的速度访问数据时所形成的性能瓶颈,这会导致用户需要等待更长的时间才能得到响应。 在当前的计算技术发展中,“内存墙”问题愈发凸显,成为制约系统性能提升的重要因素。尽管硬件制造工艺不断进步,但数据存取速度的提升却相对滞后,这种不匹配使得许多高性能计算应用面临效率瓶颈。对于普通用户而言,这可能表现为程序运行缓慢或响应延迟;而对于科研、人工智能等高负载场景,则可能直接影响到整体工作效率和成果产出。因此,如何突破“内存墙”限制,已成为业界关注的焦点之一。
TPU 8i采用分层式Boardfly网络拓扑结构:其基础构建单元由4枚完全互联的芯片组成,进一步扩展形成由8块板卡(通过铜缆)构成的本地化组;而36个这样的组再通过OCS互联成一个TPU 8i集群。在这样的结构下,任意两枚芯片之间的通信最多只需经过7次跳转。
与上一代芯片相比,TPU8i在性价比方面提升了80%,使得企业在相同成本下能够为接近两倍的客户提供服务。
谷歌云同时表示,TPU8t和TPU8i均基于公司自研的Axion ARM CPU平台运行,并由第四代液冷技术提供支持。
在硬件性能提升之后,软件应用领域也迅速迈入了人工智能时代的新一轮创新。
谷歌云在周三推出面向AI代理的数据库“知识目录”(Knowledge Catalog)。
公司介绍称,传统的数据目录主要是为开发者手动浏览而设计的,侧重于表结构,而非AI代理所需的深层次业务语义。当AI缺少业务语义和数据关联时,容易产生幻觉、响应延迟以及过时的洞察。“知识目录”原生集成了Gemini,能够识别有价值的业务信息,并自动构建数据处理流程,从非结构化内容中提取实体,并映射复杂的业务关系。
同时通过谷歌云的“智能存储”(Smart Storage)功能,在数据上传到云端的那一刻,就会被自动添加标签、生成嵌入向量并丰富元数据。通过“智能存储”与“知识目录”相结合,智能代理能够即时找到非结构化数据。
在数据端,谷歌云推出跨云湖仓(Cross-Cloud Lakehouse),智能体可以像在本地谷歌云上一样使用存储在亚马逊AWS、微软Azure等外部云服务商的数据,实现无缝的跨云访问。
谷歌云近日推出面向企业洞察的深度研究代理,该工具基于对企业内部所有结构化与非结构化数据的全面掌握,能够回答如“导致我供应链中断的根本原因是什么?”或“你能对该地区进行财务审计吗?”等复杂业务问题,并提供此前需要消耗“数周人力”才能实现的精确度。 这一技术突破标志着企业在处理复杂数据分析时迈入了新的阶段。通过人工智能驱动的深度研究代理,企业可以更快地获取关键信息,提升决策效率和准确性。这不仅降低了对传统人工分析的依赖,也为企业在面对突发状况时提供了更迅速的应对能力。随着这类智能工具的普及,企业将更加注重数据的整合与智能化应用,推动整体运营模式向高效、精准的方向发展。
谷歌云在周三公布了其在云安全领域的最新进展。继公司上个月以320亿美元收购云端安全平台公司Wiz之后,谷歌云正式推出“谷歌云反诈防御平台”,旨在识别机器人、真人及代理的合法性与授权情况。
最后,作为对标“微软办公全家桶”的谷歌Workspace也正式迈入AI智能时代,其核心功能如Gmail邮箱的智能收件箱助手已逐步上线,为职场人士提供了更高效的邮件管理体验。同时,用户可通过“谷歌聊天”应用整合各类对话与企业数据,在日历中安排会议、创建谷歌文档,甚至生成符合企业品牌形象的PPT,进一步提升了办公协同效率。 在当前AI技术快速发展的背景下,谷歌Workspace的智能化升级不仅反映了科技企业对办公场景深度优化的趋势,也预示着未来办公软件将更加注重个性化与自动化。这种变化对提升工作效率、降低沟通成本具有积极意义,但也对用户的数字素养提出了更高要求。如何在享受技术便利的同时,保持对信息的独立判断和有效管理,将是每位职场人需要面对的新课题。
谷歌还“兴奋地宣布”,为了帮助广大企业立即开启全新的生产力时代,公司特意推出“快速企业迁移”功能。现在将整个组织的办公环境从微软的365平台迁移到谷歌Workspace的速度快了足足5倍。