搜索
搜索
产品展示

谷歌2026 IO大会完整回顾:模型依然重要但智能体正在接管一切

来源:乐鱼官网登录页面    发布时间:2026-05-24 11:31:23

  5月20日凌晨,谷歌举办了2026年I/O发布会。CEO Sundar Pichai在会上透露,目前谷歌各项服务每月处理的Token数量已达3.2千万亿个,相比上一年增长了七倍。

  芯片层:推出针对预训练优化的TPU 8t 与针对推理优化的TPU 8i,通过升级全球算力集群,解决行业高昂的算力成本痛点。

  模型层:发布具备物理一致性的Gemini Omni 世界模型,让AI跨越纯文本与像素生成的限制,真正理解三维空间智能。同时,推出主打超高的性价比、低延迟的 Gemini 3.5 Flash,能力在编码能力、Agent能力、工具调用能力都比上一代的3.1 Pro要强不少。至于Gemini 3.5 Pro,则要下个月才能见到了。

  应用层:发布最新Antigravity 2.0平台,该平台的多智能体协同能在12小时内自主编写出完整的操作系统。此外,推出可在云端虚拟机全天候自主运行的个人智能体Gemini Spark,加速软件工程自动化的落地。

  行业标准:联合亚马逊、微软、Meta 等巨头推出UCP与AP2智能体电商协议,抢先确立智能体时代的商业交互规范。

  终端硬件:发布首款基于Android XR平台的内置Gemini音频智能眼镜。

  一句话总结,整场发布会看下来:谷歌凭借全栈AI技术优势,在搜索、办公、购物和硬件全线筑起了“Agent优先”的超级生态壁垒,AI从工具变成了全天候在线、能自主拆解并执行复杂任务的生产力,智能体正在接管一切。

  谷歌发布了针对预训练优化的TPU 8t和专为推理设计的TPU 8i。同时,Sundar Pichai披露,谷歌今年的年度资本支出预计将达到约1800亿至1900亿美元,是2022年的近六倍。

  Gemini Omni具备跨越式的物理概念理解能力,突破了此前AI系统在模拟动能和重力等物理属性上的局限,不仅能根据文本提示生成具有准确物理特性的视频,还支持用户通过对话直接对视频元素进行二次编辑。

  Gemini 3.5 Flash主打极高的响应速度与成本效益。据官方数据,3.5 Flash在每秒输出Token数上是其他前沿模型的四倍。

  Antigravity 2.0平台极大提高了软件开发效率。在一个测试项目中,由93个子智能体组成的团队并行工作12小时,处理了26亿个Token,从零开始编写并测试了一个包含调度程序、内存管理和文件系统的完整操作系统。在Gemini 3.5 Flash的成本优势支撑下,这一复杂软件工程的端到端API调用成本被压缩到了1000美元以内。

  Gemini Spark运行在Google Cloud的专用虚拟机上,保持24/7全天候在线,即使终端设备处于关闭状态,Gemini Spark依然可以在后台自主跨越Docs、Gmail、Calendar等多款应用程序,替用户执行复杂任务。

  谷歌搜索全面升级至Gemini 3.5,用户现在可以设定多个智能体在后台持续监控网络信息,在金融市场剧烈波动、特定商品上架等关键节点,推送高度相关的定制化方案。

  此外,搜索出来的结果页还引入了由Antigravity平台支持的动态交互式UI,可以依据用户的具体提问,实时生成可直接操作的数据可视化图表。

  UCP(通用商业协议)为各家AI智能体提供了一种通用的数据交互方式,涵盖产品搜索、结账到物流查询的全流程。目前Amazon、Meta、Microsoft、Salesforce和Stripe等企业已加入支持该标准。

  AP2(智能体支付协议)用于设定AI购物的资金边界并确保权责明晰。它在用户、商家和支付机构之间建立了基于隐私保护技术的验证链接,确保退货和账单记录的一致性。

  基于上述协议,通用智能购物车(Universal Cart)实现了跨商家和跨服务功能,能够在后台自动比价、监控库存,并提供购买建议。

  谷歌联合三星、Gentle Monster和Warby Parker,推出了首款基于Android XR平台、内置Gemini的音频智能眼镜。该设备专注于免提交互体验,用户无需掏出手机,可完全通过语音指令让Gemini执行任务,例如结合实时地图数据来进行路线导航,调用本地生活应用,以及完成商品的订购与支付验证。

  面对社会对生成式AI内容失控的担忧,谷歌宣布将SynthID数字水印技术全面扩展至搜索和Chrome浏览器中,目前该技术已累计为全球超过1000亿张图片和视频添加了底层来源标记。OpenAI、NVIDIA、Kakao和ElevenLabs等行业头部机构已正式公开宣布采用这一标准,共同确立AI内容来源的识别规范。

  SUNDAR PICHAI:现场观众大家好,以及全球各地正在观看直播的朋友们,你们好。很高兴能回到今年的I/O大会。过去的一年意义非凡,持续不断的产品发布和技术的飞速进步,让我们处于一个超速发展的时期。我确实深有感触,这是极其充实的一年。这里带大家回顾一下我最近都在忙些什么。

  刚才视频中我正在插上TPU的画面其实挺准确的,但我希望今年不仅忙于这些。在它进入太空之前,还有很多工作要做,我们正在为此努力。说认真的,这确实是一个非凡的时刻。自公司转型为AI优先以来,已逝去了10年。我们深知AI在推进公司使命、大规模改善我们正常的生活方面,将产生多么深远的影响。这就是怎么回事我们正在采取一种差异化的全栈AI创新方法:从定制芯片和安全基础,到世界级的科学研究和模型,再到触达数十亿用户的产品和平台。这种方法使我们也可以更快速地迭代和创新,并正在全方位赋能我们这家公司。

  真正令人惊叹的是人们使用我们AI的方式。学生们通过Gemini应用备考期末考试;音乐家和艺术家将Lyria和Veo等生成式AI模块融入他们的创作流程;开发者们编写代码,将他们的创意变为现实。我自己在生活中也以各种方式使用Gemini。最近,我一直在用Gemini来读懂我父母的就诊报告,相信你们中的许多人也做过类似的事情。这些关于人们怎么样去使用AI的故事,是衡量AI价值和进展的最佳标准。

  SUNDAR PICHAI:为了更直观地展示人们使用AI的规模,还有一个很好的指标:Token。Token是模型处理数据的基本单位,每一个Token都代表着一个正在被解决的问题。两年前,我们各项服务每月处理9.7万亿个Token,这已经是个庞大的数字。在去年的I/O大会上,这一个数字增长到了约480万亿。而到今天,这一个数字已经翻了七倍,达到每月3.2千万亿个Token。

  在I/O主旨演讲中提到“千万亿”这个量级确实罕见,但我们确实做到了。有些人可能会觉得这只是在“刷榜”,确实有一定道理,但我认为它深刻反映了我们的产品以及开发者在这些模型基础上构建生态的火热现状。目前每月有850万用户使用我们的模型构建新的应用和体验。我们的模型API现在每分钟处理约190亿个Token。在过去的12个月里,有超过375家客户各自处理了超过1万亿个Token,这代表了整个行业对AI的强劲需求。

  当然,我们各款产品的需求也极其旺盛。我们现在拥有13款用户数超过10亿的产品,其中有5款产品的用户数更是超过了30亿。我们的Gemini模型正在吸引更多人使用我们的产品,并提升他们的使用频率。

  这一切都始于Search,它比世界上任何别的产品都更早让大众享受到生成式AI的益处。AI Overviews现在的月活跃用户已超过25亿。这是一项突破性的功能,也是我们对搜索进行的史上最大升级。人们十分喜爱它,在短短一年内,其月活跃用户数就突破了10亿。当人们在Search中使用AI驱动的功能时,他们使用搜索的频率明显变高了。我十分喜爱现在的Search,它不再仅仅局限于单个查询,而更像是一场持续的对话,不仅能为您提供更深刻的见解,还能将您与广阔的网络世界无缝连接。

  另一个我们在快速创新的领域是Gemini应用。在去年的I/O大会上,Gemini应用的月活跃用户数为4亿。今天,这一个数字已经突破了9亿,在一年内翻了一倍多。与此同时,每日请求量增长了七倍以上。这是令人惊叹的增长。我们从始至终在添加许多独特的功能,例如Personal Intelligence,它能让AI的响应更加定制化、更有帮助。目前,已经有超过500亿张图像是由我们的Nano Banana模型生成的。它在过去的一年里大放异彩,我知道大家玩得都很开心。除了Gemini应用之外,我们还在许多产品内部直接引入了Gemini,让对话变得更自然。

  最近,Maps迎来了十年来最大的升级,推出了名为Ask Maps的新功能。人们正在用它来询问更复杂、更长的问题。这里有一个家长的真实查询:“我的孩子刚掉进了鸭子池塘,而婚礼30分钟后就要开始了。我可以在附近步行能到的地方买到一件新裙子吗?”我很想知道她最后顺利买到没有。

  我们还将把这种对话式AI引入另外两款产品。首先是Ask YouTube。人们天天都会来YouTube提出很多问题,这里有海量的优秀视频,但有时很难知道该从哪里看起。Ask YouTube完全重塑了这种体验。假设你想教3岁的孩子骑脚踏自行车,而他之前只学会了骑平衡车。你只需询问YouTube,就能看到完全不同的搜索出来的结果:信息变得易于理解且方便浏览,你不仅能获得概览和实用技巧,还能看到最符合你需求的视频。如果你想尝试某种特定的教育学生的方式,还点击进行深入了解。最棒的是,它能直接跳转到视频中最相关的片段,这让我想起了当年教孩子们骑车的场景。它能记住上下文,因此你能够直接进行追问,比如:“我应该买带手刹的还是脚刹的?”这使它成为一种连续的对话体验。它甚至能以表格形式呈现信息,方便你作对比。我们现在正开始测试Ask YouTube,它将于今年夏天在美国正式推出。

  到目前为止,我们展示的都是对话式文本查询。但很多时候,我希望能以说话的速度来达成目标。得益于我们在音频技术方面的飞跃,这在今天慢慢的变成了现实。一项名为Docs Live的新功能将这种体验提升到了新的高度。以前使用Gemini创建文档时,你必须输入非常精确的提示词。而有了Docs Live,你只需口头倾诉脑海中的任何想法,剩下的交给Gemini即可。让我们通过产品团队的演示来看看它的实际效果。需要说明的是,这些都是实时演示,没有经过任何加速处理。

  好的,让我们来试一下。我刚才突然想起,明天我要回母校的高中职业日做一个校友演讲,要准备一些演讲要点,向学生们解释我的职业一名软件工程师具体是做什么的。虽然我自己就是工程师,但我不太确定该从哪里开始。你能从我的Drive里提取我的简历吗?直接看简历可能有点无聊,也许你能想出一些有趣的类比,让这场演讲对学生们来说更引人入胜?另外,学校之前给过我一封主题大概是“职业日后勤”的电子邮件。你可以从那封邮件里获取具体细节,把它们放在文档的最顶端,这样我就能清楚知道该去哪里以及何时到。让我们更新这些需求,并直接生成一份草稿。

  【生成结果】这很酷,但内容有点太密集了。也许可以把这些类比用表格的形式展现,这样更方便我扫视。然后再帮我加一条笔记,讲讲我哥哥是如何激励我成为一名软件工程师的故事。把它放在文档顶部附近并加粗,这样我就不会漏掉。好的,看起来棒极了。

  在未来,你将能够创建新的Docs并直接进行编辑,全程只需使用语音。Docs Live将于今年夏天向Pro和Ultra订阅用户推出,同样强大的语音功能也将应用于Gmail和Google Keep。看到各项产品展现出的创新速度令人赞叹。

  SUNDAR PICHAI:为了向广大新老用户提供大规模支持,同时服务全球企业和开发者,我们应该在基础设施领域进行巨大投入,且一直在为现在和未来投资。2022年我们的年度资本支出为310亿美元。今年预计这一数字将增长约六倍,达到约1800亿至1900亿美元。这项投资的关键部分是我们的定制芯片。

  十年前,我们在这个I/O舞台上发布了第一款TPU。从那时起,我们改变了行业构建AI的方式。最近在Cloud Next大会上,我们发布了第八代TPU。这是我们首次采用双芯片策略,针对训练和推理设计了专门的架构:TPU 8t和8i。虽然它们看起来相似,但实际上大不相同。

  8t针对大规模预训练进行了优化,原始算力几乎是上一代产品的三倍。我们对训练基础设施采取了根本性的不同方法。通过JAX和Pathways,训练不再受限于单个庞大数据中心。相反,现在可以无缝将训练分布到多个站点,实现在全球超过100万个TPU上扩展运行。这使我们有能力创建全球最大的训练集群。对模型构建者而言,这在某种程度上预示着可以在数周而非数月内训练出规模更大、能力更强的模型。TPU 8i专为推理设计。我们大幅度的提高了每一步的速度,因为在从事搜索业务的27年里,我们深知延迟至关重要。

  为了让你直观感受这种速度,这里有一个即将在Flash模型上运行的提示词,假设它运行在8i上。我将创建一个Chrome Dino游戏并点击提交,响应是实时生成的。在观看的同时,请留意右上角的每秒token数。速度很惊人,接近每秒1500个token。写请求的时间几乎比生成时间还长,而且游戏也很有趣。除了速度,我们也在思考怎么样实现可持续扩展。这两款芯片都具有更高的能效,每瓦性能提升高达两倍。TPU一直在为今年的I/O大会进行紧张训练。据我所知,这里有一段幕后花絮。

  短片角色:嘿,周末过得好吗?挺好的,刚刚折叠了稀有肿瘤数据集中的蛋白质。你呢?我模拟了未来50年的气候数据。我画了一张哈巴狗的照片,你见过穿得像会计师一样的哈巴狗吗?没见过,想看吗?好了,TPU们听好了,I/O马上就要开始了,我们有活儿要干了。事实上,我们有数万亿项任务要处理,所以清理一下缓存。Timmy!擦的风扇,让我们火力全开。嘿,你在干什么呢?我在剪辑蒙太奇呢。行了,你能不能别弄你那蒙太奇了,赶紧下来帮帮忙?什么?就现在吗?好吧,这就来。

  SUNDAR PICHAI:我敢打赌在I/O大会结束后,像Timmy这样的TPU已经准备好直接躺平休息了。我们的算力创新推动了自身的进步。

  今天我想在模型、编程和智能体(Agents)这三个领域进行深入探讨,向大家展示各方面的进展。让我们从世界模型(World Models)取得的令人兴奋的进展开始。通过世界模型,AI正在从预测文本转向模拟现实。Demis和Google DeepMind团队一直在致力于突破这些模型的能力边界。让我邀请Demis出来分享更多内容。

  DEMIS HASSABIS:大家好,很高兴来到这里。过去一年里,AI能力实现了飞跃式提升。我们现在有了能够为我们制定计划并采取行动的智能体。距离实现通用AI(AGI)也只有几年时间了。今天,我很高兴能分享我们在构建通用AI方面取得的进展。

  去年我阐述了扩展Gemini多模态能力的愿景,使其成为一个能够理解并模拟世界的AI世界模型。这是实现AGI的关键,也将对从构建AI助手到训练机器人等所有领域产生深远影响。现在我们迈出了下一步,我很高兴宣布Gemini Omni。

  这款新模型可以依据任何输入生成任何内容。它将Gemini的智能与我们最优秀的生成式媒体模型相结合,实现了全新的世界理解、多模态和编辑能力。Veo、Nano Banana和Genie等模型已经能够创建极其逼真的视频、图像和交互式模拟。虽然尚不完美,但它们展示了令人印象非常深刻的直观物理概念理解。借助Omni,我们现在取得了更大进展,在模拟动能和重力等方面实现了跨越式的突破,而以前的系统很难处理这些概念。Gemini的世界知识和推理能力在Omni中表现得淋漓尽致,它可以将复杂的想法转化为高度准确的视频。例如,你可以给它一个简单的提示词,比如“制作一个关于蛋白质折叠的定格动画解说视频”,你们可以看看效果。

  视频旁白:蛋白质最初是氨基酸链。它们折叠成特定的模式,比如alpha螺旋和被称为beta折叠的平坦部分,从而形成完美的蛋白质三维结构。

  DEMIS HASSABIS:但初始生成仅仅是开始。创作过程很少一步到位,通常是不断迭代的。就像Nano Banana重新定义了图像编辑一样,Omni为你提供了一种更自然的方式,允许通过对话式语言来编辑视频。真正酷的是你能够给大家提供自己的视频(例如一段),然后以一种很有趣的方式改变现实。你可以轻松调整细节和风格,甚至添加新元素,整个场景都会随之演变,从而体现你的新创意。

  比如一个简单的圆圈可以变成黑洞,或者让一段黄昏下的漫步焕发生机。任何事物都能成为创造全新现实的画布。让我们通过一段短片来看看Omni能做些什么。我们目前从视频生成开始,但跟着时间推移,Omni将能够从任何输入生成任何输出。这始终是我们的目标,也是我们从一开始就将Gemini构建为原生多模态模型的原因。虽然这是一条更艰难的道路,但坚实的基础架构现在正发挥巨大作用。

  今天我们将发布Omni系列的首个模型Gemini Omni Flash。它现已贯穿我们的各项产品中,稍后您将听到更多有关信息。我对目前的进展感觉到很兴奋,很快也会分享更多关于Omni Pro的消息。迫不及待想看到你们的绝妙创作,现在把舞台交还给Sundar。

  SUNDAR PICHAI:谢谢Demis,这确实是巨大的进步。随着生成式AI逐渐完备,对更高透明度的需求也随之增加。研究表明人们能正确识别高质量深度伪造(Deepfake)视频的概率仅为四分之一左右。

  三年前我们推出了SynthID,这是一种肉眼无法察觉的水印技术。自发布以来,SynthID已为1000亿张图片和视频,以及长达6万年的音频资产添加了水印。数百万人正在使用Gemini应用中的SynthID Detector来验证AI生成的内容。

  而现在我们正更进一步,增加跨产品的Content Credentials(内容凭证)验证功能。这将向你展示内容的来源是AI还是相机,以及它是否曾使用生成式AI工具进行过编辑。在这个示例中,Gemini可以识别出这张照片是用Pixel相机拍摄的,然后使用Google Photos进行了编辑。我们大家都希望让更多人能轻松使用这一些工具。

  因此,我们正将SynthID和Content Credentials验证功能扩展到Search和Chrome中。你只需通过即圈即搜(Circle to Search)或在Chrome中右键点击并询问“这是由AI生成的吗?”,就能获得清晰的回答及其他有用的上下文。例如,这张图片去年在社会化媒体上广为流传,但这显然是假的,因为我根本不吃汉堡。对其他人来说这可能并不明显,这就是这些工具真正能派上用场的地方。当然,只有当更多合作伙伴决定为其AI生成的内容添加水印时,这一切才能实现规模化效应。NVIDIA去年已签约加入SynthID阵营,今天我非常激动地宣布OpenAI、Kakao和ElevenLabs也正在采用SynthID。很高兴看到这种跨行业的合作,我们期待将合作扩展到更多伙伴,并为AI时代的透明度设定新标准。

  以上就是我们在世界模型(World Models)方面取得的进展。现在来谈谈Gemini 3系列的下一步计划。

  SUNDAR PICHAI:几个月前发布的Gemini 3拥有完整的模型系列,也是我们迄今为止被采用最广泛的系列。我们很高兴看到开发者将Flash作为日常主力模型,并利用Pro的深度推理能力构建出令人惊叹的多模态体验。我们从始至终致力于改进这些模型,特别专注于智能体编程、长周期任务以及真实世界的流程。

  今天,我很高兴能介绍Gemini 3.5 Flash,这是我们首个将前沿智能与行动能力相结合的模型系列。有两点我想强调:

  首先,与3.1 Pro相比,Flash在几乎所有基准测试中都表现得更好。它在编程方面取得了巨大进步,在涵盖许多具有实际经济价值任务的GDP val基准测试中实现了惊人跨越。

  其次,3.5 Flash是一款功能强大的行业前沿模型,足以媲美顶尖模型但速度要快得多。这就是为什么在观察智能程度与输出速度的关系图表时,它能在右上象限中独占鳌头。在每秒输出Token数方面,它的速度是其他前沿模型的四倍,使用体验令人惊叹。

  这款新模型对Google内部而言具有变革性意义。我们一直将3.5 Flash应用于重新构想的Agent优先开发平台Antigravity,它极大地加速了我们的构建过程。三月份,我们每天为内部开发者处理5000亿个token,这个数字每隔几周就会翻倍,而现在我们每天处理超过3万亿个token。这种规模创造了一个强大的反馈循环,正帮助我们不断改进3.5。今天我们也将把它带给Antigravity的开发者们,下面让Varun来分享更多信息。

  VARUN MOHAN:这确实是一个成为构建者的绝佳时代。我们已经超越了辅助编写代码的AI工具,进化到了能够协助执行任务的智能体(Agents)。这些智能体极大地降低了开发门槛,让任何人都能成为构建者,甚至是忙碌的CEO。事实上,Sundar上周还使用Google Antigravity修复了Google代码库中的一个Bug。当我们在11月推出Antigravity IDE时,我们确保核心的智能体驱动型IDE体验达到极致,并添加了一个实验性的首创智能体用于Surface,以此展示未来的发展方向。数以百万计的用户已经在使用Antigravity,因此我们今天很高兴能带来更多内容。我们观察了任务和偏好的多样性,听取了坦率的产品反馈并吸取了经验。

  现在,Antigravity正在大规模扩展其智能体能力、界面、集成和产品系列功能。

  首先,我们将推出完整的CLI体验:Antigravity SDK、支持Gemini音频模型的原生语音支持,以及与Android、Firebase和Google AI Studio等多个界面和平台的集成。所有这些今天就已准备就绪供大家试用。

  最重要的是,其核心是Antigravity 2.0,这是一款全新的独立桌面应用程序,完全实现了最初对真正Agent优化体验的愿景。全新的Antigravity毫不掩饰地坚持Agent优先,专注于核心智能体对话、智能体生成的制品以及多智能体编排。

  正如Sundar提到的,这正是Google内部团队一直以来用于创造巨大价值的体验。Antigravity Agent Harness是Gemini执行现实世界任务的隐形框架,随着子智能体(Subagents)、钩子(Hooks)和异步任务管理等新核心原语的加入,功能变得更加强大。

  支撑这一切的基础是Gemini模型,其中Gemini 3.5 Flash已经与Antigravity Harness进行了深度协同优化。作为工程师我们很好奇,这些智能体和模型究竟能将可能性的边界推向何处。

  因此,利用全新的Antigravity和Gemini 3.5 Flash,我们要求智能体去承担一项被认为高度复杂且令人印象深刻的任务:从头开始构建一个运行中的操作系统。我们对结果感到非常惊讶。Antigravity以异步方式将挑战分解为一个连贯的计划,通过并行子智能体处理任务,并对其进行生成、执行和迭代。在内部测试中,93个子智能体并行工作超过12小时,发起了超过15000次模型请求,处理了26亿个token,将一个最初为空的项目开发成了一个功能完备的操作系统核心。这在Gemini 3.1 Pro上是不可能实现的,但得益于Gemini 3.5 Flash的性能和成本效益,构建这样一个功能完备的操作系统消耗了不到1000美元的API额度。

  Antigravity智能体编写了从调度程序到内存和文件系统管理的每一行代码,全部由一个自主智能体团队生成、审计和测试。需要说明的是,从零开始开发操作系统出了名的残酷,可能需要耗费数月时间。我们不仅仅是在构建一个应用程序,而是一个应用程序可以运行其上的功能完备的操作系统。

  现在我正处于Antigravity构建的操作系统终端窗口中。演示运行中的操作系统并不容易,所以让我们找点乐子看看好不好使。我们可以安装一个有趣的实用程序SL,这是LS命令的一个常见拼写错误。先不剧透,直接看效果。成功了,你可以看到一辆印着Antigravity标志的酷炫机车穿过屏幕。

  但显然,除非能玩《毁灭战士》(Doom),否则它就不是一个真正的操作系统。我现在尝试运行Doom,但它无法工作,结果发现这里缺少一些必要的视频和键盘驱动程序。所以让我们尝试在新的Antigravity中修复它。我准备了一个提示词正准备粘贴进去,在它运行的同时,我们先来参观一下Antigravity 2.0。

  如你所见,Antigravity 2.0完全采用了智能体优先(Agent First)的设计,所有的智能体对话和项目都显示在侧边栏。让我们快速查看一下我之前进行过的一段对话。对于这次演示,我很好奇关于Doom的一些趣闻轶事,所以我让智能体做了一些调研。它在面板右侧生成了图表,最后还为我生成了一个很酷的制品(Artifact)。它甚至使用Nano Banana Pro生成了一张信息图,利用它刚刚编写的代码生成图表,随后又生成了一些很酷的表格。正如你所见,Antigravity 2.0是毫不掩饰的智能体优先产品,并且已优化为你与智能体交互的最佳界面。

  让我们回顾之前的对话看看进展如何。Antigravity最终进行了大量研究,编写了超过100行代码,修复并构建了操作系统。让我们瞧瞧Doom是否能运行,真相大白的时刻到了。完美运行,太棒了!这游戏永远不会过时。虽然在Antigravity构建的操作系统上玩Doom既有趣又令人印象深刻,但进步并未止步于此。我们已经要求智能体构建了一套照片编辑套件、一个实时消息应用以及一个多用户协作平台,所有这些都取得了相同的高质量结果。得益于全新的子智能体(Subagent)团队协作能力,长达数天的工程工作正在缩减至数小时甚至数分钟。

  我们很高兴能以早期研究预览版的形式,在Antigravity中为您呈现这一强大功能。最后但同样重要的一点是,3.5 Flash的速度快得惊人。正如Sundar所说,它比其他前沿模型快四倍。但众所周知智能体编程极度消耗Token,因此我们在Antigravity中将其性能提升到了新高度。我们对Flash进行了专属优化,使其在Antigravity中的速度不仅快了4倍,而是快了惊人的12倍。

  我们非常激动能从今天开始让大家体验到这一切。我们今天展示的不仅仅是一个愿景,更是我们如何将Antigravity打造成为面向所有人的最完备智能体开发平台。我们正通过Google生态系统来实现这一目标,无论是集成你已在使用的技术栈和工具,还是利用Antigravity的Agent Harness为Google各项产品中下一批智能体体验提供动力。今天,Antigravity 2.0已面向全球所有人开放。请加入我们的开发者主题演讲,我们将演示所有新功能。回到你那里,Sundar。

  SUNDAR PICHAI:谢谢Varun。令人难以置信的是,Varun演示的整个操作系统是由一个子智能体团队在短短12小时内以如此低的成本构建完成的。Flash的惊人之处在于,它能以不到同类前沿模型一半的价格,提供前沿级别的能力。

  我们听说许多公司才到五月份就已经耗尽了全年的Token预算。如果公司混合使用Flash和其他前沿模型,他们可以节省大量资金。为了更直观地说明这一点,Google Cloud的顶尖客户每天处理约1万亿个token。如果他们将80%的工作负载从其他前沿模型转移到3.5 Flash,每年将节省超过10亿美元。这些实实在在节省下来的资金,可以重新投入到公司的发展中。

  Gemini 3.5 Flash即日起面向所有人开放,涵盖我们的各项产品和API。我们对3.5 Pro也感到非常兴奋,我们正在内部使用它,它展现出了巨大的进步。我知道你们等不及想亲手体验它了,请再给我们一个月的时间将其交付给你们。

  SUNDAR PICHAI:Gemini 3.5和Antigravity正在开启一个关于智能体及智能体能力的新世界。我们始终致力于为开发者和企业提供智能体。而现在,我们正全力专注于安全、可靠地将这种力量带给消费者,让它们为每个人服务。

  今天你将在我们的许多产品中看到丰富的智能体体验。我对我们直接引入Gemini App的新功能感到无比兴奋,隆重推出Gemini Spark。它是你的个人AI智能体,可以帮助你处理数字生活,在你的指导下代表你执行操作。它运行在Google Cloud的专用虚拟机上,并且24/7全天候在线。没错,你可以安心合上笔记本电脑。它由Gemini 3.5和Google Antigravity Harness提供动力,这使得它能够轻松在后台执行长时间运行的任务。Spark与各种工具无缝集成,首先从我们自己的工具开始,并在接下来的几周内通过MCP与第三方工具集成。你可以采用最方便的方式与Spark协作,无论是在Gemini应用中,还是很快将支持的电子邮件和聊天交互。让我们请Josh上台分享更多内容。

  JOSH WOODWARD:谢谢Sundar。很高兴见到大家。让我通过一些个人生活中的例子向大家展示Spark是如何工作的。现在我们打开了经过彻底重新设计的全新Gemini,稍后会在节目中详细讨论这一点。

  我想带大家看看这里的Spark,你可以直接看到一个包含我在后台运行的所有任务的仪表板。它允许你查看这些任务,我马上就粘贴进一个任务。这是一个非常直接但很实用的例子。帮我给团队起草一封邮件,汇总关于我们最近Gemini Live发布的所有内容以及上周取得的成果。使用斜杠命令调用ghost writer,这样就有几件事正在处理。它会跨越Docs、电子邮件和聊天记录编译所有内容,并抓取本次更新所需的最重要信息。它还会使用上周所有调用了slash ghost writer的内容。这是我编写的一项个人技能,所以电子邮件听起来很像我的语气。最棒的是通过Spark你可以上传在网上找到的最喜欢的技能。所以我们要让它在后台运行。你可以看到它已经开始执行各种工具调用。

  现在我要切换到另一个个人生活中的例子。我们正在筹划一场大型街区派对。这是一个相当复杂的提示词,我们希望它能协助收集所有的RSVP回复确认,记录谁带了什么东西,并记得给那些还没注册的邻居发邮件。

  这里最令人惊叹的是Spark将逐步执行所有步骤,并在跨越各种技能和应用进行协作时为你节省大量时间。它会把任务分解并为你生成文件。第一个是一个实时RSVP追踪器,直接在Google Sheets中运行。它显示了谁已确认谁还没有。它实际上会自动更新,因为它与Gmail相连。当L. Thompson回复了8份RSVP时它会自动更新,这非常了不起。

  另一件事是它会跟踪所有不同的嘉宾并向尚未报名的人发送后续提醒,这同样会自动发生。它会创建草稿并在我的控制下由我发送。最后提示词还生成了一份用于街区派对的预热演示文稿,直接在Google Slides中生成并完美集成。它甚至加入了像我们将放在尽头路口的巨大充气城堡之类的内容。所有这一切都发生在后台并受我控制。Gemini甚至可以更进一步提取出诸如你所在社区的业主协会不允许你在6月5日周五下午之前进行搭建之类的信息,这是从我Google Drive中的一个文件里提取出来的。因此它在整合所有内容方面表现得非常出色。

  这展示了Spark在笔记本电脑上的运行情况,它在移动端同样表现惊人,同时支持Android和iPhone。在我的手机上打开进入Spark,你可以看到我们之前的两项任务刚刚同步完成。它们会在你的所有设备上保持同步,这非常有帮助。

  Spark在记录脑海中的灵感碎片方面表现惊人。如果你超级忙碌,你可以随手把任务抛给它,Spark就会接住它们并开始处理。请看这个指令:帮我开启几个线程。第一个找到所有即将举行的与Sundar的会议并将它们全部标记为亮粉色以免错过。第二个给昨晚写下的新邻居John和他的家人写一张便条,邀请他们参加我们的街区派对,因为他们不在我们最初的列表上。第三个创建一个文档,列出在学年结束前我和妻子需要为孩子们做的最重要的事情,按截止日期和优先级进行分类并使其易于理解,我不想错过任何事情。发送该请求后,它能以我说话的速度捕捉所有上下文并处理任务。它以单线程开始,而在后台实际上会去处理并将这些内容分解为单个任务。现在我可以直接收起手机继续我一天的生活,Spark会在后台为我工作。这是我们第一次能够把手机放下让它在I/O舞台上持续工作,这太棒了。

  出于安全考虑,我们本周将向受信任的测试人员谨慎发布Spark,并于下周作为测试版面向美国的Google AI Ultra订阅用户推出。我们希望这种新型帮助能让尽可能多的人使用,因此我们将推出每月100美元的全新Ultra方案。对于那些需要最高限制的用户,我们将把顶级Ultra方案的价格从每月250美元降至每月200美元。

  还有更多精彩内容即将推出,今年夏天晚些时候Gemini Spark将直接在Chrome中运行,作为你在整个网络上的代理浏览器,它可以在您的指导下执行操作完成任务。我们还在为您的智能体在手机上构建一个专属的大本营Android Halo,它将于今年晚些时候推出。正如Sundar所说,我们已经进入了整个Google的全新智能体时代,我们迫不及待地想看到你们将用它构建出什么样的成果。回到你这里Sundar。

  SUNDAR PICHAI:谢谢Josh。很高兴看到Gemini Spark能够代表你处理事务。我尝试过各种各样的智能体,你能真切地看到其中的潜力。在让智能体变得易于使用、极度安全且真正提供帮助方面目前仍处于早期阶段。这就是怎么回事我对Gemini Spark感到非常兴奋。我们正在奠定基础以安全可靠的方式将这一切带给各地的消费者,期待着让大家都能尝试。

  我们正坚定地处于智能体化的Gemini时代。Gemini Spark是你们所见到的第一个体验,由3.5模型和Antigravity共同实现。这种结合为我们提供了履行使命的新方式,并使我们的产品能够发生根本性的变革从而提供更强大的帮助。我迫不及待地想看到它将如何改变Search这项我们最终的登月计划。过去的一年已经证明了创新的力量有多么强大,这正是我们信息使命的核心所在。随着我们进入智能体时代,Search将比以往任何时候都更加实用和强大。现在我把麦克风交给Liz,让她来分享接下来的内容。

  LIZ REID:人们每天都会向Search提出数十亿个问题。有时全世界都在搜索同一件事,但更多时候你的问题就像你本人一样独一无二。这就是为什么我们致力于让人们能够随心所欲地提问。为了实现这一点,我们从始至终致力于将搜索引擎的最佳体验与AI的优势相结合。

  我们从AI Overview开始了这一转型。就在去年的这个舞台上我们推出了AI Mode。这是我们最强大的AI Search,引入了最先进的Gemini模型。从今天起我们将它升级至Gemini 3.5。

  正如Sundar所提到的,AI Mode的月活跃用户数已突破10亿大关,并且我们正见证着惊人的增长。自发布以来AI Mode的查询量每季度都在翻倍。随着搜索功能的不断增强,用户开始提出更多问题,以至于上个季度搜索查询量达到了历史新高。

  更令人瞩目的是你们正在以极其具体详尽的方式提出真实的问题,因为你们知道Search确实可以解决这些问题。你正在与Search进行真正的来回对话互动并不断深入。你不仅仅是在询问附近的徒步路线,你还会要求制定一个附近徒步的一日程,要求有壮丽的景色、宠物友好型路线以及一个停车方便的午餐地点。

  现在我们正进入Google Search的新篇章,令人惊叹的AI功能不仅存在于Search之中,Google Search本身就是彻头彻尾的AI Search。现在它是一款集成了我们最先进的Gemini模型、最新的智能体能力以及全球最广泛信息的AI Search。

  我们在每分钟更新一次超过10亿条事实,每天索引数十亿个新网页,并连接到无限广泛的人类视角。所以无论你想到什么都可以来到Google询问任何事情。首先我很兴奋地宣布我们将推出全新的智能搜索框。以前搜索框是一个受限的空间,但现在它通过AI进行了彻底重构,会随着你的好奇心而扩展。

  当你提问时,搜索会通过AI驱动的建议帮助你构思问题。这超越了自动补全,它提供了你可能从未想过的细微差别,帮助你将脑海中确切的问题轻松表达出来。这个全新的搜索框将我们最强大的AI工具置于你的指尖。你可以通过文本、图像、文件和视频进行跨模态提问,并跨越所有这些维度进行搜索。这是自25年前问世以来我们标志性搜索框所经历的最大一次升级,它从今天开始正式推出。

  接下来我们将引入AI Overviews和AI Mode整合为一种无缝的AI Search体验,让与搜索进行对话变得更加容易。你可以毫不费力地从问题跳转到主搜索结果页上的回答,再到AI Mode中的后续追问。你的上下文会一直保留,对话也会随之深入。你的链接和来源会变得与你的需求更加相关,让你能持续获得最优质的AI和Web体验。这种全新的无缝AI搜索体验已于今日在全球范围内的桌面端和移动端上线。

  刚才你们听到了Sundar和Josh分享了关于智能体及其所能开启潜力的思路。现在我们正朝着这一愿景迈出令人兴奋的一步,届时你将能够直接在Search中创建并管理多个AI智能体来处理各项任务。

  我们正进入Search智能体时代。你可以让信息智能体在后台全天候为你服务。它们能准确找到你所需的内容,并在关键时刻协助你采取行动。你可以在Search中同时启动多个智能体以便获取最新动态,并在所有对你重要的事情上取得进展。这些智能体将配合Gemini Spark帮助你完成更多工作。让我们看一些实际应用,假设你对金融非常感兴趣,想在关键时刻了解市盈率低于15、现金流为正且负债率低的生物技术大盘股。

  你只需提出要求你的智能体就会立即开始工作。它接收你极其复杂的问题并制定出一套方案,判断紧急程度,理解你需要即时情报并设置触发器留意不断变化的信息,同时挑选该任务所需的工具和数据钩子。它直接连接到我们的实时金融数据,让你获得秒级的最新更新,涵盖股票价格和市场洞察,在市场波动的瞬间即刻掌握。当市场发生变化时,智能体会向你发送一份智能综合更新。它能帮助你理解当前局势去伪存真,从杂乱的信息中提取核心信号。它还会为你指向高度相关的众包研究平台、新闻网站和社交媒体内容。这有助于网站和创作者在人们最关心的时刻让那些真正感兴趣的人发现新鲜内容。

  假设你正在找公寓,你可以把脑海中关于目标的各种想法包括地理位置、自然采光和可用性等标准告诉它,然后你的智能体会持续扫描整个网络涵盖各大网站、社交媒体和论坛。或者如果你是个球鞋迷,你只需要求在任何你喜爱的运动员发布运动鞋联名或发售信息时通知你即可。它会监控从博客到我们Shopping Graph的所有内容,让你不会错过任何消息。今年夏天你将能够让信息智能体为你工作,只需让Search随时为你更新你想了解的信息。

  信息智能体是我们在搜索中推出的首批智能体之一,旨在为您提供更多帮助。所以无论你是想查找、核实、预订、购买还是进行其他操作,搜索都能帮您搞定。我们还将智能体编程引入搜索,使其能够为您的问题定制专属体验。为了向大家展示具体运作机制有请Robby。

  ROBBY STEIN:我们相信Search的最佳版本是专为您创建的版本,能以最有助于回答您提问的格式呈现信息。我们已花费多年时间来完善这一点。如果你在购物我们会为你提供产品,询问数据你会看到图表,寻找灵感你会获得精美的视觉效果。

  现在我们正将其带入一个全新水平,将Antigravity以及Gemini 3.5 Flash的智能体编程能力直接引入Search。因此Search可以针对您的问题即时完全定制并构建出理想的格式,包括动态布局、交互式组件甚至是整个为你量身定制的体验。这就是在Search规模上实现的智能体编程。

  让我举个例子。假设我是一名试图理解天体物理学的大学生,我可以直接去Search搜索黑洞是如何影响时空的。在AI概览中我直接得到了一个交互式可视化图表。搜索意识到对于如此复杂的概念我一定要通过交互来真正理解它。这只是入门,所以我要追问向我展示像联星黑洞这样两个相互绕转的天体是怎么样产生引力波的。搜索功能实时动态构建了一个全新的交互式视觉效果,完全为我的特定问题定制。我能调整轨道间距和质量比等参数,看到波形模式的变化,观察较小的黑洞绕着较大的黑洞螺旋运行。既然掌握了基础知识我就可以深入研究LIGO Discovery Papers等资源知道更多信息。

  你可能想知道Search究竟是如何为数十亿个独特问题构建这样的自定义UI的。借助Gemini 3.5 Flash,Search可以从零开始规划理想的回复,负责设计布局、决定构建哪些自定义组件、展开调研并最终部署代码。为了在回复中构建自定义组件,这项搜索功能调用了由Antigravity提供支持的智能体编码框架,因此它可以在安全的容器化环境中读取、写入文件并执行代码。这就是Varun用来构建整个操作系统的技术,我们正将这种强大的能力直接引入Search。搭载Antigravity的生成式UI将于今年夏季向所有人免费推出。因此无论你想了解什么,无论是想知道手表究竟是如何运作的还是在分析通勤的新成本,你都将获得与问题一样独特的回答。

  让我们再进一步。有些项目并非一次性问题而是持续性的任务。现在Search可以帮助你构建完整的自定义有状态体验,包括工具、追踪器和仪表板。我将这些视为在Search中构建我自己的小程序,它们在处理筹备婚礼或管理搬家等需要持续跟进的长期任务时表现尤为出色。

  我们要不要一起构建一个?我一直在想周末该和家人做些什么,这是我刚刚搜索的活动内容。除了来自AI Mode的出色回复外,Search还主动提出为我制定一个周末计划。就像刚才看到Search从零开始创建生成式UI和交互式视觉效果一样,Search现在就可以编写代码了。为了让大家探索幕后运作机制,在构建过程中你会看到实时思考步骤和代码生成的流动过程。Search正在思考合适的组件不仅是获取信息,还要以最佳方式呈现。我选择安全地连接Gmail、Photos和Calendar,因此它利用个人智能参考收据和日历等内容使建议更加实用。它生成了一个精美的计划,已经考虑到了行车时间和天气。

  Search知道我有两个孩子,喜欢动物,还知道老大正在学习国际象棋,所以第二个选项对老大很棒。但为了让两个孩子都开心,我打算选定Happy Hollow公园和动物园。因为它与我的日历同步,它已经占用了我下午的时间去见个朋友看比赛。下方所有超酷的餐厅预订信息都精美地展示在Maps上。既然看过了这些智能体,我想让总统夫人的优先级更高一些,而且我太太和我尽量安排在周五晚上约会。所以我打算继续自定义添加每周五晚上的约会并移至顶部。就像之前一样它思考调整计划所需的操作、查询实时信息甚至再次检查我的偏好设置,速度很快。它利用Google的各种信息实时构建内容,现在可以在最上方看到地图和周五约会之夜标签页。向下滚动能看到等保姆到了以后的很棒的餐厅。选好后我们就准备好出发了。

  一个周末计划如果没有正真获得我妻子Danielle的认可就不算完整,所以我把这个应用分享给她。当她收到时这正是她在手机上看到的画面。Danielle进来了,可能等我回家后她有些反馈要给我,不过我们待会儿再处理。我只需要把它添加到我的日历中,Search会将其添加到我们所有的家庭日历中然后就准备就绪了。下周末我也能像这样为家人规划一个全新的周末。

  我们将把Antigravity引入Search,生成式UI将于今年夏天从订阅用户开始推出。在接下来的几个月里您将能够像这样自定义构建体验。从Search智能体到智能体编程,这是一款能为您做更多事情的AI Search。无论提出什么样的问题,智能体能力将改变你使用Search的所有方式包括购物方式。为了向大家介绍更多详细的信息,有请Vidhya。

  原文标题:谷歌2026 I/O大会完整回顾:模型依然重要,但智能体正在接管一切

  机器人奥运会战报:宇树机器人摘下首金,天工Ultra抢走首位“百米飞人”

电话

地图

分享

联系我们

24小时全国服务热线
地址: 福建省晋江市陈埭镇苏厝村河滨路力丰职工便利店

电话:0595-85185345

样管:180 0699 6961
总生管:180 0699 6966

传真:0595-85189766
E-mail:13505052637@163.com