帮大家总结了一下凌晨的Google I/O 2026开发者大会。

7957点击 2026-05-20 10:37

刚刚，Google开完了他们的产品发布会。

回顾这半年，AI圈的热闹，几乎跟Google没啥关系。

但了解Google的人都知道，它就喜欢攒一波，然后在I/O大会上，一口气全放出来。

终于，今年的，又来了。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

我也通宵给大家蹲完，然后整理完了。

可能会是最全的一篇了。

一. AI模型

1. Gemini 3.5 Flash

今年I/O大会的明星之一，Gemini 3.5 Flash。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

一般来说，Flash系列是轻量快速版，主打便宜和快，Pro才是满血旗舰版。

但现在基本上都流行，新一代的小模型，要比上一代的大模型还要强，所以这次也是一样，3.5 Flash的能力在编码能力、Agent能力、工具调用能力都比上一代的3.1 Pro要强不少。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

Terminal-Bench 2.1编码测试，3.5 Flash拿了76.2%，3.1 Pro只有70.3%。GDPval-AA，衡量真实世界经济价值任务的，3.5 Flash 1656 Elo，3.1 Pro 1314 Elo，差了三百多分。

跑分上确实强了不少。

不过呢，3.5 Flash在Humanity's Last Exam（人类最后考试）上40.2%，比3.1 Pro的44.4%差，ARC-AGI-2上72.1%也输给Pro的77.1%。

这两个benchmark主要考的是世界知识和纯抽象推理。

也就是说，这次也是牺牲了知识的能力，换来了干活的能力的加强。

输出速度方面，比其他前沿模型快4倍。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

价格这块，输入$1.50/百万token，输出$9.00/百万token，比3 Flash贵了3倍，但比3.1 Pro便宜40%。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

现在真的全网token提价真的是大势所趋。。。

然后知识截止日期到2025年1月（感觉拉了个大的），上下文窗口100万token。

至于Gemini 3.5 Pro，他们亲口说的是“Give us until next month to get it to you”，也就是下个月见。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

3.5 Flash今天直接成为Gemini App和AI Mode in Search的默认模型，全球同步上线API、AI Studio、Antigravity等等，所有人也都可以去体验了。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

2. Gemini Omini Flash

Gemini Omni，这个东西其实发布会之前就已经在推特上炒疯了。

说真的，其实是有点期待的。

毕竟，谷歌把这玩意称为“a new model that can create anything from any input”，也就是能根据任何输入创造出任何东西的全新模型。

而且现在Google的视频模型，已经被大家认为唯一一个能勉强跟Seedance 2.0打一打的模型了，也是很多AI漫剧公司最后的希望。

在宣发上，看着效果感觉还行。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

目前也已经上线了，但是吧，我体验了一下，只能说，有点拉了。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

就真的有一点不太行，而且中文的口音，一股港台腔，真的怪怪的。

看到一个评论说。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

emmmm。

别说看起来了，用起来也不如Seedance啊。。。

不过有一个功能值得一提，就是它支持保持视频中某一个片段不变，只修改其他部分。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

不过今天发布的是Gemini Omni Flash，拉一点感觉也能理解，毕竟是Omni家族的第一个模型，google也明确说了，Omni Pro即将发布。

二. Gemini产品

1. Gemini App 全新设计

Gemini App的设计语言，正式名字叫Neural Expressive。

一打开网页端，整体配色，从之前那个灰白色的界面，换成了一个蓝色渐变的背景。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

第一眼会觉得挺高级的，但也有点像。。。手机省电模式？

手机端也是。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

工具栏做了一个合并，之前上传文件、调用工具、选附件是分散在不同地方的，现在全塞进了一个+号里。

点开模型选择器，底下有一个思维水平的选项，展开以后有标准和扩展两项。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

最让我没想到的是设置里，Google也开始整限额了。。。

打开设置一看，好家伙，两个进度条，一个当前使用情况，一个每周限额。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

不学Claude好的方面，净学这方面。。。

目前，新设计Neural Expressive今天起在Android、iOS、Web全球上线。

2. Ask Maps

Google Maps来了一个十年最大升级，加了个叫Ask Mapx的功能。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

你现在，可以直接用自然语言跟地图对话。

现场举了个例子，有家长真的问了这么一个问题：“我家孩子刚掉进鸭子池塘，婚礼30分钟后就开始了，我能走着去哪里给她买件新裙子？”

这种问题你以前在搜索框里根本没法打，现在可以了。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

Google的生态还是太猛了，把地图这种东西，接到了Gemini里，还是能产生一些化学反应的。

3. Ask YouTube

YouTube也搞了一个类似的东西，叫Ask YouTube。

你也不用再自己翻视频了，直接问它“怎么教三岁小孩骑自行车，他已经会骑平衡车了”，它会给你一个整理好的概览、小贴士、最相关的视频片段，甚至直接跳到视频里最对口的那一段。

还能追问，它记得上下文。

跟上面那个功能其实思路是一样的，把搜索框变成对话框，不管是地图还是视频。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

Ask YouTube现在在美国对Premium订阅者开放，今年夏天全美推广。

4. Docs live

之前你想让Gemini帮你写个文档，得敲一段很精准的prompt，想清楚了再打字。

然后Docs Live的思路是，你不用打字了，直接说话就行。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

脑子里想到什么就说什么，说乱了也没关系，Gemini自己整理。

现场他们搞了个演示，一个工程师要给高中母校的职业日做分享，他就对着Gemini一顿说，“把我简历从Drive里调出来”“想几个搞笑的类比”“哦对把学校发的那封邮件里的时间地点也抓出来”“做成表格”“在最前面加个备注让我别忘了讲我哥的故事，加粗”。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

全程没打一个字，就是一直一边想一边说，说完文档就直接出来了。

非常的丝滑。

最有意思的是中途改主意，比如他说Thursday，然后立刻改口说Friday，Gemini就会自动把Thursday抹掉换成Friday，这个还挺好的。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

今年夏天对Pro和Ultra订阅者开放。Gmail Live和Google Keep的Live模式后面也会接入。

5. Gemini Live升级

Gemini Live的语音更新。

现场放了几段，利物浦腔的英语、印度哈里亚纳方言、巴西里约葡萄牙语。。。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

三个口音切来切去玩了一段。

接下来几周会陆续上线更多。

6. Daily Brief

这是Gemini App里一个新功能，每天早上给你一份个性化摘要。

它会自己翻你的邮箱、日历、任务清单，挑出今天最重要的事情，按主题分好类，甚至建议你下一步该做什么，比如提醒你还书、出行时间之类的。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

今天起面向美国的Plus、Pro、Ultra用户开放。

7. NotebookLM

功能上增加了电影级视频概览，你丢一堆资料进去，它能直接生成一段带流畅动画和视觉效果的讲解视频。

信息图也升级了，现在有10种预设风格可选，手绘风、可爱风、专业风、科学风、动漫风、黏土风。。。

学习工具这块，闪卡和测验都改了，进度会跨设备保存。

最大的变化是，NotebookLM跟Gemini App打通了。Gemini里现在有一个笔记本功能，你在 Gemini里创建的笔记本会自动同步到NotebookLM，反过来也一样。

还支持上传EPUB电子书了，幻灯片可以导出PPTX格式，聊天记录自动保存，可以在对话里直接生成播客、视频、报告。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

另外NotebookLM也进了Google Classroom，大学生可以在课堂里直接创建自己的课程笔记本，用老师提供的资料生成学习工具。

三. Agent系统

Agent今年是Google整场发布会的真主线。

1. Antigravity2.0

先讲Antigravity2.0。

Antigravity是Google的之前的开发平台，但是真的难用，而且完全没啥更新，去年11月才发布的，当时发了之后我们每天干的最多的事，就是把Antigravity的Claude额度给反代出来给OpenCode用，后面开始封号，我基本也就没咋用过了。

今天，终于版本来到了2.0。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

更新内容有几个。

第一，全新独立桌面应用。这跟之前是个IDE插件不一样了，是个真正的Agent工作环境了。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

第二，Antigravity CLI上线，全球可用。

这其实就是直接把Gemini CLI给替代了。

Google官方公告，2026年6月18日之后，Gemini CLI和Gemini Code Assist IDE扩展会停止对Pro/Ultra用户服务。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

开发者要全部迁到Antigravity CLI。

这条信息对所有用Gemini CLI开发的人都注意一下（虽然我估计可能没有），别到6月18号才发现自己的工作流挂了。

第三，Antigravity SDK，开发者可以把Google用在Antigravity里的agent harness，直接拿到自己的服务器上跑。

第四，原生语音支持，整合Gemini音频模型，跟Android、Firebase、AI Studio都打通了。

然后他们现场演示了一下，让Antigravity配合Gemini 3.5 Flash，从零构建一个可运行的操作系统。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

93个subagent并行跑，12个小时，1.5万次模型请求，处理26亿token，总成本不到$1000。

还真搞了个OS出来，能跑命令行，能跑doom游戏，可以放动画。

还挺有意思的。

更骚的是3.5 Flash在Antigravity里被专门优化过，跟别的模型相比，不是4倍快，是12倍快了。。。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

Antigravity 2.0全球开放，所有人今天都能用。

2. Gemini Spark

接下来是Gemini Spark。

你的个人AI Agent，感觉是对标了OpenClaw。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

它跑在Google Cloud的专属虚拟机上，24/7不间断，你可以关掉你的电脑，Spark也会在云端继续干活。

由Gemini 3.5 Flash和Antigravity harness驱动，可以处理长链路后台任务。

也直接打通了Google 全家桶，帮你打理各种事。

比如，在工作中让Spark帮团队写一封邮件，汇总最近一周Gemini Live的发布和成绩等等。

Spark会自己去翻你的Docs、邮件、聊天记录，把最重要的信息抓出来，然后按照你预设的写作风格起草邮件。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

或者是在生活中，筹备一场街区派对。

Spark在Google Sheets里生成实时RSVP追踪表，自动跟Gmail打通，邻居回复一句“我来”表格就会自动更新，没回复的邻居它自己会生成催回复的邮件草稿。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

然后又从Google Drive里翻出了小区HOA的章程，提醒你周五下午之前不能布置充气城堡，还在Google Slides里做了一份派对宣传deck。。。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

目前，Spark本周对一些测试人员开放，下周开始对美国Google AI Ultra订阅者开放Beta测试。

注意，是Ultra订阅者，不是Pro，不过说真的，这年头谁家好人会没事给Google冲250刀的Ultra会员啊，过于大冤种了。

所以呢，伴随着Spark发布的，是Google整个订阅价格体系的重新洗牌。

Google AI Ultra之前只有一档，$250一个月，这次拆成两档。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

新的$100/月Ultra plan，给开发者、技术lead、内容创作者准备，5倍于Pro的用量、20TB云存储、YouTube Premium、优先用Antigravity。

老的Ultra plan从$250降到$200/月，保留所有顶配能力。

Spark在$100和$200两档都可以用。

按我意思来说，Google你的价格其实还得再降降才行。

3. Android Halo

Spark在云端24/7干活，但你怎么看它在干啥呢。

答案是Android Halo。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

Halo是Android上一个专门给Agent准备的home base，会在状态栏顶部显示Agent正在干什么。

Spark做什么、做到哪一步、要不要你确认，都在这条状态栏里。

今年晚些时候上线。

Halo其实被带过的比较快，但是我觉得还挺有意思的，可能会是一个新的UI层级。

过去的Android UI都是给App用的，App是底层逻辑。

Halo开始的Android，是给Agent用的，Agent是底层逻辑。

可能未来会诞生很多新的玩法。

四. 视觉生成

1. Google Pics

Workspace里的新产品，Google Pics。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

注意是Pics，不是Pix，跟Google Photos区分开。

Pics是图像创作和编辑工具，做派对传单、信息图、活动海报这种东西。

支持目标分割，可以选中图里任何一个元素单独编辑。

比如把一只狗变成一只猫，或者把毛衣换个颜色，背景可以完全不动。

文字也能直接在图里编辑、一键翻译多语种啥的。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

所有输出自动加SynthID水印，保证可以被溯源。

今年夏天先在美国上Ultra订阅者。

2. Stitch

Stitch是Google做UI设计的工具。

过去一年，全球用户用Stitch生成了超过1亿张UI画面，Google说内部自己也在用。

（PS：用过这个的可以举个手）

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

这次更新有几个，实时语音协作（你说话、UI实时改），导出代码、直接发布到Netlify、跟Antigravity打通。

Google有段披萨店的演示还挺好玩的。

两个完全不懂UI设计的人，对着Stitch一通说，“menu突出更多披萨选项”， “header字大一点”啥的。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

UI实时响应，最后一键发布上线。

3. Google Flow

老朋友了，Flow就是Google的AI creative studio。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

这次更新有四个。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

1.加入Gemini Omni，可以保留原始视频里的表演和动作，只改环境和特效。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

2.新Agent功能。一张图同时生成16段不同机位的视频，比如你给它一张街景，它给你出16种镜头语言的视频。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

3.大规模场景修改。把所有镜头从清晨变成深夜，灯光、阴影、车灯，整个场景自洽切换。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

4.Flow Tools。你可以在Flow里vibe code自己的创意工具，比如做视频特效、手绘动画、文字图层叠加啥的。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

最好玩的是Flow Music。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

现场演示了一段。一个团队成员录了一段钢琴riff，扔进Flow Music，跟它说“往R&B方向走，加女声”。然后它就给出了一段编曲完整的歌。

效果还可以的，比Suno还差点，但是作为小demo其实够用了。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

所以其实在这里，Flow的发布逻辑就很清晰了。

想做做创意人的整个工作流入口。

从画板、到剧本、到镜头、到剪辑、到调色、到配乐，一站式想全包。

但是坦率的讲，功能确实全，但是也真的不咋好用。。。

4. SynthID

还有一个小更新，SynthID。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

Google做的AI水印技术，专门用来标记哪些内容是AI生成的。

已经给超过1000亿张图片和视频打了水印，还有累计6万年时长的音频。

新的变化是，现在你在Chrome里右键点一张图，或者用圈选搜索，就能查这张图是不是AI生成的。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

还玩了个梗，说去年有一张他吃汉堡的图在社交媒体传疯了，但其实是假的，他原话说“I don't eat hamburgers”。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

最让我意外的是，Google宣布OpenAI、Kakao、ElevenLabs也加入了SynthID。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

OpenAI也发了公告。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

这是这次发布会最有故事感的一个细节。

过去三年这两家恨不得搞死对方，今天他们在SynthID这件事上放下芥蒂一起合作了。

AI生成的假图、假声音、假视频这个问题，已经严重到大家不得不放下架子一起搞了。

Nvidia去年加入，Sony Pictures、Reuters、TikTok也在路上。

五. Google搜索

AI Mode月活已经突破 10 亿，自上线以来每个季度查询量翻一倍。

然后今天也官宣底层模型升级成了Gemini 3.5。

具体的更新有四个。

1. 重做了搜索框

Google说这是搜索框25年以来最大的一次升级。

以前你只能打字，现在可以丢图片、文件、视频进去，搜索会跨模态一起理解。而且它会用AI帮你补全问题，帮你把真正想问的问题梳理出来。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

2. AI Overviews和AI Mode合并了

从搜索结果页自然过渡到对话式追问，上下文可以一直跟着你。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

3. Search Agents

搜索里可以创建Agent了。可以在搜索里同时启动多个Agent，让它们7x24小时在后台帮你盯着事情。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

比如说，你是炒股的，想盯PE小于15、现金流为正、负债低的生物科技股，AI agent接到指令自己去查，看到价格变动给你推送更新，可以放你方便的把信号和噪音分开等等。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

4. Agentic Coding 进了搜索

搜索现在会针对你的问题，实时从零搭建定制化的交互界面。

比如问黑洞怎么影响时空的，可以直接生成了一个可以拖拽参数的交互式的可视化页面。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

这玩意背后是Antigravity在驱动。

搜索的时候调用了一个containerized agent环境，让3.5 Flash实时写代码、跑代码、把渲染结果嵌回搜索结果。

这玩意今年夏天对所有用户免费开放。

直接在搜索里面嵌入生成式UI，可能是搜索这个产品形态自1998年以来最大的一次进化。

六. Agent电商

这块整个是新增的板块，但是反而是今天发布会最有意思的板块。

两个支柱协议加一个新产品，凑成了完整的三件套。

1. Universal Commerce Protocol（UCP）

UCP是Google一月份发布的开源协议，定位是Agent电商时代的HTTP。

你可以简单的理解成，给Agent自己去买东西时候用的一套通用购物规则，类似MCP。

Google在NRF零售展会上提出来的时候，已经拉了Shopify、Etsy、Wayfair、Target、Walmart五家创始合作伙伴一起搞了，还找到一群公司来背书。

这次I/O的新进展是，Amazon、Meta、Microsoft、Salesforce、Stripe官宣加入了UCP的技术委员会。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

Vidya原话是：“it may very well be the first time we've all agreed on something”，这可能是我们所有人第一次达成共识。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

之前只在美国上，现在开始扩展到加拿大、澳大利亚，英国也紧随其后。

2. Agent Payments Protocol（AP2）

AP2你可以简单的理解成，给 Agent付款用的授权协议。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

AP2解决的的，其实就是Agent帮你买东西会不会乱花钱的问题。

你可以给Agent设三道护栏。具体品牌、具体商品、支付金额上限，三个条件全满足，Agent才会下单。

每一笔交易都有tamper-proof digital mandate，也就是篡改防护的数字授权书，如果有问题，你和商家看到的是同一份记录，可以追溯。

AP2即将先在Gemini Spark上线。

3. Universal Cart

这是这次I/O真正的新发布。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

一个跨商家、跨服务的智能购物车。

你在Search里看到一个东西可以加进去，跟Gemini聊天看到一个东西可以加进去，看YouTube视频时看到一个东西可以加进去，连读Gmail时看到一个东西也可以加进去。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

加进去之后这个购物车自动在后台干活，找折扣、查价格历史、对你账户里的支付卡权益、提醒缺货补货、跨商品检查兼容性。

比如说，你买电脑配件，先加了一块主板进购物车，之前你已经买过一个CPU。Universal Cart发现你CPU和主板不匹配，主动给你提醒，让你换个主板。

这种能力是Google搜索过去20年从来没有的能力。

我自己是真的有点期待了，非常的有意思。

Universal Cart今年夏天美国上线，先在Search和Gemini App里，YouTube和Gmail后面跟进。

Agent+钱这块的基础设施，已经开始缓缓渐进了。

七. 其他

1. Android XR智能眼镜

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

Android XR眼镜会有两条路线。

一类是带镜片显示屏的显示眼镜，去年I/O已经展示过，今年晚些时候会扩大测试计划。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

另一类是今年秋天要发的的首款音频眼镜。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

没有镜片显示屏，靠声音跟你交互，平时听音乐、拍照、打电话、调App。

Gentle Monster和Warby Parker负责的外观设计，三星做的硬件，同时支持IOS和Android。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

现场演示挺有意思的。

一个姑娘戴着眼镜，跟Gemini说带我去上周跟朋友见面的那个地方，Gemini直接设好了导航，还主动问要不要顺路买你常喝的那杯冷萃咖啡？然后自己打开手机上的外卖App帮她下了单。

最后拿眼镜给观众拍了张合影，让Gemini把照片变成卡通风格，还加了个大飞艇，放在手表上看。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

2. TPU

TPU 这次也有一次比较大的更新。

第八代TPU，是Google历史上第一次采用了双芯片路线，分别针对训练和推理做优化。

训练芯片叫TPU 8t，主要面向大规模预训练。原始算力接近上一代的3倍。

提到一套叫Jackson Pathways的训练基础设施，可以把训练任务分布到多个数据中心，不再受单个超大数据中心限制，最高能跨全球超过100万颗TPU做scaling。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

推理芯片叫TPU 8i，重点是降低延迟、提升生成速度。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

Google现场用一个即将发布的Flash模型做演示，让它生成一个Chrome Dino小游戏，屏幕上显示的生成速度接近每秒1500个token。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

速度确实快的有点过于离谱了。

3. AI科研

发布会最后，Google讲了AI在科学领域的几个项目。

一个是Gemini for Science，新发布的科研工具集，包含三个实验性原型。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

第一个叫假设生成器，基于Co-Scientist底层系统，让多个agent一起生成、辩论、评估科研假设，每个论点都有可点击的引用来源。

第二个叫计算发现引擎，基于AlphaEvolve和ERA，并行生成上千个代码变体，让科学家几小时跑完原本要几个月的实验。

第三个叫科学技能包，针对生物医药，整合了UniProt、AlphaFold Database、AlphaGenome API、InterPro等30多个生命科学数据库，复杂分析从几小时压到几分钟。

除了Gemini for Science之外，还有两个东西。

一个叫Weather Next。AI天气预报，比传统模型更准、更早预警。

去年的梅丽莎飓风袭击牙买加，Weather Next提前3天预测到了，比传统模型更准确，帮助当地提前撤离居民，救了不少人。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

一个是AI制药。Google旗下Isomorphic Labs用AI加速新药研发，已经有多个项目进入临床前阶段，针对免疫疾病和癌症。Hassabis说目标是“one day solving all disease”，有朝一日治好所有的病。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

除了几个科研的之外，还有一个Code Mender。能自动找到代码里的安全漏洞并修好，今天起对一小批专家开放Code Mender API测试。

帮大家总结了一下凌晨的Google I/O 2026开发者大会。

程序员看到这块应该挺安心的。

毕竟Agent写的代码越来越多，安全漏洞自动修复这件事，已经是基础设施级别的需求了。

写在最后

终于。。。总结完了。。。

Google每次的发布会是真的信息量大到让人窒息。

最后，Hassabis结束的时候。

他说了一句让我还蛮动容的话。

他说：

When we look back at this time, I think we'll realize that we were standing in the foothills of the singularity

当我们回望这个时刻时，我想我们会意识到，我们正站在奇点的山脚下。

我也确实相信这句话。

AI，至少在现在看，它是人类智慧的放大器。

也许，我们会开启一个，科学发现和进步的新黄金时代。

也希望未来。

我们能不断的，一起见证。

文章来自于"数字生命卡兹克"，作者 "卡兹克、可达、Chiyo"。

关键词: AI新闻 , Google I/O , 谷歌AI发布会 , 谷歌AI

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI工作流

【开源免费】字节工作流产品扣子两大核心业务：Coze Studio（扣子开发平台）和 Coze Loop（扣子罗盘）全面开源，而且采用的是 Apache 2.0 许可证，支持商用！
项目地址：https://github.com/coze-dev/coze-studio

【开源免费】n8n是一个可以自定义工作流的AI项目，它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址：https://github.com/n8n-io/n8n
在线使用：https://n8n.io/（付费）

【开源免费】DB-GPT是一个AI原生数据应用开发框架，它提供开发多模型管理（SMMF）、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL（智能体工作流编排）等多种技术能力，让围绕数据库构建大模型应用更简单、更方便。
项目地址：https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file


【开源免费】VectorVein是一个不需要任何编程基础，任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤，并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址：https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用：https://vectorvein.ai/（付费）

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法，编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词，进而高质量的帮助用户通过AI解决问题。
项目地址：https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用：https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0

无人直播

【开源免费】VideoChat是一个开源数字人实时对话，该项目支持支持语音输入和实时对话，数字人形象可自定义等功能，首次对话延迟低至3s。
项目地址：https://github.com/Henry-23/VideoChat
在线体验：https://www.modelscope.cn/studios/AI-ModelScope/video_chat

【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案，生成数字人形象进行直播，并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址：https://github.com/PeterH0323/Streamer-Sales