Google I/O 2026懒人包!AI代理接管生活 Gemini 3.5/Spark/Omni三大核心科技一文看清
发布时间:17:19 2026-05-20 HKT
年度科技盛事Google I/O 2026大会揭幕,在长达两小时的Keynote演讲中,Google贯彻「AI-First」路线,发布了新一代Gemini 3.5系列模型、24/7工作的AI代理Gemini Spark,以及被喻为影片版Nano Banana的Gemini Omni,同时透过Gemini植入搜寻、办公及眼镜所有场景,将AI由辅助工具进化为核心大脑,以下为大家整理了各项重点技术,了解Gemini将会如何影响我们的日常生活及工作。
Google I/O 2026懒人包!AI代理接管生活 Gemini 3.5/Spark/Omni三大核心科技一文看清
Gemini 3.5系列:超强Flash版即日上架
Google正式发布新一代Gemini 3.5核心模型,当中主打轻量高效的Gemini 3.5 Flash即日向用户免费开放,香港用户现在打开Gemini App、Google Search已经用得到。据大会公布数据,新模型的资讯输出速度比上代大幅提升,运算能加更胜Gemini 3.1 Pro,尤其处理复杂的程式码生成,以及需要多步骤执行的AI代理(Agent)自动化任务,表现更为流畅。至于运算能力更强大的Gemini 3.5 Pro暂定6月登场。
- Gemini 3.5 Flash:即日推出,Google强调是目前最强代理与编程模型,输出速度快过Gemini 3.1 Pro。在程式码生成与多步骤Agent代理自动化任务上表现极佳。
- Gemini 3.5 Pro:官方预告要等到6月先推出。
Gemini Spark:24小时工作AI代理




这可能是上班族最期待的功能!Gemini Spark是一个24小时不停工作的个人AI代理,不用打开手提电脑或手机,Spark依然在云端后台执行被指派的任务,且能够深度串连用户的Gmail、日历及Google Drive,自动追踪重要邮件、整理会议摘要,甚至跨平台串接Canva或OpenTable等第三方程式,自动帮用户排好整个星期的工作或预先通知餐厅订枱,名副其实全天候助理,并会于下周率先供订阅「AI Ultra」服务的美国用户试用。
- 真Agent能力:基于Gemini 3.5,自动处理多步骤工作,如准备客户会议资料。
- 全天候开工:24小时在云端处理任务,自动按排行程与工作流程。
- 打通Google Apps:可以串联你的Gmail、日历、文件,自动追踪邮件、整理会议记录、甚至串接第三方App。
- 安全机制:为防止AI「暴走」,Google推出Agent Payments Protocol(AP2),设有消费限额同商户白名单,现阶段任何交易都须用户确认。
Gemini Omni:对应多模态 语音剪片




今年在多媒体生成领域的重大突破,首推多模态世界模型Gemini Omni,这款新模型打破以往文字、图像与影片各自独立处理的界限,能同时理解所有元素,并直接生成影片。率先推出的Gemini Omni Flash更带来革新的「对话式影片剪辑」功能,未来在制作影片或拍摄YouTube Shorts时,不再需要繁复剪辑技术,直接用文字或语音指令,如说出「帮我将背景转成旺角街景」或「令画面左边架车开快一点」,AI就能即时理解并修改影片中的特定元素。
- 多模态世界模型:过去AI是文字归文字、影片归影片,Gemini Omni能同时理解文字、声音、图像并生成影片。
- 语音剪片:Gemini Omni Flash不但可生成电影级影片,还能直接用语音或文字对话方式修改影片。
Google Workspace:全面语音办公


针对商务及办公市场,Google Workspace迎来近年最大升级,当中核心功能Docs Live,对懒得打字的用户来说,现在处理文书,只需开启语音,将脑海中零碎想法一口气讲出来,Gemini就会自动捕捉语音内容,进行逻辑梳理、排版,并在几秒钟内生成一份结构完整、内容充实的Google Doc文件。Google表示,这项强大的语音办公功能将于今夏同步登陆Gmail及Keep,未来配合Gemini Spark,更能实现跨Sheets数据分析与自动发送报告的全自动工作流程。
- Docs Live:只要开启语音,把脑中想法全部讲出来,Gemini就会自动梳理及生成结构完整Google Doc。
- 自动工作流:配合Gemini Spark能自动跨越Sheets、Gmail与Docs处理繁杂的后台任务。
Android XR:语音眼镜秋季登场


除了AI,Google I/O 2026宣布跟Samsung扩大合作,并于秋季推出首款采用Android XR系统的语音智能眼镜,眼镜设计交由Gentle Monster及Warby Parker负责,尽管是不设萤幕显示的语音眼镜(Audio Glasses),仍可透过语音跟AI互动,并可随时叫Gemini帮忙认路、影相、播歌,又或翻译文字。
- 设计:Gentle Monster及Warby Parker参与设计,外观偏向时尚,由于没有萤幕,机身更轻巧。
- 功能:透过Gemini AI可以影相、播歌、翻译、亦可操控手机、智能手表应用。
Google I/O 2026核心亮点概览:
| 核心亮点 | 主要功能 | 上线时间 / 适用对象 |
| Gemini 3.5 Flash | 主打Agent与Coding,表现比Gemini 3.1 Pro更好 | 即日起全球免费开放 |
| Gemini Spark | 24/7云端个人助理 | 下周开放美国AI Ultra订阅者试用 |
| Gemini Omni Flash | 多模态影片生成与「对话式剪辑」 | 本周起陆续登陆YouTube / Gemini App |
| Docs Live | 灵感讲出来即变文件 | 今年夏天推出 |
| Android XR语音眼镜 | 联手三星,全天候语音助理 | 今年秋季登场 |
文:B1807
图:Google

















