迈向自主化操作的重大一步
谷歌正式扩充了其 AI 生态系统,推出了名为 Gemini Spark 的“全天候”智能体。该工具旨在直接与外部应用程序交互,并执行复杂的多步骤任务。目前,该功能正逐步向订阅了每月 99 美元 AI Ultra 计划的用户开放,标志着谷歌在实现计算机自主操作方面迈出了重要一步。据《The Verge》的测试显示,该智能体能够扫描 Gmail 以处理整理任务,并从 Google 文档中检索特定信息。
深度集成与工作流管理
在一项功能演示中,该软件自动生成了一份结构清晰的文档,其中包含直接链接,帮助用户批量取消订阅营销邮件。这一能力标志着它与以往仅限于基础行程规划或浅层推荐的通用 AI 工具拉开了差距。通过更深入地融入用户的个人数字生态,Spark 旨在管理那些需要跨多个软件界面操作的工作流程。
《The Verge》特约编辑大卫·皮尔斯(David Pierce)将这种体验描述为一项技术成就,同时也令人感到不安。在评估该智能体的表现时,皮尔斯表示:“这是一项了不起的技术,但这样的未来确实让人毛骨悚然。”
谷歌的战略转型
Gemini Spark 的发布紧随谷歌 2026 I/O 大会之后,此次大会释放了公司全面转向“代理式 AI”(Agentic AI)的信号。在活动期间,谷歌还推出了 Gemini 3.5 模型系列,其中“Flash”版本现已成为公司主要 AI 应用和搜索功能的默认模型。此外,谷歌还发布了能够根据多种输入生成内容的多模态工具 Gemini Omni,并展示了 Project Aura 智能眼镜的最新进展。这些发布共同反映了谷歌的战略转型:从简单的“查询-响应”模式,转变为能够代表用户执行复杂自主操作的智能体。