谷歌希望 “双子座”(Gemini)如何控制安卓应用,将人工智能辅助提升到新水平

根据对最近谷歌应用程序测试版的分析报告,谷歌正准备大幅扩展其在安卓系统上的人工智能助手 “双子座 “的功能,有可能让它直接控制用户手机上的应用程序。
此举标志着向所谓的代理人工智能(agentic AI)迈出了重要一步–人工智能系统不仅能回答问题,还能代表用户采取行动。
从助理到数字代理
据Android Police 报道,谷歌已经在尝试人工智能驱动的自动化。最近,谷歌在 Chrome 浏览器中为付费人工智能层级的用户推出了自动浏览功能,允许浏览器自主完成任务。
现在,类似的功能似乎也将通过Gemini 进入安卓系统。根据 9to5Google 对谷歌应用测试版 17.4 的拆解,这项内部代号为“bonobo“的功能将使 Gemini 能够通过屏幕自动化与应用互动。
在实际应用中,这可以让用户要求 Gemini 订车、订餐或完成其他常规任务,而无需手动打开各个应用程序。
有限的推广和应用程序支持
至少在最初阶段,Gemini 的应用程序控制能力预计只能与有限的几款应用程序配合使用。这主要是由于应用程序界面经常变化,使得自动化变得更加复杂和容易出错。
早期支持可能集中在第一方谷歌应用程序,以及少量流行的第三方服务,如叫车或送餐平台。
该功能预计还需要 Android 16 QPR3 的支持,因为谷歌已经在该版本中引入了对屏幕自动化的基础系统级支持。
用户保持控制
谷歌强调,当 Gemini 代表用户执行任务时,用户仍将完全处于控制之中。用户可以随时停止或接管操作。
不过,该功能也会引起隐私方面的考虑。根据该应用程序代码中的信息,Gemini 与应用程序互动时截取的屏幕截图可能会由训练有素的人工审核人员进行审核,以改进谷歌的服务–前提是用户启用了活动跟踪功能。
谷歌还计划警告用户不要在 Gemini 聊天中直接输入敏感的支付信息,并避免在紧急情况下使用自动化功能。
谁将获得访问权?
虽然谷歌尚未正式确认价格或可用性,但至少在最初推出期间,新功能预计将仅限于付费级别,如 Gemini Pro 或 Ultra。
人们普遍预计,该公司将在 Android 16 QPR3 的测试版中推出该功能,最早可能在 3 月份推出。
为何重要
如果按计划实施,Gemini 控制应用程序的能力将代表着人们与智能手机交互方式的重大转变,从手动使用应用程序转变为人工智能驱动的任务执行。
对于用户来说,这可能意味着更快、更方便的日常交互。对于开发者和监管者来说,在人工智能系统日益自主的时代,这也可能引发有关自动化、隐私和控制的新争论。
谷歌双子座人工智能的最新进展
2026 年初,谷歌双子座人工智能(Gemini AI)通过向消费者生态系统的战略扩张和增强浏览器集成而成为头条新闻。主要公告强调了其在从语音助手到网页浏览等日常技术中不断深化的作用。
与苹果公司合作全面改进 Siri
在 CNBC 报道的一份内部文件中确认的一项重要交易中,苹果公司已选择 Gemini 型号为下一代 Siri 提供动力,这标志着一项多年期合作的达成。此举充分利用了 Gemini 的先进功能,以重振落后于竞争对手的苹果人工智能助手。这一整合有望带来更智能、更符合情境的响应,通过 iOS 设备提升 Gemini 的市场影响力。
Chrome 浏览器人工智能升级
据9to5google.com 报道,基于 Gemini 3 的功能于 2026 年 1 月 28 日推出,引入了多任务侧边栏、更紧密的谷歌应用同步以及通过 Nano Banana 工具进行的创新图像编辑。此外,Gemini 将在 2026 年全面取代安卓设备上的谷歌助手,简化跨平台的语音交互。这些更新可实现主动任务处理,如自动研究和个性化。
更广泛的生态系统动力
2025 年早些时候,谷歌发布了 Gemini 2.5,其中的 “计算机使用 “功能可实现应用程序和浏览器的自主控制,为代理人工智能铺平了道路。Hir36等匈牙利媒体每分钟都在追踪这些信息,反映了欧洲的全球热议。随着人工智能竞争的白热化,Gemini 的跨设备推动使其成为一个多功能的动力源。

