Google I/O 2025 深度解析:Gemini 2.5 領軍 AI 超級代理,你我的搜尋與生活將如何被改變?
Google I/O 2025 大會是一個重要轉捩點,以前 Google 是走「AI 優先」(AI-first) 路線,也就是讓 AI 幫助你做事;現在他們改變策略,變成「代理式優先」(agentic-first),意思是讓 AI 不只是輔助,而是能主動幫你處理事情、替你行動。
Google 執行長 Sundar Pichai 和 DeepMind 的 Demis Hassabis 在演講中說,他們的目標是把 AI 研究變成人人用得到的實用工具,並把 Gemini 打造成一個超強的萬用 AI 助理。
這些不是空談,Google 拿出很驚人的數據:
- 每個月處理超過 480 萬億個 token(AI 的運算單位),是去年的 50 倍。
- 用 Gemini 寫程式的開發者超過 700 萬人,是去年的 5 倍。
- Gemini App 月活躍用戶突破 4 億。
這場發表會是 Google 對 OpenAI 和微軟競爭壓力的正面回應,他們不再只比模型厲害,而是要打造一個完整、實用、好用的「代理式優先」(agentic-first) 平台,讓 AI 從「聽你說」變成「幫你做」,開啟全新的未來互動方式。
https://google-io-2025.kcores.com

.
第一章 Gemini 引擎:淬鍊核心智慧
Google 的所有 AI 雄心都建立在其基礎模型之上。I/O 2025 揭示了 Google 正在執行一個複雜且精密的雙軌策略:一方面透過開放模型將低階市場商品化,建立廣泛的生態系;另一方面,透過專有的先進功能,打造高利潤的頂級服務,鞏固其在價值鏈頂端的地位。
1.1 Gemini 2.5 家族:優化效能與成本的邊界
Google 對其旗艦 Gemini 2.5 系列模型進行了重大更新,旨在滿足從大規模應用到高階企業需求的廣泛場景,Gemini 2.5 Pro 持續在 LMArena 等權威性能基準測試中保持領先地位,鞏固了其作為業界頂級模型的聲譽。
與此同時 Google 推出了全新的 Gemini 2.5 Flash,定位為「主力模型」,專為速度和低成本進行了優化。相較於前代,新版 Flash 在推理、多模態、程式碼和長文本處理等幾乎所有維度上都有顯著提升,其綜合表現僅次於 2.5 Pro。這一高效能、低成本的模型將成為 Google 大規模部署 AI 服務的基石,例如,它已被用於驅動 Search 產品中的全新 AI 模式和 AI 總覽功能。
本次更新中最引人注目的,是針對 Gemini 2.5 Pro 推出的實驗性增強推理模式——「Deep Think」。該模式運用了 Google 在「平行思維」等領域最前沿的研究成果,專為處理高等數學、複雜程式碼生成等高難度用例而設計。為了滿足企業級應用的需求,Google 還推出了「思維摘要」功能,該功能可以揭示模型在生成答案時的原始思考過程,包括關鍵細節和工具使用情況,極大地提高了模型決策的可追溯性和可審計性。
在可用性方面,Gemini 2.5 Flash 已於六月初在 Google AI Studio 和 Vertex AI 上正式提供給開發者和企業使用,而功能更強大的 Gemini 2.5 Pro 也將緊隨其後推出。
1.2 Gemma 家族:普及裝置端與專業領域的 AI
除了專有的 Gemini 系列,Google 也持續擴展其 Gemma 開放模型家族,旨在降低 AI 開發門檻,推動其在各個領域的普及。
最新的 Gemma 3 是一款高效的裝置端多模態模型,經過精心設計,可在僅有 2GB RAM 的裝置上流暢運行,並能同時處理文字、音訊和圖像等多種輸入格式。這為在手機、筆記型電腦等邊緣裝置上實現複雜的 AI 功能開闢了新的可能性。
基於 Gemma 3 架構,Google 還推出了一系列針對特定領域的開放模型,展現了其在垂直領域的深度佈局:
MedGemma:這是一款專為醫療領域設計的多模態模型,能夠理解和分析醫學文本與影像,如放射學圖像。它提供 4B 和 27B 兩種參數規模的版本,旨在成為開發者建構醫療保健應用的高效起點。
SignGemma:這是一款手語理解模型,目前專注於將美國手語 (ASL) 翻譯成英文文本,旨在為聽障社群開發創新的輔助技術,提升科技產品的可及性。
LearnLM:這是一個專為學習和教育場景微調的模型家族,現已直接整合到 Gemini 2.5 中。它能驅動如客製化測驗、分級閱讀等個人化學習體驗,目標是讓 Gemini 成為全球領先的學習模型。
DolphinGemma:這是一個看似小眾但具策略意義的模型,它被用於幫助科學家理解海豚的溝通模式。這個專案不僅展示了 Gemma 架構的靈活性,也凸顯了 Google 利用 AI 解決特定科學研究挑戰的承諾。

1.3 晶片基石:TPU Ironwood 的關鍵作用
Sundar Pichai 在演講中明確指出,模型的飛速進步離不開基礎設施的強大支持。他隆重介紹了 Google 的第七代 TPU 處理器——「Ironwood」。這款晶片專為大規模的「思考與推理」AI 工作負載而設計,其性能相較於前一代提升了 10 倍,每個 Pod 的運算能力高達驚人的 42.5 exaflops。
這一硬體層面的突破是 Google AI 策略的關鍵推動者。正是 Ironwood 卓越的效能功耗比,使得 Google 能夠「以最具效益的價格點提供最優秀的模型」,從根本上改變了 AI 運算的成本效益曲線。這種效率使得像 Gemini 2.5 Flash 這樣兼具強大性能與經濟性的模型得以大規模部署,進而驅動了每月 480 萬億 token 處理量的爆炸性增長,形成了一個從硬體到服務的良性循環。
第一章總結:Google 的 AI 策略不是只拚誰的模型比較強,而是更聰明地打造一整個市場生態。 他們推出開源的 Gemma 系列,像 Gemma 3 和 MedGemma,就是要讓更多人可以免費用到高效的 AI 工具,特別是在手機或特定領域的應用。這樣一來,開發者更容易入門,也更容易依賴 Google 的技術架構。
這種策略讓 Google 在開源市場快速擴張,也讓對手必須在 Google 訂的規則裡玩,等於在這些領域中建立了不成文的「標準」。
但另一邊,Google 把最強的 AI 能力(像 Deep Think 模式)放進每月要價 249.99 美元的高階訂閱服務,或是企業用的 Vertex AI 方案裡。
這種「槓鈴策略」作法:一邊用免費工具抓住大量使用者,另一邊靠高階功能賺取利潤。這比單純拚模型分數來得更有遠見,也更有商業策略。

.
第二章 從助理到代理:主動式 AI 的崛起
I/O 2025 最重要的策略主題,是 Google 有計劃、系統性地將 AI 從一個被動回應的助理,轉變為一個能夠跨應用程式和網路執行複雜、多步驟任務的主動代理。這標誌著人機互動典範的轉移。
2.1 從 Project Astra 到 Gemini Live:通用 AI 助理的雛形
Google 展示了其通用 AI 助理研究原型 Project Astra 的演進成果,其核心能力現已整合到 Gemini 應用程式中,並命名為 Gemini Live。這項功能允許使用者透過裝置的攝影機和螢幕,與 AI 進行即時、持續的多模態對話。在現場演示中,AI 不僅能識別眼前的物體,還能記住先前的互動內容(例如,回答「我稍早拿的那個杯子上的咖啡店叫什麼名字?」),並提供相關的脈絡資訊。
此舉的策略意義深遠,它揭示了 Google 對未來互動模式的構想:一個能夠看見你所見、並能長期記憶互動上下文的持續性 AI。更重要的是,Google 正在將這些功能免費提供給所有 Android 和 iOS 使用者,顯示其推動大規模普及的決心。這些「Live」功能也將於今年夏天被整合到 Search 的 AI 模式中,進一步擴大其應用範圍。

2.2 從 Project Mariner 到 Agent Mode:自動化網路世界
Project Mariner 是 Google 針對 AI 代理直接在瀏覽器中操作以完成複雜任務的研究專案。該專案現已發展出新的多工處理能力,以及一種名為「示範與重複」的學習方法,讓代理能夠從單次示範中學會執行類似任務。
這些強大的代理能力正在被迅速產品化。一個名為「代理模式」的新功能即將向 Gemini 訂閱使用者推出,使其能夠執行如尋找公寓房源、在網站上調整篩選條件,甚至安排看房等複雜任務。同時,Search 的 AI 模式也將利用 Mariner 的能力,協助使用者完成購買活動門票、預訂餐廳和安排本地服務預約等操作。
Google 的雄心不止於此。它正在建構一個代理生態系統,不僅透過 Gemini API 開放 Mariner 的能力,還引入了一個開放的「代理對代理」(Agent2Agent, A2A) 通訊協定,旨在促進不同 AI 代理之間的互操作性。這清楚地表明,Google 意圖成為一個全新的「代理式網路」(agentic web) 的核心平台。

2.3 Jules 與代理式開發:軟體生命週期的自動化
代理式的主題同樣延伸到了開發者領域。Google 推出了 Jules,一個自主的 AI 程式碼代理,現已進入公開測試階段。Jules 的設計目標是理解開發者的意圖,並非同步地執行複雜任務,例如編寫測試案例、修復錯誤以及在大型程式碼庫中進行操作。
Jules 能夠與現有的 GitHub 等程式碼託管平台整合,並在安全的雲端環境中運行,有效解決了企業對程式碼安全的擔憂。與此相輔相成的是 Android Studio 中新增的代理式體驗,如用於自動化 UI 測試的「Journeys」和協助處理版本升級的「Version Upgrade Agent」。
這些代理式工具的推出,預示著軟體開發的未來將發生深刻變革。開發者將從繁瑣的重複性工作中解放出來,轉而專注於更高層次的架構設計和創新,而 AI 代理將成為他們不可或缺的協作夥伴。

第二章總結:Google 的策略正在改變我們使用數位服務的方式。未來的主角不再是一個個 App,而是一個會主動幫你完成任務的 AI 助理,這就是所謂的「代理式優先」(agentic-first) 模式。
Google 在 Gemini 加入「代理模式」、讓搜尋功能也能幫你處理事情,還推出 A2A 協定,讓各種 AI 能互相配合。這些做法讓 AI 變成你跟數位世界互動的主要入口,而 App 和網站則變成背後的「工具」。
重點也從 App 的畫面好不好看,轉向它有沒有「開放 API」讓 AI 能用。Google 推出的 Model Context Protocol (MCP) 就是為了讓 App 更容易被整合進去。 未來最關鍵的不是手機主畫面上的 App,而是你 AI 助理裡的預設工具。
另外透過 Project Mariner,Google 把搜尋和 Chrome 結合,打造一個「代理式網路」,讓 AI 不只是找資料,而是直接幫你完成任務,比如買票或訂房。這雖然讓使用更方便,但也可能影響依賴廣告的網站流量。
最終「代理相容性」(agent-compatible) 會變得像「搜尋引擎優化」(SEO) 一樣重要,Google 正在用 AI 建立一個全新的網路互動模式。

.
第三節 重塑核心體驗:AI 即新使用者介面
在 Google 的旗艦產品中,AI 已不再是一個附加功能,而是正在演變為核心體驗本身。這一轉變正在從根本上改變使用者與資訊、通訊及生產力工具的互動方式。
3.1 搜尋的變革:AI 模式的崛起
Google 正在向使用者推出一個「全新的 AI 模式」(all-new AI Mode),並將其描述為對搜尋產品的「徹底重塑」。該模式擺脫了傳統的「十個藍色連結」範式,轉而提供一個完全對話式、類似聊天機器人的介面。它由 Gemini 2.5 模型驅動,並採用一種名為「查詢扇出」(query fan-out) 的技術,能夠將使用者提出的長篇、複雜問題分解成多個子主題,並行執行搜尋,最終綜合出全面的答案。
AI 模式整合了多種強大功能,包括深度研究能力、源自 Project Mariner 的代理式操作、源自 Project Astra 的即時多模態輸入,以及先進的數據分析和視覺化功能。此外,它還包含一個全新的 AI 驅動購物體驗,甚至提供了虛擬「試穿」(try on) 功能,讓使用者可以上傳自己的照片來預覽衣物上身效果。作為此模式的前身,AI 總覽功能已經擴展到 15 億月活躍使用者,並在美國和印度等主要市場為相關查詢帶來了超過 10% 的使用量增長。
目前 AI 模式已開始向所有美國使用者推出,標誌著 Google 搜尋體驗新紀元的正式開啟。
3.2 協作的未來:Google Beam 與即時翻譯
曾以 Project Starline 為代號的 3D 視訊通話亭,現已從一個研究專案正式畢業,成為名為 Google Beam 的商業產品。它是一個「AI 優先的視訊通訊平台」,利用一個由六個攝影機組成的陣列和先進的 AI 模型,來渲染出一個無需佩戴眼鏡即可觀看的、逼真的 3D 影像。該系統具備近乎完美的頭部追蹤能力,精準度達到毫米級,並能以每秒 60 幀的流暢度即時呈現,旨在創造一種身臨其境的對話體驗。首批與惠普 (HP) 合作開發的 Google Beam 裝置預計將於今年稍晚向早期客戶提供。
與此相輔相成的是 Google Meet 中新增的即時語音翻譯功能。這項技術不僅能翻譯語言,還能保留說話者的原始聲音、語調甚至表情,致力於實現跨語言的自然、流暢對話。
延伸閱讀:https://blog.google/technology/research/project-starline-google-beam-update/

3.3 Workspace 與超個人化:一個真正懂你的 AI
Google 正在為其 AI 模型引入「個人脈絡」(personal context) 的概念,允許模型在獲得使用者授權的前提下,從其 Gmail、Google Drive 等應用程式中提取資訊,以提供高度個人化的協助。
這項技術的首個重要應用是 Gmail 中的個人化智慧回覆。Gemini 能夠搜尋使用者過去的電子郵件和雲端硬碟中的文件(例如,一份旅行計畫的 Google 文件),從而生成詳細、符合情境且語氣匹配的回覆建議。這項功能將於今年稍晚向訂閱使用者開放。Workspace 的其他更新還包括在 Google Vids 中引入 AI 虛擬人像,以及在 Google Docs 中提供增強的寫作輔助功能。
第三章總結:Google 正在把搜尋轉向 AI 模式,這是一場非常大的策略賭注。未來你在 Google 上問問題,AI 會直接給完整答案、幫你完成任務,讓你不需要再點進其他網站。這雖然對使用者很方便,但也可能讓 Google 傳統靠廣告賺錢的生意受影響,因為點擊量會下降。
Google 的賭注是:它要在廣告收入減少之前,靠「代理式交易」等新方式賺到更多錢,來彌補這些損失。這場轉型的速度和成效,是這次 I/O 大會最關鍵的看點。
另一個關鍵優勢,是 Google 手上有超多使用者的「個人脈絡」資料,來自 Gmail、雲端硬碟、日曆、相簿等服務。這讓 Google 的 AI 更懂你,像是可以根據你雲端裡的行程自動幫你回信,這是其他競爭對手(像 OpenAI)很難做到的。
雖然這會引起隱私的擔憂,但這種「真正懂你」的 AI 實用性,可能會讓更多人願意繼續留在 Google 生態系。這也進一步強化了 Google 難以被取代的優勢。

.
第四節 全新的創意與互動前沿
Google 正在透過生成式媒體和全新的硬體形態,拓展使用者與 AI 互動和創作的邊界,將運算體驗推向傳統螢幕之外。
4.1 生成式媒體的興盛:Veo 3、Imagen 4 與 Flow
Google 在 I/O 2025 上發布了其最新一代的生成式媒體模型,標誌著其在內容創作領域的重大進展。
Veo 3:這是一款先進的影片生成模型,其最顯著的突破是加入了原生音訊生成能力。它不僅能生成影片畫面,還能創造出與畫面內容相匹配的音效,甚至是角色的對白,極大地提升了生成影片的完整性和實用性。
Imagen 4:作為 Google 最新的圖像生成模型,Imagen 4 在提升圖像的真實感和細節的同時,解決了一個長期困擾業界的難題:在圖像中準確、連貫地渲染文字和排版。這項能力的提升,使得 AI 生成的圖像在海報設計、廣告創意等商業應用中更具價值。
為了將這些強大的模型整合到實際工作流程中,Google 推出了 Flow,一個全新的 AI 電影製作套件。Flow 將 Veo 3、Imagen 4 和 Gemini 的能力集於一身,讓創作者能夠透過對話式指令,控制角色、場景和風格,創作出具有電影感的影片。它甚至支援將 AI 生成的內容與真人拍攝的素材混合編輯,為專業影視製作提供了新的可能性。為了展示其潛力,Google 還與著名導演 Darren Aronofsky 的製作實驗室合作,利用 Flow 創作了實驗性短片。
4.2 Android XR:將環境 AI 帶入你的視野
Google 透過對 Android XR 平台的重大更新,清晰地展示了其對環境運算的未來願景。Android XR 是 Google 為 VR 頭戴裝置和智慧眼鏡打造的平台。在 I/O 大會的現場演示中,一款由 Gemini 驅動的智慧眼鏡展示了其強大的能力:它能夠「看見」使用者周圍的環境,回答關於環境的問題,提供導航指引,並處理通訊任務,實現了 AI 與現實世界的無縫融合。
這並非 Google 的獨角戲,而是一個精心佈局的生態系統策略。在 VR 領域,Google 與三星合作開發名為「Project Moohan」的頭戴裝置,直接對標 Apple Vision Pro。而在更具挑戰性的智慧眼鏡領域,Google 做出了關鍵的策略選擇:與時尚眼鏡品牌 Gentle Monster 和 Warby Parker 合作,推出首批 Android XR 眼鏡。此外,XREAL 也參與了 Project Aura 專案。為了鼓勵開發者加入,Google 也同步更新了 Android XR 的 SDK 和模擬器,降低了開發門檻。
第四章總結:Google 推出 Flow 工具,代表它的策略從單純比 AI 模型厲害,轉向更重視「工作流程整合」。不像 OpenAI 的 Sora 只強調影片生成功能,Google 更在意創作者的整體需求——從構思、寫腳本到影像製作與剪輯,都能在 Flow 一站完成。這讓專業使用者可以更高效地創作,是一種更實用、更成熟的產品方向。
同時Google 推出的 Android XR 智慧眼鏡策略,也很有巧思。這次他們跟 Gentle Monster、Warby Parker 等時尚品牌合作,學到了當年 Google Glass 失敗的教訓。現在的目標不是硬推科技產品,而是先把眼鏡變成時尚配件,再悄悄把 Gemini 助理放進使用者的日常視野中。
這麼做的真正用意,是讓 Google 能透過眼鏡,持續獲得使用者周圍的視覺與聲音資訊,打造一個能真正「理解環境、主動幫忙」的 AI 代理,這是邁向未來環境運算平台的重要一步。

.
第五節 策略分析與市場定位
本節將對 I/O 2025 的發布內容進行綜合分析,將其置於更廣泛的競爭格局中,並剖析 Google 旨在建立一個可持續、具有防禦性的長期 AI 業務的策略。
5.1 構築護城河:開發者與企業生態系統
I/O 2025 發布了大量針對開發者和企業的工具與平台,旨在構築一個難以逾越的生態護城河。這些措施包括:透過 Cloud Run 和 Google AI Studio 簡化 AI 應用的部署流程;推出新的代理開發套件 (ADK) 和代理引擎使用者介面 (Agent Engine UI);提供由 Gemini 2.5 驅動的 Gemini Code Assist;以及在 Firebase Studio 中加入新的 AI 功能。尤為關鍵的是,Google 宣布與 NVIDIA 建立一個新的 Google Cloud & NVIDIA 社群,旨在提供專家支持、獨家學習內容和運算資源,直接瞄準高效能 AI 開發這一高價值市場。
5.2 競爭格局:與微軟、OpenAI 的三強鼎立
Google 的策略:Google 的策略現已非常清晰,即建立一個由其自有垂直整合技術棧(TPU -> Gemini -> 代理 -> 產品)驅動的、整合的代理式生態系統。其目標是透過將最有用、最主動的 AI 深度嵌入到全球最廣泛使用的消費者和開發者平台中來贏得競爭。
微軟的策略:從其 Build 2025 大會和 2025 AI 策略要點可以看出,微軟的策略重心在於企業市場。其目標是將 AI 代理和 Copilot 注入其整個企業軟體套件(Azure、Microsoft 365、GitHub),使 AI 成為董事會的優先事項和業務轉型的驅動力。同時,微軟也透過 NLWeb 和支援 MCP 等舉措,致力於建構一個「開放的代理式網路」。
OpenAI 的策略:OpenAI 持續專注於模型技術的領先地位和 API 的開放存取。其 2025 年的動態顯示,公司正致力於開發如 Codex(一個軟體工程代理)等新的代理能力,並推動 ChatGPT 本身變得更具代理性。其策略是成為驅動其他公司產品的核心智慧層,同時也透過自有應用程式直接參與市場競爭。
一個至關重要的趨勢是,「代理式網路」之戰正在成為新的平台戰爭。
Google 和微軟都已明確表示正在為此建構基礎設施,雙方都在支持像 MCP 這樣的通用協定,並開發工具讓代理能夠與網站和應用程式互動。這意味著下一個主要的平台戰爭將不再是關於作業系統或瀏覽器,而是關於誰的代理生態系統能成為使用者與數位世界之間的主導中介。贏家將控制資訊和商業的流動,其影響力將遠超當年的瀏覽器之爭。

.
結論:從 AI 優先到代理優先,Google 正在改寫平台規則
Google I/O 2025 展現的不只是技術堆疊,而是一場深層的策略重組。從「AI 優先」(AI-first) 到「代理式優先」(agentic-first),這是 Google 對未來人機互動模式的重新定義——不再只是回應式的工具,而是能主動理解、代表使用者行動的智慧代理。
它不再單靠模型分數競爭,而是構建一個橫跨開源普及與高階商業的雙層生態,以槓鈴策略滲透開發者與企業市場;它不再只是升級產品,而是全面重塑搜尋、XR 與創作流程,將 Gemini 和 Flow 變成通用的創作與決策平台。這些布局,最終指向的不是一個單一的產品競爭,而是對「世界模型」的長期主導權。
從創作人的角度來看,Google 正在構建的是一個能理解脈絡、跨模態溝通、並能主動協助創作決策的環境,這將重新定義我們與工具的關係。而從品牌與用戶信任的角度來看,Google 要贏的,不只是平台戰爭,而是能否在極致個人化與隱私信任間,找到讓十億人願意依賴的平衡點。
這是一場不只是技術,而是價值觀的賽局,Google 並非單純要打造最強的 AI,而是要成為我們未來生活與創作中的「第一位共同創作者」。
.
🚀 Google I/O 2025 AI 模型與平台矩陣
模型/平台 | 類型 | 主要特性 | 目標受眾 | 可用狀態 |
---|---|---|---|---|
Gemini 2.5 Pro | 專有大型語言模型 | 基準測試領先,增強推理能力 | 企業 / 進階使用者 | 預覽版 (Vertex AI) |
Gemini 2.5 Flash | 專有大型語言模型 (速度優化) | 低成本,快速推理 | 開發者 / 大眾市場 | 2025年6月 GA (AI Studio/Vertex) |
Deep Think | 推理模式 | 平行思維技術 | 研究人員 / 企業 | 信任測試者 |
Gemma 3 | 開放多模態模型 | 可在 2GB RAM 上運行 | 裝置端開發者 | 現已可用 |
MedGemma | 開放醫療視覺語言模型 | 醫療文本/影像分析 | 醫療保健開發者 | 現已可用 |
SignGemma | 開放無障礙模型 | ASL 至文本翻譯 | 無障礙應用開發者 | 今年稍晚推出 |
LearnLM | 微調學習模型 | 驅動測驗/學習體驗 | 教育科技 / 消費者 | 已整合至 Gemini |
Veo 3 | 影片生成模型 | 帶有原生音訊的影片生成 | 創作者 / 電影製作人 | Gemini App / API |
Imagen 4 | 圖像生成模型 | 先進的文字渲染能力 | 創作者 / 設計師 | Gemini App / API |
Jules | AI 程式碼代理 | 非同步程式碼生成 | 開發者 | 公開測試版 |
Project Mariner | 網頁互動代理 | 多步驟網頁任務自動化 | 消費者 / 開發者 | 已整合至 Search/Gemini App |