在最新的 Google I/O 2025 年度發表會上,Google 公佈了一系列針對 AI、搜尋引擎、Android、擴增實境(XR)及未來人機互動的重大更新。儘管 Android 16 在活動前已率先亮相,這場發表會的重點則放在接下來的發展:更智慧的 Gemini 整合、對搜尋引擎的大膽重構,以及 Android XR 眼鏡的實地演示。

這些改變對於非洲的開發者及數位創業家來說,代表著建立新平台、設計新介面的機會,還有將智慧融入搜尋、對話和人機互動方式的新可能。

Gemini 2.5:準備迎接真實工作的 AI

在 I/O 2025 上,Google 公佈了其 Gemini AI 模型的重大升級,為非洲的創業公司和開發者帶來了振奮人心的新機會。Gemini 2.5 Pro 現在支持多達 200 萬字的內容視窗,這意味著它能夠一次讀取整本書籍或法律文件。這對於當地的教育科技、法律科技以及金融科技平台來說,是一項重大突破。例如,一款來自尼日利亞的 SaaS 工具可以即時分析合同,而肯尼亞的教育應用程式可以將教科書翻譯並總結成斯瓦希里語或阿姆哈拉語,從而節省昂貴的人力工作。

開發者亦能使用進階推理模式 Deep Think,這可以幫助構建更智能的健康、金融或公共服務工具。在網路訪問有限的地方,Gemini Nano 可以直接在手機上運行,這代表用戶可以獲得如詐騙電話檢測或離線文本摘要等功能,而不需要連網。

Google 還將即時語音翻譯引入了 Google Meet,使用 Gemini AI 讓人們可以即時在說話的同時以另一種語言進行翻譯,而且仍然保持說話者的語調和聲音。對於擁有各種語言的非洲大陸而言,這可以讓商務會議、線上課程或遠程服務更便捷,而不受語言障礙影響。

「Gemini 2.5 Pro」現已通過 Gemini API 和 AI Studio 實現,擁有如 200 萬字內容視窗和原生音訊輸出的新功能。進階推理模式 Deep Think 目前仍在有限預覽中,而 Gemini Nano 則通過新的 Android 和 Chrome API 提供設備端 AI 功能。Google Meet 的即時語音翻譯將很快推出,具體發布細節尚未確認。

AI在搜尋中的應用

在 Google I/O 2025 上,對於非洲科技社群來說,Google 的重新構想搜尋引擎是重要的一次更新。AI 概述現已上線,為所有人提供快速、對話式的搜尋結果摘要。這些摘要由 Gemini 提供動力,旨在幫助用戶獲取所需資訊,而不必打開多個鏈接。

這種新的搜尋體驗改變了 Google 上的可見性規則。對依賴內容的非洲創業公司來說,能在 AI 摘要中亮相成為新目標。例如,一個健康科技網站分享防治瘧疾的建議,已不能只依賴傳統的 SEO 策略。文章需要組織良好,圍繞常見的使用者問題編寫,並輔以清晰的元數據,才能有機會被 AI 選中。

AI 模式現已在 Google 搜尋中向所有美國用戶推出,首批新功能首在此發布,然後才會整合到常規搜尋中。

實惠的建設:Gemini 給開發者帶來新契機

Google 在 I/O 2025 擴展了對其 Gemini API 的訪問,並引入了如 Gemini Flash 等模型,為非洲開發者提供了快速且低成本的工具,能夠在不需大量基礎設施的情況下構建 AI 解決方案。

在 I/O 2025 上,Google 擴大了 AI Studio 的功能,使其成為一個更強大的 no-code 平台,支持 Gemini 2.5 模型和 Firebase Genkit,它簡化了後端整合過程。Jules 編程助理也首次亮相,能理解不僅是代碼語法,還有開發者的意圖,幫助改善軟件開發工作流程。對於沒有內部 AI 人才的早期創業公司,這些工具將成為開發中的助力。

Google 還推出了 Stitch,一個由 AI 驅動的工具,可以將簡單的提示或草圖轉換為可用的 UI 設計和代碼。基於 Gemini 2.5 Pro,Stitch 加快了應用程式開發速度,快速生成前端代碼和多種設計選項,幫助開發者和設計師輕鬆地實驗和完善他們的想法。

此外,科技巨頭還推出了如 AI Pro ($19.99/月) 這樣的優惠訂閱計划,讓資源有限的開發者能夠獲得先進的 AI。在與免費工具和適用於合資格初創企業的 Google Cloud 積分搭配時,這些計畫降低了創新中的財務壁壘。

對於致力於教育、健康或農業本地挑戰的非洲初創企業來說,這一時刻非常重要。隨著合適工具的推出,構建強大且影響力大的 AI 驅動的解決方案變得更加可能。

Gemini App 的 Flash 已向所有用戶提供,預計將於六月全面提供給生產環境使用。Stitch 目前作為 Google Labs 中的早期預覽版本,可在 stitch.withgoogle.com 使用。

Project Mariner:適合移動優先的非洲

有超過 84% 的非洲智能手機用戶使用 Android,Google 的新 AI 驅動 Project Mariner 可能會改變數百萬人的網路互動方式。這個 AI 代理能瀏覽多個網站,摘要內容並處理任務,讓用戶能專注於其他事務。在忙碌的城市或連線有限的偏遠地區,這將是一個重大的改變。

Project Mariner 的整合可協助 Android 15 解決非洲獨特的需求,並引入如衛星消息以實現離線簡訊、保護共享手機上敏感數據的私人空間,以及改善中端設備的電池壽命等多個功能,幫助開發人員構建更具韌性和隱私意識的應用程式。Mariner 不僅提高了行動使用的效率和個性化,還為非洲投資者開啟了新機會,有潛力透過 AI 驅動的自動化解决農業、醫療和教育面臨的地方挑戰。

但這也帶來了一些挑戰。Google DeepMind 的 CEO Demis Hassabis 警告關於 AI 的“幻想”,當系統自信地提供錯誤答案時,可能會削弱用戶的信任。而出版商也擔心 AI 代理瀏覽他們的內容時,可能會分散注意力和收益。

對非洲的開發者和創作者來說,這一時刻要求適應,否則可能面臨在 Google 轉向 AI 優先網路時被拋下的風險。

Project Mariner 預計在 2025 年夏季整合到 Google 搜尋中的 AI 模式中。

將聲音、視覺與背景結合的 Project Astra

在 Google I/O 2025 上,首次於 2024 年作為研究原型展示的 Project Astra 成為了亮點之一。它現在已整合到 Google 搜索、Gemini 應用程式和開發者工具中。對於非洲來說,這類 AI 能理解視覺、聲音和背景的能力,將有助於解決圍繞識字、語言障礙和不穩定網路的真實問題。

Astra 讓用戶能夠使用相機和麥克風以實時互動。烏干達的農夫可以將手機對準生病的木薯植物並用他們的本地語言收到建議。在拉各斯,倉庫工人可以透過說話來管理存貨,而不需要輸入。這種技術使得農業、教育和小型企業的工具變得更加有用和易於使用。

它已支持 24 種語言並能自然地在它們之間切換,這在如非洲多語言的地區是個重大突破。由於它運行於 Android 和 iOS,因此更多人能夠使用。Astra 還提供了 Google 搜索中的新“即時”按鈕,讓你能就相機所見事物提出問題,並立即獲得答案。

Astra 的特殊之處在於它不斷增長的“察言觀色”能力。正如 DeepMind 的 CEO Demis Hassabis 所言,這意味著了解何時行動、用什麼語氣,並且—同樣重要地—何時保持沉默。這種微妙的智慧非常難以構建,但對於使 AI 在日常情境中感覺更有幫助和人性化至關重要。

對本地開發者來說,有了 Astra 融合入 Google 的工具,他們可以開始構建不僅支持文本,也支持語音和視頻的應用程式。這是創造更智能、更有用的解決方案的機會,真正符合非洲人的生活和工作方式。

Astra 支持 24 種語言,並預計將進一步擴展。Google 尚未宣布 Project Astra 智能眼鏡的發布日期,目前正在 Google AI Pro 和 Ultra 用戶的測試版中使用。

硬體與運算:非洲進入全球 AI 網格

驅動這些工具的背後是計算能力,Google 正在加大投入。它介紹了第七代 Tensor Processing Unit (TPU),專為推論工作設計的 Ironwood。Ironwood 提供其前代 10 倍的性能,並提供每個 Pod 42.5 exaflops 的運算能力,使高級模型如 Gemini 2.5 Pro 能高效運行。

這些硬體效率提升對於支持現實世界中的 AI 應用至關重要,特別是在資源有限的環境中。對非洲來說,這比以往任何時候都更重要。由於基礎設施如將歐洲連接至西非的 Equiano 海底光纜改善了連線質量,拉各斯、阿克拉及開普敦等樞紐的數據傳輸速度和延遲顯著提高,使得基於雲端的 AI 開發在整個大陸上變得更實際且經濟。

Ironwood 的多重模式功能更進一步支持能獨立計劃和執行複雜工作流的代理 AI,開啟了從醫療到教育領域的更智能、更自動化的工具的大門。

Ironwood TPU 預計將在 2025 年晚些時候推出。

為非洲創作者及媒體機構帶來新機會

Google 不僅推出了商業工具,也推出了多種新創意 AI 系統,這將改變我們製作視頻、圖片和音樂的方式。

Flow 是 Google 的新 AI 應用,能從文字描述中創建複雜的視頻場景。著名導演 Darren Aronofsky,製作《The Whale》與《Black Swan》,已將這些工具納入了他的創作過程,證明專業人士已經開始認真考量這些技術的實用性。

Imagen 已更新至第 4 版,在生成圖像的細節與逼真度上更勝一籌。Veo 3 除了改進了視頻的生成效果,也能夠添加音效、背景聲音和聲音,大幅降低了創作者製作高質量視頻所需的設備和人力。

Google 亦更新了音樂生成系統 Lyria 2,現在能創作完整的歌曲及編輯現有音樂,這可能幫助非洲音樂家製作專業音軌,而不必花費昂貴的錄音室時間。

此外,Google 還推出了 SynthID,能對 AI 生成的內容添加不可見的水印,日後可以用來驗證,以辨別哪些內容是由 AI 創作,使得已漸難以分辨的界限可被更清楚區別。

這些工具為非洲媒體創作者提供了更快更省成本製作高質量內容的方式。

Google 尚未透露 SynthID 和 Lyria 2 的具體推出日期,但預計將應用於其 AI 媒體工具中。Imagen 4 已通過 Gemini app、Vertex AI、Whisk 和 Google Workspace 應用如 Slides、Docs 及 Vids 上線。Veo 3 目前僅限於美國用戶的 $249.99/月的 AI Ultra 計畫,尚無全球推出時間表。

給非洲科技業的啟示

儘管全球的對話一再集中在 AI 可能取代人類工作,Google 的工具旨在為全球、以移動優先受眾設計的構建塊,這正好契合非洲的科技需求。

非洲的初創企業應盡早利用 Gemini 的功能。添加智能回复和 AI 摘要以改善產品。内容團隊需要為 AI 帶來的搜尋變革做好準備。開發者可以使用 Android 15 和 Astra 創造適合非洲的新移動體驗。

投資者則應尋找利用這些工具解決非洲問題的初創企業。最佳的機會不在於追隨全球趨勢,而在於將這些工具本地化應用。

那些創造出實用且符合本地需求的 AI 應用的非洲科技建設者將主導一場獨具非洲特色的科技革命。他們將運用全球創新來應對區域挑戰並創造新機遇。