Google DeepMind剛剛放出了Gemini 3.5,這次不是簡單的升級——官方部落格的標題直接點明瞭方向:「frontier intelligence with action」。翻譯過來就是:能動手的智慧。Gemini 3.5被設計用來執行那些複雜、多步驟的代理工作流(agentic workflows)。這不再是陪你聊天或生成圖片的模型,而是一個能自主規劃、呼叫工具、完成任務的AI智慧體。
什麼是「代理工作流」?為什麼現在才做?
過去的對話模型,本質上還是個「應答機」——你問一句,它答一句。即便加上外掛呼叫,也是單次觸發:使用者說「查天氣」,模型調API返回結果。但要完成「幫我規劃一次去東京的旅行,包括查機票、找酒店、排行程,並在日曆上標註」這種任務,就需要模型自己拆解子目標、依次執行、根據中間結果動態調整。這就是代理工作流的核心:自主性、多步推理、工具使用。Gemini 3.5正是為此而生。
DeepMind在部落格中提到,Gemini 3.5在規劃能力和工具呼叫精度上有顯著提升。它能夠理解高層目標,自動分解為可執行的步驟,並在執行過程中保持上下文連貫——即便某個步驟失敗,也能嘗試替代方案。這聽起來可能有點抽象,但如果你想象一下AI為你跑一個複雜的自動化指令碼,它不再需要你每一步都盯著、糾正,而是可以放手讓它自己跑通。
哪些場景會直接受益?
首先是企業自動化。過去用RPA(機器人流程自動化)來處理資料錄入、報表生成等重複性任務,但RPA指令碼僵化,一遇介面變化就報廢。Gemini 3.5這類模型可以作為智慧流程引擎,通過自然語言描述任務,自動生成執行計劃並呼叫各類API或GUI工具。例如,財務部門可以讓它「從SAP匯出上月銷售資料,格式化後傳送郵件給區域經理,並標註異常值」——整個過程無需手動配置。
其次是軟體開發和運維。DevOps場景中常有複雜的部署、測試、回滾流程,而Gemini 3.5可以承擔一部分自動化編排工作。開發者可能只需要說「為新功能分支執行整合測試,如果通過則部署到staging環境,並通知團隊」,模型就會呼叫CI/CD工具鏈完成操作。這對初創團隊尤其有意義——缺乏專職運維,但模型能頂上。
另外,個人AI助理也將從「問答」升級到「執行」。想象一下,你對手機說:「把這個週末所有會議時間發給參會者,並預訂每個人到達公司最近的共享辦公室。」如果模型能做到,那才是真正的智慧助理。Gemini 3.5代表了這個方向的第一步。
硬核能力:規劃與工具呼叫的深度融合
從技術角度看,Gemini 3.5相比之前版本有幾個關鍵改進:
- 分解式規劃:模型能自動將複雜任務拆成子任務,並確定依賴關係。不再需要人為提供思維鏈提示。
- 動態工具選擇:內建的工具使用層可以根據任務需求,自主決定呼叫哪些API、資料庫或外部模型,無需預設工作流。
- 錯誤恢復:當一個步驟失敗(比如API超時),模型能嘗試重試、調整引數或切換到替代工具——而不是直接崩潰報錯。
當然,這些能力目前可能還侷限在DeepMind內部測試環境中。Google的部落格沒有給出具體的效能基準,但強調這些改進是基於真實世界複雜任務驗證的。獨立開發者和企業目前還無法直接使用Gemini 3.5,但可以關注其後續通過Google AI Studio或Vertex AI上線的API版本。
怎麼看這件事?
Gemini 3.5的釋出,是AI從「對話工具」向「自主代理」演進的重要里程碑。過去一年,業界一直在討論智慧體(Agent)正規化,但真正落地的產品很少——主要卡在規劃可靠性和工具呼叫的魯棒性上。DeepMind作為AlphaGo和AlphaFold的締造者,在推理和規劃方面有深厚積累。這次將能力注入Gemini產品線,意味著自主工作流AI正式進入實用化軌道。
對於開發者而言,現在是時候熟悉「代理模式」了——不再是寫一個prompt然後期待魔法,而是設計任務描述、提供可靠的工具介面,讓模型自己編排執行。對於企業決策者,可以將部分自動化流程的預算投向智慧體方案,但需警惕初期模型幻覺和錯誤蔓延的風險。
短期內,想嚐鮮的使用者可以關注Google DeepMind的部落格更新,看是否放出演示或研究論文。中期內,預計會有基於Gemini 3.5的API或服務推出,屆時才是真正的應用爆發點。
一句話:別再把AI當聊天框,它要開始幹活了。











評論
暫無評論
成為第一個評論的人