當你開啟Google Street View,看到的是一張張360度靜態照片。但DeepMind最新的Project Genie,正在把這些靜止的街景變成可以走進去、互動起來的3D世界。聽起來像科幻片?其實它已經來了。
World模型的新玩法
Project Genie本質上是一個AI世界模型。它不像傳統3D重建那樣依賴鐳射掃描或手工建模,而是直接從海量的Street View影象中學習——理解空間的幾何結構、光影變化、物體之間的相對關係。然後,當使用者輸入一個地點(比如東京的某條小巷),Genie就能生成對應的互動式3D場景,你可以在裡面自由移動、改變視角,甚至模擬不同的天氣和光照條件。
這一點對遊戲開發者尤其有意義。過去要復刻一個真實地點,需要前期大量實地拍攝和建模工作。現在,通過Street View的資料庫,Genie幾乎能瞬間生成任何可街景覆蓋區域的數字孿生。
Street View的新角色
Google Street View已經執行了十幾年,積累了超過1700億張圖片。但以前,這些圖片的用途基本停留在「檢視」層面。Project Genie把它變成了一座龐大的訓練素材庫。模型不僅學習建築和道路的外觀,還能推理出空間背後的物理邏輯——比如一堵牆背後的區域應該被遮擋,而不是憑空消失。
這種能力源於DeepMind在生成式AI和3D視覺上的長期積累。據官方介紹,Genie在訓練時使用了數億張來自不同國家和地區、不同時間段的街景影象,因此對現實世界的多樣性有很強的適應能力。不過,目前生成的場景在細節上仍有提升空間,比如人物和車輛的動態模擬還不夠自然。
開放與限制
Project Genie並非完全免費。它首先面向Google AI Ultra訂閱使用者開放,這是Google One旗下的高階AI服務,包含Gemini Advanced等工具。訂閱使用者可以通過專門的介面輸入地點,然後生成並匯出3D場景。官方沒有透露未來是否會擴充套件到更低層級或免費使用,但考慮到計算成本,初期保持訂閱制是合理的。
此外,生成的場景可以用於非商業用途,比如教學設計、虛擬旅行或者個人創意專案。如果開發者想在商業遊戲中直接使用,可能需要額外的授權——不過這點DeepMind還沒明確。
意義不止於「好玩」
除了娛樂和設計,Project Genie在城市規劃、災害模擬、文化遺產保護等領域也有潛力。你可以用它快速模擬一個新建築對周圍環境的光照影響,或者遊客在古蹟中的移動路線。甚至,對於自動駕駛系統來說,這種合成的真實世界場景也能提供額外的訓練資料——不過那可能需要更高精度的互動。
當然,隱私問題也不容忽視。Street View本身曾因拍攝到人臉等敏感資訊而引發爭議。雖然DeepMind表示生成的場景會模糊處理個體資訊,但能否完全避免資料濫用,還需要更透明的機制。
總的來看,Project Genie是AI將「看」轉化為「懂」的一個漂亮案例。它讓街景不再只是一張張照片,而變成可以走進去、可以改變的空間。對訂閱使用者來說,這是一個值得立刻去試的新玩具;對行業來說,它可能預告了下一代3D內容生成的方式。











評論
暫無評論
成為第一個評論的人