近日,有媒體報道,谷歌正在人工智能領域加速布局,組建全新團隊專注于開發可模擬物理世界的“世界模型”AI技術。值得關注的是,該團隊由曾任OpenAI視頻生成器Sora聯合負責人的蒂姆·布魯克斯領導,他于2024年10月從OpenAI跳槽至谷歌旗下的DeepMind。

蒂姆·布魯克斯在社交媒體平臺X上發文透露,DeepMind計劃構建大規模生成模型,以模擬真實世界。他表示:“我們將專注于世界模型的開發,這是一條通往通用人工智能(AGI)的關鍵路徑。”他還宣布正在招聘新團隊成員,為這一目標注入更多技術力量。
布魯克斯進一步指出,該團隊的重點是**“實時交互生成”工具的開發**,并探索如何將世界模型技術與谷歌現有的多模態模型(如Gemini)整合,提升AI的推理、規劃和交互能力。
什么是“世界模型”?
“世界模型”被認為是當前AI技術中最復雜的領域之一,其目標是讓機器像人類一樣具備對物理世界的深刻理解。其核心優勢在于:
1. 視覺推理與環境模擬:可廣泛應用于機器人訓練、自動駕駛等領域。
2. 代理規劃與決策支持:為復雜場景中的AI決策提供支持。
3. 互動娛樂與虛擬世界構建:用于打造更智能的視頻游戲、電影和虛擬現實體驗。
這一技術的發展不僅關乎AI的感知能力,還可能成為通用人工智能的基礎構件。
谷歌的戰略與多模式模型整合
布魯克斯團隊的研究方向將與谷歌現有的多模態模型項目深度協作,包括:
• Gemini:谷歌的旗艦AI模型,應用于圖像分析、文本生成等多任務場景。
• Veo:谷歌的視頻生成模型,專注于內容創作與動態生成。
• Genie:谷歌的基礎世界模型,支持用戶通過多種輸入方式創建交互式虛擬環境。
布魯克斯計劃在這些技術的基礎上,進一步提升世界模型的復雜性和實用性,以實現“最高水平的計算能力”。
行業熱潮:多方競逐世界模型
不僅是谷歌,其他科技巨頭與初創公司也在爭奪“世界模型”賽道。包括:
• 李飛飛的World Labs:專注于世界模擬技術的前沿研究。
• 以色列公司Decart:開發真實感極高的機器人訓練環境。
• Odyssey初創公司:致力于將世界模型應用于互動娛樂與模擬領域。
這些公司普遍認為,“世界模型”將成為未來互動媒體、仿真系統和智能代理技術的核心基石。
谷歌此次吸引布魯克斯加盟并組建新團隊,凸顯其對“世界模型”戰略的重要性。作為一種前沿技術,世界模型不僅可以推動AI技術在多模態交互上的跨越性進步,還可能成為驅動通用人工智能的關鍵助力。未來,谷歌能否在這一領域取得突破性成果,將決定其在AI領域的長期競爭力。