<strike id="bnbzb"></strike>
<span id="bnbzb"><dl id="bnbzb"></dl></span>
<span id="bnbzb"><dl id="bnbzb"><ruby id="bnbzb"></ruby></dl></span>
<strike id="bnbzb"><i id="bnbzb"><cite id="bnbzb"></cite></i></strike>
<strike id="bnbzb"></strike>
<ruby id="bnbzb"></ruby>

中信建投:谷歌旗下兩大AI實驗室合并 機器人模型進展有望進一步加速


(資料圖)

中信建投發布研報稱,2023年4月20日,Google宣布將Google Brain和DeepMind兩大世界級AI實驗室合并,成立Google DeepMind部門,以谷歌的計算資源作為后盾,加速人工智能研發和應用的推進。Google Deepmind在2023年6月和7月發布了其最新研究成果,具備“自我完善”能力的“RoboCat”和融合大語言模型能力的VLA模型“RT-2”,機器人智能化進一步加速,有望掀起新一輪AI革命。

中信建投主要觀點如下

從Gato到RoboCat,更大規模的訓練數據集和創新的自我完善方法助力打造更強的機器人智能體。在2022年5月提出的Gato模型將智能體擴展到機器人控制領域中,但“通用性”和“智能性”仍有較大提升空間,其模型架構和控制任務數據的序列化方式是后續模型發展的重要基礎。2023年7月提出的RoboCat則基于Gato的模型基礎,將訓練數據集擴充至400萬個機器人相關片段,并創新性的提出“自我完善”的方式來進一步豐富訓練數據,這兩點創新讓RoboCat在實現了訓練任務的性能提升并具備了一定的泛化性能,并且能夠在少量數據微調的情況下處理未見過的任務。

從RT-1到RT-2,大語言模型帶來更強的泛化能力、邏輯推理能力、知識能力,深度賦能機器人智能化。2022年12月提出的RT-1模型構建起了特定的指令、圖像和機器人指令之間的橋梁;2023年3月的PaLM-E模型則能夠處理輸入的文本和圖像信息,將復雜任務轉化為RT-1能夠接受的指令;2023年7月提出的RT-2是二者的融合, 在大語言模型強大能力的賦能下,RT-2能夠完成分解復雜任務、簡單的計算、識別人臉等現實場景中常見但以往的模型無法完成的任務,智能化程度大幅提升。

差異路線引領發展,團隊整合協同革新。Google Brain和DeepMind兩個團隊從兩個不同的切入點出發逐步推進AI機器人模型發展,DeepMind團隊從智能體(Agent)的角度出發不斷提升機器人能力,因此RoboCat中的訓練數據大多來自強化學習,模型參數量控制表現更為優秀,能夠實現更高頻率的機器人控制;而Google Brain則嘗試將大語言模型應用到機器人的控制領域,因此RT-2的模型參數量更大,在泛化能力、知識和推理能力方面有更強的表現。隨著兩個團隊進一步合并,深化數據、模型等方面的協同合作,谷歌的機器人模型進展有望進一步加速。

關鍵詞:

亚洲不卡顿无码在线观看
<strike id="bnbzb"></strike>
<span id="bnbzb"><dl id="bnbzb"></dl></span>
<span id="bnbzb"><dl id="bnbzb"><ruby id="bnbzb"></ruby></dl></span>
<strike id="bnbzb"><i id="bnbzb"><cite id="bnbzb"></cite></i></strike>
<strike id="bnbzb"></strike>
<ruby id="bnbzb"></ruby>