谷歌DeepMind的機器人團隊宣布了三項新進展,旨在幫助機器人在復雜環境中做出更快、更好、更安全的決策。其中之一是一個用于收集訓練數據的系統,配備了“機器人憲法”,以確保您的機器人辦公助手在為您取更多打印紙的同時不會撞到處于途中的人類同事。
谷歌的數據收集系統AutoRT使用了視覺語言模型(VLM)和大型語言模型(LLM),相互協作以理解環境、適應陌生情境,并決定適當的任務。該“機器人憲法”靈感來自于Isaac Asimov的“機器人三定律”,被描述為一組“以安全為重點的提示”,指導LLM避免選擇涉及人類、動物、尖銳物體甚至電器的任務。
為了額外的安全性,DeepMind將機器人程序設計成在其關節受力超過一定閾值時自動停止,并添加了一個物理切斷開關,以供人類操作員使用進行停用。在為期七個月的時間里,谷歌在四個不同的辦公樓部署了53臺AutoRT機器人,并進行了超過77,000次試驗。一些機器人由人類操作員遠程控制,而另一些則根據腳本或完全自主地使用谷歌的Robotic Transformer (RT-2) AI學習模型操作。
AutoRT對每個任務執行以下四個步驟。在試驗中使用的機器人看起來更加實用,配備有攝像頭、機械臂和移動底座。Google在其博客文章中指出:“對于每個機器人,系統使用VLM理解其環境和視野內的物體。接下來,LLM提出一系列創造性的任務清單,如‘將零食放在臺面上’,并扮演決策者的角色,選擇機器人執行的合適任務。”
DeepMind的其他新技術包括SARA-RT,這是一個神經網絡架構,旨在提高現有Robotic Transformer RT-2的準確性和速度。此外,RT-Trajectory添加了2D輪廓,幫助機器人更好地執行特定的物理任務,比如擦拭桌子。
雖然我們離能夠完全自主為人們服務、整理枕頭的機器人似乎還有很長的路要走,但當它們面世時,它們可能已經從AutoRT這樣的系統中學到了一些經驗。


產品與服務
聯系站長
關于我們