創(chuàng)澤機器人
CHUANGZE ROBOT
當前位置:首頁 > 新聞資訊 > 行業(yè)動態(tài) > ICRA 自然語義引導的機器人技能操作

ICRA 自然語義引導的機器人技能操作

來源:CAAI認知系統(tǒng)與信息處理專委會     編輯:創(chuàng)澤   時間:2023/11/7   主題:其他 [加盟]

隨著自然語言處理技術(shù)的發(fā)展以及客戶需求的提高,當機器人進入以人為主的環(huán)境時,必須學會理解人類語言,完成指定任務。相較于傳統(tǒng)只對場景做出反應的機器人操作方法,結(jié)合語義輸入,讓機器人理解人類語言,根據(jù)場景和自然語言指令完成相應任務,能為人機協(xié)作帶來更大的便利性。然而,目前該方法具有如下限制:

(1)依賴手工編碼任務符號來實現(xiàn)語義表達,限制了語義層面的泛化性。

(2)從指令中推斷動作序列時,需要密集的子目標監(jiān)督。

(3)缺乏更深層次的以目標為中心的推理方法,在解釋復雜指令時不連貫。

針對上述問題,該文章提出了一種可感知視覺場景,同時處理語言輸入的端到端可訓練的模型。該模型使用視覺輸入得到當前場景中物體在初始狀態(tài)下的位置關系,以語義文字推理目標狀態(tài)下對應的位置關系,實現(xiàn)由自然語言引導機器人進行技能操作。 相關成果以“Learning Neuro-symbolic Programs for Language Guided Robot Manipulation”為題發(fā)表于International Conference on Robotic and Automation (ICRA)會議中。

該文章提出了一種新型神經(jīng)符號模型,使用自然語言推理目標場景,實現(xiàn)在給定初始場景和目標場景的情況下即可學習執(zhí)行復雜的操作任務,并展示了如何在不需要任何中間監(jiān)督的情況下,僅使用初始與目標兩個場景作為監(jiān)督來獲取機器人操作動作的密集表示。 實驗表明,該文章的方法可通過端到端的訓練而不需進行任何子目標監(jiān)督,即可展現(xiàn)出強大的指令理解能力,并對新場景和指令展現(xiàn)出強大的泛化能力,為將來基于自然語言的人機協(xié)作,機器人的語義指令集的拓展提供了新的參考思路。

1、模型結(jié)構(gòu)設計

該端到端模型的結(jié)構(gòu)如圖1所示,由視覺提取器、語言解釋器、視覺解釋器、動作模擬器組成。輸入初始場景和基于自然語言的任務指令,模型輸出完成該指令所需的動作參數(shù),以及預測完成任務后的最終場景。

視覺提取器相當于一個目標檢測模型,用于識別初始場景下的物體信息。以圖11為例,輸入桌面初始狀態(tài)的圖像,視覺提取器輸出各個物體的外接框、顏色信息及物體名稱,并由外接框在桌面上的相對位置推斷物體的位置信息。

語言解釋器用于處理自然語言指令推理任務中隱含的操作動作。例如圖中“移動綠色骰子后面的紅色骰子至紅色方塊的右邊”這句指令,語言解釋器經(jīng)過推理會得到完成該任務需要進行“移動”動作,移動的物體是“位于綠色骰子后面的紅色骰子”,目標是“紅色方塊右邊”,并可屏蔽“綠色方塊”和“藍色骰子”這些與完成任務無關的信息。推理完畢后,以專用指令集組合出推理結(jié)果。

專用指令集的結(jié)構(gòu)如圖2所示,分為“關鍵詞”和“操作詞”,前者用于描述物體信息,后者用于表示操作信息。

視覺解釋器結(jié)合前二者輸出的場景信息和任務指令集,輸出完成該任務所需的參數(shù)化表示,交由任務模擬器生成機器人所能執(zhí)行的動作參數(shù),并預測完成任務后的場景情況。

以預測場景和數(shù)據(jù)集中提前設定好的目標場景做差,設置損失函數(shù),即可實現(xiàn)端到端的訓練過程。


人形機器人的落地思考-場景聚焦明確產(chǎn)品形態(tài)考慮成本設計

要立足場景正向設計產(chǎn)品從場景出發(fā)解決問題;續(xù)航能力將是制約人形機器人應用和發(fā)展的又一個重要因素;需要做到萬元級別的成本才有可能大面積進入家庭

中國公共服務機器人產(chǎn)業(yè)鏈研究報告2023-市場規(guī)?偭刻嵘^快,企業(yè)總量增速放緩

服務機器人的市場規(guī)模在2019年后快速增長,預計到2025年CAGR將達到近65%;人形機器人會是未來公共服務機器人主要形態(tài),軟件升級引領硬件發(fā)展

中國服務機器人行業(yè)未來的主要發(fā)展趨勢

商業(yè)模式創(chuàng)新,打造一體化服務,持續(xù)拓展下游細分賽道;業(yè)務模式創(chuàng)新,多場景融合,實現(xiàn)實現(xiàn)一個服務機器人可以完成在多場景下完成工作

中國服務機器人行業(yè)發(fā)展目前面臨的潛在風險

新科技的出現(xiàn)可能會對傳統(tǒng)服務機器人廠商造成 一些沖擊;優(yōu)秀畢業(yè)生首選行業(yè)是軟件和信息服務可能會導致人才供給不足等風險;行業(yè)內(nèi)公司經(jīng)營模式相似度過高

中國服務機器人行業(yè)發(fā)展目前面臨的主要挑戰(zhàn)

收入和研發(fā)費用的比例均超過了5%;國產(chǎn)機器人推廣應用面臨新場景拓展慢的挑戰(zhàn);代理商分銷的方式可以有效的幫助服務機器人廠商也會造成市場的惡意競價

服務機器人在中國市場短期迎來向好拐點 需求增長

在已使用或計劃使用服務機器人的企業(yè)中,酒旅,金融服務,餐飲快消行業(yè)滲透率最高,均超過20%;2023年6月我國服務機器人產(chǎn)量為662658臺,同比增長40%

服務機器人產(chǎn)業(yè)迎來向好拐點 增長空間巨大

進入2023年后服務機器人產(chǎn)量同比增長47.6%,結(jié)束了連續(xù)12個月的同比下滑;人工智能技術(shù)的突破也將給服務機器人從語音,視覺,決策,控制四個方面帶來賦能

創(chuàng)澤上市輔導進展情況報告(第十三期)20230414

中原證券參與輔導工作的人員為高巖,趙巖,鄒堅貞,胡殿軍,李雅璇,開展輔導的方式主要包括持續(xù)關注相關行業(yè)領域熱點信息

環(huán)境感知的核心SLAM算法基本結(jié)構(gòu)可分為前端和后端

算法在前端完成占據(jù)柵格地圖的構(gòu)建,得出激光雷達掃描幀的最佳位姿后,后端根據(jù)掃描幀間的位姿關系進行全局的地圖優(yōu)化,得出閉環(huán)掃描幀在全局地圖中的最佳位姿

環(huán)境感知模塊中基于激光雷達或視覺傳感器的SLAM算法是核心

環(huán)境感知模塊的基礎硬件是各類不同的傳感器,收集不同的測量信息,SLAM算法用于融合收集的信息數(shù)據(jù),機器人可以在未知環(huán)境中進行自主探索和導航

運動控制、環(huán)境感知與人機交互是公共服務機器人三大核心技術(shù)模塊

環(huán)境感知模塊主要依靠如激光雷達實現(xiàn)對內(nèi)外部環(huán)境狀態(tài)信息的獲取;運動控制模塊主要依靠控制器等硬件實現(xiàn)派發(fā)的位置指令;人機交互模塊主要依靠多模態(tài)信息理解交互技術(shù)

公共服務機器人產(chǎn)業(yè)鏈價值集中于上游核心技術(shù)與下游商業(yè)服務環(huán)節(jié)

公共服務機器人產(chǎn)業(yè)鏈符合“微笑曲線”理論,產(chǎn)業(yè)鏈附加價值集中于上游核心技術(shù)部分以及中游機器人廠商對下游用戶的商業(yè)行為,中游機器人 整機制造商一般具備部分上游核心技術(shù)
資料獲取
行業(yè)動態(tài)
== 最新資訊 ==
ICRA 自然語義引導的機器人技能操作
2023語義增強可編程知識圖譜SPG白皮
2023 中國人工智能系列白皮書--人工
2023中國人工智能系列白皮書《人工智能
AI大模型市場研究報告(2023)邁向通
深圳2023人工智能發(fā)展白皮書-人工智能
人形機器人的落地思考-場景聚焦明確產(chǎn)品形
銀行保險金融機構(gòu)生成式人工智能戰(zhàn)略報告-
中小學階段的人工智能課程報告-人工智能課
中國公共服務機器人產(chǎn)業(yè)鏈研究報告2023
上海機器人產(chǎn)業(yè)園產(chǎn)業(yè)政策及入住代表性企業(yè)
2023年中國AI技術(shù)變革企業(yè)服務白皮書
中國服務機器人行業(yè)未來的主要發(fā)展趨勢
中國服務機器人行業(yè)發(fā)展目前面臨的潛在風險
中國服務機器人行業(yè)發(fā)展目前面臨的主要挑戰(zhàn)
== 機器人推薦 ==
迎賓講解服務機器人

服務機器人(迎賓、講解、導診...)

智能消毒機器人

智能消毒機器人

機器人開發(fā)平臺

機器人開發(fā)平臺


機器人底盤 Disinfection Robot 消毒機器人  講解機器人  迎賓機器人  移動機器人底盤  商用機器人  智能垃圾站  智能服務機器人  大屏機器人  霧化消毒機器人  紫外線消毒機器人  消毒機器人價格  展廳機器人  服務機器人底盤  核酸采樣機器人  機器人代工廠  智能配送機器人  噴霧消毒機器人  圖書館機器人  導引機器人  移動消毒機器人  導診機器人  迎賓接待機器人  前臺機器人  消殺機器人  導覽機器人 
版權(quán)所有 創(chuàng)澤智能機器人集團股份有限公司 中國運營中心:北京 清華科技園九號樓5層 中國生產(chǎn)中心:山東日照太原路71號
銷售1:4006-935-088 銷售2:4006-937-088 客服電話: 4008-128-728