創(chuàng)澤機(jī)器人
CHUANGZE ROBOT
當(dāng)前位置:首頁(yè) > 新聞資訊 > 機(jī)器人應(yīng)用 > 機(jī)器人示教學(xué)習(xí):學(xué)習(xí)低級(jí)技能運(yùn)動(dòng)基元軌跡運(yùn)動(dòng)技能

機(jī)器人示教學(xué)習(xí):學(xué)習(xí)低級(jí)技能運(yùn)動(dòng)基元軌跡運(yùn)動(dòng)技能

來(lái)源:CAAI認(rèn)知系統(tǒng)與信息處理專(zhuān)委會(huì)     編輯:創(chuàng)澤   時(shí)間:2020/6/9   主題:其他 [加盟]

人們使用機(jī)器人的目的是節(jié)約人力和時(shí)間并高效完成任務(wù)。傳統(tǒng)的機(jī)器人需要預(yù)先編程來(lái)滿(mǎn)足特定任務(wù),但如果任務(wù)發(fā)生變化,往往需要重新編程。而通過(guò)機(jī)器人的示教學(xué)習(xí),它使機(jī)器人能夠自主地執(zhí)行新任務(wù),允許用戶(hù)通過(guò)示教任務(wù)來(lái)教授機(jī)器人所需的技能,而無(wú)需繁瑣的重新編程。我們結(jié)合2020年ICIMIA 會(huì)議發(fā)表的《A Comprehensive Study onRobot Learning from Demonstration》文章,介紹了機(jī)器人示教學(xué)習(xí)LfD(Learning from Demonstration)的研究概況。

機(jī)器人可以通過(guò)采取行動(dòng)與所處環(huán)境交互,導(dǎo)致當(dāng)前狀態(tài)到新?tīng)顟B(tài)的概率轉(zhuǎn)換。機(jī)器人活動(dòng)的環(huán)境可以被完全或部分觀察到。觀察性條件取決于示教數(shù)據(jù)采集方法的類(lèi)型以及所選擇的教學(xué)方法。在[6]中,對(duì)環(huán)境描述的方法進(jìn)行了研究。定義明確的目標(biāo)可以清晰的評(píng)價(jià)任務(wù)表現(xiàn),并改進(jìn)已學(xué)習(xí)的任務(wù)[7]。LfD目前沒(méi)有標(biāo)準(zhǔn)的評(píng)估參數(shù)或方法,這是因?yàn)榈侥壳盀橹筁fD框架缺乏通用性,沒(méi)有可以進(jìn)行比較的基準(zhǔn)。人類(lèi)如何提供示教,基于與機(jī)器人的交互方式。

(1)低級(jí)技能

低級(jí)技能通常包括在三維空間中從一個(gè)點(diǎn)移動(dòng)到另一個(gè)點(diǎn)。它可以包括原始的動(dòng)作,如手勢(shì)、觸摸物體、挑選物體等,這種情況下獲得的示教數(shù)據(jù)是機(jī)器人關(guān)節(jié)的位置、速度和加速度。低級(jí)運(yùn)動(dòng)可記錄在關(guān)節(jié)空間、任務(wù)空間或扭矩空間[11]。然而,在某些情況下,任務(wù)目標(biāo)不能完全由關(guān)節(jié)位置來(lái)表示,應(yīng)提供任務(wù)框架方面的額外信息。例如,挑選一個(gè)在每次示教中可能位于不同位置的目標(biāo)對(duì)象。當(dāng)這種低級(jí)技能在機(jī)器人框架中學(xué)習(xí)時(shí),軌跡可能沒(méi)有相似性,因此很難提取模型。但是,如果在任務(wù)框架中表示相同的對(duì)象,則可以得到相同對(duì)象的一般模型。一種常用的方法是跟蹤末端執(zhí)行器相對(duì)于目標(biāo)對(duì)象的笛卡爾坐標(biāo)位置[12]。

低級(jí)技能學(xué)習(xí)或建模的三種主要方法:

1)動(dòng)態(tài)運(yùn)動(dòng)基元(DMP):DMP方法的中心思想是依賴(lài)于一個(gè)可靠的動(dòng)態(tài)系統(tǒng),調(diào)整該系統(tǒng)的非線(xiàn)性項(xiàng),實(shí)現(xiàn)預(yù)期的吸引子行為。

圖3 DMP方法:字母書(shū)寫(xiě)技巧[50]的不變性

在圖3中,可以看出DMP的不變性性質(zhì)的重要性。藍(lán)線(xiàn)表示示教軌跡,紅線(xiàn)表示技能執(zhí)行軌跡。起點(diǎn)是相似的,但是,即使target_0和target_1表示的終點(diǎn)不同,它也能夠執(zhí)行低級(jí)技能。此外,還能根據(jù)示教的字母“a”生成“a”的一致放大版本。為了利用高度規(guī)則的結(jié)構(gòu)和潛在空間來(lái)簡(jiǎn)化DMP方法,提出了一個(gè)高斯過(guò)程的隱藏變量模型[13]。在[9]中,通過(guò)調(diào)整DMP方程中的起始參數(shù)和目標(biāo)參數(shù),評(píng)估了一種泛化技能的方法,并在baxter機(jī)械臂上進(jìn)行了進(jìn)一步的論證。

2)高斯混合建模與回歸(GMM-GMR):該方法依賴(lài)于統(tǒng)計(jì)監(jiān)督學(xué)習(xí),由兩部分組成:a)使用高斯混合模型(GMM)對(duì)技能進(jìn)行編碼 b)利用高斯混合回歸(GMR)方法再現(xiàn)該技能。根據(jù)給定的示教,維度下降方法將數(shù)據(jù)投射到潛在空間中。這些方法可以執(zhí)行局部線(xiàn)性變換[14]或利用任何全局非線(xiàn)性方法[15]。在[16]中,使用GMM作為一種技能學(xué)習(xí)算法,對(duì)7個(gè)關(guān)節(jié)角度的示教數(shù)據(jù)進(jìn)行預(yù)處理,進(jìn)一步采用k均值聚類(lèi)算法確定期望最大值(EM)算法的初始均值和協(xié)方差。通過(guò)運(yùn)行迭代算法提取一個(gè)GMM,并進(jìn)一步使用該GMM來(lái)執(zhí)行一項(xiàng)技能。在[17]中使用GMM-GMR對(duì)技能編碼的類(lèi)似方法進(jìn)行了評(píng)估。

3)隱馬爾科夫模型(HMM):此類(lèi)模型基于概率方法。為了用隱馬爾可夫模型來(lái)建模低級(jí)技能,可以用隱藏狀態(tài)序列和所有的概率分布來(lái)表示該技能。HMM模型學(xué)習(xí)由兩部分組成:a)結(jié)構(gòu)學(xué)習(xí)b)參數(shù)學(xué)習(xí)。結(jié)構(gòu)學(xué)習(xí)處理識(shí)別隱藏狀態(tài)的數(shù)量。除此之外,它還涉及到確定這些隱藏狀態(tài)是如何相互聯(lián)系的。HMM模型學(xué)習(xí)的另一部分是參數(shù)學(xué)習(xí),用于估計(jì)先驗(yàn)、轉(zhuǎn)移和觀察概率分布。HMM模型使用概率分布,以便從當(dāng)前狀態(tài)前進(jìn)到下一個(gè)狀態(tài),從而生成一個(gè)序列。該序列可以提供給控制器,以產(chǎn)生平滑的控制信號(hào)。應(yīng)該注意的是,由于提供的示教并不是暫時(shí)一致的。所記錄的重復(fù)示教或者一批示教,其時(shí)間值不相同。即使是一個(gè)熟練的示教者也不可能提供完全相同的重復(fù)示教。因此,預(yù)處理步驟涉及動(dòng)態(tài)時(shí)間扭曲(DTW)技術(shù),該技術(shù)測(cè)量多個(gè)示教的時(shí)間序列之間的相似性。




機(jī)器人示教學(xué)習(xí):高級(jí)技能學(xué)習(xí)方法(學(xué)習(xí)計(jì)劃和學(xué)習(xí)目標(biāo))

人類(lèi)教師提供的示教被用來(lái)推斷執(zhí)行高級(jí)技能的意圖,現(xiàn)代方法也使用基于獎(jiǎng)勵(lì)函數(shù)的強(qiáng)化學(xué)習(xí)方法來(lái)實(shí)現(xiàn)期望目標(biāo)

蘇州行政審批局實(shí)現(xiàn)導(dǎo)引機(jī)器人導(dǎo)覽服務(wù)

蘇州行政審批局實(shí)現(xiàn)機(jī)器人導(dǎo)覽服務(wù)。5G 高速互聯(lián)網(wǎng)接入服務(wù)。異地超高清視頻通話(huà)

農(nóng)業(yè)機(jī)器人視覺(jué)識(shí)別雜草技術(shù)

由于機(jī)器視覺(jué)可以提供目標(biāo)物的顏色、形狀、紋理、深度等豐富的信息,且精度相當(dāng)高,成本相對(duì)較低,因此以往關(guān)于植物檢測(cè)的研究大多基于機(jī)器視覺(jué)

武漢大學(xué)研發(fā)可精準(zhǔn)控制迷你軟體機(jī)器人

武漢大學(xué)薛龍建教授團(tuán)隊(duì)研制出一種迷你軟體機(jī)器人Geca-Robot,其可精準(zhǔn)控制方向和速度,可在廢墟狹縫、生物體內(nèi)完成各種復(fù)雜作業(yè)

方濱興院士:人工智能安全之我見(jiàn)

人工智能技術(shù)在安全領(lǐng)域的應(yīng)用需求日益迫切,人工智能自身的安全問(wèn)題也不容小覷,安全與人工智能并舉,雙方的融合發(fā)展與創(chuàng)新是我強(qiáng)國(guó)戰(zhàn)略中不可忽視的重要助推因素

淺談機(jī)器人的靈巧手

專(zhuān)注于極簡(jiǎn)主義設(shè)計(jì)方法。在保留擬人化設(shè)計(jì)的許多優(yōu)點(diǎn)的同時(shí),在設(shè)計(jì)和控制方面進(jìn)行原則性的簡(jiǎn)化,可以合理地降低系統(tǒng)的復(fù)雜度,包括執(zhí)行器、傳感器和程序代碼的數(shù)量

輔助機(jī)器人對(duì)機(jī)器人靈巧手的應(yīng)用要求

輔助機(jī)器人必須能夠在日常生活活動(dòng)中與環(huán)境和人類(lèi)安全地互動(dòng)和合作,這意味著手需要小、輕、靈活

獵戶(hù)星空:醫(yī)療服務(wù)機(jī)器人

醫(yī)療服務(wù)機(jī)器人根據(jù)醫(yī)院需求分別執(zhí)行遞送化驗(yàn)單、藥物等工作,用機(jī)器人代替醫(yī)護(hù)過(guò)程中簡(jiǎn)單但耗力的流程化工作

極飛科技:無(wú)人機(jī)抗疫解決方案

在巨大的公共衛(wèi)生危機(jī)面前,無(wú)人機(jī)能夠進(jìn)入疫情嚴(yán)重區(qū)域自動(dòng)噴灑消毒劑,降低應(yīng)急人員被病毒感染的風(fēng)險(xiǎn)

水下機(jī)器人靈巧操作的新型觸覺(jué)感知

泵和傳感器可以安裝在靠近手臂的機(jī)器人底座上進(jìn)行保護(hù),并實(shí)現(xiàn)與機(jī)械手遠(yuǎn)程連接

國(guó)內(nèi)安防AI芯片型號(hào),類(lèi)型,處理速度和功能一覽表

Hi3559AV100 Hi3519AV100 Hi3516DV300 Hi3516CV500 昇騰310 旭日 聽(tīng)濤 思元220 BM1682 BM1880 DeepEye1000 T01

機(jī)器人守護(hù)人類(lèi)生命線(xiàn),六大趨勢(shì)凸顯前景無(wú)限

機(jī)器人也都成為應(yīng)急救援搶險(xiǎn)的標(biāo)配,救援機(jī)器人發(fā)展空間和潛力的爆發(fā),既得益于需求的釋放,也離不開(kāi)技術(shù)突破與商用價(jià)值的支撐
資料獲取
機(jī)器人應(yīng)用
== 最新資訊 ==
ChatGPT:又一個(gè)“人形機(jī)器人”主題
ChatGPT快速流行,重構(gòu) AI 商業(yè)
中國(guó)機(jī)器視覺(jué)產(chǎn)業(yè)方面的政策
中國(guó)機(jī)器視覺(jué)產(chǎn)業(yè)聚焦于中國(guó)東部沿海地區(qū)(
從CHAT-GPT到生成式AI:人工智能
工信部等十七部門(mén)印發(fā)《機(jī)器人+應(yīng)用行動(dòng)實(shí)
全球人工智能企業(yè)市值/估值 TOP20
創(chuàng)澤智能機(jī)器人集團(tuán)股份有限公司第十一期上
諧波減速器和RV減速器比較
機(jī)器人減速器:諧波減速器和RV減速器
人形機(jī)器人技術(shù)難點(diǎn) 高精尖技術(shù)的綜合
機(jī)器人大規(guī)模商用面臨的痛點(diǎn)有四個(gè)方面
青島市機(jī)器人產(chǎn)業(yè)概況:機(jī)器人企業(yè)多布局在
六大機(jī)器人產(chǎn)業(yè)集群的特點(diǎn)
機(jī)械臂-高度非線(xiàn)性強(qiáng)耦合的復(fù)雜系統(tǒng)
== 機(jī)器人推薦 ==
迎賓講解服務(wù)機(jī)器人

服務(wù)機(jī)器人(迎賓、講解、導(dǎo)診...)

智能消毒機(jī)器人

智能消毒機(jī)器人

機(jī)器人開(kāi)發(fā)平臺(tái)

機(jī)器人開(kāi)發(fā)平臺(tái)


機(jī)器人招商 Disinfection Robot 機(jī)器人公司 機(jī)器人應(yīng)用 智能醫(yī)療 物聯(lián)網(wǎng) 機(jī)器人排名 機(jī)器人企業(yè) 機(jī)器人政策 教育機(jī)器人 迎賓機(jī)器人 機(jī)器人開(kāi)發(fā) 獨(dú)角獸 消毒機(jī)器人品牌 消毒機(jī)器人 合理用藥 地圖
版權(quán)所有 創(chuàng)澤智能機(jī)器人集團(tuán)股份有限公司 中國(guó)運(yùn)營(yíng)中心:北京 清華科技園九號(hào)樓5層 中國(guó)生產(chǎn)中心:山東日照太原路71號(hào)
銷(xiāo)售1:4006-935-088 銷(xiāo)售2:4006-937-088 客服電話(huà): 4008-128-728