當(dāng)前位置：首頁(yè) > 新聞資訊 > 機(jī)器人知識(shí) > 多尺度圖卷積神經(jīng)網(wǎng)絡(luò)：有效統(tǒng)一三維形狀離散化特征表示

多尺度圖卷積神經(jīng)網(wǎng)絡(luò)：有效統(tǒng)一三維形狀離散化特征表示

來(lái)源：中國(guó)科學(xué)院自動(dòng)化研究所編輯：創(chuàng)澤時(shí)間：2020/6/9 主題：其他 [加盟]

三維不規(guī)則數(shù)據(jù)常常出現(xiàn)在許多領(lǐng)域的研究中，比如社會(huì)科學(xué)中的社會(huì)網(wǎng)絡(luò)、大腦成像中的功能網(wǎng)絡(luò)，又或者在我們接下來(lái)要提到的研究三維形狀的計(jì)算機(jī)圖形學(xué)中，這樣的不規(guī)則數(shù)據(jù)在現(xiàn)實(shí)生活中幾乎是無(wú)處不在的。

近年來(lái)，基于這種三維不規(guī)則數(shù)據(jù)的深度學(xué)習(xí)發(fā)展迅速，而圖卷積神經(jīng)網(wǎng)絡(luò)應(yīng)對(duì)三維不規(guī)則數(shù)據(jù)的表現(xiàn)尤為突出[2]。

在計(jì)算機(jī)圖形學(xué)中，為了虛擬化真實(shí)世界的物體(如人或者動(dòng)物等)，三維形狀通常需要離散化為網(wǎng)格（mesh），用于真實(shí)感渲染。但是，因?yàn)樵O(shè)備的差異或采集方式的不同，很難針對(duì)單個(gè)三維形狀得到的相同的離散化方式（固定的分辨率和連接關(guān)系）。這種同一個(gè)形狀具有不同的離散化方式是計(jì)算機(jī)圖形學(xué)有別于其他學(xué)科的一個(gè)重要特點(diǎn)，而現(xiàn)有的圖神經(jīng)網(wǎng)絡(luò)無(wú)法有效統(tǒng)一不同離散化下的特征，這極大地限制了圖神經(jīng)網(wǎng)絡(luò)在圖形學(xué)領(lǐng)域的發(fā)展。

那么，如何解決這一問(wèn)題呢？

自動(dòng)化所團(tuán)隊(duì)提出了一種新穎的多尺度圖卷積神經(jīng)網(wǎng)絡(luò)，重點(diǎn)解決了傳統(tǒng)圖卷積神經(jīng)網(wǎng)絡(luò)中圖節(jié)點(diǎn)學(xué)習(xí)到的特征對(duì)圖分辨率和連接關(guān)系敏感的問(wèn)題。該方法可以實(shí)現(xiàn)在低分辨率的三維形狀上學(xué)習(xí)特征，在高低分辨率形狀之上進(jìn)行測(cè)試，并且保持不同分辨率特征的一致性。

01 研究背景

傳統(tǒng)的圖卷積神經(jīng)網(wǎng)絡(luò)通常聚集1-鄰域（GCN），k-環(huán)鄰域（ChebyGCN）或k-近鄰鄰域（DGCNN）的信息，所以其感受野與分辨率或者圖連接關(guān)系是相關(guān)的。也就是說(shuō)，在三維形狀的不同離散化下，卷積的感受野對(duì)應(yīng)的形狀語(yǔ)義范圍產(chǎn)生了較大的變化。如何解決這種卷積方式未考慮到針對(duì)不同離散化情況所產(chǎn)生的問(wèn)題，存在較大的挑戰(zhàn)。

02 方法簡(jiǎn)述

為解決現(xiàn)有圖卷積神經(jīng)網(wǎng)絡(luò)的問(wèn)題，團(tuán)隊(duì)設(shè)計(jì)了一種多尺度圖卷積神經(jīng)網(wǎng)絡(luò)（multiscale graph convolutional network，MGCN）。如圖1所示，我們發(fā)現(xiàn)，針對(duì)不同分辨率和連接關(guān)系的離散化，三維圖譜小波函數(shù)表現(xiàn)出極佳的魯棒性，并且不需要計(jì)算測(cè)地距離。因此，我們?cè)O(shè)計(jì)將多尺度的小波函數(shù)嵌入到圖卷積神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)當(dāng)中。

多尺度圖卷積神經(jīng)網(wǎng)絡(luò)：有效統(tǒng)一三維形狀離散化特征表示

OpenAI發(fā)布了有史以來(lái)最強(qiáng)的NLP預(yù)訓(xùn)練模型GPT-3

達(dá)摩院金榕教授113頁(yè)P(yáng)PT詳解達(dá)摩院在NLP、語(yǔ)音和CV上的進(jìn)展與應(yīng)用實(shí)踐

重構(gòu)ncnn，騰訊優(yōu)圖開源新一代移動(dòng)端推理框架TNN

知識(shí)圖譜在個(gè)性化推薦領(lǐng)域的研究進(jìn)展及應(yīng)用

基于網(wǎng)格圖特征的琵琶指法自動(dòng)識(shí)別

利用時(shí)序信息提升遮擋行人檢測(cè)準(zhǔn)確度

京東姚霆：推理能力，正是多模態(tài)技術(shù)未來(lái)亟需突破的瓶頸

看高清視頻，如何做到不卡頓

基于真實(shí)環(huán)境數(shù)據(jù)集的機(jī)器人操作仿真基準(zhǔn)測(cè)試

億級(jí)視頻內(nèi)容如何實(shí)時(shí)更新

深度解析大規(guī)模參數(shù)語(yǔ)言模型Megatron-BERT

自然語(yǔ)言處理技術(shù)五大技術(shù)進(jìn)展和四大應(yīng)用與產(chǎn)品

服務(wù)機(jī)器人(迎賓、講解、導(dǎo)診...)

智能消毒機(jī)器人

機(jī)器人開發(fā)平臺(tái)

多尺度圖卷積神經(jīng)網(wǎng)絡(luò)：有效統(tǒng)一三維形狀離散化特征表示

服務(wù)機(jī)器人(迎賓、講解、導(dǎo)診...)

智能消毒機(jī)器人

機(jī)器人開發(fā)平臺(tái)

服務(wù)機(jī)器人(迎賓、講解、導(dǎo)診...)