1 三維感知模型與多模態(tài)信息融合將來自不同傳感器和數(shù)據(jù)源的多種信息進(jìn)行整合,可更全面、準(zhǔn)確地理解環(huán)境的特征。融合信息涵蓋圖像、點(diǎn)云、聲音等不同類型的數(shù)據(jù)。
2 多模態(tài)信息融合可克服單一傳感器存在的局限性,提供更全面、魯棒的信息,有助于在機(jī)器人導(dǎo)航、人機(jī)交互、環(huán)境監(jiān)測(cè)、自動(dòng)駕駛等取得更好性能;同時(shí),面臨傳感器不一致性、數(shù)據(jù)同步、信息不完整等挑戰(zhàn)。
3 三維感知模型與多模態(tài)信息融合與具身智能、垂直大模型的協(xié)同和融合,將進(jìn)一步擴(kuò)大機(jī)器人應(yīng)用范圍。
4 核心技術(shù)包括:結(jié)構(gòu)光和立體視覺、三維物體檢測(cè)和分割、多模態(tài)特征提取、融合模型設(shè)計(jì)等。
第一代FSD芯片單個(gè)算力72tops,CPU做控制,GPU做圖像處理,NPU為神經(jīng)處理單元,完全適用于人形機(jī)器人;D1芯片32位浮點(diǎn)計(jì)算的最大性能達(dá)到22.6TFLOPs
大模型提升仿真學(xué)習(xí)能力,可大幅提升算法訓(xùn)練效率,縮短算法與硬件調(diào)整時(shí)間,極大提高訓(xùn)練效率,可加快軟件更新迭代
仿生機(jī)器人以模仿生物的運(yùn)動(dòng)、行為和外貌,實(shí)現(xiàn)更自然、更適應(yīng)性強(qiáng)的性能。包括四足機(jī)器人、人形機(jī)器人、仿魚水下機(jī)器人、仿生撲翼機(jī)器人等
具身智能是指擁有自主感知、交互和行動(dòng)能力的智能體;核心技術(shù)包括:智能體環(huán)境感知與建模,智能體自主決策與規(guī)劃,人機(jī)交互,群控協(xié)作,機(jī)器學(xué)習(xí)與強(qiáng)化學(xué)習(xí)等技術(shù)
人形機(jī)器人將重新定義AI時(shí)代的工人,把人從重復(fù)性的勞動(dòng)中解脫出來;商用服務(wù)場(chǎng)景是人形機(jī)器人最快應(yīng)用的市場(chǎng),而家庭落地場(chǎng)景則是人形機(jī)器人最具潛力的應(yīng)用市場(chǎng)
需求方更注重應(yīng)用層的落地使用場(chǎng)景,學(xué)研方則主要聚焦在平臺(tái)層,基礎(chǔ)模型層和中間層方面的技術(shù)研發(fā),各地區(qū)域發(fā)展和招商引進(jìn)重點(diǎn)都會(huì)落實(shí)強(qiáng)鏈補(bǔ)鏈戰(zhàn)略布局
人形機(jī)器人是 AI領(lǐng)域的重要載體,或?qū)⒃炀鸵粋(gè)新的萬億級(jí)市場(chǎng),假設(shè)人形機(jī)器人與汽車銷量一致,按照人形機(jī)器人單價(jià) 2 萬美元,人形機(jī)器人市場(chǎng)規(guī)模約 11.43 萬億元
未來智能機(jī)器人發(fā)展將聚焦10大應(yīng)用重點(diǎn)領(lǐng)域,覆蓋經(jīng)濟(jì)發(fā)展領(lǐng)域與社會(huì)民生領(lǐng)域,服務(wù)機(jī)器人,特種機(jī)器人行業(yè)應(yīng)用深度和廣度顯著提升
具身智能機(jī)器人的任務(wù)工作原理是聽/看懂人類意圖 > 分解任務(wù) > 規(guī)劃子任務(wù) > 移動(dòng)中識(shí)別物體 > 與物理環(huán)境交互 > 完成任務(wù)
智能機(jī)器人(L4-L5)擁有更豐富的傳感器和更高的智能水平,能獲取并處理外部綜合信息,能據(jù)此自己制定行動(dòng)目標(biāo)
機(jī)器人的決策主要依靠算法實(shí)現(xiàn),微模型,中小模型對(duì)智能機(jī)器人在特定場(chǎng)景的感知,決策具備 技術(shù)支撐基礎(chǔ),而基礎(chǔ)大模型則有機(jī)會(huì)打造真正的“通用機(jī)器人
科技創(chuàng)新功能集聚(大張江),最高補(bǔ)貼4000萬元;智能化數(shù)字化網(wǎng)絡(luò)化建設(shè)(轉(zhuǎn)型升級(jí)),最高補(bǔ)貼2000萬元;成果轉(zhuǎn)化和產(chǎn)業(yè)化(產(chǎn)業(yè)化),最高補(bǔ)貼1000萬元