首頁(yè)
產(chǎn)品系列
行業(yè)應(yīng)用
渠道合作
新聞中心
研究院
投資者關(guān)系
技術(shù)支持
關(guān)于創(chuàng)澤
| En
 
  當(dāng)前位置:首頁(yè) > 新聞資訊 > 機(jī)器人開發(fā) > 如何更高效地壓縮時(shí)序數(shù)據(jù)?基于深度強(qiáng)化學(xué)習(xí)的探索  
 

如何更高效地壓縮時(shí)序數(shù)據(jù)?基于深度強(qiáng)化學(xué)習(xí)的探索

來(lái)源:阿里機(jī)器智能      編輯:創(chuàng)澤      時(shí)間:2020/6/4      主題:其他   [加盟]

隨著移動(dòng)互聯(lián)網(wǎng)、IoT、5G 等的應(yīng)用和普及,一步一步地我們走進(jìn)了數(shù)字經(jīng)濟(jì)時(shí)代。隨之而來(lái)的海量數(shù)據(jù)將是一種客觀的存在,并發(fā)揮出越來(lái)越重要的作用。時(shí)序數(shù)據(jù)是海量數(shù)據(jù)中的一個(gè)重要組成部分,除了挖掘分析預(yù)測(cè)等,如何高效的壓縮存儲(chǔ)是一個(gè)基礎(chǔ)且重要的課題。同時(shí),我們也正處在人工智能時(shí)代,深度學(xué)習(xí)已經(jīng)有了很多很好的應(yīng)用,如何在更多更廣的層面發(fā)揮作用?本文總結(jié)了當(dāng)前學(xué)術(shù)界和工業(yè)界數(shù)據(jù)壓縮的方法,分析了大型商用時(shí)序數(shù)據(jù)壓縮的特性,提出了一種新的算法,分享用深度強(qiáng)化學(xué)習(xí)進(jìn)行數(shù)據(jù)壓縮的研究探索及取得的成果。

深度學(xué)習(xí)的本質(zhì)是做決策,用它解決具體的問(wèn)題時(shí)很重要的是找到契合點(diǎn),合理建模,然后整理數(shù)據(jù)優(yōu)化 loss 等最終較好地解決問(wèn)題。在過(guò)去的一段時(shí)間,我們?cè)谟蒙疃葟?qiáng)化學(xué)習(xí)進(jìn)行數(shù)據(jù)壓縮上做了一些研究探索并取得了一些成績(jī),已經(jīng)在 ICDE 2020 research track 發(fā)表(Two-level Data Compression using Machine Learning in Time Series Database)并做了口頭匯報(bào)。在這里做一個(gè)整體粗略介紹,希望對(duì)其它的場(chǎng)景,至少是其它數(shù)據(jù)的壓縮等,帶來(lái)一點(diǎn)借鑒作用。

背景描述

1 時(shí)序數(shù)據(jù)

時(shí)序數(shù)據(jù)顧名思義指的是和時(shí)間序列相關(guān)的數(shù)據(jù),是日常隨處可見的一種數(shù)據(jù)形式。下圖羅列了三個(gè)示例:a)心電圖,b)股票指數(shù),c)具體股票交易數(shù)據(jù)。

關(guān)于時(shí)序數(shù)據(jù)庫(kù)的工作內(nèi)容,簡(jiǎn)略地,在用戶的使用層面它需要響應(yīng)海量的查詢,分析,預(yù)測(cè)等;而在底層它則需要處理海量的讀寫,壓縮解壓縮,采用聚合等操作,而這些的基本操作單元就是時(shí)序數(shù)據(jù) <timestamp, value>,一般(也可以簡(jiǎn)化)用兩個(gè) 8 byte 的值進(jìn)行統(tǒng)一描述。

可以想象,任何電子設(shè)備每天都在產(chǎn)生各種各樣海量的時(shí)序數(shù)據(jù),需要海量的存儲(chǔ)空間等,對(duì)它進(jìn)行壓縮存儲(chǔ)及處理是一個(gè)自然而然的方法。而這里的著重點(diǎn)就是如何進(jìn)行更高效的壓縮。

2  強(qiáng)化學(xué)習(xí)

機(jī)器學(xué)習(xí)按照樣本是否有 groundTruth 可分為有監(jiān)督學(xué)習(xí),無(wú)監(jiān)督學(xué)習(xí),以及強(qiáng)化學(xué)習(xí)等。強(qiáng)化學(xué)習(xí)顧名思義是不停地努力地去學(xué)習(xí),不需要 groundTruth,真實(shí)世界很多時(shí)候也沒(méi)有 groundTruth,譬如人的認(rèn)知很多時(shí)候就是不斷迭代學(xué)習(xí)的過(guò)程。從這個(gè)意義上來(lái)說(shuō),強(qiáng)化學(xué)習(xí)是更符合或更全面普遍的一種處理現(xiàn)實(shí)世界問(wèn)題的過(guò)程和方法,所以有個(gè)說(shuō)法是:如果深度學(xué)習(xí)慢慢地會(huì)像 C/Python/Java 那樣成為解決具體問(wèn)題的一個(gè)基礎(chǔ)工具的話,那么強(qiáng)化學(xué)習(xí)是深度學(xué)習(xí)的一個(gè)基礎(chǔ)工具。

強(qiáng)化學(xué)習(xí)的經(jīng)典示意圖如下,基本要素為 State,Action,和 Environment;具^(guò)程為:Environment 給出 State,Agent 根據(jù) state 做 Action 決策,Action 作用在 Environment 上產(chǎn)生新的 State 及 reward,其中 reward 用來(lái)指導(dǎo) Agent 做出更好的 Action 決策,循環(huán)往復(fù)….

而常見的有監(jiān)督學(xué)習(xí)則簡(jiǎn)單很多,可以認(rèn)為是強(qiáng)化學(xué)習(xí)的一種特殊情況,目標(biāo)很清晰就是 groudTruth,因此對(duì)應(yīng)的 reward 也比較清晰。

強(qiáng)化學(xué)習(xí)按照個(gè)人理解可以歸納為以下三大類:

1)DQN

Deep Q network,比較符合人的直觀感受邏輯的一種類型,它會(huì)訓(xùn)練一個(gè)評(píng)估 Q-value 的網(wǎng)絡(luò),對(duì)任一 state 能給出各個(gè) Action 的 reward,然后最終選擇 reward 最大的那個(gè) action 進(jìn)行操作即可。訓(xùn)練過(guò)程通過(guò)評(píng)估 “估計(jì)的 Q-value” 和 “真正得到的 Q-value” 的結(jié)果進(jìn)行反向傳遞,最終讓網(wǎng)絡(luò)估計(jì) Q-value 越來(lái)越準(zhǔn)。

2)Policy Gradient

是更加端到端的一種類型,訓(xùn)練一個(gè)網(wǎng)絡(luò),對(duì)任一 state 直接給出最終的 action。DQN 的適用范圍需要連續(xù) state 的 Q-value 也比較連續(xù)(下圍棋等不適用這種情況),而 Policy Gradient 由于忽略內(nèi)部過(guò)程直接給出 action,具有更大的普適性。但它的缺點(diǎn)是更難以評(píng)價(jià)及收斂。一般的訓(xùn)練過(guò)程是:對(duì)某一 state,同時(shí)隨機(jī)的采取多種 action,評(píng)價(jià)各種 action 的結(jié)果進(jìn)行反向傳遞,最終讓網(wǎng)絡(luò)輸出效果更好的 action。

3)Actor-Critic

試著糅合前面兩種網(wǎng)絡(luò),取長(zhǎng)補(bǔ)短,一方面用 policy Gradient 網(wǎng)絡(luò)進(jìn)行任一 state 的 action 輸出,另外一方面用 DQN 網(wǎng)絡(luò)對(duì) policy gradient 的 action 輸出進(jìn)行較好的量化評(píng)價(jià)并以之來(lái)指導(dǎo) policy gradient 的更新。如名字所示,就像表演者和評(píng)論家的關(guān)系。訓(xùn)練過(guò)程需要同時(shí)訓(xùn)練 actor(policy Graident)和 critic(QN)網(wǎng)絡(luò),但 actor 的訓(xùn)練只需要 follow critic 的指引就好。它有很多的變種,也是當(dāng)前 DRL 理論研究上不停發(fā)展的主要方向。

時(shí)序數(shù)據(jù)的壓縮

對(duì)海量的時(shí)序數(shù)據(jù)進(jìn)行壓縮是顯而易見的一個(gè)事情,因此在學(xué)術(shù)界和工業(yè)界也有很多的研究和探索,一些方法有:

Snappy:對(duì)整數(shù)或字符串進(jìn)行壓縮,主要用了長(zhǎng)距離預(yù)測(cè)和游程編碼(RLE),廣泛的應(yīng)用包括 Infuxdb。

Simple8b:先對(duì)數(shù)據(jù)進(jìn)行前后 delta 處理,如果相同用RLE編碼;否則根據(jù)一張有 16 個(gè) entry 的碼表把 1 到 240 個(gè)數(shù)(每個(gè)數(shù)的 bits 根據(jù)碼表)pack 到 8B 為單位的數(shù)據(jù)中,有廣泛的應(yīng)用包括 Infuxdb。

Compression planner:引入了一些 general 的壓縮 tool 如 scale, delta, dictionary, huffman, run length 和 patched constant 等,然后提出了用靜態(tài)的或動(dòng)態(tài)辦法組合嘗試這些工具來(lái)進(jìn)行壓縮;想法挺新穎但實(shí)際性能會(huì)是個(gè)問(wèn)題。

ModelarDB:側(cè)重在有損壓縮,基于用戶給定的可容忍損失進(jìn)行壓縮。基本思想是把維護(hù)一個(gè)小 buff,探測(cè)單前數(shù)據(jù)是否符合某種模式(斜率的直線擬合),如果不成功,切換模式重新開始buff等;對(duì)支持有損的 IoT 領(lǐng)域比較合適。

Sprintz:也是在 IoT 領(lǐng)域效果會(huì)比較好,側(cè)重在 8/16 bit 的整數(shù)處理;主要用了 scale 進(jìn)行預(yù)測(cè)然后用 RLC 進(jìn)行差值編碼并做 bit-level 的 packing。

Gorilla:應(yīng)用在 Facebook 高吞吐實(shí)時(shí)系統(tǒng)中的當(dāng)時(shí) sofa 的壓縮算法,進(jìn)行無(wú)損壓縮,廣泛適用于 IoT 和云端服務(wù)等各個(gè)領(lǐng)域。它引入 delta-of-delta 對(duì)時(shí)間戳進(jìn)行處理,用 xor 對(duì)數(shù)據(jù)進(jìn)行變換然后用 Huffman 編碼及 bit-packing。示例圖如下所示。

MO:類似 Gorilla,但去掉了 bit-packing,所有的數(shù)據(jù)操作基本都是字節(jié)對(duì)齊,降低了壓縮率但提供了處理性能。











基于深度學(xué)習(xí)目標(biāo)檢測(cè)模型優(yōu)缺點(diǎn)對(duì)比

深度學(xué)習(xí)模型:OverFeat、R-CNN、SPP-Net、Fast、R-CNN、Faster、R-CNN、R-FCN、Mask、R-CNN、YOLO、SSD、YOLOv2、416、DSOD300、R-SSD

傳統(tǒng)目標(biāo)檢測(cè)算法對(duì)比

SIFT、PCA-SIFT、SURF 、ORB、 VJ 等目標(biāo)檢測(cè)算法優(yōu)缺點(diǎn)對(duì)比及使用場(chǎng)合比較

基于深度學(xué)習(xí)和傳統(tǒng)算法的人體姿態(tài)估計(jì),技術(shù)細(xì)節(jié)都講清楚了

人體姿態(tài)估計(jì)便是計(jì)算機(jī)視覺(jué)領(lǐng)域現(xiàn)有的熱點(diǎn)問(wèn)題,其主要任務(wù)是讓機(jī)器自動(dòng)地檢測(cè)場(chǎng)景中的人“在哪里”和理解人在“干什么”

讓大規(guī)模深度學(xué)習(xí)訓(xùn)練線性加速、性能無(wú)損,基于BMUF的Adam優(yōu)化器并行化實(shí)踐

Adam 算法便以其卓越的性能風(fēng)靡深度學(xué)習(xí)領(lǐng)域,該算法通常與同步隨機(jī)梯度技術(shù)相結(jié)合,采用數(shù)據(jù)并行的方式在多臺(tái)機(jī)器上執(zhí)行

音樂(lè)人工智能、計(jì)算機(jī)聽覺(jué)及音樂(lè)科技

音樂(lè)科技、音樂(lè)人工智能與計(jì)算機(jī)聽覺(jué)以數(shù)字音樂(lè)和聲音為研究對(duì)象,是聲學(xué)、心理學(xué)、信號(hào)處理、人工智能、多媒體、音樂(lè)學(xué)及各行業(yè)領(lǐng)域知識(shí)相結(jié)合的重要交叉學(xué)科,具有重要的學(xué)術(shù)研究和產(chǎn)業(yè)開發(fā)價(jià)值

【深度】未來(lái)5-10年計(jì)算機(jī)視覺(jué)發(fā)展趨勢(shì)為何?

專家(查紅彬,陳熙霖,盧湖川,劉燁斌,章國(guó)鋒)從計(jì)算機(jī)視覺(jué)發(fā)展歷程、現(xiàn)有研究局限性、未來(lái)研究方向以及視覺(jué)研究范式等多方面展開了深入的探討

華南理工大學(xué)羅晶博士和楊辰光教授團(tuán)隊(duì)發(fā)文提出遙操作機(jī)器人交互感知與學(xué)習(xí)算法

羅晶博士和楊辰光教授團(tuán)隊(duì)提出,遙操作機(jī)器人系統(tǒng)可以自然地與外界環(huán)境進(jìn)行交互、編碼人機(jī)協(xié)作任務(wù)和生成任務(wù)模型,從而提升系統(tǒng)的類人化操作行為和智能化程度

實(shí)時(shí)識(shí)別卡扣成功裝配的機(jī)器學(xué)習(xí)框架

卡扣式裝配廣泛應(yīng)用于多種產(chǎn)品類型的制造中,卡扣裝配是結(jié)構(gòu)性的鎖定機(jī)制,通過(guò)一個(gè)機(jī)器學(xué)習(xí)框架將人類識(shí)別成功快速裝配的能力遷移到自主機(jī)器人裝配上。

基于多任務(wù)學(xué)習(xí)和負(fù)反饋的深度召回模型

基于行為序列的深度學(xué)習(xí)推薦模型搭配高性能的近似檢索算法可以實(shí)現(xiàn)既準(zhǔn)又快的召回性能,如何利用這些豐富的反饋信息改進(jìn)召回模型的性能

張帆博士與Yiannis Demiris教授團(tuán)隊(duì)提出高效的機(jī)器人學(xué)習(xí)抓取衣服方法

機(jī)器人輔助穿衣通常人工的將衣服附在機(jī)器人末端執(zhí)行器上,忽略機(jī)器人識(shí)別衣服抓取點(diǎn)并進(jìn)行抓取的過(guò)程,從而將問(wèn)題簡(jiǎn)化

百度算法大牛35頁(yè)P(yáng)PT講解基于EasyDL訓(xùn)練并部署企業(yè)級(jí)高精度AI模型

百度AI開發(fā)平臺(tái)高級(jí)研發(fā)工程師餅干老師,為大家系統(tǒng)講解企業(yè)在AI模型開發(fā)中的難點(diǎn),以及針對(duì)這些難點(diǎn),百度EasyDL專業(yè)版又是如何解決的

Technica公司發(fā)布智能霧計(jì)算平臺(tái)技術(shù)白皮書

SmartFog可以輕松地將人工智能分析微服務(wù)部署到云、霧和物聯(lián)網(wǎng)設(shè)備上,其架構(gòu)支持與現(xiàn)有系統(tǒng)的靈活集成,提供了大量的實(shí)現(xiàn)方案,要用下一代人工智能算法來(lái)彌補(bǔ)現(xiàn)有解決方案的不足。
 
資料獲取
新聞資訊
== 資訊 ==
» 人形機(jī)器人未來(lái)3-5年能夠?qū)崿F(xiàn)產(chǎn)業(yè)化的方
» 導(dǎo)診服務(wù)機(jī)器人上崗門診大廳 助力醫(yī)院智慧
» 山東省青島市政府辦公廳發(fā)布《數(shù)字青島20
» 關(guān)于印發(fā)《青海省支持大數(shù)據(jù)產(chǎn)業(yè)發(fā)展政策措
» 全屋無(wú)主燈智能化規(guī)范
» 微波雷達(dá)傳感技術(shù)室內(nèi)照明應(yīng)用規(guī)范
» 人工智能研發(fā)運(yùn)營(yíng)體系(ML0ps)實(shí)踐指
» 四驅(qū)四轉(zhuǎn)移動(dòng)機(jī)器人運(yùn)動(dòng)模型及應(yīng)用分析
» 國(guó)內(nèi)細(xì)分賽道企業(yè)在 AIGC 各應(yīng)用場(chǎng)景
» 國(guó)內(nèi)科技大廠布局生成式 AI,未來(lái)有望借
» AIGC領(lǐng)域相關(guān)初創(chuàng)公司及業(yè)務(wù)場(chǎng)景梳理
» ChatGPT 以 GPT+RLHF 模
» AIGC提升文字 圖片滲透率,視頻 直播
» AI商業(yè)化空間前景廣闊應(yīng)用場(chǎng)景豐富
» AI 內(nèi)容創(chuàng)作成本大幅降低且耗時(shí)更短 優(yōu)
 
== 機(jī)器人推薦 ==
 
迎賓講解服務(wù)機(jī)器人

服務(wù)機(jī)器人(迎賓、講解、導(dǎo)診...)

智能消毒機(jī)器人

智能消毒機(jī)器人

機(jī)器人底盤

機(jī)器人底盤

 

商用機(jī)器人  Disinfection Robot   展廳機(jī)器人  智能垃圾站  輪式機(jī)器人底盤  迎賓機(jī)器人  移動(dòng)機(jī)器人底盤  講解機(jī)器人  紫外線消毒機(jī)器人  大屏機(jī)器人  霧化消毒機(jī)器人  服務(wù)機(jī)器人底盤  智能送餐機(jī)器人  霧化消毒機(jī)  機(jī)器人OEM代工廠  消毒機(jī)器人排名  智能配送機(jī)器人  圖書館機(jī)器人  導(dǎo)引機(jī)器人  移動(dòng)消毒機(jī)器人  導(dǎo)診機(jī)器人  迎賓接待機(jī)器人  前臺(tái)機(jī)器人  導(dǎo)覽機(jī)器人  酒店送物機(jī)器人  云跡科技潤(rùn)機(jī)器人  云跡酒店機(jī)器人  智能導(dǎo)診機(jī)器人 
版權(quán)所有 © 創(chuàng)澤智能機(jī)器人集團(tuán)股份有限公司     中國(guó)運(yùn)營(yíng)中心:北京·清華科技園九號(hào)樓5層     中國(guó)生產(chǎn)中心:山東日照太原路71號(hào)
銷售1:4006-935-088    銷售2:4006-937-088   客服電話: 4008-128-728