物聯(lián)網(wǎng)場(chǎng)景已經(jīng)成為各行業(yè)巨頭和各互聯(lián)網(wǎng)公司的兵家必爭(zhēng)之地,百度云天工TSDB對(duì)物聯(lián)網(wǎng)場(chǎng)景下時(shí)序數(shù)據(jù)表現(xiàn)除了優(yōu)秀的存儲(chǔ)和查詢能力,已經(jīng)成為物聯(lián)網(wǎng)應(yīng)用的標(biāo)配,支撐著智能制造、工業(yè)能源、智能車聯(lián)網(wǎng)、智能家居、智慧城市等多個(gè)行業(yè)應(yīng)用。TSDB正在助力企業(yè)擁抱物聯(lián)網(wǎng)時(shí)代的到來(lái)。
眾所周知,百度云TSDB在讀取、寫(xiě)入和查詢數(shù)據(jù)上的性能一直表現(xiàn)優(yōu)異。
支持每秒百萬(wàn)級(jí)數(shù)據(jù)點(diǎn)的寫(xiě)入,可線性擴(kuò)展
查詢1億個(gè)數(shù)據(jù)點(diǎn)聚合值的響應(yīng)時(shí)間小于1秒
提供優(yōu)于傳統(tǒng)數(shù)據(jù)庫(kù)的壓縮能力,大大節(jié)約存儲(chǔ)空間
彈性、按需的海量數(shù)據(jù)存儲(chǔ)能力,成本更低。
我們都清楚,僅有提供海量的數(shù)據(jù)存儲(chǔ)、極速的查詢能力還不足以支撐不停發(fā)展的物聯(lián)網(wǎng)行業(yè)應(yīng)用。存儲(chǔ)的海量數(shù)據(jù)如何產(chǎn)生價(jià)值為業(yè)主所用,是TSDB要解決的新問(wèn)題。
物聯(lián)網(wǎng)場(chǎng)景下,設(shè)備都是7*24小時(shí)工作以一定的頻率上報(bào)數(shù)據(jù)的,數(shù)據(jù)量十分巨大。比如一輛無(wú)人車,以10Hz的頻率上傳數(shù)據(jù),每次上傳20個(gè)維度的數(shù)據(jù)點(diǎn),每輛車每天就要存儲(chǔ)1700萬(wàn)數(shù)據(jù)點(diǎn);一個(gè)傳感類監(jiān)測(cè)設(shè)備比如溫度傳感器,通常每10秒鐘上傳一次數(shù)據(jù),一個(gè)樓宇建筑中如果部署200個(gè)監(jiān)測(cè)點(diǎn),那一天下來(lái)需要170萬(wàn)個(gè)數(shù)據(jù)點(diǎn)。隨著業(yè)務(wù)的發(fā)展,數(shù)據(jù)只會(huì)越來(lái)越多。這么多數(shù)據(jù)都是挖掘行業(yè)應(yīng)用的金礦。
我們都不甘心數(shù)據(jù)只做存儲(chǔ)躺在服務(wù)器里,那怎么把TSDB中的數(shù)據(jù)發(fā)揮價(jià)值呢。不用擔(dān)心,TSDB目前已經(jīng)可以作為Hadoop和spark集群的數(shù)據(jù)源,進(jìn)行數(shù)據(jù)分析計(jì)算啦。
先來(lái)看最常使用的大數(shù)據(jù)分析工具Hadoop。Hadoop作為大數(shù)據(jù)分析的領(lǐng)軍代表,提供可靠存儲(chǔ)HDFS以及MapReduce編程范式以便大規(guī)模并行處理數(shù)據(jù)。TSDB作為存儲(chǔ)海量數(shù)據(jù)的數(shù)據(jù)源,自然更需要Hadoop的幫助來(lái)做數(shù)據(jù)分析啦。我們都知道,Hadoop提供了基于廉價(jià)硬件實(shí)現(xiàn)大規(guī)模并行處理的能力,不過(guò),簡(jiǎn)單的查詢都要寫(xiě)MapReduce代碼,對(duì)于商業(yè)用戶實(shí)在不怎么友好。所以TSDB采用了更友好的方式,直接提供基于TSDB的Hive SQL。Hive是一個(gè)關(guān)系數(shù)據(jù)倉(cāng)庫(kù),用戶可以方便的利用類似SQL語(yǔ)言查詢數(shù)據(jù),而Hive會(huì)自動(dòng)把SQL語(yǔ)言轉(zhuǎn)換成MapReduce代碼交給Hadoop處理。
用作品證明實(shí)力,網(wǎng)站建設(shè)行業(yè)排名前列