孕妇一区二区在线|青青草久久五月丁香综合|国产精品制服高跟|琪琪女色999999|偷拍美女视频在线|成人性交无码视频|天堂社区中文字幕|亚洲成人精品A片|五月婷婷香蕉色国产人成福利导航|久久人妻系列中文

返回

美林?jǐn)?shù)據(jù)技術(shù)專家團(tuán)隊(duì) | 工業(yè)大數(shù)據(jù)分析,怎么做?


瀏覽【25510】  2021-11-05 18:35:00



認(rèn)識(shí)工業(yè)大數(shù)據(jù)

什么是工業(yè)大數(shù)據(jù)?
我們先看看維基百科的說法:“工業(yè)大數(shù)據(jù)(Industrialbig data)是構(gòu)成工業(yè)人工智能的重要元素,指由工業(yè)設(shè)備高速產(chǎn)生的大量數(shù)據(jù),對(duì)應(yīng)不同時(shí)間下的設(shè)備狀態(tài),是物聯(lián)網(wǎng)中的訊息。此一詞語在2012年隨著工業(yè)4.0的概念而出現(xiàn),也和信息技術(shù)行銷流行的大數(shù)據(jù)有關(guān),工業(yè)大數(shù)據(jù)也意味著工業(yè)設(shè)備產(chǎn)生的大量數(shù)據(jù)有其潛在的商業(yè)價(jià)值。工業(yè)大數(shù)據(jù)會(huì)配合工業(yè)互聯(lián)網(wǎng)的技術(shù),利用原始資料來支援管理上的決策?!?br/>百度百科是這樣說的:“工業(yè)大數(shù)據(jù)是指在工業(yè)領(lǐng)域中,圍繞典型智能制造模式,從客戶需求到銷售、訂單、計(jì)劃、研發(fā)、設(shè)計(jì)、工藝、制造、采購、供應(yīng)、庫存、發(fā)貨和交付、售后服務(wù)、運(yùn)維、報(bào)廢或回收再制造等整個(gè)產(chǎn)品全生命周期各個(gè)環(huán)節(jié)所產(chǎn)生的各類數(shù)據(jù)及相關(guān)技術(shù)和應(yīng)用的總稱。其以產(chǎn)品數(shù)據(jù)為核心,極大延展了傳統(tǒng)工業(yè)數(shù)據(jù)范圍,同時(shí)還包括工業(yè)大數(shù)據(jù)相關(guān)技術(shù)和應(yīng)用。其主要來源可分為以下三類:第一類是生產(chǎn)經(jīng)營相關(guān)業(yè)務(wù)數(shù)據(jù)。第二類是設(shè)備物聯(lián)數(shù)據(jù)。第三類是外部數(shù)據(jù)?!?br/>不同的說法體現(xiàn)了對(duì)工業(yè)大數(shù)據(jù)不同的認(rèn)知角度。但毋庸置疑的是,工業(yè)大數(shù)據(jù)為創(chuàng)新制造業(yè)企業(yè)的研發(fā)、生產(chǎn)、運(yùn)營、維保、營銷等提供了全方位支撐!

工業(yè)大數(shù)據(jù)

工業(yè)大數(shù)據(jù)如此重要,我們當(dāng)然要立刻開展基于工業(yè)大數(shù)據(jù)的分析、挖掘工作,以便從中獲取重要的價(jià)值。且慢,工業(yè)數(shù)據(jù)具有不同于關(guān)系型業(yè)務(wù)數(shù)據(jù)的特殊性,使其難以直接使用現(xiàn)有數(shù)據(jù)分析工具。


工業(yè)大數(shù)據(jù)的特點(diǎn)
經(jīng)典數(shù)據(jù)分析方法通常面向關(guān)系表數(shù)據(jù)結(jié)構(gòu)(DataFrame)。無論是業(yè)務(wù)信息化系統(tǒng)中具有復(fù)雜數(shù)據(jù)關(guān)聯(lián)的表結(jié)構(gòu),還是面向分析專用的冗余數(shù)據(jù)寬表都會(huì)用到這一數(shù)據(jù)結(jié)構(gòu)。它們同樣具有下面這些特征:

工業(yè)大數(shù)據(jù)的特點(diǎn)

1、數(shù)據(jù)按行與列的方式放置,每條數(shù)據(jù)為一行,一行數(shù)據(jù)分為若干列,所有數(shù)據(jù)具有相同的列數(shù),這些列表示了記錄的不同屬性。
2、各行數(shù)據(jù)在同一列具有相同的數(shù)據(jù)類型,各列之間可以不同。
3、各列數(shù)據(jù)類型通常為基本類型,即數(shù)值型、文本型、布爾型等。
4、各行數(shù)據(jù)之間具有獨(dú)立性,沒有依賴關(guān)系。
關(guān)系表數(shù)據(jù)結(jié)構(gòu)既是關(guān)系型數(shù)據(jù)庫所使用的基本邏輯模型,也是包括Excel、SPSS、R、Python—pandas、Spark等諸多數(shù)據(jù)分析處理軟件與框架所使用的數(shù)據(jù)模型,有大量數(shù)據(jù)分析方法針對(duì)這一數(shù)據(jù)結(jié)構(gòu)。而工業(yè)制造領(lǐng)域常見的數(shù)據(jù)類型是信號(hào)數(shù)據(jù),這種數(shù)據(jù)并不很適合使用關(guān)系表數(shù)據(jù)結(jié)構(gòu)去進(jìn)行表達(dá)。
信號(hào)數(shù)據(jù)是工業(yè)大數(shù)據(jù)的重要構(gòu)成部分,其一般直接或間接來源工業(yè)設(shè)備本身,是反應(yīng)工業(yè)設(shè)備現(xiàn)狀的重要參考。在設(shè)備故障診斷和健康預(yù)測(即PHM)應(yīng)用中具有重要的價(jià)值。
和關(guān)系表數(shù)據(jù)相比,它存在以下特點(diǎn):
1、每條信號(hào)數(shù)據(jù)內(nèi)所有數(shù)據(jù)值均為同一類型數(shù)字,通常為浮點(diǎn)數(shù)值。
2、信號(hào)數(shù)據(jù)中數(shù)值的次序非常重要,其中包含關(guān)鍵信息。
3、一條信號(hào)數(shù)據(jù)內(nèi)可以包含數(shù)百萬乃至更多標(biāo)量值,通常難以用關(guān)系型數(shù)據(jù)庫逐一存儲(chǔ)。
4、針對(duì)工業(yè)信號(hào)數(shù)據(jù)存在著大量經(jīng)典算法,以數(shù)字信號(hào)處理算法為主,這些算法與經(jīng)典數(shù)據(jù)分析算法有很大差異。
5、大量機(jī)器學(xué)習(xí)、深度學(xué)習(xí)方法難以直接應(yīng)用于原生信號(hào)數(shù)據(jù)形式。
可見,由于上述原因,面向關(guān)系表數(shù)據(jù)的處理、分析工具難以直接應(yīng)用工業(yè)信號(hào)數(shù)據(jù)類型。換言之,當(dāng)前工業(yè)信號(hào)分析領(lǐng)域的困境是:缺少面向工業(yè)信號(hào)數(shù)據(jù)的“數(shù)據(jù)分析+機(jī)器學(xué)習(xí)” 應(yīng)用平臺(tái)。

面向工業(yè)大數(shù)據(jù)的分析工具
為解決工業(yè)大數(shù)據(jù)分析困境,Tempo大數(shù)據(jù)分析平臺(tái)開發(fā)提供了面向工業(yè)信號(hào)數(shù)據(jù)的專用分析工具包,該工具包是TempoAI為工業(yè)賦能的專用擴(kuò)展功能之一。
通過該工具包,我們能快速便捷的使用拖曳方式,完成對(duì)信號(hào)的各種經(jīng)典變換處理。更重要的是,本工具打通了主流及前沿的數(shù)據(jù)分析方法和機(jī)器學(xué)習(xí)技術(shù)應(yīng)和工業(yè)信號(hào)類數(shù)據(jù)之間的壁壘。
現(xiàn)在工業(yè)工程師、質(zhì)量工程師和PHM系統(tǒng)運(yùn)維的小伙伴們可以將大量優(yōu)秀的數(shù)據(jù)分析方法直接應(yīng)用于工業(yè)現(xiàn)場數(shù)據(jù)挖掘。

面向工業(yè)大數(shù)據(jù)的分析工具


TempoAI 的信號(hào)處理工具包功能強(qiáng)大,下面我們看一下它具體都能做些什么吧。
1、支持多種信號(hào)數(shù)據(jù)存儲(chǔ)形式的輸入與輸出

TempoAI 的信號(hào)處理工具

2、支持多種數(shù)字信號(hào)數(shù)據(jù)預(yù)處理操作
支持將信號(hào)數(shù)據(jù)按照不同的分割方法進(jìn)行切分,支持按照分幀、分貝、時(shí)段、功率、平穩(wěn)性、自適應(yīng)分割方法。

TempoAI 的信號(hào)處理工具


3、支持多種數(shù)字信號(hào)處理方法拖曳式使用

TempoAI 的信號(hào)處理工具支持多種數(shù)字信號(hào)處理

4、支持多種面向信號(hào)數(shù)據(jù)的特征工程方法
通過特征工程方法,可以將信號(hào)數(shù)據(jù)轉(zhuǎn)化為一系列特征量描述,從而便于用戶經(jīng)典數(shù)據(jù)分析方法對(duì)其進(jìn)行分析、建模等研究。

支持多種面向信號(hào)數(shù)據(jù)的特征工程方法

5、支持信號(hào)數(shù)據(jù)類型與關(guān)系表數(shù)據(jù)類型的相互轉(zhuǎn)換

支持信號(hào)數(shù)據(jù)類型與關(guān)系表數(shù)據(jù)類型的相互轉(zhuǎn)換

6、支持信號(hào)數(shù)據(jù)處理與特征提取功能自定義
信號(hào)處理擴(kuò)展節(jié)點(diǎn)支持用戶通過選擇自定義的信號(hào)處理算法將信號(hào)數(shù)據(jù)進(jìn)行處理,使信號(hào)數(shù)據(jù)處理更靈活更便捷。(自定義功能擴(kuò)展需要管理授權(quán))

支持信號(hào)數(shù)據(jù)處理與特征提取功能自定義

工業(yè)信號(hào)處理工具包在TempoAI里的位置是這樣的:

工業(yè)信號(hào)處理工具

如下圖所示,平臺(tái)新增了信號(hào)分析模塊,將極大提高平臺(tái)對(duì)工業(yè)數(shù)據(jù)的兼容能力,尤其是工業(yè)信號(hào)數(shù)據(jù),也為后續(xù)工業(yè)信號(hào)分析項(xiàng)目的大數(shù)據(jù)解決方案提供可能。

信號(hào)分析

擴(kuò)展后的技術(shù)路線主要包含三個(gè)層次:
1、最上層表示機(jī)器學(xué)習(xí)流程
其余CRISP-DM流程(跨行業(yè)數(shù)據(jù)挖掘標(biāo)準(zhǔn)流程)基本保持一致。
2、最下層就是經(jīng)典數(shù)字信號(hào)處理流程
平臺(tái)內(nèi)置了信號(hào)處理、信號(hào)變換、信號(hào)特征提取、譜分析以及信號(hào)濾波五大核心模塊,此外平臺(tái)集成了信號(hào)讀入和信號(hào)輸出兩個(gè)基本節(jié)點(diǎn),這樣就可以實(shí)現(xiàn)經(jīng)典信號(hào)分析流程端到端解決方法的暢通。
3、信號(hào)分析和機(jī)器學(xué)習(xí)融合
在平臺(tái)上體現(xiàn)為S端口(信號(hào)數(shù)據(jù))和D端口(關(guān)系型數(shù)據(jù))的連接。目前融合的核心組件是信號(hào)特征提取和S轉(zhuǎn)D。前者通過信號(hào)特征提取,完成機(jī)器學(xué)習(xí)或深度學(xué)習(xí)建模中特征工程的任務(wù)。后者完成信號(hào)數(shù)據(jù)機(jī)理分析結(jié)果的關(guān)系型轉(zhuǎn)存。

信號(hào)分析和機(jī)器學(xué)習(xí)融合

“信號(hào)分析+機(jī)器學(xué)習(xí)”其核心思路是基于信號(hào)分析算子完成信號(hào)數(shù)據(jù)的特征工程的功能。在實(shí)際使用信號(hào)分析工具包進(jìn)行數(shù)據(jù)分析時(shí),信號(hào)處理算法節(jié)點(diǎn)與數(shù)據(jù)分析節(jié)點(diǎn)的結(jié)合一般是下面這個(gè)樣子的。(紅框中是信號(hào)處理節(jié)點(diǎn)部分)

信號(hào)分析+機(jī)器學(xué)習(xí)


一個(gè)示例
現(xiàn)在我們用一個(gè)工業(yè)數(shù)據(jù)分析的例子來實(shí)際看一下信號(hào)處理工具包的使用。某風(fēng)力發(fā)電機(jī)結(jié)構(gòu)由三相感應(yīng)發(fā)電機(jī)、冷卻箱和單級(jí)行星齒輪箱組成。齒輪的前后支撐都是深溝球類型的軸承,容易發(fā)生故障?,F(xiàn)有以下需求:基于發(fā)電機(jī)組中發(fā)電機(jī)前軸承的振動(dòng)信號(hào)實(shí)現(xiàn)軸承故障特征自適應(yīng)提取和復(fù)合特征提取。
1、軸承故障特征自適應(yīng)提取
分析說明:振動(dòng)信號(hào)的時(shí)域信號(hào)存在在強(qiáng)弱不等的沖擊波形,但由于大量背景噪聲的干擾,使得這些沖擊的規(guī)律性和特征性不明顯。但其頻域信號(hào)中,高頻成分較為豐富。
實(shí)現(xiàn)路線:小波變換+信號(hào)特征提取

工業(yè)數(shù)據(jù)分析

過程簡介:樣例數(shù)據(jù)和數(shù)據(jù)轉(zhuǎn)信號(hào)節(jié)點(diǎn)完成關(guān)系型數(shù)據(jù)向信號(hào)數(shù)據(jù)的轉(zhuǎn)變,然后基于離散小波變換,通過指定小波基函數(shù)和分解層數(shù),對(duì)原信號(hào)數(shù)據(jù)實(shí)現(xiàn)多尺度的細(xì)分,最后基于這些細(xì)分信號(hào)數(shù)據(jù),提取對(duì)應(yīng)的信號(hào)特征。
2、復(fù)合特征提取
分析說明:此時(shí)的振動(dòng)信號(hào)頻譜圖很難看到明顯的故障信息。
實(shí)現(xiàn)路線:經(jīng)驗(yàn)?zāi)B(tài)分解+信號(hào)特征提取(或小波變換+信號(hào)特征提取)
過程簡介:雖然與上述子問題的實(shí)現(xiàn)路線一致,但是側(cè)重點(diǎn)不同。這里信號(hào)特征提取只是輔助驗(yàn)證,重點(diǎn)在于經(jīng)驗(yàn)?zāi)B(tài)分解(或小波變換)的分解和重構(gòu)。以經(jīng)驗(yàn)?zāi)B(tài)分解為例:

工業(yè)數(shù)據(jù)分析

當(dāng)前信號(hào)被分成了6個(gè)模態(tài)函數(shù)和1個(gè)殘差余量。從波形圖上我們發(fā)現(xiàn)IMF1和MIF2的振動(dòng)頻率比較相近,IMF3~IMF6比較相近。
所以據(jù)此,我們可以將相近的模態(tài)函數(shù)進(jìn)行簡單相加(這里通過希爾伯特黃變換實(shí)現(xiàn))形成新的信號(hào),這些新信號(hào)的特征就是我們想要的符合特征。當(dāng)分解層數(shù)較多時(shí),各IMF分量比較接近時(shí),我們可以選用信號(hào)特征提取中的特征幫助實(shí)現(xiàn)對(duì)其的分組(如以分貝、加速度級(jí)等)。

工業(yè)信號(hào)數(shù)據(jù)分析

這樣,我們就獲得了這一類風(fēng)機(jī)的典型運(yùn)行工況特征。將這些特征提取出來后,就可以使用統(tǒng)計(jì)分析去發(fā)現(xiàn)風(fēng)機(jī)運(yùn)行的規(guī)律,或者將大量風(fēng)機(jī)運(yùn)行數(shù)據(jù)積累形成訓(xùn)練數(shù)據(jù),構(gòu)建人工智能模型,以發(fā)現(xiàn)風(fēng)機(jī)的運(yùn)行異常等。

總而言之,TempoAI 的信號(hào)處理工具包解決了工業(yè)大數(shù)據(jù)分析中遇到的數(shù)據(jù)分析方法難以直接應(yīng)用的問題,使得深入挖掘工業(yè)大數(shù)據(jù),發(fā)現(xiàn)工業(yè)大數(shù)據(jù)價(jià)值變得便捷易行。感興趣的朋友們,請(qǐng)趕快嘗試吧!