大數(shù)據(jù)挖掘系統(tǒng) (Hifar-BDM)
適用部門:面向裝備制造業(yè)的企業(yè)和技術(shù)管理層
客戶問題:針對(duì)裝備制造業(yè)的海量數(shù)據(jù),后續(xù)如何挖掘應(yīng)用已經(jīng)成為炙手可熱的話題了,主要表現(xiàn)為海量格式未知且不統(tǒng)一的半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)的存儲(chǔ);海量未知結(jié)構(gòu)數(shù)據(jù)的快速搜索、比對(duì)分析、類比推送;海量未知結(jié)構(gòu)數(shù)據(jù)相關(guān)性提取很困難以及未來測(cè)試數(shù)據(jù)量持續(xù)快速增長(zhǎng)帶來的存儲(chǔ)、管理壓力巨大等。.
解決方案:
Hifar-BDM主要從以下幾方面解決:
具體來講:系統(tǒng)需要接入各種測(cè)試系統(tǒng)生成的數(shù)據(jù),這些數(shù)據(jù)的數(shù)據(jù)格式不統(tǒng)一且新型型號(hào)測(cè)試數(shù)據(jù)的類型、參數(shù)不可預(yù)知,這些問題決定了不能利用傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)等嚴(yán)格依賴于數(shù)據(jù)結(jié)構(gòu)化的數(shù)據(jù)管理工具來存儲(chǔ);海量未知格式和參數(shù)類型的測(cè)試數(shù)據(jù)之間很難建立起簡(jiǎn)單的依賴關(guān)系,給數(shù)據(jù)的快速查詢及經(jīng)驗(yàn)比對(duì)帶來巨大的困難;當(dāng)試驗(yàn)數(shù)據(jù)量累積到海量時(shí),靠人力和傳統(tǒng)的分析方法已經(jīng)無法總結(jié)出各個(gè)數(shù)據(jù)之間的聯(lián)動(dòng)變化關(guān)系,也就意味著這些數(shù)據(jù)不能用于指導(dǎo)后期型號(hào)的研發(fā)工作,成為了死數(shù)據(jù)。
1)各種試驗(yàn)儀器產(chǎn)生出各種格式不統(tǒng)一的試驗(yàn)數(shù)據(jù),難以用人工的方式梳理。給系統(tǒng)存儲(chǔ)層的設(shè)計(jì)帶來很大的困難。
2)未來產(chǎn)品研制過程中可能產(chǎn)生各種未知格式、參數(shù)和數(shù)量的試驗(yàn)數(shù)據(jù),對(duì)系統(tǒng)在存儲(chǔ)和計(jì)算方面的可擴(kuò)展性提出了很高的要求。
3)目前海量測(cè)試試驗(yàn)數(shù)據(jù)的分別管理使這些數(shù)據(jù)稱為信息孤島,只能作為事故溯源的基礎(chǔ)。如果能將這些“孤島”數(shù)據(jù)進(jìn)行整合,快速有效地挖掘出各試驗(yàn)環(huán)節(jié)中獲取數(shù)據(jù)的規(guī)律性和相關(guān)性,成功預(yù)測(cè)型號(hào)運(yùn)行、研制參數(shù)的后期走勢(shì),對(duì)我們今后的工作具有重大的指導(dǎo)意義。
4)試驗(yàn)報(bào)告的傳統(tǒng)生成方法耗時(shí)耗力,無法適應(yīng)新的工作要求。因此,我們需要能夠在海量數(shù)據(jù)中快速、準(zhǔn)確提取相關(guān)數(shù)據(jù),形成標(biāo)準(zhǔn)化報(bào)告的技術(shù)來解放我們的人力。