工業(yè)大數(shù)據(jù)平臺(tái)FSpaceX
力控工業(yè)大數(shù)據(jù)平臺(tái)FSpaceX是一套基于Hadoop分布式架構(gòu)設(shè)計(jì)的數(shù)據(jù)處理及分析平臺(tái)。平臺(tái)能夠提供基于多源異構(gòu)數(shù)據(jù)采集與存儲(chǔ)、數(shù)據(jù)清洗與過(guò)濾、數(shù)據(jù)倉(cāng)庫(kù)建設(shè)、多類型算法應(yīng)用、綜合分析可視化等功能,為企業(yè)解決從客商到制造等整個(gè)產(chǎn)品全生命周期各個(gè)環(huán)節(jié)所產(chǎn)生的各類數(shù)據(jù)應(yīng)用痛點(diǎn)問(wèn)題,以達(dá)到提升企業(yè)的經(jīng)濟(jì)效益及競(jìng)爭(zhēng)能力。
力控科技擁有專業(yè)大數(shù)據(jù)應(yīng)用團(tuán)隊(duì)為用戶提供綜合分析的業(yè)務(wù)需求,梳理業(yè)務(wù)應(yīng)用、數(shù)據(jù)采集、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)處理計(jì)算、分析挖掘及可視化展現(xiàn)的解決方案規(guī)劃,明確建設(shè)目標(biāo)、設(shè)定建設(shè)原則,制定建設(shè)方案,并進(jìn)行平臺(tái)開發(fā)、測(cè)試及部署。利用數(shù)據(jù)并結(jié)合生產(chǎn)痛點(diǎn)不斷學(xué)習(xí)進(jìn)化,改善決策模型,優(yōu)化決策建議。
工業(yè)大數(shù)據(jù)平臺(tái)整體架構(gòu)分為三層:數(shù)據(jù)工廠、算法引擎及數(shù)據(jù)可視化。
數(shù)據(jù)工廠主要實(shí)現(xiàn)異構(gòu)數(shù)據(jù)的采集、稽核及存儲(chǔ),數(shù)據(jù)采集可實(shí)現(xiàn)基于工業(yè)通信網(wǎng)關(guān)、實(shí)時(shí)數(shù)據(jù)庫(kù)、關(guān)系型業(yè)務(wù)數(shù)據(jù)庫(kù)等多種異構(gòu)數(shù)據(jù)庫(kù)數(shù)據(jù)之上的融合;數(shù)據(jù)稽核主要是對(duì)接收的數(shù)據(jù)進(jìn)行校驗(yàn),提供性、空值、數(shù)據(jù)類型及準(zhǔn)確性驗(yàn)證;數(shù)據(jù)存儲(chǔ)采用HBase、Greenplum、Redis以及其它數(shù)據(jù)庫(kù)組合應(yīng)用的數(shù)據(jù)存儲(chǔ)與分析方式,構(gòu)建分布式存儲(chǔ)架構(gòu),可動(dòng)態(tài)增加存儲(chǔ)節(jié)點(diǎn),具有可伸縮、多副本、高容錯(cuò)、高吞吐量等特性。
算法引擎提供Spark分布式計(jì)算框架,基于Hadoop集群實(shí)現(xiàn)資源的高效利用, 實(shí)現(xiàn)數(shù)據(jù)實(shí)時(shí)計(jì)算、海量數(shù)據(jù)分析挖掘的功能。支持機(jī)器學(xué)習(xí)庫(kù)MLib,支持包括分類、聚類、協(xié)同過(guò)濾、降維在內(nèi)的通知學(xué)習(xí)算法和工具類。
數(shù)據(jù)可視化提供數(shù)據(jù)集、動(dòng)靜態(tài)值集組件、數(shù)據(jù)篩選、數(shù)據(jù)格式轉(zhuǎn)換等建模功能,支持拖拽操作、豐富圖表、圖表聯(lián)動(dòng)、上卷下鉆、個(gè)性化排版、定時(shí)郵件、GIS及多媒體集成等功能。
可接入異構(gòu)數(shù)據(jù),包括時(shí)序、圖像、文件等數(shù)據(jù)。
數(shù)據(jù)清洗,提供多元的數(shù)據(jù)清洗與處理能力。
數(shù)據(jù)歸檔,基于大數(shù)據(jù)構(gòu)建企業(yè)數(shù)據(jù)倉(cāng)庫(kù)及存儲(chǔ)方案。
人工智能算法模型,提供面向生產(chǎn)調(diào)度優(yōu)化等智能算法(機(jī)器學(xué)習(xí)、遺傳學(xué)等)。
豐富圖表組件,采用可視化工具靈活地進(jìn)行多維分析。
私有化部署方案,確保企業(yè)內(nèi)部核心數(shù)據(jù)資產(chǎn)安全可靠。