国产强伦姧在线观看无码,中文字幕99久久亚洲精品,国产精品乱码在线观看,色桃花亚洲天堂视频久久,日韩精品无码观看视频免费

      正在閱讀:大數(shù)據(jù)以大為本 數(shù)據(jù)挖掘技術(shù)能否“算命”?

      大數(shù)據(jù)以大為本 數(shù)據(jù)挖掘技術(shù)能否“算命”?

      2016-12-23 09:27:27來源:界面 編輯:沐子飛 關(guān)鍵詞:機(jī)器學(xué)習(xí)大數(shù)據(jù)數(shù)據(jù)挖掘閱讀量:35585

      導(dǎo)讀:BAT雖然在數(shù)據(jù)量上占據(jù)優(yōu)勢(shì),但卻在豐富性上受到局限。中小企業(yè)則可以充分利用自己在垂直領(lǐng)域里深耕的優(yōu)勢(shì),將數(shù)據(jù)的豐富性提升上來,從而獲得差異性的優(yōu)勢(shì)。
        【中國智能制造網(wǎng) 市場(chǎng)分析】BAT雖然在數(shù)據(jù)量上占據(jù)優(yōu)勢(shì),但卻在豐富性上受到局限,甚至并不具備垂直領(lǐng)域UGC所具備的大數(shù)據(jù)能力。中小企業(yè)則可以充分利用自己在垂直領(lǐng)域里深耕的優(yōu)勢(shì),將數(shù)據(jù)的豐富性提升上來,從而獲得差異性的優(yōu)勢(shì)。

       

      大數(shù)據(jù)以大為本 數(shù)據(jù)挖掘技術(shù)能否“算命”?
       
        大數(shù)據(jù)的門檻
       
        “如果你只有一堆人的電話號(hào)碼,這可能沒多大意義。但像攜程的數(shù)據(jù),比如所有人提前預(yù)訂、搜索、瀏覽、點(diǎn)評(píng)的信息等,這就是有價(jià)值的。但更深層的核心是,你能不能在某個(gè)產(chǎn)品上使用到這些數(shù)據(jù),而且確實(shí)有幫助。”眾薈數(shù)據(jù)智能事業(yè)部總經(jīng)理焦宇說。
       
        美團(tuán)云大數(shù)據(jù)平臺(tái)負(fù)責(zé)人對(duì)此表示認(rèn)同,“首先要弄清楚擁有的數(shù)據(jù)是否有價(jià)值,是否有人愿意為其買單。另外則是源數(shù)據(jù)的豐富度,是否能夠?yàn)閿?shù)據(jù)價(jià)值的發(fā)揮帶來補(bǔ)充和完善”。
       
        顯然,數(shù)據(jù)收集的目的并不單單是把數(shù)據(jù)集中起來,終還是要在實(shí)際運(yùn)營(yíng)中發(fā)揮作用。擁有數(shù)據(jù)只是開端,如何深入分析、洞察數(shù)據(jù)彼此之間的關(guān)聯(lián),才是大數(shù)據(jù)應(yīng)用的關(guān)鍵,這也是眾多手握大數(shù)據(jù)企業(yè)的分水嶺。
       
        不過,在這個(gè)過程中,有一個(gè)不容忽視的問題,那就是數(shù)據(jù)的質(zhì)量問題。“錯(cuò)誤的輸入,換來的必然是錯(cuò)誤的輸出”,螞蜂窩大數(shù)據(jù)技術(shù)總監(jiān)韓鑫在接受采訪時(shí)就特別指出了這個(gè)問題。
       
        “真正決定數(shù)據(jù)挖掘成敗的是數(shù)據(jù)本身的質(zhì)量,對(duì)于算法的合理使用和優(yōu)化反而是次要的。由于大數(shù)據(jù)的興起,我們很容易獲得龐雜的數(shù)據(jù);然而單純地指望從高深的算法中去獲得我們想要的信息而忽視數(shù)據(jù)本身的質(zhì)量,往往只能是空中樓閣。”
       
        對(duì)大數(shù)據(jù)而言,表面上看數(shù)據(jù)是越多越好,因?yàn)楦嗟臄?shù)據(jù)可以產(chǎn)生更能擬合真實(shí)情況的場(chǎng)景,但同時(shí)更多的數(shù)據(jù)也產(chǎn)生了更多的噪音——所以單純的數(shù)據(jù)的量的增加并不能提高計(jì)算的度。
       
        因而擁有高質(zhì)量的數(shù)據(jù),要遠(yuǎn)比握有一堆龐雜的數(shù)據(jù)更有價(jià)值:這樣既能減少數(shù)據(jù)挖掘的難度,也有利于提高數(shù)據(jù)挖掘的精度。但是,這就是大數(shù)據(jù)的核心門檻嗎?
       
        韓鑫認(rèn)為:“建立完整的大數(shù)據(jù)體系還需要兩個(gè)重要的因素,業(yè)務(wù)的豐富程度和數(shù)據(jù)思維的融入。”
       
        焦宇從自己的實(shí)踐經(jīng)驗(yàn)出發(fā),談了自己的看法:“對(duì)一個(gè)特別好的產(chǎn)品經(jīng)理來講,大數(shù)據(jù)的門檻首先是要理解這個(gè)東西到底是什么;第二建模能力要強(qiáng)。從這兩方面說,人才相對(duì)都是稀缺的。比如有些公司是有大數(shù)據(jù)的,但要找到很牛的人來做這件事情,雖然理論上講是可以隨時(shí)找到的,但事實(shí)上卻很難。”
       
        “個(gè)是大數(shù)據(jù)。第二個(gè)方面,有人把數(shù)據(jù)比喻成‘石油’,有石油寶藏還得有機(jī)器、工具把它挖出來,這個(gè)工具就是機(jī)器學(xué)習(xí)。第三方面是計(jì)算能力的進(jìn)步。工具再強(qiáng),沒有非常強(qiáng)的計(jì)算能力,還是跑不動(dòng)的。”滴滴研究院院長(zhǎng)何曉飛則給出了這樣的答案。
       
        數(shù)據(jù)挖掘的難點(diǎn)
       
        數(shù)據(jù)挖掘,不像收集數(shù)據(jù)填幾張表,問幾個(gè)問題就能輕松實(shí)現(xiàn)。它的專業(yè)性相對(duì)較高,運(yùn)用的知識(shí)、技術(shù)難度也明顯加大。因而大多數(shù)的數(shù)據(jù)挖掘基本是由專業(yè)人士或?qū)I(yè)團(tuán)隊(duì)來做的。
       
        另外,建模的成功與否,對(duì)數(shù)據(jù)呈現(xiàn)的結(jié)果也有非常重要的影響。模型不同,結(jié)果也往往會(huì)出現(xiàn)差異。
       
        “任何人都能搭出來一個(gè)模型,只要搭出模型就能有結(jié)果,但這個(gè)結(jié)果是不是反映真實(shí)世界?因?yàn)閿?shù)據(jù)之間的關(guān)系,并不是直接的線性關(guān)系,因此模型可以非常復(fù)雜。所以你先得知道你要解決的是個(gè)什么問題:從統(tǒng)計(jì)上來講,是哪種類型的問題,它有什么樣的特性,你在數(shù)據(jù)上的采集有什么局限?然后再找到跟這個(gè)問題接近的模型。”焦宇說。
       
        “數(shù)據(jù)挖掘的難點(diǎn)在于,主要數(shù)據(jù)收集和終應(yīng)用之間的相互關(guān)聯(lián)卻又矛盾的關(guān)系,這類似于‘先有雞還是先有蛋’的問題。兩者之間相互影響相互補(bǔ)充,導(dǎo)致其相對(duì)其他類別的程序開發(fā)而言,是更為漫長(zhǎng)而又復(fù)雜的過程。” 韓鑫說道。
       
        無論是焦宇所說的模型,還是韓鑫所說的算法,其實(shí)都在強(qiáng)調(diào)一個(gè)重點(diǎn):根據(jù)實(shí)際情況變化對(duì)模型和算法做出相應(yīng)的調(diào)整。沒有固定的規(guī)則,只有時(shí)時(shí)更新的數(shù)據(jù)和不斷變化的情況,所以運(yùn)用的規(guī)則也要因時(shí)調(diào)整。
       
        美團(tuán)云大數(shù)據(jù)平臺(tái)負(fù)責(zé)人則認(rèn)為,如何拿到“規(guī)范的數(shù)據(jù)”才是真正的難點(diǎn)所在:“新美大每天產(chǎn)生p級(jí)別的數(shù)據(jù),包括大量的商戶、用戶和交互數(shù)據(jù);每天通過hadoop、hive、spark、storm等大數(shù)據(jù)工具進(jìn)行批量和實(shí)時(shí)的清洗,才得以形成規(guī)范的數(shù)據(jù)。”
       
        然而,也許難的一點(diǎn)還是在于那個(gè)實(shí)際的問題。技術(shù)快速發(fā)展,提供了像應(yīng)用統(tǒng)計(jì)方法、事例推理、決策樹、規(guī)則推理、模糊集、神經(jīng)網(wǎng)絡(luò)、遺傳算法等諸多方法來處理信息,這既降低了數(shù)據(jù)挖掘的難點(diǎn),同時(shí)也提高了數(shù)據(jù)挖掘的效率和度——但所有的這些,都需要不菲的資金。
       
        許多人可能都聽說過那些使用大數(shù)據(jù)的輝煌案例:Facebook每天要存儲(chǔ)大約100TB的用戶數(shù)據(jù);NASA每天要處理約24TB的數(shù)據(jù)。那么處理這些數(shù)據(jù)所需的成本是多少呢?
       
        按照亞馬遜Redshift的定價(jià),NASA需要為45天數(shù)據(jù)存儲(chǔ)服務(wù)支付超過100萬美元。而根據(jù)國外的一項(xiàng)調(diào)查,大多數(shù)企業(yè)的CIO稱他們的預(yù)算支付不起大數(shù)據(jù)部署的成本,數(shù)據(jù)存儲(chǔ)和處理的成本實(shí)在太高。
       

       

      我要評(píng)論
      • 物流智能轉(zhuǎn)型新引擎:DeepSeek+物流

        DeepSeek 物流不僅是技術(shù)的革新,更是城市發(fā)展的重要推動(dòng)力。它通過智能化手段提升物流效率、優(yōu)化資源利用、減少環(huán)境影響,并為智慧城市建設(shè)提供支撐。未來,隨著AI技術(shù)的不斷進(jìn)步,物流行業(yè)將迎來更深刻的變革。
        物流大數(shù)據(jù)服務(wù)平臺(tái)
        2025-04-30 10:11:15
      • 2025年4月1日開始施行的重要新規(guī)一覽

        四月,一系列新規(guī)定即將實(shí)施,包括《公共安全視頻圖像信息系統(tǒng)管理?xiàng)l例》、《車聯(lián)網(wǎng)網(wǎng)絡(luò)安全異常行為檢測(cè)機(jī)制》等。
        大數(shù)據(jù)服務(wù)平臺(tái)
        2025-04-02 09:31:36
      • 鐵塔大數(shù)據(jù)災(zāi)害分析平臺(tái):提升自然災(zāi)害智能化預(yù)警水平

        目前,我國災(zāi)害預(yù)防面臨著監(jiān)測(cè)預(yù)警網(wǎng)絡(luò)不健全、實(shí)效性不高、精準(zhǔn)性不強(qiáng),“三斷”(斷路、斷網(wǎng)、斷電)無法及時(shí)發(fā)現(xiàn)等問題,亟需建立防災(zāi)減災(zāi)預(yù)警網(wǎng)絡(luò),實(shí)現(xiàn)“災(zāi)后救助”向“災(zāi)前預(yù)防”轉(zhuǎn)變的目標(biāo)。
        大數(shù)據(jù)災(zāi)害分析平臺(tái)
        2025-03-19 10:47:45
      • 淄博市召開大數(shù)據(jù)系統(tǒng)工作會(huì)議暨“三拼三比”動(dòng)員部署會(huì)

        會(huì)議指出,2024年是新一輪機(jī)構(gòu)改革后全市大數(shù)據(jù)系統(tǒng)全面履職的第一年,全市大數(shù)據(jù)系統(tǒng)在市委市政府的堅(jiān)強(qiáng)領(lǐng)導(dǎo)和省大數(shù)據(jù)局的有力指導(dǎo)下,數(shù)據(jù)要素價(jià)值加速釋放、數(shù)字經(jīng)濟(jì)發(fā)展步伐加快、數(shù)字政府建設(shè)深入推進(jìn)、數(shù)字支撐底座更為夯實(shí),數(shù)字淄博建設(shè)取得明顯成效。
        大數(shù)據(jù)服務(wù)平臺(tái)
        2025-03-18 10:07:30
      • 公司重要?jiǎng)討B(tài)速覽|??低?、新華三、宇樹科技......

        近期,智慧城市領(lǐng)域的企業(yè)有哪些動(dòng)態(tài)呢?小編整理了一下,一起來回顧。??低暟l(fā)布視覺大模型周界攝像機(jī);宇樹科技入駐阿里速賣通AliExpress出海......
        大數(shù)據(jù)服務(wù)平臺(tái)
        2025-03-16 14:10:47
      • 貴州省大數(shù)據(jù)局召開數(shù)字企業(yè)座談會(huì)

        會(huì)上,朱宗堯介紹了全省數(shù)據(jù)工作“一體兩翼三大轉(zhuǎn)型”總體思路及數(shù)字產(chǎn)業(yè)重點(diǎn)發(fā)展方向,數(shù)字產(chǎn)業(yè)處就起草促進(jìn)數(shù)字產(chǎn)業(yè)發(fā)展相關(guān)政策措施有關(guān)情況作了說明。
        大數(shù)據(jù)服務(wù)平臺(tái)
        2025-03-10 11:14:27
      版權(quán)與免責(zé)聲明:

      凡本站注明“來源:智能制造網(wǎng)”的所有作品,均為浙江興旺寶明通網(wǎng)絡(luò)有限公司-智能制造網(wǎng)合法擁有版權(quán)或有權(quán)使用的作品,未經(jīng)本站授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明“來源:智能制造網(wǎng)”。違反上述聲明者,本站將追究其相關(guān)法律責(zé)任。

      本站轉(zhuǎn)載并注明自其它來源(非智能制造網(wǎng))的作品,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn)或和對(duì)其真實(shí)性負(fù)責(zé),不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。如其他媒體、平臺(tái)或個(gè)人從本站轉(zhuǎn)載時(shí),必須保留本站注明的作品第一來源,并自負(fù)版權(quán)等法律責(zé)任。如擅自篡改為“稿件來源:智能制造網(wǎng)”,本站將依法追究責(zé)任。

      鑒于本站稿件來源廣泛、數(shù)量較多,如涉及作品內(nèi)容、版權(quán)等問題,請(qǐng)與本站聯(lián)系并提供相關(guān)證明材料:聯(lián)系電話:0571-89719789;郵箱:1271141964@qq.com。

      不想錯(cuò)過行業(yè)資訊?

      訂閱 智能制造網(wǎng)APP

      一鍵篩選來訂閱

      信息更豐富

      推薦產(chǎn)品/PRODUCT 更多
      智造商城:

      PLC工控機(jī)嵌入式系統(tǒng)工業(yè)以太網(wǎng)工業(yè)軟件金屬加工機(jī)械包裝機(jī)械工程機(jī)械倉儲(chǔ)物流環(huán)保設(shè)備化工設(shè)備分析儀器工業(yè)機(jī)器人3D打印設(shè)備生物識(shí)別傳感器電機(jī)電線電纜輸配電設(shè)備電子元器件更多

      我要投稿
      • 投稿請(qǐng)發(fā)送郵件至:(郵件標(biāo)題請(qǐng)備注“投稿”)1271141964.qq.com
      • 聯(lián)系電話0571-89719789
      工業(yè)4.0時(shí)代智能制造領(lǐng)域“互聯(lián)網(wǎng)+”服務(wù)平臺(tái)
      智能制造網(wǎng)APP

      功能豐富 實(shí)時(shí)交流

      智能制造網(wǎng)小程序

      訂閱獲取更多服務(wù)

      微信公眾號(hào)

      關(guān)注我們

      抖音

      智能制造網(wǎng)

      抖音號(hào):gkzhan

      打開抖音 搜索頁掃一掃

      視頻號(hào)

      智能制造網(wǎng)

      公眾號(hào):智能制造網(wǎng)

      打開微信掃碼關(guān)注視頻號(hào)

      快手

      智能制造網(wǎng)

      快手ID:gkzhan2006

      打開快手 掃一掃關(guān)注
      意見反饋
      我要投稿
      我知道了