導(dǎo)讀:小模式之所以關(guān)鍵,是因?yàn)閺目茖W(xué)到商業(yè),從治理到社會政策,它們都代表著競爭的新前沿。大數(shù)據(jù)之所以對一家公司價值極大,正是因?yàn)槿狈π∧J健?
【中國智能制造網(wǎng) 智造快訊】小模式之所以關(guān)鍵,是因?yàn)閺目茖W(xué)到商業(yè),從治理到社會政策,它們都代表著競爭的新前沿。大數(shù)據(jù)之所以對一家公司價值極大,正是因?yàn)槿狈π∧J健?div style="text-align: center">
把握大數(shù)據(jù)價值 讀懂“小模式”是關(guān)鍵
近,關(guān)于大數(shù)據(jù)的各種討論不絕于耳。所有人都在談?wù)撨@種近乎神奇的新資源,它理應(yīng)改變和提高商業(yè)生命周期的各個方面。定義一個接著一個,各類學(xué)者試圖對大數(shù)據(jù)理論、模型、分析、解決方案等等提出自己的見解。所有這些可能造成困惑,但有兩點(diǎn)是清晰的。
1、正確理解大數(shù)據(jù) 首先,關(guān)于大數(shù)據(jù)常見、而且也是佳的定義是由道格拉斯•蘭尼在2001年提出的。在為METAGroup撰寫的一篇研究報告中,蘭尼將大數(shù)據(jù)稱為規(guī)模龐大的數(shù)據(jù)集合、高速的累積和變化,以及廣泛的來源種類。這就是我們?nèi)缃袢栽谑褂玫慕?jīng)典的3V定義。雖然后來有人加入了更多的特性,尤其是“真實(shí)性”,但這其實(shí)是一種分類錯誤,因?yàn)樗劦氖侨藗儚拇髷?shù)據(jù)中提取出的信息的性質(zhì),而不是數(shù)據(jù)之所以大的數(shù)量規(guī)格(度量)。
其次,在2012年,世界經(jīng)濟(jì)論壇增加了第四個V:價值,將大數(shù)據(jù)劃分為一種新的經(jīng)濟(jì)
資產(chǎn)。這沒有改變大數(shù)據(jù)的定義,而是表明,無論大數(shù)據(jù)是什么,它都具有非常重要的價值。同一年,IBM現(xiàn)任董事長、總裁兼執(zhí)行官羅睿蘭在其年度董事長信函中寫道,“大數(shù)據(jù)不亞于一種新的自然資源。數(shù)據(jù)對我們當(dāng)今時代的角色就像是蒸汽、電磁和化石燃料對之前時代的角色一樣。它有潛力讓繁榮和社會進(jìn)步更上層樓”。
現(xiàn)在沒有人懷疑,大數(shù)據(jù)是一種非常真實(shí)的現(xiàn)象,對任何組織來說都是非常寶貴的資產(chǎn)。正如那句被用濫的比喻,許多重要特征讓大數(shù)據(jù)成為新的石油。其中5個特征非常重要。為了讓它們好記,我用5個R開頭的單詞來表示。它們并非按照重要性排列。
與其他許多無形資產(chǎn)一樣,大數(shù)據(jù)是非競爭性的。它可以被許多消費(fèi)者同時使用和重復(fù)使用,這與一桶石油不同。更確切地說,這意味著向個人提供大數(shù)據(jù)的邊際成本是零。與包括石油在內(nèi)的其他資源不同的是,大數(shù)據(jù)還呈現(xiàn)指數(shù)級增長。
易安信的數(shù)據(jù)顯示,在2013年之前的所有歷史時期內(nèi),人類積累了4.4ZB的數(shù)據(jù)(1ZB是1000EB,1EB是1000PB,1PB是100萬GB),但到2020年,我們將擁有44ZB(44萬億GB)的數(shù)據(jù)。90%的數(shù)據(jù)產(chǎn)生于過去兩年,而在2015年產(chǎn)生的數(shù)據(jù)超過了過去5000年的總和。此外,這種增長的限制是物理學(xué)、人工智能和內(nèi)存支持。現(xiàn)在這種資源的利用率只有1%,部分原因在于一些往往被大數(shù)據(jù)支持者遺忘或者忽略的成本。此類成本涉及獲取和存儲、可用性和處理模式、防護(hù)和安全、可及性、分析以及法律費(fèi)用。
然而,值得注意的是,得益于信息革命,人類成功發(fā)明了以極低成本產(chǎn)生巨量數(shù)據(jù)的技術(shù)。這些海量數(shù)據(jù)很容易處理和精煉——精煉是大數(shù)據(jù)的第三個“R”特征。這意味著,在某些情況下,大數(shù)據(jù)可能是反競爭的:一家公司越使用大數(shù)據(jù),它的質(zhì)量和價值就越高。大數(shù)據(jù)還是可再生的,與太陽能一樣。后,大數(shù)據(jù)是可延展和轉(zhuǎn)變用途的。這是大數(shù)據(jù)偉大但也令人沮喪的一個特征:出于某一目的收集的大型數(shù)據(jù)庫可能被用于完全不同的另一個目的,只要你有這樣做的正確的遠(yuǎn)見。數(shù)據(jù)轉(zhuǎn)變用途的一個典型例子是不起眼的郵政編碼。郵政編碼是美國郵政局初為了改善普通郵件投遞而設(shè)計的,但現(xiàn)在它已成為處理無窮無盡的商業(yè)和社交應(yīng)用的主力,與信封和郵票毫無關(guān)系。另一個更近一些的例子是,TripAdvisor擁有巨量的網(wǎng)絡(luò)數(shù)據(jù),結(jié)果卻被諸如旅行社等機(jī)構(gòu)用來評估某地飯店的健康和安全標(biāo)準(zhǔn)。然而,正是因?yàn)闊o法預(yù)見大數(shù)據(jù)有哪些新的應(yīng)用,因此很難完全明白你應(yīng)該如何處理獲得的數(shù)據(jù)財富。實(shí)際上,一開始你很難規(guī)劃應(yīng)該記錄和處理何種大數(shù)據(jù)。
2、大數(shù)據(jù)的商業(yè)價值 作為一種資源,大數(shù)據(jù)是非競爭性、不斷增長、可精煉、可再生以及可轉(zhuǎn)變用途的。這5個R讓大數(shù)據(jù)在至少6個任何企業(yè)都非常關(guān)鍵的主要應(yīng)用領(lǐng)域成為一項(xiàng)偉大的資產(chǎn)。大數(shù)據(jù)可以被用于:
1.改善服務(wù)、產(chǎn)品或者流程(比如公司后勤),因?yàn)榇髷?shù)據(jù)可以幫助找到低效的地方;
2.為用戶或客戶量身打造或定制產(chǎn)品或服務(wù),因?yàn)榇髷?shù)據(jù)讓公司更了解他們;
3.預(yù)測趨勢發(fā)展方向,因?yàn)榇髷?shù)據(jù)可以表明歷史如何塑造未來;
4.激發(fā)可能的戰(zhàn)略,比如新產(chǎn)品的設(shè)計和發(fā)行、時間、方式、目標(biāo)人口等等,因?yàn)榇髷?shù)據(jù)能夠讓公司用電腦模擬實(shí)驗(yàn),看到在“如果”出現(xiàn)虛擬場景的情況下會發(fā)生什么;
5.規(guī)劃并決定替代計劃,因?yàn)榇髷?shù)據(jù)支持實(shí)證選擇;
6.后,對產(chǎn)品或服務(wù)進(jìn)行創(chuàng)新或者革新,因?yàn)榇髷?shù)據(jù)可以幫助公司預(yù)測或者只是找出新的、未被發(fā)現(xiàn)或者以其他方式無法察覺的需要、愿望和需求。
顯然大數(shù)據(jù)的價值極大。問題在于,當(dāng)人們談?wù)摯髷?shù)據(jù)的實(shí)際價值的時候,事情變得混亂起來。讓我們先從市場價值、市場價格或者經(jīng)濟(jì)價值的標(biāo)準(zhǔn)差別說起。這種差別非常重要。
假設(shè)一幅畫在eBay上拍賣,沒有任何底價或者“一口價”選項(xiàng)。愛麗絲是一位專家,她知道這幅畫真正的基本價值應(yīng)該是1000美元。這是它的市場價值,也是她準(zhǔn)備支付的價格。鮑勃不知道市場價值,但他查看了同一畫家其他作品的估價,估計這幅畫當(dāng)前售價通常會達(dá)到1500美元。這是其市場價格,也是鮑勃的高出價??_爾不知道這幅畫的市場價值或價格。她所知道的是,自己只愿意為這幅畫高出價800美元。對她來說,這是這幅畫的經(jīng)濟(jì)價值。注意,3個人的估值可能完全不同:比如,愛麗絲可能出價500美元,表明這是她所認(rèn)為的這幅畫的經(jīng)濟(jì)估值,即便她知道實(shí)際價值高出一倍。她可能想撿個大便宜。正如你看到的那樣,它與愛麗絲的知識、鮑勃的理性分析以及卡羅爾的需要或愿望都有點(diǎn)關(guān)系。一旦他們確定價格以后,不相關(guān)但有聯(lián)系的是這3個估值之間的比率。在這個例子里,鮑勃的市場價格高估500美元,而卡羅爾的經(jīng)濟(jì)價值低估200美元。
這些之所以重要,是因?yàn)楹茈y確定無形資產(chǎn)的市場價值和市場價格,比如品牌認(rèn)知度、、商標(biāo)、版權(quán)、商業(yè)模式甚至商譽(yù)(即良好的客戶基礎(chǔ)、良好的客戶關(guān)系、良好的員工關(guān)系等等)。盡管根據(jù)OceanTomo發(fā)布的年度研究報告,2015年標(biāo)普500指數(shù)中逾84%的價值由無形資產(chǎn)組成。我們不知道這種價值有多少依賴公司所有的大數(shù)據(jù)。我們只知道的是,確定此類無形資產(chǎn)的市場估值實(shí)際上是不可能的。這并非是因?yàn)槿狈Χ攘抗ぞ?。例如,就市場營銷而言,人們可以努力使用客戶終身價值(CLV)來預(yù)測與客戶的未來關(guān)系帶來的凈利潤。這是因?yàn)槿藗儾豢赡軐σ患夜镜拇髷?shù)據(jù)的價值本身給出一個合理的近似值,除非他明確知道大數(shù)據(jù)的用途以及如何成功運(yùn)用。因此合理的方法是談?wù)摯髷?shù)據(jù)的經(jīng)濟(jì)價值,并在公司自己準(zhǔn)備為從大數(shù)據(jù)中獲取的信息付費(fèi)時采用這種做法。這種新古典主義方法有助于我們聚焦于大數(shù)據(jù)的真正用途,也就是人們準(zhǔn)備付費(fèi)的東西:小模式。
3、小模式為何關(guān)鍵 仔細(xì)想想看。如果可以輕易發(fā)現(xiàn)一種模式或者趨勢,你就不需要大數(shù)據(jù)了。正如NSA曾經(jīng)說過的那樣,你需要在大海里撈針。只有當(dāng)模式或趨勢很小的時候,你才需要海量的數(shù)據(jù)來發(fā)現(xiàn)它。因此大數(shù)據(jù)就像是一個
顯微鏡:一個分析企業(yè)中細(xì)小但非常重要的特征的偉工具,只要你知道自己在找什么。由于如此多的數(shù)據(jù)現(xiàn)在可以如此迅速而低成本地產(chǎn)生和處理,而且?guī)缀醍a(chǎn)生于所有事情,因此無論是亞馬遜、Facebook或者谷歌等數(shù)據(jù)新貴,還是銀行、石油公司或者超市等老牌數(shù)據(jù)巨頭,它們的壓力是在龐大的數(shù)據(jù)庫里找到具有真正附加值的新模式,以及如何才能大程度利用這些模式創(chuàng)造財富。
小模式之所以關(guān)鍵,是因?yàn)閺目茖W(xué)到商業(yè),從治理到社會政策,它們都代表著競爭的新前沿。在一個競爭和開放的思想市場,如果其他人能夠比你更快、更成功地利用它們,你可能很快就會破產(chǎn),就像柯達(dá)一樣;或者錯過利用根本性的創(chuàng)新,就像施樂帕克實(shí)驗(yàn)室錯過鼠標(biāo)和圖形用戶界面解決方案一樣——而史蒂夫•喬布斯則將這種技術(shù)轉(zhuǎn)化為商業(yè)上的成功。
當(dāng)然,小模式也可能有風(fēng)險,因?yàn)樗鼈兺黄屏丝深A(yù)測的極限。它們可能讓一家公司預(yù)測并操縱人們的行為。這不僅是一個法律問題,而且還是一個道德問題。個案例出現(xiàn)在2012年(沒錯,上文提到的世界經(jīng)濟(jì)論壇和IBM也是在這一年),主角是美國零售商Target。當(dāng)時Target依賴對25種產(chǎn)品的購買模式的分析,為每位顧客分配了“懷孕預(yù)測”指數(shù),估計她們的預(yù)產(chǎn)期,并在其妊娠階段及時寄送優(yōu)惠廣告信息。在一起引起轟動的新聞事件里,Target制造了些大麻煩——它寄送的優(yōu)惠廣告讓某位蒙在鼓里的家長發(fā)現(xiàn)他們還在讀高中的女兒懷孕了。
至此,從大數(shù)據(jù)中獲取價值似乎只需要有一個合理的戰(zhàn)略,從而能夠捕獲對你的企業(yè)產(chǎn)生積極影響的小模式。遺憾的是,事情并非這么簡單。小模式只有在做到以下幾點(diǎn)的基礎(chǔ)上才有意義:正確匯總,比如就會員卡和購物建議而言;進(jìn)行比較,比如當(dāng)一家銀行可以使用大數(shù)據(jù)打擊欺詐的時候,以及及時處理,比如在金融市場。由于信息在匱乏的時候也有指示作用,因此可怕的消息是,大數(shù)據(jù)之所以對一家公司價值極大,正是因?yàn)槿狈π∧J健H绻阏J(rèn)為這似乎有些矛盾——某事怎么能因其匱乏而有價值呢?——想想福爾摩斯正是因?yàn)榘l(fā)現(xiàn)本應(yīng)狂叫的狗沒有叫才終偵破的某個案件吧。如果大數(shù)據(jù)在本應(yīng)“叫”的時候而沒有“叫”,顯然事出有因。困難就在于理解本應(yīng)發(fā)生而沒有發(fā)生的事情。
4、利用數(shù)據(jù)科學(xué) 日益擴(kuò)大的大數(shù)據(jù)海洋中有價值的“潛流”越來越多,但對于沒有計算機(jī)能力的人來說是看不到的,因此更多更好的技能和技術(shù)將會有極大的幫助。當(dāng)IT部門要求更多資金的時候,它可能有非常好的理由。然而,僅靠其一己之力,再多的數(shù)字技術(shù)和解決方案也依然不用。從大數(shù)據(jù)中自動獲取不了經(jīng)濟(jì)價值(即雖然小卻非常重要的模式)。如果你認(rèn)為可以等待更好更強(qiáng)大的軟硬件的發(fā)展,你好還是三思。單純地存儲數(shù)據(jù)沒啥用。自2007年以來,世界產(chǎn)生的數(shù)據(jù)超過了可用存儲容量。我們已經(jīng)從思考“存儲什么”轉(zhuǎn)向了“清除什么”。某些東西必須清除,而且從一開始就不應(yīng)該記錄。想想你的智能手機(jī)由于存儲了過多的圖片而變得空間不足,這已經(jīng)成為一個問題。信息界多年前就清空了存儲空間以轉(zhuǎn)存其數(shù)據(jù)。這并不像看起來那么壞。改寫一句廣告俗語:一半的數(shù)據(jù)是垃圾,只是我們不知道哪一半。
一家公司需要的是,前瞻性地深入理解哪些數(shù)據(jù)首先值得存儲和處理。這就得明白現(xiàn)在或未來哪些問題會引起關(guān)注,從而找出相關(guān)的小模式。大數(shù)據(jù)提供答案,但它們對該問的問題保持緘默。這些問題來自負(fù)責(zé)人的智慧。也就是說,由于大數(shù)據(jù)的價值是小模式,終獲勝的將是那些“知道如何問答問題的”人,正如柏拉圖2500年前在其某部作品中寫得那樣。只有那些知道怎樣問正確問題的人才知道,哪些數(shù)據(jù)可能對回答問題有用和相關(guān),從而值得收集和處理,目的是開發(fā)它們的寶貴模式。我們需要更多更好的技能和技術(shù)來發(fā)現(xiàn)大數(shù)據(jù)中的小數(shù)據(jù)模式,但我們更需要更多更好的思路來篩選有價值的模式。
大數(shù)據(jù)將會不斷地增長。應(yīng)對它的方式是知道自己是什么人或者正在尋找什么。就目前而言,此類技巧由被稱為分析學(xué)或數(shù)據(jù)科學(xué)的“妖術(shù)”教授和運(yùn)用。不完全是你在大學(xué)的標(biāo)準(zhǔn)課程。這種情況將很快改變,因?yàn)閷Υ祟惣夹g(shù)的需求逐步增長。而且因?yàn)槲覀內(nèi)绱硕嗟臉I(yè)務(wù)、創(chuàng)新和福利都取決于數(shù)據(jù)科學(xué),現(xiàn)在是時候?qū)?shù)據(jù)方法論展開系統(tǒng)性的研究了。