第一篇:大數(shù)據(jù)時(shí)代的總統(tǒng)選舉:奧巴馬團(tuán)隊(duì)如何處理數(shù)據(jù)
大數(shù)據(jù)時(shí)代的總統(tǒng)選舉:奧巴馬團(tuán)隊(duì)如何處理數(shù)據(jù)
虎嗅曾在“奧巴馬如何玩轉(zhuǎn)社交”里介紹了奧巴馬團(tuán)隊(duì)如何與時(shí)俱進(jìn)地利用各種新興社交平臺(tái)。玩轉(zhuǎn)社交,這是奧巴馬獲取民意的前臺(tái)表現(xiàn)。而在后臺(tái),是什么支撐著奧巴馬各種競(jìng)選策略的出臺(tái)呢?是什么決定他應(yīng)該到哪些社交平臺(tái)上去亮相呢?他的一個(gè)幾十人數(shù)據(jù)分析與挖掘團(tuán)隊(duì)是支重要力量。
這 支團(tuán)隊(duì)在2008年奧巴馬競(jìng)選時(shí)就已存在并發(fā)揮作用。而這次,他們更動(dòng)用了五倍于上屆的人員規(guī)模,且進(jìn)行了更大規(guī)模與深入的數(shù)據(jù)挖掘。它幫助奧巴馬在獲取 有效選民、投放廣告、募集資金方面起到一定作用。事實(shí)證明,奧巴馬募集到的資金盡管與對(duì)手羅姆尼募集的資金規(guī)模不相上下,但前者從普通民眾直接募集到的資 金是后者的近兩倍。
在奧巴馬獲勝幾小時(shí)后,《時(shí)代》雜志刊發(fā)報(bào)道,揭示了這支團(tuán)隊(duì)的部分運(yùn)作情況。該報(bào)道發(fā)出后,多家不同類(lèi)型媒體轉(zhuǎn)載,也引發(fā)了硅谷科技人士的熱議。
以下是虎嗅編譯內(nèi)容:
大數(shù)據(jù)時(shí)代的總統(tǒng)選舉
文/Michael Scherer
在春季晚些時(shí)候,在幕后支持巴拉克?奧巴馬獲取勝利的數(shù)據(jù)處理團(tuán)隊(duì)注意到,喬治·克魯尼在西岸對(duì)40-49歲的女性粉絲有莫大吸引力,這個(gè)群體無(wú)疑是為了在好萊塢與克魯尼——以及奧巴馬共進(jìn)晚餐而最愿意掏錢(qián)的一支人群。(譯注:5月10日,喬治·克魯尼為奧巴馬舉辦籌資聚會(huì),當(dāng)晚籌得競(jìng)選連任資金1500萬(wàn)美元。)所 以,就像他們對(duì)待所有其他收集、存儲(chǔ)、分析的數(shù)據(jù)一樣(這些數(shù)據(jù)是他們?yōu)榱藠W巴馬的再次競(jìng)選而在過(guò)去兩年收集的),奧巴馬競(jìng)選連任的最高班底決定試試以上 這個(gè)觀察是否正確。他們從東岸的名人里選擇到了一個(gè)對(duì)這個(gè)群體有相似吸引力的人,以圖復(fù)制“克魯尼競(jìng)標(biāo)”中產(chǎn)生的千萬(wàn)美金效應(yīng)?!拔覀冇胸S常多的選擇,但 我們選擇了女星莎拉·杰西卡·帕克?!币幻呒?jí)競(jìng)選顧問(wèn)解釋說(shuō)。所以接下來(lái)與奧巴馬晚餐的競(jìng)標(biāo)誕生了:一個(gè)與他在帕克的紐約西村私宅吃上一頓的機(jī)會(huì)。(譯注:席位的公開(kāi)售價(jià)是每位8萬(wàn)美元。)
對(duì)公眾而言,他們不可能知道,“帕克競(jìng)標(biāo)”的想法來(lái)自于競(jìng)選團(tuán)隊(duì)對(duì)支持者的數(shù)據(jù)挖掘:他們喜歡競(jìng)賽、小型宴會(huì)和名人。
首席科學(xué)家
從一開(kāi)始,競(jìng)選活動(dòng)經(jīng)理Jim Messina已經(jīng)打算要搞一次完全不同的、以度量驅(qū)動(dòng)的競(jìng)選活動(dòng),該競(jìng)選的目的是政治,但是政治直覺(jué)可能并不是手段,數(shù)據(jù)是?!拔?們要用數(shù)據(jù)去衡量這場(chǎng)競(jìng)選活動(dòng)中的每一件事情?!彼f(shuō),在接受這份工作后,他雇用了一個(gè)五倍規(guī)模于2008年競(jìng)選時(shí)的分析部門(mén),芝加哥競(jìng)選總部還任命 Rayid Ghani為“首席科學(xué)家”。此人是埃森哲技術(shù)實(shí)驗(yàn)室的分析性研究帶頭人,他是知識(shí)發(fā)現(xiàn)和數(shù)據(jù)發(fā)掘這一應(yīng)用科學(xué)領(lǐng)域的領(lǐng)軍人物,其技術(shù)常用于公司處理海量 數(shù)據(jù)發(fā)掘客戶(hù)所好,比如將超市促銷(xiāo)的效率最大化。
2011年,Ghani在一次談話(huà)中透露,在政治 活動(dòng)中運(yùn)用數(shù)據(jù)分析這一工具。他說(shuō)難點(diǎn)在于如何充分利用在競(jìng)選中可獲得的選民行動(dòng)、行為、支持偏向方面的大量數(shù)據(jù)?,F(xiàn)在選民名冊(cè)與在公開(kāi)市場(chǎng)上可得的用戶(hù) 資料緊密相連,選民的姓名和住址則與很多資料可以相互參照,從雜志訂閱、房屋所有權(quán)證明,到狩獵執(zhí)照、信用積分(都有姓名和住址登記)。除了這些資料,還有拉票活動(dòng)、電話(huà)銀行的來(lái)電所提供的信息,以及其他任何與競(jìng)選活動(dòng)相聯(lián)系并自主提供的私人信息。加尼和他的團(tuán)隊(duì)將試圖挖掘這一連串?dāng)?shù)據(jù)并預(yù)計(jì)出選民的選舉模式,這將使奧巴馬競(jìng)選團(tuán)隊(duì)的花費(fèi)更加精確和有效率。
秘密進(jìn)行
不過(guò),這個(gè)幾十人數(shù)據(jù)分析團(tuán)隊(duì)具體做了些什么,被嚴(yán)格保密?!八麄兪俏覀兊暮司幋a?!碑?dāng)被問(wèn)及都做了哪些工作時(shí),競(jìng)選發(fā)言人Ben LaBolt如此說(shuō)道。
在 辦公室里,該團(tuán)隊(duì)會(huì)給各個(gè)數(shù)據(jù)挖掘?qū)嶒?yàn)進(jìn)行神秘代碼命名,比如獨(dú)角鯨、追夢(mèng)人。該團(tuán)隊(duì)甚至在遠(yuǎn)離其他競(jìng)選工作人員的地方工作,在總部巨大辦公室的北邊盡 頭,專(zhuān)設(shè)了一個(gè)沒(méi)有窗戶(hù)的房間?!翱茖W(xué)家”們會(huì)為在白宮羅斯福廳的總統(tǒng)及他的高級(jí)幕僚發(fā)送常規(guī)工作報(bào)告,而更多的公開(kāi)細(xì)節(jié)是不會(huì)透露的,競(jìng)選團(tuán)隊(duì)保護(hù)著他 們自認(rèn)為相對(duì)于羅姆尼團(tuán)隊(duì)有制度優(yōu)勢(shì)的地方:即數(shù)據(jù)。
11月4日,一個(gè)高級(jí)競(jìng)選顧問(wèn)同意匿名向《時(shí) 代》雜志講講他們的前沿工作,也同時(shí)要讓我們保證,除非競(jìng)選結(jié)束,否則不能披露信息。他們披露了他們?nèi)绾卫煤A繑?shù)據(jù)分析挖掘,幫助奧巴馬籌集到10億美 金,如何重新制訂了電視廣告投放,如何做出“搖擺州”選民的詳細(xì)模型(該模型可用于提升利用電話(huà)、上門(mén)投遞郵件、社會(huì)化媒體等手段的效率)
如何籌集10億美金
奧 巴馬團(tuán)隊(duì)在2008年對(duì)高科技的運(yùn)用贏得了無(wú)數(shù)贊美,但其成功也表明了一個(gè)巨大缺陷:數(shù)據(jù)庫(kù)太多了。那時(shí),通過(guò)奧巴馬網(wǎng)站打電話(huà)的志愿者用的名單是一份賦 閑在家者名單,這名單與在競(jìng)選辦公室打電話(huà)人所用的名單是不一樣的。而動(dòng)員投票名單也永遠(yuǎn)不會(huì)與資金籌集名單重合。就像911之前的FBI和CIA:這兩 支團(tuán)隊(duì)絕不會(huì)共享數(shù)據(jù)?!拔覀?cè)缙谝庾R(shí)到,民主黨的問(wèn)題就在于數(shù)據(jù)庫(kù)太多了,”一個(gè)工作人員說(shuō),“數(shù)據(jù)庫(kù)之間不彼此碰頭。”所以在頭18個(gè)月里,競(jìng)選團(tuán)隊(duì) 就創(chuàng)建了一個(gè)單一的巨大系統(tǒng),可以將從民調(diào)專(zhuān)家、籌款人、選戰(zhàn)一線(xiàn)員工、消費(fèi)者數(shù)據(jù)庫(kù)、以及“搖擺州”民主黨主要選民檔案的社會(huì)化媒體聯(lián)系人與手機(jī)聯(lián)系人 那里得到的所有數(shù)據(jù)都聚合到一塊。
這個(gè)組合起來(lái)的巨大數(shù)據(jù)并不僅僅讓競(jìng)選團(tuán)隊(duì)能夠發(fā)現(xiàn)選民并獲取他 們的注意,還能讓數(shù)據(jù)處理團(tuán)隊(duì)去做一些測(cè)試,看哪些類(lèi)型的人有可能被某種特定的事情所打動(dòng)或說(shuō)服。比如,在辦公室里的電話(huà)名單上,不只是列出對(duì)方的名字與 號(hào)碼,還用他們可能被說(shuō)服的內(nèi)容、以及競(jìng)選團(tuán)隊(duì)最重要的優(yōu)先訴求來(lái)排序。決定排序的因素中有四分之三是基本信息,比如年齡、姓別、種族、鄰居以及投票記 錄。選民的消費(fèi)者數(shù)據(jù)幫助完成這個(gè)圖譜?!拔覀兛梢灶A(yù)測(cè)哪些人會(huì)在網(wǎng)上捐錢(qián),也可做出模型來(lái)看哪些人會(huì)用郵件捐。我們可以為志愿者建模?!币粋€(gè)用數(shù)據(jù)來(lái)創(chuàng) 建預(yù)測(cè)文檔的高級(jí)顧問(wèn)說(shuō),“最后,建模對(duì)我們來(lái)說(shuō)變得是一種更重要的方式,相較于2008年而言,它讓我們工作得更有效率?!?/p>
比 如在早期,競(jìng)選團(tuán)隊(duì)就發(fā)現(xiàn),在個(gè)人注意力最容易被重新吸納回來(lái)的人群里,2008年曾經(jīng)退訂了競(jìng)選郵件的那部分人是首要目標(biāo)。策略師為特定地域的人群制作 相應(yīng)的測(cè)試??匆粋€(gè)本地志愿者撥打的電話(huà)效果,如何優(yōu)于一個(gè)從非搖擺州(比如加州)志愿者打來(lái)的電話(huà)。就像Jim Messina說(shuō)的,在整個(gè)競(jìng)選活里,沒(méi)有數(shù)字做支撐的假設(shè)絕少存在。
新的大數(shù)據(jù)庫(kù)能讓競(jìng)選團(tuán)隊(duì)籌 集到比他們?cè)A(yù)料到的更多的資金。到8月份,奧巴馬陣營(yíng)里的每個(gè)人都認(rèn)為他們達(dá)不到10億美金的籌集目標(biāo)?!拔覀?cè)?jīng)有過(guò)很大爭(zhēng)議,我們甚至不能接受9億 的目標(biāo)。”一個(gè)對(duì)該過(guò)程接觸密切的高級(jí)官員說(shuō)。但是,另一個(gè)人說(shuō),“結(jié)果到了夏天的時(shí)候,互聯(lián)網(wǎng)效應(yīng)爆炸了?!?網(wǎng) 上籌集到的資金極大一部分通過(guò)一個(gè)復(fù)雜的、以度量驅(qū)動(dòng)的電郵營(yíng)銷(xiāo)活動(dòng)而來(lái)。在此時(shí),數(shù)據(jù)收集與分析變得異常重要。很多給支持者的郵件只是測(cè)試,它們采用了 不同的標(biāo)題、發(fā)送者與訊息內(nèi)容。在春天時(shí),米歇爾·奧巴馬的郵件表現(xiàn)得最好,有時(shí),競(jìng)選總指揮Messina表現(xiàn)得比副總統(tǒng)拜登好。在很多時(shí)候,表現(xiàn)最佳 的募集人能夠得到十倍于其他募集人的資金。
芝加哥總部發(fā)現(xiàn),參與了“快速捐獻(xiàn)”計(jì)劃(該計(jì)劃允許在 網(wǎng)上或者通過(guò)短信重復(fù)捐錢(qián),而無(wú)須重新輸入信用卡信息)的人,捐出的資金是其他的捐獻(xiàn)者四倍。于是該計(jì)劃開(kāi)始被推廣,以各種方式加以激勵(lì)。在10月底時(shí),該計(jì)劃成為競(jìng)選團(tuán)隊(duì)對(duì)支持者傳遞信息的重要組成部分,第一次捐助的人如果參加該計(jì)劃的話(huà)可以得到一個(gè)免費(fèi)的保險(xiǎn)桿貼紙。
預(yù)測(cè)結(jié)果
隨 后,那些意在打開(kāi)錢(qián)包的戲法接著又用于去拉動(dòng)選票。分析團(tuán)隊(duì)用了四組民調(diào)數(shù)據(jù),建立了一個(gè)關(guān)鍵州的詳細(xì)圖譜。據(jù)說(shuō),在過(guò)去的一個(gè)月內(nèi),分析團(tuán)隊(duì)做了俄亥俄 州29000人的民調(diào),這是一個(gè)巨大的樣本,占了該州全部選民的0.5%,這可以讓團(tuán)隊(duì)深入分析特定人口、地區(qū)組織在任何給定時(shí)間段里的趨勢(shì)。這是一個(gè)巨 大的優(yōu)勢(shì):當(dāng)?shù)谝淮无q論后民意開(kāi)始滑落的時(shí)候,他們可以去看哪些選民改換了立場(chǎng),而哪些沒(méi)有。
正是這個(gè)數(shù)據(jù)庫(kù),幫助競(jìng)選團(tuán)隊(duì)在10月份激流涌動(dòng)的時(shí)候明確意識(shí)到:大部分俄亥俄州人不是奧巴馬的支持者,更像是羅姆尼因?yàn)?月份的失誤而丟掉的支持者?!拔覀儽绕渌随?zhèn)定多了?!币粋€(gè)官員說(shuō)。民調(diào)數(shù)據(jù)與選民聯(lián)系人數(shù)據(jù)每晚都在所有可能想象的場(chǎng)景下被電腦處理、再處理。“我們每天晚上都在運(yùn)行66000次選舉?!币粋€(gè)高級(jí)官員說(shuō),他描述了計(jì)算機(jī)如何模擬競(jìng)選,以推算出奧巴馬在每個(gè)“搖擺州”的勝算?!懊刻煸缟希覀兌紩?huì)得出數(shù)據(jù)處理結(jié)果,告訴我們贏得這些州的機(jī)會(huì)在哪,從而我們?nèi)ミM(jìn)行資源分配?!?線(xiàn)上,動(dòng)員投票的工作首次嘗試大規(guī)模使用Facebook,以達(dá)到上門(mén)訪(fǎng)問(wèn)者的效果。在 競(jìng)選的最后幾周里,下載了App的人們,會(huì)受到一些帶有他們?cè)趽u擺州朋友的圖片的信息。該訊息告訴他們,只要點(diǎn)擊一個(gè)按鈕,程序則會(huì)自動(dòng)向目標(biāo)選民發(fā)出鼓 勵(lì),推動(dòng)他們采取恰當(dāng)?shù)男袆?dòng),比如登記參選、早點(diǎn)參選或奔赴投票站。競(jìng)選團(tuán)隊(duì)發(fā)現(xiàn),通過(guò)Facebook上朋友接受到如此信息的人有五分之一會(huì)響應(yīng),很大 程度上因?yàn)檫@個(gè)訊息是來(lái)自他們認(rèn)識(shí)的人。
數(shù)據(jù)也幫助了競(jìng)選廣告的購(gòu)買(mǎi)投放。與其依賴(lài) 于外部媒體顧問(wèn)來(lái)決定廣告應(yīng)該在哪里出現(xiàn),Messina覺(jué)得不如將他的購(gòu)買(mǎi)決策建立在內(nèi)部大數(shù)據(jù)庫(kù)上。“我們可以通過(guò)一些真的很復(fù)雜的模型,精準(zhǔn)定位選 民。比如說(shuō),邁阿密戴德35歲以下的女性選民,如何定位?”一個(gè)官員說(shuō)。結(jié)果是,競(jìng)選團(tuán)隊(duì)買(mǎi)了一些非傳統(tǒng)類(lèi)劇集(如《混亂之子》、《行尸走肉》、《23號(hào) 公寓的壞女孩》)之間的廣告時(shí)間,而回避了跟地方新聞挨著的廣告時(shí)間。奧巴馬團(tuán)隊(duì)2012年的廣告購(gòu)買(mǎi)比2008年高了多少呢?芝加哥方面有一個(gè)數(shù)字: “電視廣告效率提高了14%……這確保我們是通過(guò)廣告在與我們可勸服的選民對(duì)話(huà)?!蹦俏还賳T說(shuō)。
數(shù)據(jù)同樣讓團(tuán)隊(duì)把候選人送到通常在競(jìng)選晚期不會(huì)出現(xiàn)的地方。8月份時(shí),奧巴馬決定到社會(huì)化新聞網(wǎng)站Reddit去回答問(wèn)題。許多總統(tǒng)的高級(jí)助手們甚至不知道這個(gè)網(wǎng)站是干嘛的。“為什么我們要把巴拉克·奧巴馬放在Reddit上?”一個(gè)官員問(wèn)道,“因?yàn)橐淮蠖盐覀兊膭?dòng)員目標(biāo)在Reddit上?!?/p>
數(shù)據(jù)驅(qū)動(dòng)的決策對(duì)奧巴馬——這位第44位總統(tǒng)的續(xù)任起到了巨大作用,也是研究2012選舉中的一個(gè)關(guān)鍵元素。它是一個(gè)信號(hào)——表明華盛頓那些基于直覺(jué)與經(jīng)驗(yàn)決策的競(jìng)選人士的優(yōu)勢(shì)在急劇下降,取而代之的是數(shù)量分析專(zhuān)家與電腦程序員的工作,他們可以在大數(shù)據(jù)中獲取洞察。正如一位官員所說(shuō),“決策者們坐在一間密室里,一邊抽雪茄,一邊說(shuō):‘我們總是會(huì)在《60分鐘》節(jié)目上投廣告?!钡臅r(shí)代已經(jīng)結(jié)束。在政治領(lǐng)域,大數(shù)據(jù)的時(shí)代已經(jīng)到來(lái)?!?s
第二篇:大數(shù)據(jù)時(shí)代
大數(shù)據(jù)時(shí)代
近年來(lái),隨著互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)、智能手機(jī)及傳感器等的普及,信息流量有了爆發(fā)性的增長(zhǎng),兩會(huì)以后,互聯(lián)網(wǎng)里最熱的詞匯,就是李克強(qiáng)總理在政府工作在報(bào)告里面提到的“互聯(lián)網(wǎng)+”,大數(shù)據(jù)將會(huì)更廣泛的被運(yùn)用到各個(gè)領(lǐng)域,越來(lái)越多的業(yè)內(nèi)人士開(kāi)始談?wù)摗按髷?shù)據(jù)”,如何利用大數(shù)據(jù),成為政府和眾多企業(yè)關(guān)心的熱點(diǎn)?
互聯(lián)網(wǎng)+《大數(shù)據(jù)》緊緊圍繞這些問(wèn)題展開(kāi),幫您如何利用大數(shù)據(jù)為企業(yè)從戰(zhàn)略上面進(jìn)行指導(dǎo)挖掘和預(yù)測(cè),從戰(zhàn)術(shù)上進(jìn)行營(yíng)銷(xiāo)服務(wù)和安全措施,精彩我們共同期待。
第一篇大數(shù)據(jù)很熱,大數(shù)據(jù)不神秘(趨勢(shì))有人說(shuō),如果你不知道大數(shù)據(jù),你就OUT了 --大數(shù)據(jù)到底有多熱 什么樣的數(shù)據(jù)算是大數(shù)據(jù) --大數(shù)據(jù)的特點(diǎn)和概念辨析 亂我心者,大數(shù)據(jù)之事多煩憂(yōu) --大數(shù)據(jù)并不象你想象的那樣神秘 身邊的大數(shù)據(jù)
--大數(shù)據(jù)就在你我身邊
案例分析:淘寶是如何利用大數(shù)據(jù)淘寶的 小結(jié):不管你愿不愿意,大數(shù)據(jù)已經(jīng)在那里 電話(huà):010---59002742 010--59004371 第二篇:認(rèn)識(shí)大數(shù)據(jù) 1.什么是大數(shù)據(jù) 2.大數(shù)據(jù)應(yīng)用的意義
3.大數(shù)據(jù)在企業(yè)經(jīng)營(yíng)中應(yīng)用的意義 4.對(duì)大數(shù)據(jù)的認(rèn)識(shí)誤區(qū) 案例分析
第三篇:大數(shù)據(jù)時(shí)代變革 1:大數(shù)據(jù)時(shí)代的思維變革 2:大數(shù)據(jù)時(shí)代的商業(yè)變革 3:大數(shù)據(jù)時(shí)代的管理變革
第四篇:大數(shù)據(jù)在營(yíng)銷(xiāo)中的運(yùn)用 大數(shù)據(jù)精準(zhǔn)營(yíng)銷(xiāo) 1.什么是精確營(yíng)銷(xiāo) 2.精確營(yíng)銷(xiāo)的方法 實(shí)操教學(xué)+案例分析
第五篇:在技術(shù)中應(yīng)用 數(shù)據(jù)挖掘
大數(shù)據(jù)的核心價(jià)值——挖掘 1.什么是數(shù)據(jù)挖掘? 2.數(shù)據(jù)挖掘的流程 3.數(shù)據(jù)挖掘解決的問(wèn)題 結(jié)合現(xiàn)場(chǎng)實(shí)操教學(xué)+案例分析
第六篇:預(yù)測(cè)
大數(shù)據(jù)的核心價(jià)值——預(yù)測(cè) 1:如何預(yù)測(cè)? 案例分析
第七篇:大數(shù)據(jù)與云計(jì)算 1:什么是云計(jì)算
2:大數(shù)據(jù)與云計(jì)算的關(guān)系
第八篇:大數(shù)據(jù)的安全問(wèn)題
大數(shù)據(jù)給信息安全帶來(lái)新的挑戰(zhàn)和機(jī)遇 大數(shù)據(jù)存儲(chǔ)安全策略 大數(shù)據(jù)應(yīng)用安全策略 大數(shù)據(jù)管理安全策略
第三篇:大數(shù)據(jù)時(shí)代
“大”數(shù)據(jù)時(shí)代 眾所周知,數(shù)據(jù)本身就蘊(yùn)藏著價(jià)值,但是將有用的數(shù)據(jù)與沒(méi)有價(jià)值的數(shù)據(jù)進(jìn)行區(qū)分看起來(lái)可能是一個(gè)棘手的問(wèn)題。
顯然,您所掌握的人員情況、工資表和客戶(hù)記錄對(duì)于企業(yè)的運(yùn)轉(zhuǎn)至關(guān)重要,但是其他數(shù)據(jù)也擁有轉(zhuǎn)化為價(jià)值的力量。一段記錄人們?nèi)绾卧谀纳痰隇g覽購(gòu)物的視頻、人們?cè)谫?gòu)買(mǎi)您的服務(wù)前后的所作所為、如何通過(guò)社交網(wǎng)絡(luò)聯(lián)系您的客戶(hù)、是什么吸引合作伙伴加盟、客戶(hù)如何付款以及供應(yīng)商喜歡的收款方式……所有這些場(chǎng)景都提供了很多指向,將它們抽絲剝繭,透過(guò)特殊的棱鏡觀察,將其與其他數(shù)據(jù)集對(duì)照,或者以與眾不同的方式分析解剖,就能讓您的行事方式發(fā)生天翻地覆的轉(zhuǎn)變。
大數(shù)據(jù)(big data),或稱(chēng)巨量資料,指的是所涉及的資料量規(guī)模巨大到無(wú)法通過(guò)目前主流軟件工具,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營(yíng)決策更積極目的的資訊。
“大數(shù)據(jù)”這個(gè)術(shù)語(yǔ)最早期的引用可追溯到apache org的開(kāi)源項(xiàng)目Nutch。當(dāng)時(shí),大數(shù)據(jù)用來(lái)描述為更新網(wǎng)絡(luò)搜索索引需要同時(shí)進(jìn)行批量處理或分析的大量數(shù)據(jù)集。隨著谷歌MapReduce和Google File System(GFS)的發(fā)布,大數(shù)據(jù)不再僅用來(lái)描述大量的數(shù)據(jù),還涵蓋了處理數(shù)據(jù)的速度。
早在1980年,著名未來(lái)學(xué)家阿爾文·托夫勒便在《第三次浪潮》一書(shū)中,將大數(shù)據(jù)熱情地贊頌為“第三次浪 潮的華彩樂(lè)章”。不過(guò),大約從2009年開(kāi)始,“163大數(shù)據(jù)”才成為互聯(lián)網(wǎng)信息技術(shù)行業(yè)的流行詞匯。美國(guó)互聯(lián)網(wǎng)數(shù)據(jù)中心指出,互聯(lián)網(wǎng)上的數(shù)據(jù)每年將增長(zhǎng)50%,每?jī)赡瓯銓⒎环?,而目前世界?0%以上的數(shù)據(jù)是最近幾年才產(chǎn)生的。此外,數(shù)據(jù)又并非單純指人們?cè)诨ヂ?lián)網(wǎng)上發(fā)布的信息,全世界的工業(yè)設(shè)備、汽車(chē)、電表上有著無(wú)數(shù)的數(shù)碼傳感器,隨時(shí)測(cè)量和傳遞著有關(guān)位置、運(yùn)動(dòng)、震動(dòng)、溫度、濕度乃至空氣中化學(xué)物質(zhì)的變化,也產(chǎn)生了海量的數(shù)據(jù)信息。
大數(shù)據(jù)技術(shù)的戰(zhàn)略意義不在于掌握龐大的數(shù)據(jù)信息,而在于對(duì)這些含有意義的數(shù)據(jù)進(jìn)行專(zhuān)業(yè)化處理。換言之,如果把大數(shù)據(jù)比作一種產(chǎn)業(yè),那么這種產(chǎn)業(yè)實(shí)現(xiàn)盈利的關(guān)鍵,在于提高對(duì)數(shù)據(jù)的“加工能力”,通過(guò)“加工”實(shí)現(xiàn)數(shù)據(jù)的“增值”。
大數(shù)據(jù)就是互聯(lián)網(wǎng)發(fā)展到現(xiàn)今階段的一種表象或特征而已,沒(méi)有必要神話(huà)它或?qū)λ3志次分?,在以云?jì)算為代表的技術(shù)創(chuàng)新大幕的襯托下,這些原本很難收集和使用的數(shù)據(jù)開(kāi)始容易被利用起來(lái)了,通過(guò)各行各業(yè)的不斷創(chuàng)新,大數(shù)據(jù)會(huì)逐步為人類(lèi)創(chuàng)造更多的價(jià)值。
第四篇:大數(shù)據(jù)時(shí)代
《大數(shù)據(jù)時(shí)代》讀書(shū)筆記
作者:邁爾舍恩伯格
出版發(fā)行:浙江人民出版社
版次:2013年1月第一版
讀者:物流一班、時(shí)菲陽(yáng)
一、作者觀點(diǎn)
谷歌有一個(gè)名為“谷歌流感趨勢(shì)”的工具,它通過(guò)跟蹤搜索詞相關(guān)數(shù)據(jù)來(lái)判斷全美地區(qū)的流感情況。這就是一個(gè)典型的“大數(shù)據(jù)”的應(yīng)用例子,舍恩伯格的這本《大數(shù)據(jù)時(shí)代》受到了廣泛的贊譽(yù),他本人也因此書(shū)被視為大數(shù)據(jù)領(lǐng)域中的領(lǐng)軍人物。
作者提出了三點(diǎn)結(jié)論:第一,要盡可能分析事物相關(guān)的“全部”數(shù)據(jù),而不是之前的隨機(jī)抽樣,即“樣本=總體”。第二,要樂(lè)于接受數(shù)據(jù)的繁雜,而不應(yīng)過(guò)分追求其精確性。第三,重視大數(shù)據(jù)呈現(xiàn)的“相關(guān)關(guān)系”,而不要執(zhí)于探索事物間的因果關(guān)系。
二、摘抄:
在甲型H1N1流感爆發(fā)的幾周前,互聯(lián)網(wǎng)巨頭谷歌公司的工程師們?cè)凇蹲匀弧冯s志上發(fā)表了一篇引人注目的論文。它令公共衛(wèi)生官員們和計(jì)算機(jī)科學(xué)家們感到震驚。文中解釋了谷歌為什么能夠預(yù)測(cè)冬季流感的傳播:不僅是全美范圍的傳播,而且可以具體到特定的地區(qū)和州。谷歌通過(guò)觀察人們?cè)诰W(wǎng)上的搜索記錄來(lái)完成這個(gè)預(yù)測(cè),而這種方法以前一直是被忽略的。谷歌保存了多年來(lái)所有的搜索記錄,而且每天都會(huì)收到來(lái)自全球超過(guò)30億條的搜索指令,如此龐大的數(shù)據(jù)資源足以支撐和幫助它完成這項(xiàng)工作。
發(fā)現(xiàn)能夠通過(guò)人們?cè)诰W(wǎng)上檢索的詞條辨別出其是否感染了流感后,谷歌公司把五千萬(wàn)條美國(guó)人最頻繁檢索的詞條和美國(guó)疾控中心在03年至08年間季節(jié)性流感傳播時(shí)期的數(shù)據(jù)進(jìn)行了比較。其他公司也曾試圖確定這些相關(guān)的詞條,但是他們?nèi)狈ο窆雀韫疽粯育嫶蟮臄?shù)據(jù)資源、處理能力和統(tǒng)計(jì)技術(shù)。
雖然谷歌公司的員工猜測(cè),特定的檢索詞條是為了在網(wǎng)絡(luò)上得到關(guān)于流感的信息,如“哪些是治療咳嗽和發(fā)熱的藥物”,但是找出這些詞條并不是重點(diǎn),他們也不知道哪些詞條更重要,更關(guān)鍵的是,他們建立的系統(tǒng)并不依賴(lài)于這樣的語(yǔ)義理解。他們?cè)O(shè)立的這個(gè)系統(tǒng)唯一關(guān)注的就是特定檢索詞條的頻繁使用與流感在時(shí)間和空間上的傳播之間的聯(lián)系。谷歌公司為了測(cè)試這些檢索詞條,總共處理了4.5億個(gè)不同的數(shù)字模型。在將得出的預(yù)測(cè)與07年、08年美國(guó)疾控中心記錄的實(shí)際流感病例進(jìn)行對(duì)比后,谷歌公司發(fā)現(xiàn),他們的軟件發(fā)現(xiàn)了45條檢索詞條的組合,一旦將它們用于一個(gè)數(shù)學(xué)模型,他們的預(yù)測(cè)與官方數(shù)據(jù)的相關(guān)性高達(dá)97%。和疾控中心一樣,他們也能判斷出流感是從哪里傳播出來(lái)的,而且他們的判斷非常及時(shí),不會(huì)像疾控中心一樣要在流感爆發(fā)一兩周之后才可以做到。
所以,09年甲型H1N1流感爆發(fā)的時(shí)候,與習(xí)慣性滯后的官方數(shù)據(jù)相比,谷歌成為了一個(gè)更有效、更及時(shí)的指示標(biāo)。公共衛(wèi)生機(jī)構(gòu)的官員獲得了非常有價(jià)值的數(shù)據(jù)信息。驚人的是,谷歌公司的方法甚
至不需要分發(fā)口腔試紙和聯(lián)系醫(yī)生——它是建立在大數(shù)據(jù)的基礎(chǔ)之上的。這是當(dāng)今社會(huì)所獨(dú)有的一種新型能力:以一種前所未有的方式,通過(guò)對(duì)海量數(shù)據(jù)進(jìn)行分析,獲得有巨大價(jià)值的產(chǎn)品和服務(wù),或深刻的洞見(jiàn)?;谶@樣的技術(shù)理念和數(shù)據(jù)儲(chǔ)備,下一次流感來(lái)襲的時(shí)候,世界將會(huì)擁有一種更好的預(yù)測(cè)工具,以預(yù)防流感的傳播。
三、感想:
看完本書(shū)有如下感想:
首先,作者站在理論的制高點(diǎn)上,條理清楚地闡述了大數(shù)據(jù)對(duì)人類(lèi)的工作、生活、思維帶來(lái)的革新,大數(shù)據(jù)時(shí)代的三種典型的商業(yè)模式,以及大數(shù)據(jù)時(shí)代對(duì)于個(gè)人隱私保護(hù)、公共安全提出的挑戰(zhàn)。其次,文中的事例貼近現(xiàn)實(shí)生活,貼近時(shí)代,令讀者既印象深刻,又感同身受。此外,作者沒(méi)有使用大量的專(zhuān)業(yè)術(shù)語(yǔ),沒(méi)有假裝一副專(zhuān)業(yè)的面孔??v觀全書(shū),遣詞造句,均通俗易懂。
其次,作者認(rèn)為大數(shù)據(jù)時(shí)代具有三個(gè)顯著特點(diǎn)。
一、人們研究與分析某個(gè)現(xiàn)象時(shí),將使用全部數(shù)據(jù)而非抽樣數(shù)據(jù);
二、在大數(shù)據(jù)時(shí)代,不能一味地追求數(shù)據(jù)的精確性,而要適應(yīng)數(shù)據(jù)的多樣性、豐富性、甚至要接受錯(cuò)誤的數(shù)據(jù)。
三、了解數(shù)據(jù)之間的相關(guān)性,勝于對(duì)因果關(guān)系的探索?!笆鞘裁础北取盀槭裁础敝匾?/p>
最后,作者指出,隨著技術(shù)的發(fā)展,數(shù)據(jù)的存儲(chǔ)與處理成本顯著降低,人們現(xiàn)在有能力從支離破碎的、看似毫不相干的數(shù)據(jù)礦渣中抽煉出真知爍見(jiàn)。在大數(shù)據(jù)時(shí)代,三類(lèi)公司將成為時(shí)代的寵兒。一是擁有大數(shù)據(jù)的公司與組織。如政府、銀行、電信公司、全球性互聯(lián)網(wǎng)公
司(阿里巴巴、淘寶網(wǎng))。二是擁有數(shù)據(jù)分析與處理技術(shù)的專(zhuān)業(yè)公司,如亞馬遜、谷歌。三是擁有創(chuàng)新思維的公司,他們可能既不掌握大數(shù)據(jù),也沒(méi)有專(zhuān)業(yè)技術(shù),但卻擅長(zhǎng)使用大數(shù)據(jù),從大數(shù)據(jù)中找到自己的理想天地。
第五篇:大數(shù)據(jù)時(shí)代讀后感
《大數(shù)據(jù)時(shí)代》讀后感
看完“《大數(shù)據(jù)時(shí)代》——生活、工作與思維的大變革”,頗為感慨,這世界變化真的快!農(nóng)業(yè)化、工業(yè)化、信息化時(shí)代的相繼經(jīng)歷,使得世界天翻地覆。
我們不再熱衷于尋找因果關(guān)系,而應(yīng)該尋找事物之間的相關(guān)關(guān)系。這個(gè)命題是我讀這本書(shū)最大的感觸。個(gè)人認(rèn)為也是這本書(shū)最核心的思想。首先,書(shū)提出一個(gè)顛覆我以前認(rèn)知的命題--“并非原子而是信息才是一切的本源”,將世界看做信息,看做可以理解的數(shù)據(jù)的海洋,為我們提供了一個(gè)從未有過(guò)的審視下的視角。它是一種可以滲透到所有生活領(lǐng)域的世界觀。這個(gè)命題是在書(shū)的最后一部分中的某一段中描寫(xiě)的。我之所以把它放在最前面來(lái)講,因?yàn)槲矣X(jué)得,這是談數(shù)據(jù)化世界的前提,自然也是談?wù)摯髷?shù)據(jù)的前提。書(shū)的中間部分有一節(jié)講到數(shù)據(jù)化和數(shù)字化的區(qū)別。經(jīng)過(guò)我自己腦子的整理,把數(shù)據(jù)化世界這個(gè)命題列為大數(shù)據(jù)思維的第二步。寫(xiě)到這里,我不由得反省下,我是不是有領(lǐng)悟到書(shū)的精髓所在,就是第一句話(huà)。書(shū)中另一個(gè)吸引我的地方就是,有很多觀點(diǎn)的論述,會(huì)從哲學(xué)的高度論述。雖然,自己肚子沒(méi)多少墨水,但是讀這些描述的時(shí)候,就會(huì)發(fā)現(xiàn)自己會(huì)更好的理解作者提出的命題。比如書(shū)中有一段文字
當(dāng)我們說(shuō)人類(lèi)是通過(guò)因果關(guān)系了解世界時(shí),我們指的是我們?cè)倮斫夂徒忉屖澜绺鞣N現(xiàn)象時(shí)使用的兩種基本方法:一種是通過(guò)快速、虛幻的因果關(guān)系,還有一種就是通過(guò)緩慢、有條不紊的因果關(guān)系。大數(shù)據(jù)會(huì)改變這兩種基本方法在我們認(rèn)識(shí)世界時(shí)所扮演的角色。
在附上一些事例的時(shí)候,用作者提供的“本質(zhì)”去看待時(shí),很容易理解,確實(shí)是這么回事。好了,那么大數(shù)據(jù)到底改變了我們什么呢,作者給出3點(diǎn),大數(shù)據(jù)的精髓在于我們分析信息時(shí)的三個(gè)轉(zhuǎn)變,這些轉(zhuǎn)變講改變我們理解和組建社會(huì)的方法。
第一個(gè)轉(zhuǎn)變就是,在大數(shù)據(jù)時(shí)代,我們可以分析更多的數(shù)據(jù),有時(shí)候甚至可以處理和某個(gè)特別現(xiàn)象相關(guān)的所有數(shù)據(jù),而不再依賴(lài)于隨機(jī)采樣(樣本=總體)
第二個(gè)轉(zhuǎn)變就是,研究數(shù)據(jù)如此之多,以至于我們不再熱衷于追求精確度
第三個(gè)轉(zhuǎn)變因前兩個(gè)轉(zhuǎn)變而促成,即我們不再熱衷于尋找因果關(guān)系,而應(yīng)該尋找事物之間的相關(guān)關(guān)系。大數(shù)據(jù)告訴我們“是什么”而不是“為什么”。在大數(shù)據(jù)時(shí)代,我們不必知道現(xiàn)象背后的原因,我們只要讓數(shù)據(jù)自己發(fā)聲。
正如大家所知道的那樣,人類(lèi)的大腦具備這樣的功能,它會(huì)把新輸入的刺激或信息與“過(guò)去的經(jīng)驗(yàn)或積累的部分知識(shí)”相對(duì)照,然后進(jìn)行調(diào)整并接受下來(lái)。如果眼前新的現(xiàn)實(shí)與大腦中儲(chǔ)存的固有信息無(wú)法協(xié)調(diào),便會(huì)在無(wú)意識(shí)中拒絕接受新的現(xiàn)實(shí);或者通過(guò)自己一知半解的知識(shí)任意推測(cè),使自己認(rèn)識(shí)到的情況偏離實(shí)際。這是人的一種本能,目的在于使自己保持冷靜。所以作者稱(chēng)之為revolution。
講了這么多,那么大數(shù)據(jù)到底給我們帶來(lái)什么。在這里,我只想談我感觸最深的,其他的有興趣的可以自己去了解。當(dāng)然,書(shū)中提了很多,最多的就是,XXX公司或者個(gè)人利用大數(shù)據(jù)創(chuàng)造了多大的財(cái)富了,拋開(kāi)這些表面的不說(shuō),最讓我動(dòng)心亦或者是害怕的是---預(yù)測(cè)。
大數(shù)據(jù)的核心就是預(yù)測(cè)。它通常被視為人工智能的一部分,或者更確切地說(shuō),被視為一種機(jī)器學(xué)習(xí)。但是這種定義是有誤導(dǎo)性的。大數(shù)據(jù)不是要教機(jī)器像人一樣思考。相反,它是把數(shù)學(xué)算法運(yùn)用到海量的數(shù)據(jù)上來(lái)預(yù)測(cè)事情發(fā)生的可能性。一封郵件被作為垃圾郵件過(guò)濾掉的可能性,輸入的“teh”應(yīng)該是“the”的可能性,從一個(gè)人亂穿馬路時(shí)行進(jìn)的軌跡和速度來(lái)看他能及時(shí)穿過(guò)馬路的可能性,都是大數(shù)據(jù)可以預(yù)測(cè)的范圍。當(dāng)然,如果一個(gè)人能及時(shí)穿過(guò)馬路,那么他亂穿馬路時(shí),車(chē)子就只需要稍稍減速就好。但是這些預(yù)測(cè)系統(tǒng)之所以能夠成功,關(guān)鍵在于它們是建立在海量數(shù)據(jù)的基礎(chǔ)之上的。此外,隨著系統(tǒng)接收到的數(shù)據(jù)越來(lái)越多,通過(guò)記錄找到的最好的預(yù)測(cè)與模式,可以對(duì)系統(tǒng)進(jìn)行改進(jìn)。
在不久的將來(lái),世界許多現(xiàn)在單純依靠人類(lèi)判斷力的領(lǐng)域都會(huì)被計(jì)算機(jī)系統(tǒng)所改變甚至取代。計(jì)算機(jī)系統(tǒng)可以發(fā)揮作用的領(lǐng)域遠(yuǎn)遠(yuǎn)不止駕駛和交友,還有更多更復(fù)雜的任務(wù)。別忘了,亞馬遜可以幫我們推薦想要的書(shū),谷歌可以為關(guān)聯(lián)網(wǎng)站排序,facebook知道我們的喜好,而linkedin可以猜出我們認(rèn)識(shí)誰(shuí)。當(dāng)然,同樣的技術(shù)也可以運(yùn)用到疾病診斷、推薦治療措施,甚至是識(shí)別潛在犯罪分子上。
就像互聯(lián)網(wǎng)通過(guò)給計(jì)算機(jī)添加通信功能而改變了世界,大數(shù)據(jù)也將改變我們生活中最重要的方面,因?yàn)樗鼮槲覀兊纳顒?chuàng)造了前所未有的可量化的維度。大數(shù)據(jù)已經(jīng)成為了新發(fā)明和新服務(wù)的源泉,而更多的改變正蓄勢(shì)待發(fā)。
這是大數(shù)據(jù)帶來(lái)最核心的東西,動(dòng)心的理由無(wú)須贅述,計(jì)算機(jī)會(huì)告訴你什么時(shí)候買(mǎi)什么雙色球可以中頭獎(jiǎng),想想心里是不是有一點(diǎn)小激動(dòng)咧。當(dāng)然這只是我打的一個(gè)比較夸張的比喻。至于害怕呢,書(shū)中有段話(huà)我很喜歡
公平正義的基礎(chǔ)是人只有做了某事才需要對(duì)它負(fù)責(zé),畢竟,想做而未做不是犯罪,社會(huì)關(guān)系于個(gè)人責(zé)任的基本信條是,人為其選擇的行為承擔(dān)責(zé)任。如果大數(shù)據(jù)分析完全準(zhǔn)確,那么我們的未來(lái)會(huì)被精準(zhǔn)的預(yù)測(cè),因此在未來(lái),我們不僅會(huì)失去選擇的權(quán)利,而且會(huì)按照預(yù)測(cè)去行動(dòng)。如果精準(zhǔn)的預(yù)測(cè)成為現(xiàn)實(shí)的話(huà),我們也就失去了自由意志,失去了自由選擇的權(quán)利。既然我們別無(wú)選擇,那么我們也就不需要承擔(dān)責(zé)任。這不是很諷刺嗎。
扯到這里,順便扯一下,書(shū)中另一段關(guān)于自由意志的描述
在哲學(xué)界,關(guān)于因果關(guān)系是否存在的爭(zhēng)論已經(jīng)持續(xù)了幾個(gè)世紀(jì)。畢竟,如果凡事皆有因果的話(huà),那么我們就沒(méi)有決定任何事的自由了。如果說(shuō)我們做的每一個(gè)決定或者每一個(gè)想法都是其他事情的結(jié)果。而這個(gè)結(jié)果又是由其他原因?qū)е碌?。以此循環(huán)往復(fù),那么就不存在人的自由意志這一說(shuō)了。----所有的生命軌跡都只是受因果關(guān)系的控制了。因此,對(duì)于因果關(guān)系在世間所扮演的角色,哲學(xué)家們爭(zhēng)論不休,有時(shí)他們認(rèn)為,這是與自由意志相對(duì)立。
書(shū)中舉了個(gè)例子,舉了部電影《少數(shù)派報(bào)告》,當(dāng)我看到這里的時(shí)候,“哎喲,我居然看過(guò)這部電影,想想心里還是有點(diǎn)小激動(dòng)”,有興趣的可以去看下,大概就是講警察通過(guò)預(yù)測(cè)來(lái)提前抓捕犯人,不過(guò)不是通過(guò)大數(shù)據(jù),是通過(guò)超人類(lèi)的方式。當(dāng)你什么舉動(dòng)都可以被預(yù)測(cè),相當(dāng)于你完全暴露在太陽(yáng)光下,換成你,你害怕不。
最后,附上兩段結(jié)語(yǔ),一段是書(shū)中的一段話(huà),另一段是我自己瞎編的大數(shù)據(jù)并不是一個(gè)充斥著算法和機(jī)器的冰冷世界,人類(lèi)的作用依然無(wú)法被完全替代。大數(shù)據(jù)為我們提供的不是最終答案,只是參考答案,幫助是暫時(shí)的,而更好的方法和答案還在不久的未來(lái)。
大數(shù)據(jù)終將會(huì)影響到我們,也像其他技術(shù)一樣會(huì)是一把雙刃劍,用得好,動(dòng)心,濫用,害怕。如同核技術(shù)一樣,用的話(huà),造福地球,濫用,給個(gè)金剛石地球你,照樣爆。我相信,未來(lái)的大數(shù)據(jù)的發(fā)展會(huì)如作者所說(shuō)的,是一場(chǎng)生活、工作與思維的革命。
無(wú)論如何,大家看到這四個(gè)是不是有種,不管我上面扯得有沒(méi)有道理,通不通順,下面的話(huà),會(huì)很有道理的樣子的錯(cuò)覺(jué)(抄襲于《棟篤笑》)OK,無(wú)論如何,日子還是得照過(guò)。施主,我看你骨骼驚奇,是個(gè)練武奇才,最后送上《九陽(yáng)神功》心法,以后維護(hù)世界和平的重任就交給你了。
他強(qiáng)由他強(qiáng),清風(fēng)撫山岡。
他橫由他橫,明月照大江。
他自狠來(lái)他自惡,我自一口真氣足。
無(wú)處不在的大數(shù)據(jù):各種云計(jì)算,谷歌的神通,亞馬遜的推送,天涯人肉,微博萬(wàn)能等等等等,我們掌握了新的工具,也獲取了以前從未有過(guò)的各種信息。大數(shù)據(jù)拉近了我們與現(xiàn)實(shí)的距離,“地球村”變成了“地球屋”,仿佛所有人所有事物都觸手可及,而這些牛逼哄哄的互聯(lián)網(wǎng)巨頭就在客廳展示著世界的每一寸光景。
然而,事實(shí)真的是這樣嗎?首先,從應(yīng)用角度出發(fā),低廉的運(yùn)算能力和存儲(chǔ)空間,讓以前的樣本分析顯得非常簡(jiǎn)陋——一些從全體數(shù)據(jù)挖掘出來(lái),忽略精確而從大量數(shù)據(jù)的簡(jiǎn)單算法得出來(lái)的結(jié)論顛覆了常識(shí)。但個(gè)人覺(jué)得,這只是統(tǒng)計(jì)學(xué)的終極目標(biāo)——并沒(méi)有非常大的跨越,可能終結(jié)了回歸分析,有效性驗(yàn)證等手段,但依舊還是統(tǒng)計(jì)。而革命性在于關(guān)注相關(guān)關(guān)系而非因果關(guān)系。現(xiàn)場(chǎng)討論從神學(xué)角度挑戰(zhàn)了因果關(guān)系的不可能——或者說(shuō)人類(lèi)用簡(jiǎn)單思考的邏輯來(lái)定義因果,以及用之前小數(shù)據(jù)演繹出大概率事件來(lái)推導(dǎo)因果,都是不正確的。真正的因果關(guān)系應(yīng)該屬于上帝的范疇,人類(lèi)如果真的完全掌握之后,會(huì)統(tǒng)治整個(gè)宇宙。但我覺(jué)得,無(wú)需從神學(xué)觀點(diǎn)來(lái)討論,而可以借鑒量子力學(xué)對(duì)經(jīng)典力學(xué)的顛覆——在原子層面上,經(jīng)典力學(xué)會(huì)失效——那么在大數(shù)據(jù)層面上,普通的抽樣調(diào)查直觀反映會(huì)失效。而且從量子力學(xué)角度是很難推導(dǎo)經(jīng)典力學(xué)的公式,那么從現(xiàn)在的慣有思維,也難以推導(dǎo)出大數(shù)據(jù)的因果關(guān)系。同時(shí)現(xiàn)場(chǎng)有討論,是否計(jì)算機(jī)可以精確地模擬每個(gè)原子,然后完整地展現(xiàn)微觀到宏觀的化學(xué)反應(yīng)細(xì)節(jié)?我覺(jué)得首先是計(jì)算能力不足,其次即便設(shè)定原子的運(yùn)動(dòng)條件真的正確,計(jì)算結(jié)果未知但宏觀結(jié)果我們卻已經(jīng)知道——牛頓的經(jīng)典力學(xué)足以應(yīng)付日常絕大部分情況了。好比切西瓜,究竟刀頭的鐵原子和西瓜的有機(jī)分子如何作用,真的重要嗎?回歸到商業(yè)領(lǐng)域,如果我們可以提高相關(guān)性的準(zhǔn)確度,從而提高投入效率,那就已經(jīng)足夠了。本來(lái)一個(gè)產(chǎn)品受到一半客戶(hù)喜歡,但如果通過(guò)大數(shù)據(jù)挖掘到更好的定位,有百分之八十的客戶(hù)喜歡,那么價(jià)值已經(jīng)非??捎^了。
大數(shù)據(jù)幫助我們把未來(lái)的迷霧撥開(kāi)了一點(diǎn),但好比《沉重的肉身》當(dāng)中討論的,更多的選擇權(quán)并不能帶給人幸?!?yàn)橹雷约翰荒茏霾荒艿玫降囊哺嗔?。解決工作模式,生存意義,幸福之道等問(wèn)題,關(guān)鍵還是看自己如何看待和使用這些新式工具以及新結(jié)論。引用《神探伽利略》里面的臺(tái)詞:可被重復(fù)的,一定有道理存在。那么現(xiàn)在重復(fù)的越來(lái)越多,更需要保持探索和敬畏之心,人才不會(huì)迷路。