現(xiàn)在已經(jīng)進(jìn)入到了二十一世紀(jì)了,當(dāng)今社會(huì)已經(jīng)擺脫了上個(gè)世紀(jì)的那種消息滯后的時(shí)代了,我們最應(yīng)該感謝的就是科學(xué)的進(jìn)步為我們帶來(lái)了這么多便利。與此同時(shí),科學(xué)的進(jìn)步還為我們帶來(lái)了“大數(shù)據(jù)”這個(gè)讓人類(lèi)減少了很多工作量的東西。
在這個(gè)學(xué)期的名著導(dǎo)讀課上我們就被要求讀:《大數(shù)據(jù)時(shí)代》這本書(shū)。《大數(shù)據(jù)時(shí)代》是國(guó)外大數(shù)據(jù)系統(tǒng)研究的先河之作,本書(shū)作者維克托·邁爾·舍恩伯格被譽(yù)為“大數(shù)據(jù)時(shí)代的預(yù)言家”,他是一個(gè)特別厲害的人,他作為一個(gè)教師,他曾經(jīng)在哈佛大學(xué)、牛津大學(xué)、耶魯大學(xué)和新加坡國(guó)立大學(xué)等多所世界前列名校任教的經(jīng)歷。他作為一個(gè)科學(xué)家,早在20xx年就在《經(jīng)濟(jì)學(xué)人》上發(fā)布了長(zhǎng)達(dá)14頁(yè)對(duì)大數(shù)據(jù)應(yīng)用的前瞻性研究。他是十余年潛心研究數(shù)據(jù)科學(xué)的技術(shù)權(quán)威。他是最早洞見(jiàn)大數(shù)據(jù)時(shí)代發(fā)展趨勢(shì)的數(shù)據(jù)科學(xué)家之一,也是最受人尊敬的權(quán)威發(fā)言人之一?,F(xiàn)任牛津大學(xué)網(wǎng)絡(luò)學(xué)院互聯(lián)網(wǎng)治理與監(jiān)管專(zhuān)業(yè)教授,曾任哈佛大學(xué)肯尼迪學(xué)院信息監(jiān)管科研項(xiàng)目負(fù)責(zé)人,哈佛國(guó)家電子商務(wù)研究中網(wǎng)絡(luò)監(jiān)管項(xiàng)目負(fù)責(zé)人;曾任新加坡國(guó)立大學(xué)李光耀學(xué)院信息與創(chuàng)新策略研究中心主任。并擔(dān)任耶魯大學(xué)、芝加哥大學(xué)、弗吉尼亞大學(xué)、圣地亞哥大學(xué)、維也納大學(xué)的客座教授。他作為一個(gè)研究學(xué)者,他的學(xué)術(shù)成果斐然,有一百多篇論文公開(kāi)發(fā)表在《科學(xué)》《自然》等著名學(xué)術(shù)期刊上,他同時(shí)也是哈佛大學(xué)出版社、麻省理工出版社、通信政策期刊、美國(guó)社會(huì)學(xué)期刊等多家出版機(jī)構(gòu)的特約評(píng)論員。他是備受眾多世界知名企業(yè)信賴的信息權(quán)威與顧問(wèn)。他的咨詢客戶包括微軟、惠普和IBM等全球頂級(jí)企業(yè);
“大數(shù)據(jù)”在百度上搜索到的解釋是:稱巨量資料,指的是所涉及的資料量規(guī)模巨大到無(wú)法透過(guò)目前主流軟件工具工具,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營(yíng)決策更積極目的的資訊。特點(diǎn):數(shù)量、速度、品種、真實(shí)性。而舍恩伯格認(rèn)為,大數(shù)據(jù)并不能定義一個(gè)確切的概念。他提到“大數(shù)據(jù)是人們獲得新的認(rèn)知,創(chuàng)造新的價(jià)值的源泉;大數(shù)據(jù)還是改變市場(chǎng)、組織機(jī)構(gòu),以及政府和公民關(guān)系的方法?!边@是一種更具有人文色彩和社會(huì)意義的詮釋。
大數(shù)據(jù)不僅改變了公共衛(wèi)生領(lǐng)域,整個(gè)商業(yè)領(lǐng)域都因?yàn)榇髷?shù)據(jù)而重新洗牌。購(gòu)買(mǎi)飛機(jī)票就是一個(gè)很好的例子。就像書(shū)中寫(xiě)到20xx年,奧倫·埃齊奧尼準(zhǔn)備乘坐從西雅圖到洛杉磯的飛機(jī)去參加弟弟的婚禮。他知道飛機(jī)票越早預(yù)訂越便宜,于是他在這個(gè)大喜日子來(lái)臨之前的幾個(gè)月,就在網(wǎng)上預(yù)訂了一張去洛杉磯的機(jī)票。在飛機(jī)上,埃齊奧尼好奇地問(wèn)鄰座的乘客花了多少錢(qián)購(gòu)買(mǎi)機(jī)票。當(dāng)?shù)弥m然那個(gè)人的機(jī)票比他買(mǎi)得更晚,但是票價(jià)卻比他便宜得多時(shí),他感到非常氣憤。于是,他又詢問(wèn)了另外幾個(gè)乘客,結(jié)果發(fā)現(xiàn)大家買(mǎi)的票居然都比他的便宜。
飛機(jī)著陸之后,埃齊奧尼下定決心要幫助人們開(kāi)發(fā)一個(gè)系統(tǒng),用來(lái)推測(cè)當(dāng)前網(wǎng)頁(yè)上的機(jī)票價(jià)格是否合理。作為一種商品,同一架飛機(jī)上每個(gè)座位的價(jià)格本來(lái)不應(yīng)該有差別。但實(shí)際上,價(jià)格卻千差萬(wàn)別,其中緣由只有航空公司自己清楚。
埃齊奧尼表示,他不需要去解開(kāi)機(jī)票價(jià)格差異的奧秘。他要做的僅僅是預(yù)測(cè)當(dāng)前的機(jī)票價(jià)格在未來(lái)一段時(shí)間內(nèi)會(huì)上漲還是下降。這個(gè)想法是可行的,但操作起來(lái)并不是那么簡(jiǎn)單。這個(gè)系統(tǒng)需要分析所有特定航線機(jī)票的銷(xiāo)售價(jià)格并確定票價(jià)與提前購(gòu)買(mǎi)天數(shù)的關(guān)系。
在信息時(shí)代,信息安全問(wèn)題的日趨凸顯,數(shù)據(jù)獨(dú)裁與隱私保護(hù)之間的矛盾更是立于風(fēng)口浪尖,成為眾矢之的,舍恩伯格在本書(shū)的最后章節(jié)曾試圖尋找一種解決方式來(lái)擺脫這一種困境,但最終沒(méi)能做到,但是他提出“大數(shù)據(jù)并不是一個(gè)充斥著算法的和機(jī)器的冰冷世界,人類(lèi)的作用仍無(wú)法被完全代替。”這里表明人在數(shù)據(jù)時(shí)代同樣的重要,數(shù)據(jù)是為人類(lèi)服務(wù)的,也就該人類(lèi)驅(qū)使下完成相應(yīng)的目的。在這樣的大環(huán)境下,常引起我更多的思考和擔(dān)憂。
大數(shù)據(jù)時(shí)代對(duì)于我們同是機(jī)遇與挑戰(zhàn),一些國(guó)家已開(kāi)始步入大數(shù)據(jù)時(shí)代的行列,并在各個(gè)領(lǐng)域開(kāi)始研究和使用。而對(duì)于我國(guó)龐大的人口,以及較大的領(lǐng)土面積,都可以在大數(shù)據(jù)時(shí)代為我們提供數(shù)據(jù)的保障,而能否面臨挑戰(zhàn),在大國(guó)之間的新一輪角色角逐間嶄露頭角,我們更需要解決技術(shù)等方面的問(wèn)題,更應(yīng)在政策上逐步開(kāi)放各領(lǐng)域的數(shù)據(jù),保證數(shù)據(jù)來(lái)源、權(quán)限等問(wèn)題得到解決,不斷學(xué)習(xí)先進(jìn)的計(jì)算機(jī)技術(shù),縮小與其他國(guó)家的差距。
《大數(shù)據(jù)時(shí)代》這本書(shū)主要描述的是大數(shù)據(jù)時(shí)代人們生活、工作與思維各方面所遇到的重大變革,并用三個(gè)部分講述了大數(shù)據(jù)時(shí)代的思維變革、商業(yè)變革和管理變革。第一部分提出了大數(shù)據(jù)時(shí)代處理數(shù)據(jù)理念上的三大轉(zhuǎn)變:抽樣=全體;要效率不要絕對(duì)精確;要相關(guān)不要因果;第二部分作者從萬(wàn)事萬(wàn)物數(shù)據(jù)化和數(shù)據(jù)的巨大價(jià)值出發(fā),闡述數(shù)據(jù)創(chuàng)新是驅(qū)動(dòng)各行各業(yè)在大數(shù)據(jù)時(shí)代向前發(fā)展的最根本動(dòng)力;最后一部分,作者描繪了大數(shù)據(jù)應(yīng)用帶來(lái)的風(fēng)險(xiǎn),包括產(chǎn)業(yè)生態(tài)環(huán)境、數(shù)據(jù)安全隱私、信息公正公開(kāi)等問(wèn)題。全文清晰的闡述了大數(shù)據(jù)的基本概念和特點(diǎn),給出了作者對(duì)于大數(shù)據(jù)的明確的觀點(diǎn),列舉和分析了微軟、惠普、IBM、亞馬遜、facebook、twitter、VISA等大數(shù)據(jù)先鋒們的最前沿的大數(shù)據(jù)應(yīng)用案例,對(duì)大數(shù)據(jù)的價(jià)值、帶來(lái)的變革、角色定位及風(fēng)險(xiǎn)給予了清晰的預(yù)見(jiàn),對(duì)于通訊運(yùn)營(yíng)商來(lái)說(shuō),非常具有價(jià)值。
一、大數(shù)據(jù)帶來(lái)的思維變革
主要有如下三個(gè)思維變革:(1)要分析與某事物相關(guān)的所有數(shù)據(jù),而不是依靠分析少量的數(shù)據(jù)樣本。大數(shù)據(jù)是全數(shù)據(jù)模式,樣本=總體,紛繁的數(shù)據(jù),越多越好。在信息處理能力受限的時(shí)代,世界需要數(shù)據(jù)分析,卻缺少用來(lái)分析所收集數(shù)據(jù)的工具,因此隨機(jī)采樣應(yīng)運(yùn)而生,它也可以被視為那個(gè)時(shí)代的產(chǎn)物。如今,計(jì)算和制表不再像過(guò)去一樣困難。感應(yīng)器、手機(jī)導(dǎo)航、網(wǎng)站點(diǎn)擊和twitter被動(dòng)地收集了大量數(shù)據(jù),而計(jì)算機(jī)可以輕易地對(duì)這些數(shù)據(jù)進(jìn)行處理?!皹颖?總體”使得我們能對(duì)數(shù)據(jù)進(jìn)行深度探討得到一些微觀細(xì)節(jié)的信息,獲得對(duì)某些特定子類(lèi)別進(jìn)行進(jìn)一步研究的能力,大數(shù)據(jù)的簡(jiǎn)單算法比小數(shù)據(jù)的復(fù)雜算法更有效。(2)大數(shù)據(jù)允許不精確。大數(shù)據(jù)放松了容錯(cuò)的標(biāo)準(zhǔn),人們掌握的數(shù)據(jù)也多了起來(lái),還可以利用這些數(shù)據(jù)做更多新的事情,使得大量數(shù)據(jù)創(chuàng)造了更好的結(jié)果。學(xué)會(huì)接受不精確,這就是由“小數(shù)據(jù)”到“大數(shù)據(jù)”的重要轉(zhuǎn)變之一(3)大數(shù)據(jù)不重因果,只求相關(guān)。通過(guò)去探求“是什么”而不是“為什么”,相關(guān)關(guān)系幫助我們更好地了解了這個(gè)世界。相關(guān)關(guān)系同時(shí)它也為研究因果關(guān)系奠定了基礎(chǔ)。通過(guò)找出可能相關(guān)的事物,我們可以在此基礎(chǔ)上進(jìn)行進(jìn)一步的因果關(guān)系分析,如果存在因果關(guān)系的話,我們?cè)龠M(jìn)一步找出原因。
二、大數(shù)據(jù)帶來(lái)的商業(yè)變革
(1)一切皆可“量化”:量化一切是數(shù)據(jù)化的核心。公元前3000年,信息記錄在印度河流域、埃及和美索不達(dá)米亞平原地區(qū)就有了很大的發(fā)展。伴隨著數(shù)據(jù)記錄的發(fā)展,人類(lèi)探索世界的想法一直在膨脹,我們渴望能更精準(zhǔn)地記錄時(shí)間、距離、地點(diǎn)、體積和重量,等等。到了19世紀(jì),隨著科學(xué)家們發(fā)明了新工具來(lái)測(cè)量和記錄電流、氣壓、溫度、聲頻之類(lèi)的自然科學(xué)現(xiàn)象,科學(xué)已經(jīng)離不開(kāi)定量化了。計(jì)算機(jī)的出現(xiàn)帶來(lái)了數(shù)字測(cè)量和存儲(chǔ)設(shè)備,這樣就大大提高了數(shù)據(jù)化的效率,數(shù)字化帶來(lái)了數(shù)據(jù)化,萬(wàn)千事物都能轉(zhuǎn)化為數(shù)據(jù)形式,滋生無(wú)窮無(wú)盡的用途。將世界看作信息,看作可以理解的數(shù)據(jù)的海洋,為我們提供了一個(gè)從未有過(guò)的審視現(xiàn)實(shí)的視角。它是一種可以滲透到所有生活領(lǐng)域的世界觀。(2)大數(shù)據(jù)的價(jià)值難以估量:無(wú)論是向公眾開(kāi)放還是將其鎖在公司的保險(xiǎn)庫(kù)中,數(shù)據(jù)的價(jià)值都難以衡量。公司賬面價(jià)值和市場(chǎng)價(jià)值之間的差額被記為“無(wú)形資產(chǎn)”。20世紀(jì)80年代中期,無(wú)形資產(chǎn)在美國(guó)上市公司市值中約占40%,而在2002年,這一數(shù)字已經(jīng)增長(zhǎng)為75%。無(wú)形資產(chǎn)早期僅包含品牌、人才和戰(zhàn)略這些應(yīng)計(jì)入正規(guī)金融會(huì)計(jì)制度的非有形資產(chǎn)部分。但漸漸地,公司所持有和使用的數(shù)據(jù)也漸漸納入了無(wú)形資產(chǎn)的范疇。經(jīng)濟(jì)正在漸漸開(kāi)始圍繞數(shù)據(jù)形成,“數(shù)據(jù)是一個(gè)平臺(tái)”,因?yàn)閿?shù)據(jù)是新產(chǎn)品和新商業(yè)模式的基石。(3)大數(shù)據(jù)決定企業(yè)競(jìng)爭(zhēng)力:大數(shù)據(jù)成為許多公司競(jìng)爭(zhēng)力的來(lái)源,從而使整個(gè)行業(yè)結(jié)構(gòu)都改變,大公司和小公司最有可能成為贏家,而大部分中等規(guī)模的公司則可能無(wú)法在這次行業(yè)調(diào)整中嘗到甜頭。大公司收集大量的數(shù)據(jù),將其轉(zhuǎn)化為收入,聰明而靈活的小公司能享受到非固有資產(chǎn)規(guī)模帶來(lái)的好處,它們可能沒(méi)有很多的固定資產(chǎn)但是存在感非常強(qiáng),也可以低成本地傳播它們的創(chuàng)新成果。大大小小的公司都能從大數(shù)據(jù)中獲利,這個(gè)情況并不只是適用使用數(shù)據(jù)的公司,也適用于掌握數(shù)據(jù)的公司。
三、大數(shù)據(jù)帶來(lái)的風(fēng)險(xiǎn)
目前所采集的大部分?jǐn)?shù)據(jù)都包含有個(gè)人信息,而且存在著各種各樣的誘因,讓我們想盡辦法去采集更多、存儲(chǔ)更久、利用更徹底。大數(shù)據(jù)的價(jià)值不再單純來(lái)源于它的基本用途,而更多源于它的二次利用。這就顛覆了當(dāng)下隱私保護(hù)法以個(gè)人為中心的思想:數(shù)據(jù)收集者必須告知個(gè)人,他們收集了哪些數(shù)據(jù)、作何用途,也必須在收集工作開(kāi)始之前征得個(gè)人的同意。雖然這不是進(jìn)行合法數(shù)據(jù)收集的唯一方式,“告知與許可”已經(jīng)是世界各地執(zhí)行隱私政策的共識(shí)性基礎(chǔ)。更重要的是,大數(shù)據(jù)時(shí)代,很多數(shù)據(jù)在收集的時(shí)候并無(wú)意用作其他用途,而最終卻產(chǎn)生了很多創(chuàng)新性的用途。
大數(shù)據(jù)為監(jiān)測(cè)我們的生活提供了便利,同時(shí)也讓保護(hù)隱私的法律手段失去了應(yīng)有的效力。面對(duì)大數(shù)據(jù),保護(hù)隱私的核心技術(shù)不再適用了。同樣,通過(guò)大數(shù)據(jù)的預(yù)測(cè),對(duì)我們的未來(lái)想法而非實(shí)際行為采取懲罰措施,也讓我們惶恐不安。大數(shù)據(jù)帶來(lái)的影響使我們面臨更多的隱私、安全性問(wèn)題,我們時(shí)刻都暴露在第三只眼之下,亞馬遜監(jiān)視著我們的購(gòu)物習(xí)慣,谷歌監(jiān)視著我們的網(wǎng)頁(yè)瀏覽習(xí)慣,而微博似乎什么都知道,不僅竊聽(tīng)到了我們心中的“TA”,還有我們的社交關(guān)系網(wǎng) 多少密碼和賬號(hào)是因?yàn)椤吧缃痪W(wǎng)絡(luò)”流出去的?面對(duì)大數(shù)據(jù),保護(hù)隱私的核心技術(shù)不再適用了。針對(duì)這一問(wèn)題,作者提出必須杜絕對(duì)數(shù)據(jù)的過(guò)分依賴,以防我們誤用了數(shù)據(jù)而落入深淵。政府企業(yè)需要全新的制度規(guī)范,而不是修改原有規(guī)范的適用范圍。想要保護(hù)個(gè)人隱私就需要個(gè)人數(shù)據(jù)處理器對(duì)其政策和行為承擔(dān)更多的責(zé)任。同時(shí),我們必須重新定義公正的概念,以確保人類(lèi)的行為自由(也相應(yīng)地為這些行為承擔(dān)責(zé)任)。新機(jī)構(gòu)和專(zhuān)家們需要設(shè)計(jì)復(fù)雜的程序?qū)Υ髷?shù)據(jù)進(jìn)行解讀,挖掘出其潛在的價(jià)值和結(jié)論。他們也要向那些可能受害于大數(shù)據(jù)結(jié)論的人——因之被剝奪了工作、接受醫(yī)療或貸款權(quán)利的人,提供支持。
四、大數(shù)據(jù)啟示
大數(shù)據(jù)時(shí)代是名副其實(shí)的“信息社會(huì)”,大數(shù)據(jù)在實(shí)用層面的影響很廣泛,解決了大量的日常問(wèn)題。大數(shù)據(jù)更是利害攸關(guān)的,它將重塑我們的生活、工作和思維方式。擁有知識(shí)意味著掌握過(guò)去,現(xiàn)在則更意味著能夠預(yù)測(cè)未來(lái)。除了糾結(jié)于數(shù)據(jù)的準(zhǔn)確性、正確性、純潔度和嚴(yán)格度之外,我們也應(yīng)該容許一些不精確的存在。數(shù)據(jù)不可能是完全對(duì)或完全錯(cuò)的。當(dāng)數(shù)據(jù)的規(guī)模以數(shù)量級(jí)增加時(shí),這些混亂也就算不上問(wèn)題了。在日常情況下,知道“是什么”就已經(jīng)足夠了,不必非要弄清楚“為什么”。大數(shù)據(jù)的相關(guān)性將人們指向了比探討因果關(guān)系更有前景的領(lǐng)域。對(duì)個(gè)人來(lái)說(shuō):
1、我們現(xiàn)在所處的時(shí)代是大數(shù)據(jù)時(shí)代,對(duì)于大數(shù)據(jù)時(shí)代賦予的便利,絕對(duì)學(xué)習(xí)并吸收;
2、明白大數(shù)據(jù)時(shí)代在隱私等諸多層面存在隱憂,對(duì)于個(gè)人重要隱私應(yīng)妥善保護(hù),減少隱私被不法分子利用的可能; 對(duì)企業(yè)來(lái)說(shuō):重視數(shù)據(jù),重視數(shù)據(jù)庫(kù)平臺(tái)的搭建,以幫助企業(yè)快速做出正確決策,提高企業(yè)競(jìng)爭(zhēng)力,拓展企業(yè)收入來(lái)源; 對(duì)國(guó)家來(lái)說(shuō):反對(duì)數(shù)據(jù)壟斷,學(xué)習(xí)國(guó)外數(shù)據(jù)開(kāi)放與透明;