欧美色欧美亚洲高清在线观看,国产特黄特色a级在线视频,国产一区视频一区欧美,亚洲成a 人在线观看中文

  1. <ul id="fwlom"></ul>

    <object id="fwlom"></object>

    <span id="fwlom"></span><dfn id="fwlom"></dfn>

      <object id="fwlom"></object>

      大數(shù)據(jù)時(shí)代讀書(shū)心得

      時(shí)間:2019-05-12 15:47:10下載本文作者:會(huì)員上傳
      簡(jiǎn)介:寫(xiě)寫(xiě)幫文庫(kù)小編為你整理了多篇相關(guān)的《大數(shù)據(jù)時(shí)代讀書(shū)心得》,但愿對(duì)你工作學(xué)習(xí)有幫助,當(dāng)然你在寫(xiě)寫(xiě)幫文庫(kù)還可以找到更多《大數(shù)據(jù)時(shí)代讀書(shū)心得》。

      第一篇:大數(shù)據(jù)時(shí)代讀書(shū)心得

      生活,工作以及思維的大變革

      ——讀《大數(shù)據(jù)時(shí)代》有感及所思

      讀了《大數(shù)據(jù)時(shí)代》后,感覺(jué)到一個(gè)大變革的時(shí)代將要來(lái)臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結(jié)”或顛覆一些傳統(tǒng)上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強(qiáng)烈震撼,不禁戰(zhàn)栗起來(lái)。

      本書(shū)從思維、商業(yè)、管理三個(gè)方面闡述了在大數(shù)據(jù)時(shí)代在下的變革,這些變革涉及到我們生活的方方面面,幾乎其影響程度可以與兩次工業(yè)革命相媲美。作者在第一部分提出了三個(gè)比較令人震驚的觀點(diǎn),也就是大數(shù)據(jù)的精髓在于我們分析信息時(shí)的三個(gè)轉(zhuǎn)變,這三個(gè)轉(zhuǎn)變將改變我們的理解和組建社會(huì)的方法。并且作者將生活,工作思維的大變革和這幾個(gè)方面緊緊聯(lián)系在一起。

      第一個(gè)轉(zhuǎn)變是,在大數(shù)據(jù)時(shí)代,我們可以分析更多的數(shù)據(jù),有時(shí)候甚至可以處理和某個(gè)特別現(xiàn)象相關(guān)的所有數(shù)據(jù),而不再依賴(lài)于隨機(jī)采樣。也就是說(shuō)樣本等于總體;第二個(gè)轉(zhuǎn)變是對(duì)研究數(shù)據(jù)不會(huì)追求精度,而且追求混雜性,小數(shù)據(jù)時(shí)代下,追求精確度是合理的,因?yàn)槲覀兪占臄?shù)據(jù)很少,所以要越精確越好,包括如今仍然也在使用這種辦法;但是在某些時(shí)代,尤其是在大數(shù)據(jù)時(shí)代背景下,快速獲得一個(gè)大概輪廓和發(fā)展脈絡(luò),要比精確性重要得多,既然選擇了整體性,肯定要忽視細(xì)節(jié)和確定性;第三個(gè)改變是不是因果關(guān)系而是相關(guān)關(guān)系,在大數(shù)據(jù)時(shí)代,我們更需要了解一個(gè)東西是什么,而不是為什么,要找到關(guān)聯(lián)無(wú),通過(guò)一個(gè)良好的關(guān)聯(lián)物的相關(guān)關(guān)系可以幫助我們捕捉預(yù)測(cè)未來(lái)。

      這三個(gè)方面是大數(shù)據(jù)時(shí)代所給我們帶來(lái)的思維上的改變,所謂思路決定出路,思路有了創(chuàng)新,有了拓展,相應(yīng)的社會(huì)也就會(huì)有很大的變化。緊接著第二部分作者從萬(wàn)事萬(wàn)物數(shù)據(jù)化和數(shù)據(jù)交叉復(fù)用的巨大價(jià)值兩個(gè)方面,講述驅(qū)動(dòng)大數(shù)據(jù)戰(zhàn)車(chē)在材質(zhì)和智力方面向前滾動(dòng)的最根本動(dòng)力。第三部分則是闡述了大數(shù)據(jù)時(shí)代下的弊端以及在管理上的措施。個(gè)人認(rèn)為本書(shū)的精髓部分是第一部分,第一部分的三個(gè)觀點(diǎn)涉及的面很廣,包括統(tǒng)計(jì)學(xué)、邏輯學(xué)、哲學(xué)等。后兩個(gè)部分都是以第一部分這三個(gè)觀點(diǎn)為基礎(chǔ)展開(kāi)闡述的。

      這本書(shū)給我感觸最深的就是這三個(gè)轉(zhuǎn)變,或者說(shuō)是三個(gè)觀點(diǎn),可以說(shuō)是哲學(xué)上說(shuō)的世界觀,因?yàn)槭澜缬^決定方法論,所以這三個(gè)觀點(diǎn)對(duì)傳統(tǒng)看法的顛覆,就會(huì)導(dǎo)致各種變革的發(fā)生。首先是第一個(gè),作者認(rèn)為在抽樣研究時(shí)期,由于研究條件的欠缺,只能以少量的數(shù)據(jù)獲取最大的信息,而在大數(shù)據(jù)時(shí)代,我們可以獲得海量的數(shù)據(jù),抽樣自然就失去它的意義了。放棄了隨機(jī)分析法這種捷徑,采用所有的數(shù)據(jù)。作者用大數(shù)據(jù)與喬布斯的癌癥治療例子說(shuō)明了使用全部數(shù)據(jù)而非樣本的意義,列舉了日本“相撲”等來(lái)證明使用全體數(shù)據(jù)的重要性。這個(gè)觀點(diǎn)足以引起統(tǒng)計(jì)學(xué)乃至社會(huì)文明的變革,因?yàn)榻y(tǒng)計(jì)抽樣和幾何學(xué)定理、萬(wàn)有引力一樣被看做文明得以建立牢固的基石。我對(duì)這個(gè)觀點(diǎn)還是比較認(rèn)同的,如果真能收集到整體的數(shù)據(jù)而且分析數(shù)據(jù)的工具也足夠先進(jìn),自然是全體數(shù)據(jù)研究得出的結(jié)果更令人信服。但是這個(gè)觀點(diǎn)也過(guò)于絕對(duì),就算是在大數(shù)據(jù)時(shí)代要想收集到全體數(shù)據(jù)還是不太可能實(shí)現(xiàn)的,因?yàn)槭占w數(shù)據(jù)要付出的代價(jià)有時(shí)會(huì)很大。比如說(shuō),你要檢測(cè)食品中致癌物質(zhì)是否超標(biāo),你不可能每一件食品你都檢測(cè)一遍吧。

      第二,要效率不要絕對(duì)的精確。作者說(shuō),執(zhí)迷于精確性是信息缺乏時(shí)代和模擬時(shí)代的產(chǎn)物,只有5%的數(shù)據(jù)是結(jié)構(gòu)化且能適用于傳統(tǒng)數(shù)據(jù)庫(kù)的。如果不接受混亂,剩下95%的非結(jié)構(gòu)化數(shù)據(jù)都無(wú)法被利用。作者是基于數(shù)據(jù)不可能百分之百正確的考慮而做出這樣的判斷的,如果采用小數(shù)據(jù)一個(gè)數(shù)據(jù)的錯(cuò)誤就會(huì)導(dǎo)致結(jié) 果的誤差很大,但是如果數(shù)據(jù)足夠多、數(shù)據(jù)足夠雜那得出的結(jié)果就越靠近正確答案。大數(shù)據(jù)時(shí)代要求我們重新審視精確性的優(yōu)劣,甚至還說(shuō)到大數(shù)據(jù)不僅讓我們不再期待精確性,也讓我們無(wú)法實(shí)現(xiàn)精確性。谷歌翻譯的成功很好地證明了這一點(diǎn),谷歌的翻譯系統(tǒng)不像Candide那樣精確地翻譯每一句話,它谷歌翻譯之所以?xún)?yōu)于IBM的Candide系統(tǒng)并不是因?yàn)樗鼡碛懈玫乃惴C(jī)制,和微軟的班科和布里爾一樣,谷歌翻譯增加了各種各樣的數(shù)據(jù),并且接受了有錯(cuò)誤的數(shù)據(jù)。

      而在閱讀這本書(shū)時(shí),發(fā)現(xiàn)這本書(shū)中爭(zhēng)議最大的一個(gè)觀點(diǎn),不僅是讀者,就算是本書(shū)的譯者也在序言中明確地說(shuō)到他不認(rèn)同“相關(guān)關(guān)系比因果關(guān)系更重要”的觀點(diǎn)。作者覺(jué)得相關(guān)關(guān)系對(duì)于預(yù)測(cè)一些事情已經(jīng)足夠了,不用花大力氣去研究他們的因果關(guān)系。作者用林登的亞馬遜推薦系統(tǒng)的成功,證實(shí)了大數(shù)據(jù)在分析相關(guān)性方面的優(yōu)勢(shì)以及在銷(xiāo)售中獲得的成功。沃爾瑪也是充分利用并挖掘各類(lèi)數(shù)據(jù)信息的代表,從啤酒和尿布的案例,以及作者舉的有關(guān)蛋撻和颶風(fēng)天氣的案例,都說(shuō)明了掌握了相關(guān)關(guān)系對(duì)于他們策略的幫助。一句話,知道是什么就夠了,不用知道為什么。很明顯作者所舉的例子都是屬于商業(yè)領(lǐng)域的,但是對(duì)于其他領(lǐng)域來(lái)說(shuō)這個(gè)觀點(diǎn)就值得商榷了。比如說(shuō),在科學(xué)研究領(lǐng)域,你需要知其然也需要知道其所以然,找到事件發(fā)生的原理。用文中的一個(gè)例子說(shuō)明,喬布斯測(cè)出整個(gè)基因圖譜來(lái)治療癌癥,但是你治療癌癥你必須知道癌癥發(fā)病的原理,知道哪一段基因?qū)е铝诉@種疾病,不可能只是說(shuō)收集各種數(shù)據(jù),然后利用其相關(guān)性來(lái)判斷哪里出現(xiàn)了問(wèn)題。

      過(guò)度依賴(lài)所帶來(lái)的后果。也用《少數(shù)派的報(bào)告》這部電影來(lái)說(shuō)明如果癡迷于數(shù)據(jù)會(huì)導(dǎo)致我們將生活在一個(gè)沒(méi)有獨(dú)立選擇和自由意志的社會(huì),如果一切變?yōu)楝F(xiàn)實(shí),我們將被禁錮在大數(shù)據(jù)的可能性之中。所以書(shū)中提出了幾種解決方法,一種是使用數(shù)據(jù)時(shí)征詢(xún)數(shù)據(jù)所有個(gè)人的知曉和授權(quán)。第二個(gè)技術(shù)途徑就是匿名化。毫無(wú)疑問(wèn),大數(shù)據(jù)將會(huì)給社會(huì)管理帶來(lái)巨大的變革。

      在這個(gè)信息爆炸的時(shí)代,大數(shù)據(jù)給人類(lèi)社會(huì)的方方面面帶來(lái)了巨大的變革,這是社會(huì)發(fā)展的潮流,不可逆轉(zhuǎn),我們只有順應(yīng)這種潮流,把握住大數(shù)據(jù)時(shí)代變革的思想,才能在時(shí)代潮流中成為佼佼者,在思維上思路上略高一籌,才能在行動(dòng)中占得先機(jī)!

      第二篇:《大數(shù)據(jù)時(shí)代》讀書(shū)心得

      大數(shù)據(jù)時(shí)代,引領(lǐng)信息全球化

      ——讀《大數(shù)據(jù)時(shí)代》有感

      如今說(shuō)起新媒體和互聯(lián)網(wǎng),必提大數(shù)據(jù),似乎不這樣說(shuō)就OUT了。而且人云亦云的居多,不少談?wù)撜呱踔吝€沒(méi)有認(rèn)真讀過(guò)這方面的經(jīng)典著作——舍恩佰格的《大數(shù)據(jù)時(shí)代》。維克托·邁爾——舍恩伯格何許人也?他現(xiàn)任牛津大學(xué)網(wǎng)絡(luò)學(xué)院互聯(lián)網(wǎng)研究所治理與監(jiān)管專(zhuān)業(yè)教授,曾任哈佛大學(xué)肯尼迪學(xué)院信息監(jiān)管科研項(xiàng)目負(fù)責(zé)人。他的咨詢(xún)客戶包括微軟、惠普和IBM等全球頂級(jí)企業(yè),他是歐盟互聯(lián)網(wǎng)官方政策背后真正的制定者和參與者,他還先后擔(dān)任多國(guó)政府高層的智囊。這位被譽(yù)為:大數(shù)據(jù)時(shí)代的預(yù)言家“的牛津教授真牛!那么,這位大師說(shuō)的都是金科玉律嗎?并不一定,讀大師的作品一定要做些功課才好讀懂,如果能做足功課又具備相應(yīng)的理論功底,就能與之進(jìn)行一場(chǎng)思想上的對(duì)話。

      粗淺認(rèn)識(shí)之我見(jiàn)

      舍恩伯格分三部分來(lái)討論大數(shù)據(jù),即思維變革、商業(yè)變革和管理變革。在第一部分“大數(shù)據(jù)時(shí)代的思維變革”中,舍恩伯格旗幟鮮明的亮出他的三個(gè)觀點(diǎn):

      一、更多:不是隨機(jī)樣本,而是全體數(shù)據(jù);

      二、更雜:不是精確性,而是混雜性;

      三、更好:不是因果關(guān)系,而是相關(guān)關(guān)系。對(duì)于第一個(gè)觀點(diǎn),我不敢茍同。一方面是對(duì)全體數(shù)據(jù)進(jìn)行處理,在技術(shù)和設(shè)備上有相當(dāng)高的難度。另一方面是不是都有此必要,對(duì)于簡(jiǎn)單事實(shí)進(jìn)行判斷的數(shù)據(jù)分析難道也要采集全體數(shù)據(jù)嗎?我曾與香港城市大學(xué)的祝建華教授討論過(guò)。祝教授是傳播學(xué)研究方法和數(shù)據(jù)分析的專(zhuān)家,他認(rèn)為一定可以找到一種數(shù)理統(tǒng)計(jì)方法來(lái)進(jìn)行分析,并不一定需要全部數(shù)據(jù)。聯(lián)系到舍恩伯格第二個(gè)觀點(diǎn)中所說(shuō)的相關(guān)關(guān)系,我理解他說(shuō)的全體數(shù)據(jù)不是指數(shù)量而是指范圍,即大數(shù)據(jù)的隨機(jī)樣本不限于目標(biāo)數(shù)據(jù),還包括目標(biāo)以外的所有數(shù)據(jù)。我認(rèn)為大數(shù)據(jù)分析不能排除隨機(jī)抽樣,只是抽樣的方法和范圍要加以拓展。

      我同意舍恩伯格的第二觀點(diǎn),我認(rèn)為這是對(duì)他第一個(gè)觀點(diǎn)很好的補(bǔ)充,這也是對(duì)精準(zhǔn)傳播和精準(zhǔn)營(yíng)銷(xiāo)的一種反思?!按髷?shù)據(jù)的簡(jiǎn)單算法比小數(shù)據(jù)的復(fù)雜算法更有效?!备哂泻暧^視野和東方哲學(xué)思維。對(duì)于舍恩伯格的第三個(gè)觀點(diǎn),我也不能完全贊同?!安皇且蚬P(guān)系,而是相關(guān)關(guān)系?!辈恍枰馈盀槭裁础?,只需要知道“是什么”。傳播即數(shù)據(jù),數(shù)據(jù)即關(guān)系。在小數(shù)據(jù)時(shí)代人們只關(guān)心因果關(guān)系,對(duì)相關(guān)關(guān)系認(rèn)識(shí)不足,大數(shù)據(jù)時(shí)代相關(guān)關(guān)系舉足輕重,如何強(qiáng)調(diào)都不為過(guò),但不應(yīng)該完全排斥它。大數(shù)據(jù)從何而來(lái)?為何而用?如果我們完全忽略因果關(guān)系,不知道大數(shù)據(jù)產(chǎn)生的前因后果,也就消解了大數(shù)據(jù)的人文價(jià)值。如今不少學(xué)者為了闡述和傳播其觀點(diǎn)往往語(yǔ)出驚人,對(duì)舊有觀念進(jìn)行徹底的否定。

      世間萬(wàn)物的復(fù)雜性多樣化并非非此即彼那么簡(jiǎn)單,舍恩伯格也是這種二元對(duì)立的幼稚思維嗎?其實(shí)不然,讀者在閱讀時(shí)一定要看清楚他是在什么語(yǔ)境下說(shuō)的,不要因囫圇吞棗的淺讀而陷入斷章取義的誤讀。比如說(shuō)舍恩伯格在提出“不是因果關(guān)系,而是相關(guān)關(guān)系?!边@一論斷時(shí),他在書(shū)中還說(shuō)道:“在大多數(shù)情況下,一旦我們完成了對(duì)大數(shù)據(jù)的相關(guān)關(guān)系分析,而又不再滿足于僅僅知道‘是什么’時(shí),我們就會(huì)繼續(xù)向更深層次研究的因果關(guān)系,找出背后的‘為什么’。”由此可見(jiàn),他說(shuō)的全體數(shù)據(jù)和相關(guān)關(guān)系都在特定語(yǔ)境下的,是在數(shù)據(jù)挖掘中的選項(xiàng)。

      大數(shù)據(jù)研究的一大驅(qū)動(dòng)力就是商用,舍恩伯格在第二部分里討論了大數(shù)據(jù)時(shí)代的商業(yè)變革。舍恩伯格認(rèn)為數(shù)據(jù)化就是一切皆可“量化”,大數(shù)據(jù)的定量分析有力地回答“是什么”這一問(wèn)題,但仍然無(wú)法完全回答“為什么”。因此,我認(rèn)為并不能排除定性分析和質(zhì)化研究。數(shù)據(jù)創(chuàng)新可以創(chuàng)造價(jià)值,這是毫無(wú)疑問(wèn)的。舍恩伯格在討論大數(shù)據(jù)的角色定位時(shí)仍把它置于數(shù)據(jù)應(yīng)用的商業(yè)系統(tǒng)中,而沒(méi)有把它置于整個(gè)社會(huì)系統(tǒng)里,但他在第二部分大數(shù)據(jù)時(shí)代的管理變革中討論了這個(gè)問(wèn)題。在風(fēng)險(xiǎn)社會(huì)中信息安全問(wèn)題日趨凸顯,數(shù)據(jù)獨(dú)裁與隱私保護(hù)成為一對(duì)矛盾。如何擺脫大數(shù)據(jù)的困境?舍恩伯格在最后一節(jié)“掌控”中試圖回答,但基本上屬于老生常談。我想,或許凱文·凱利的《失控》可以幫助我們解答這個(gè)問(wèn)題?至少可以提供更多的思考維度。正如舍恩伯格在結(jié)語(yǔ)中所道:“大數(shù)據(jù)并不是一個(gè)充斥著算法和機(jī)器的冰冷世界,人類(lèi)的作用依然無(wú)法被完全替代。大數(shù)據(jù)為我們提供的不是最終答案,只是參考答案,幫助是暫時(shí)的,而更好的方法和答案還在不久的未來(lái)?!敝x謝舍恩伯格!讓大數(shù)據(jù)討論從自然科學(xué)回到人文社科。由此推斷,《大數(shù)據(jù)時(shí)代》不是最終答案,也不是標(biāo)準(zhǔn)答案,只是參考答案。

      此外,在閱讀此書(shū)之前還必須具備一些數(shù)據(jù)科學(xué)的基本知識(shí)和基本概念,比如說(shuō)什么叫數(shù)據(jù)?什么叫大數(shù)據(jù)?數(shù)據(jù)分析與數(shù)據(jù)挖掘的區(qū)別,數(shù)字化與數(shù)據(jù)化有什么不同?讀前做些功課讀起來(lái)就比較好懂了。

      淺薄之語(yǔ)抒我意

      概念是研究的邏輯起點(diǎn),“大數(shù)據(jù)”到底是什么?在百度上搜索到的解釋是,“大數(shù)據(jù)(big data),或稱(chēng)巨量資料,指的是所涉及的資料量規(guī)模巨大到無(wú)法透過(guò)目前主流軟件工具,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營(yíng)決策更積極目的的資訊?!贝髷?shù)據(jù)的4V特點(diǎn):數(shù)量(Volume)、速度(Velocity)、品種(Variety)和真實(shí)性(Veracity)。但舍恩伯格認(rèn)為大數(shù)據(jù)并非一個(gè)確切的概念。他在書(shū)中的一段詮釋更具人文色彩和社會(huì)意義:“大數(shù)據(jù)是人們獲得新的認(rèn)知、創(chuàng)造新的價(jià)值的源泉;大數(shù)據(jù)還是改變市場(chǎng)、組織機(jī)構(gòu),以及政府與公民關(guān)系的方法?!逼鋵?shí),概念的界定要看研究者從哪個(gè)角度來(lái)研究它而定。

      科學(xué)家的治學(xué)態(tài)度是嚴(yán)謹(jǐn)?shù)?,而人文學(xué)家更具有想象力。一些對(duì)大數(shù)據(jù)不甚了然的人往往夸大了它的作用,甚至把它神化。舍恩伯格認(rèn)為大數(shù)據(jù)的核心是預(yù)測(cè)?!按髷?shù)據(jù)不是要教機(jī)器像人一樣思考。相反,把數(shù)學(xué)算法運(yùn)用到海量的數(shù)據(jù)上來(lái)預(yù)期事情發(fā)生的可能性?!鄙岫鞑裆踔敛换乇艽髷?shù)據(jù)所產(chǎn)生的負(fù)面影響,他在第七章里談到讓數(shù)據(jù)主宰一切的隱憂。我覺(jué)得這是實(shí)事求是的科學(xué)態(tài)度。在量子力學(xué)里有一個(gè)測(cè)不準(zhǔn)原理:一個(gè)微觀粒子的某些物理量(如位置和動(dòng)量,或方位角與動(dòng)量矩,還有時(shí)間和能量等),不可能同時(shí)具有確定的數(shù)值,其中一個(gè)量越確定,另一個(gè)量的不確定程度就越大。它是解釋微觀世界的物理現(xiàn)象,信息社會(huì)中的大數(shù)據(jù)會(huì)不會(huì)也有類(lèi)似情況呢?如果我們?cè)侔褎P文·凱利的《失控》對(duì)比來(lái)讀的話就更有意思了,這樣我們對(duì)整個(gè)物質(zhì)世界及至人類(lèi)社會(huì)就有了更全面更深刻的洞察,從物理王國(guó)到生物世界,再到信息社會(huì)。從公共衛(wèi)生到商業(yè)應(yīng)用,從個(gè)人隱私到政府管理,大數(shù)據(jù)無(wú)處不在。與此同時(shí),從哪個(gè)角度探討用什么方法研究,舍恩伯格都不會(huì)忘記大數(shù)據(jù)服務(wù)人類(lèi)造福人類(lèi)的終極目的和價(jià)值所在?!按髷?shù)據(jù)并不是一個(gè)充斥著運(yùn)算法則和機(jī)器的冰冷世界,其中仍需要人類(lèi)扮演重要角色。人類(lèi)獨(dú)有的弱點(diǎn)、錯(cuò)覺(jué)、錯(cuò)誤都是十分必要的,因?yàn)檫@些特性的另一頭牽著的是人類(lèi)的創(chuàng)造力、直覺(jué)和天賦。偶爾也會(huì)帶來(lái)屈辱或固執(zhí)的同樣混亂的大腦運(yùn)作,也能帶來(lái)成功,或在偶然間促成我們的偉大。這提示我們應(yīng)該樂(lè)于接受類(lèi)似的不準(zhǔn)確,因?yàn)椴粶?zhǔn)確正是我們之所以為人的特征之一?!庇弥袊?guó)話來(lái)說(shuō)就是“人無(wú)完人”,人類(lèi)在收獲大數(shù)據(jù)帶來(lái)的紅利的同時(shí)也要承受它帶來(lái)的危害。這不是對(duì)立統(tǒng)一的辯證唯物主義?我把它看作帶著歐洲批判學(xué)派色彩的科學(xué)發(fā)展觀。問(wèn)題是研究的價(jià)值基點(diǎn),“大數(shù)據(jù)”不是舍恩伯格研究的問(wèn)題,而是研究對(duì)象,他研究的是數(shù)據(jù)處理和信息管理問(wèn)題,同時(shí)也討論信息安全和網(wǎng)絡(luò)倫理問(wèn)題,還引發(fā)哲學(xué)上的思考,哲學(xué)史上爭(zhēng)論不休的世界可知論和不可知論轉(zhuǎn)變?yōu)閷?shí)證科學(xué)中的具體問(wèn)題。可知性是絕對(duì)的,不可知性是相對(duì)的?!按髷?shù)據(jù)”之所以為大是因它引發(fā)人類(lèi)生活、工作和思維的大變革,從這個(gè)意義上來(lái)看,《大數(shù)據(jù)時(shí)代》的意義不僅在于它討論了若干重大問(wèn)題,而且對(duì)研究者開(kāi)出了一個(gè)問(wèn)題清單,從而引發(fā)更多人來(lái)探討這些有趣的問(wèn)題。

      《大數(shù)據(jù)時(shí)代》實(shí)際上主要是一本討論數(shù)據(jù)挖掘的書(shū),數(shù)據(jù)挖掘與數(shù)據(jù)分析是不同的概念,數(shù)據(jù)挖掘一般是指從大量的數(shù)據(jù)中自動(dòng)搜索隱藏于其中的有著特殊關(guān)系性的信息的過(guò)程。數(shù)據(jù)挖掘通常與計(jì)算機(jī)科學(xué)有關(guān),并通過(guò)統(tǒng)計(jì)、在線分析處理、情報(bào)檢索、機(jī)器學(xué)習(xí)、專(zhuān)家系統(tǒng)(依靠過(guò)去的經(jīng)驗(yàn)法則)和模式識(shí)別等諸多方法來(lái)實(shí)現(xiàn)上述目標(biāo)。而數(shù)據(jù)分析的目的是把隱沒(méi)在一大批看來(lái)雜亂無(wú)章的數(shù)據(jù)中的信息集中、萃取和提煉出來(lái),以找出所研究對(duì)象的內(nèi)在規(guī)律。數(shù)據(jù)挖掘主要運(yùn)用計(jì)算機(jī)來(lái)進(jìn)行處理,而數(shù)據(jù)分析既要用計(jì)算機(jī)也要人工分析,是計(jì)算機(jī)科學(xué)與人文價(jià)值判斷的統(tǒng)一結(jié)合。換言之,《大數(shù)據(jù)時(shí)代》并不是一本討論大數(shù)據(jù)所有問(wèn)題的書(shū)。

      《大數(shù)據(jù)時(shí)代》也是一本討論互聯(lián)網(wǎng)發(fā)展的書(shū),從數(shù)字化到數(shù)據(jù)化,同時(shí)有濃厚的未來(lái)學(xué)色彩。當(dāng)文字變成數(shù)據(jù),我們進(jìn)入了互聯(lián)網(wǎng);當(dāng)方位變成數(shù)據(jù),我們進(jìn)入了物聯(lián)網(wǎng);當(dāng)溝通變成數(shù)據(jù),我們進(jìn)入了下一代互聯(lián)網(wǎng)。一切可量化,萬(wàn)物皆數(shù)據(jù),正是當(dāng)今互聯(lián)網(wǎng)世界的真實(shí)寫(xiě)照。面對(duì)于這樣的世界及世界的未來(lái),在《大數(shù)據(jù)時(shí)代》出現(xiàn)最多的詞是“思維”和“方法”,因此也可以把這本書(shū)視為思維科學(xué)應(yīng)用研究的書(shū)。

      此外,在閱讀此書(shū)之前還必須具備一些數(shù)據(jù)科學(xué)的基本知識(shí)和基本概念,比如說(shuō)什么叫數(shù)據(jù)?什么叫大數(shù)據(jù)?數(shù)據(jù)分析與數(shù)據(jù)挖掘的區(qū)別,數(shù)字化與數(shù)據(jù)化有什么不同?讀前做些功課讀起來(lái)就比較好懂了。

      走出去,理論聯(lián)系實(shí)際之我看

      今年的9月30日,總書(shū)記將他命名為“烈士紀(jì)念日”。在新一屆黨中央領(lǐng)導(dǎo)班子的領(lǐng)導(dǎo)下,舉國(guó)上下開(kāi)展了系列的調(diào)研、講解、討論創(chuàng)新驅(qū)動(dòng)發(fā)展戰(zhàn)略。包括總書(shū)記、李克強(qiáng)總理在內(nèi)的七位常委全部出動(dòng)來(lái)到中關(guān)村,這是歷史上沒(méi)有過(guò)的,百度、聯(lián)想和小米的負(fù)責(zé)人,有了一次直面最高層匯報(bào)工作的機(jī)會(huì)。雷軍和柳傳志,講解的都是本公司的各種情況,李彥宏則沒(méi)有講百度的廣告業(yè)務(wù)發(fā)展得如何好,而是講起了大數(shù)據(jù)。在講解中,李彥宏認(rèn)為大數(shù)據(jù)有兩個(gè)重要價(jià)值,一是促進(jìn)信息消費(fèi),加快經(jīng)濟(jì)轉(zhuǎn)型升級(jí);二是關(guān)注社會(huì)民生,帶動(dòng)社會(huì)管理創(chuàng)新。這些價(jià)值也是目前黨和國(guó)家領(lǐng)導(dǎo)人最為重視的,可見(jiàn)《大數(shù)據(jù)時(shí)代》既有理論價(jià)值也有現(xiàn)實(shí)意義。當(dāng)今大數(shù)據(jù)正在影響著新聞傳媒業(yè),大數(shù)據(jù)新聞、大數(shù)據(jù)營(yíng)銷(xiāo)、輿情分析、受眾(用戶)研究??數(shù)據(jù)分析師變身新聞編輯,大數(shù)據(jù)正改變新聞生產(chǎn)流程、大數(shù)據(jù)在創(chuàng)造傳媒新業(yè)態(tài)。“不妨想象一下,隨著數(shù)據(jù)的進(jìn)一步增加,坐擁用戶資源的新媒體們完全有能力通過(guò)數(shù)據(jù)挖掘,分析用戶癖好,向電視臺(tái)定制一部電視劇甚至向好萊塢定制一部電影。到那個(gè)時(shí)候,電視臺(tái)一如那些家電廠商們,曾經(jīng)產(chǎn)業(yè)鏈的上游‘王者’,將徹底成為一個(gè)產(chǎn)業(yè)鏈最低端的內(nèi)容代工廠?!比欢樾我策h(yuǎn)沒(méi)有人們想象的那么樂(lè)觀,李彥宏指出目前多數(shù)所謂的大數(shù)據(jù)公司其實(shí)還是空殼子,因?yàn)閿?shù)據(jù)還沒(méi)有完全開(kāi)放。他認(rèn)為必須在政府層面上推動(dòng)才能真正實(shí)現(xiàn)大數(shù)據(jù)的開(kāi)發(fā)與利用。我在討論大數(shù)據(jù)時(shí)代的輿情監(jiān)測(cè)與預(yù)警時(shí)說(shuō)道:“經(jīng)典自由主義傳播學(xué)說(shuō)對(duì)媒體的定位:秉持公正、客觀立場(chǎng)的媒體被稱(chēng)為代表公眾監(jiān)督政府行為的‘看門(mén)狗’。其實(shí),媒體既是公眾利益也是國(guó)家利益的‘看門(mén)狗’。要看好門(mén)就要瞭望、洞察社情民意,傳統(tǒng)媒體信息反饋渠道單一,視野、人力十分有限。而開(kāi)放互動(dòng)的新媒體平臺(tái)卻大有可為。作為公共信息發(fā)布平臺(tái)的微博可以成為政府及時(shí)了解社情民意,從而選擇正確治理路徑的‘導(dǎo)盲犬’?!边z憾的是目前我國(guó)的數(shù)據(jù)平臺(tái)還沒(méi)有完全開(kāi)放,真正的大數(shù)據(jù)時(shí)代還沒(méi)有到來(lái)。

      與國(guó)內(nèi)不少教科書(shū)寫(xiě)法的專(zhuān)著相比,國(guó)外的書(shū)寫(xiě)得更有趣,尤其是大學(xué)者寫(xiě)的,不僅視野開(kāi)闊,而且能夠深入淺出?!洞髷?shù)據(jù)時(shí)代》不到22萬(wàn)字,卻有上百個(gè)學(xué)術(shù)和商業(yè)的實(shí)例,豐富翔實(shí)的例子讓讀者感到通俗易懂,深?yuàn)W的理論看起來(lái)也不費(fèi)勁。這恐怕與舍恩伯格既是學(xué)者也是專(zhuān)家,既有理論又有實(shí)踐有關(guān)。反觀我們些學(xué)者故弄玄虛而示高明,實(shí)際上是把讀者拒之門(mén)外。我覺(jué)得優(yōu)秀的科學(xué)家也應(yīng)該是一個(gè)科普作家,優(yōu)秀的學(xué)者也應(yīng)該是一個(gè)不錯(cuò)的傳播者。當(dāng)然國(guó)外學(xué)術(shù)著作也有一個(gè)翻譯問(wèn)題,這本書(shū)譯得還不錯(cuò)。此外,《大數(shù)據(jù)時(shí)代》還附有不少I(mǎi)T界名流的推薦意見(jiàn),雖是出版商的發(fā)行所為,對(duì)解讀此書(shū)也不無(wú)益處。

      除了《大數(shù)據(jù)時(shí)代》,舍恩伯格還有一本《刪除》也值得一讀。要研究大數(shù)據(jù)不能只讀一本書(shū),該書(shū)譯者周濤教授還推薦了三部國(guó)內(nèi)出版的大數(shù)據(jù)方面的專(zhuān)著:《證析》、《大數(shù)據(jù)》、《個(gè)性化:商業(yè)的未來(lái)》。相比《大數(shù)據(jù)時(shí)代》的宏大視野,這些書(shū)就大數(shù)據(jù)某一局部問(wèn)題給出深刻的介紹和洞見(jiàn)。我也推薦讀一讀中國(guó)工程院李國(guó)杰院士和中科院計(jì)算所副總工程學(xué)旗合寫(xiě)的文章《大數(shù)據(jù)研究:未來(lái)科技及經(jīng)濟(jì)社會(huì)發(fā)展的重大戰(zhàn)略領(lǐng)域——大數(shù)據(jù)的研究現(xiàn)狀與科學(xué)思考》。

      雖說(shuō)開(kāi)卷有益,但是由于每個(gè)人的時(shí)間精力有限,對(duì)于一個(gè)研究者來(lái)說(shuō),不讀什么書(shū)甚至比讀什么書(shū)更重要。我認(rèn)為書(shū)有三種:有用的書(shū),主要是應(yīng)用類(lèi)的專(zhuān)業(yè)書(shū);無(wú)用的書(shū),主要是形而上的思想類(lèi);無(wú)字的書(shū),人間百態(tài),社會(huì)現(xiàn)實(shí)??善氐粦?yīng)偏廢。對(duì)于學(xué)生來(lái)講這三類(lèi)“書(shū)”都該讀一些,對(duì)于研究者則要讀哪些解決關(guān)鍵問(wèn)題的書(shū),《大數(shù)據(jù)時(shí)代》就是這樣一部書(shū)。當(dāng)然,并非第一個(gè)讀者都是研究大數(shù)據(jù)的,但進(jìn)入大數(shù)據(jù)時(shí)代,還有什么東西與數(shù)據(jù)完全沒(méi)有關(guān)系呢?麥肯錫全球研究機(jī)構(gòu)認(rèn)為,未來(lái)十年里有12項(xiàng)對(duì)經(jīng)濟(jì)發(fā)展產(chǎn)生重大影響的技術(shù),其中包括三項(xiàng)新媒體技術(shù):移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)和云計(jì)算。這三項(xiàng)新媒體技術(shù)都與大數(shù)據(jù)密切相關(guān),而這些新媒體新技術(shù)的發(fā)展都影響著當(dāng)今的新聞傳播業(yè)。閱讀此書(shū)至少給我們研究新聞傳播學(xué)帶來(lái)一些啟迪。我覺(jué)得一本書(shū)的價(jià)值不在于讓你頂禮膜拜,而是引發(fā)廣泛而深入的討論。

      “凡是過(guò)去,皆為序曲?!弊x完此書(shū),我們對(duì)大數(shù)據(jù)的認(rèn)識(shí)才剛剛開(kāi)始。

      第三篇:大數(shù)據(jù)時(shí)代讀書(shū)心得

      一部似乎還沒(méi)有寫(xiě)完的書(shū)

      ——讀《大數(shù)據(jù)時(shí)代》有感及所思

      讀了《大數(shù)據(jù)時(shí)代》后,感覺(jué)到一個(gè)大變革的時(shí)代將要來(lái)臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結(jié)”或顛覆一些傳統(tǒng)上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強(qiáng)烈震撼,不禁戰(zhàn)栗起來(lái)?!霸谛?shù)據(jù)時(shí)代,我們會(huì)假象世界是怎樣運(yùn)作的,然后通過(guò)收集和分析數(shù)據(jù)來(lái)驗(yàn)證這種假想?!薄半S著由假想時(shí)代到數(shù)據(jù)時(shí)代的過(guò)渡,我們也很可能認(rèn)為我們不在需要理論了?!睍?shū)中幾乎肯定要顛覆統(tǒng)計(jì)學(xué)的理論和方法,也試圖通過(guò)引用《連線》雜志主編安德森的話“量子物理學(xué)的理論已經(jīng)脫離實(shí)際”來(lái)“終結(jié)”量子力學(xué)。對(duì)此我很高興,因?yàn)榻y(tǒng)計(jì)學(xué)和量子力學(xué)都是我在大學(xué)學(xué)習(xí)時(shí)學(xué)到抽筋都不能及格的課目。但這兩個(gè)理論實(shí)在太大,太權(quán)威,太基本了,我想我不可能靠一本書(shū)就能擺脫這兩個(gè)讓我頭疼一輩子的東西。作者其實(shí)也不敢旗幟鮮明地提出要顛覆它們的論點(diǎn),畢竟還是在前面加上了“很可能認(rèn)為”這樣的保護(hù)傘。

      近幾十年,我們總是在遇到各種各樣的新思維。在新思維面前我們首先應(yīng)該做到的就是要破和立,要改變自己的傳統(tǒng),跟上時(shí)代的腳步。即使腦子還跟不上,嘴巴上也必須跟上,否則可能會(huì)被扣上思想僵化甚至阻礙世界發(fā)展的大帽子。既然大數(shù)據(jù)是“通往未來(lái)的必然改變”,那我就必須“不受限于傳統(tǒng)的思維模式和特定領(lǐng)域里隱含的固

      有偏見(jiàn)”,跟作者一起先把統(tǒng)計(jì)學(xué)和量子力學(xué)否定掉再說(shuō)。反正我也不喜歡、也學(xué)不會(huì)它們。

      當(dāng)我們?nèi)祟?lèi)的數(shù)據(jù)收集和處理能力達(dá)到拍字節(jié)甚至更大之后,我們可以把樣本變成全部,再加上有能力正視混雜性而忽視精確性后,似乎真的可以拋棄以抽樣調(diào)查為基礎(chǔ)的統(tǒng)計(jì)學(xué)了。但是由統(tǒng)計(jì)學(xué)和量子力學(xué)以及其他很多“我們也很可能認(rèn)為我們不再需要的”理論上溯,它們幾乎都基于一個(gè)共同的基礎(chǔ)——邏輯。要是不小心把邏輯或者邏輯思維或者邏輯推理一起給“不再需要”的話,就讓我很擔(dān)心了!

      《大數(shù)據(jù)時(shí)代》第16頁(yè)“大數(shù)據(jù)的核心就是預(yù)測(cè)”。邏輯是——描述時(shí)空信息“類(lèi)”與“類(lèi)”之間長(zhǎng)時(shí)間有效不變的先后變化關(guān)系規(guī)則。兩者似乎是做同一件事。可大數(shù)據(jù)要的“不是因果關(guān)系,而是相關(guān)關(guān)系”,“知道是什么就夠了,沒(méi)必要知道為什么”,而邏輯學(xué)四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明確規(guī)定”任何事物都有其存在的充足理由。且邏輯推理三部分——?dú)w納邏輯、溯因邏輯和演繹邏輯都是基于因果關(guān)系。兩者好像又是對(duì)立的。在同一件事上兩種方法對(duì)立,應(yīng)該只有一個(gè)結(jié)果,就是要否定掉其中之一。這就是讓我很擔(dān)心的原因。

      可我卻不能拭目以待,像旁觀者一樣等著哪一個(gè)“脫穎而出”,因?yàn)槲疑硖幤渲?。?wèn)題不解決,我就沒(méi)法思考和工作,自然就沒(méi)法活了!

      更何況還有兩個(gè)更可怕的事情。

      其一:量子力學(xué)搞了一百多年,為了處理好混雜性問(wèn)題,把質(zhì)量

      和速度結(jié)合到能量上去了,為了調(diào)和量子力學(xué)與相對(duì)論的矛盾,又搞出一個(gè)量子場(chǎng)論,再七搞八搞又有了蟲(chóng)洞和羅森橋,最后把四維的時(shí)空彎曲成允許時(shí)間旅行的樣子,恨不得馬上造成那可怕的時(shí)間旅行機(jī)器。唯一阻止那些“愛(ài)因斯坦”們“瞎胡鬧”的就是因果關(guān)系,因?yàn)榘职志褪前职?,兒子就是兒子。那么大?shù)據(jù)會(huì)不會(huì)通過(guò)正視混雜性,放棄因果關(guān)系最后反而搞出時(shí)間機(jī)器,讓爸爸不再是爸爸,兒子不再是兒子了呢?

      其二:人和機(jī)器的根本區(qū)別在于人有邏輯思維而機(jī)器沒(méi)有。《大數(shù)據(jù)時(shí)代》也擔(dān)心“最后做出決策的將是機(jī)器而不是人”。如果真的那一天因?yàn)榉艞夁壿嬎季S而出現(xiàn)科幻電影上描述的機(jī)器主宰世界消滅人類(lèi)的結(jié)果,那我還不如現(xiàn)在就趁早跳樓。

      還好我知道自己對(duì)什么統(tǒng)計(jì)學(xué)、量子力學(xué)、邏輯學(xué)和大數(shù)據(jù)來(lái)說(shuō)都是門(mén)外漢,也許上面一大篇都是在胡說(shuō)八道,所謂的擔(dān)心根本不存在。但問(wèn)題出現(xiàn)了,還是解決的好,不然沒(méi)法睡著覺(jué)。自己解決不了就只能依靠專(zhuān)家來(lái)指點(diǎn)迷津。

      所以想向《大數(shù)據(jù)時(shí)代》的作者提一個(gè)合理化建議:把這本書(shū)繼續(xù)寫(xiě)下去,至少加一個(gè)第四部分——大數(shù)據(jù)時(shí)代的邏輯思維。

      合纖部車(chē)民

      2013年11月10日

      第四篇:學(xué)習(xí)《大數(shù)據(jù)時(shí)代》讀書(shū)心得

      讀《大數(shù)據(jù)時(shí)代》心得體會(huì)

      根據(jù)公司《關(guān)于下發(fā)中國(guó)共產(chǎn)黨員全年學(xué)習(xí)計(jì)劃的通知》組織分公司全體黨員個(gè)人學(xué)習(xí)《大數(shù)據(jù)時(shí)代》,讀了《大數(shù)據(jù)時(shí)代》后,感覺(jué)到一個(gè)大變革的時(shí)代將要來(lái)臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結(jié)”或顛覆一些傳統(tǒng)上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強(qiáng)烈震撼,不禁戰(zhàn)栗起來(lái)。

      “在小數(shù)據(jù)時(shí)代,我們會(huì)假象世界是怎樣運(yùn)作的,然后通過(guò)收集和分析數(shù)據(jù)來(lái)驗(yàn)證這種假想?!薄半S著由假想時(shí)代到數(shù)據(jù)時(shí)代的過(guò)渡,我們也很可能認(rèn)為我們不在需要理論了?!睍?shū)中幾乎肯定要顛覆統(tǒng)計(jì)學(xué)的理論和方法,也試圖通過(guò)引用《連線》雜志主編安德森的話“量子物理學(xué)的理論已經(jīng)脫離實(shí)際”來(lái)“終結(jié)”量子力學(xué)。對(duì)此我很高興,因?yàn)榻y(tǒng)計(jì)學(xué)和量子力學(xué)都是我在大學(xué)學(xué)習(xí)時(shí)學(xué)到抽筋都不能及格的課目。但這兩個(gè)理論實(shí)在太大,太權(quán)威,太基本了,我想我不可能靠一本書(shū)就能擺脫這兩個(gè)讓我頭疼一輩子的東西。作者其實(shí)也不敢旗幟鮮明地提出要顛覆它們的論點(diǎn),畢竟還是在前面加上了“很可能認(rèn)為”這樣的保護(hù)傘。

      近幾十年,我們總是在遇到各種各樣的新思維。在新思維面前我們首先應(yīng)該做到的就是要破和立,要改變自己的傳統(tǒng),跟上時(shí)代的腳步。即使腦子還跟不上,嘴巴上也必須跟上,否則可能會(huì)被扣上思想僵化甚至阻礙世界發(fā)展的大帽子。既然大數(shù)據(jù)是“通往未來(lái)的必然改變”,那我就必須“不受限于傳統(tǒng)的思維模式和特定領(lǐng)域里隱含的固有偏見(jiàn)”,跟作者一起先把統(tǒng)計(jì)學(xué)和量子力學(xué)否定掉再說(shuō)。反正我也不喜歡、也學(xué)不會(huì)它們。

      當(dāng)我們?nèi)祟?lèi)的數(shù)據(jù)收集和處理能力達(dá)到拍字節(jié)甚至更大之后,我們可以把樣本變成全部,再加上有能力正視混雜性而忽視精確性后,似乎真的可以拋棄以抽樣調(diào)查為基礎(chǔ)的統(tǒng)計(jì)學(xué)了。但是由統(tǒng)計(jì)學(xué)和量子力學(xué)以及其他很多“我們也很可能認(rèn)為我們不再需要的”理論上溯,它們幾乎都基于一個(gè)共同的基礎(chǔ)——邏輯。要是不小心把邏輯或者邏輯思維或者邏輯推理一起給“不再需要”的話,就讓我很擔(dān)心了!

      《大數(shù)據(jù)時(shí)代》第16頁(yè)“大數(shù)據(jù)的核心就是預(yù)測(cè)”。邏輯是——描述時(shí)空信息“類(lèi)”與“類(lèi)”之間長(zhǎng)時(shí)間有效不變的先后變化關(guān)系規(guī)則。兩者似乎是做同一件事??纱髷?shù)據(jù)要的“不是因果關(guān)系,而是相關(guān)關(guān)系”,“知道是什么就夠了,沒(méi)必要知道為什么”,而邏輯學(xué)四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明確規(guī)定”任何事物都有其存在的充足理由。且邏輯推理三部分——?dú)w納邏輯、溯因邏輯和演繹邏輯都是基于因果關(guān)系。兩者好像又是對(duì)立的。在同一件事上兩種方法對(duì)立,應(yīng)該只有一個(gè)結(jié)果,就是要否定掉其中之一。這就是讓我很擔(dān)心的原因。可我卻不能拭目以待,像旁觀者一樣等著哪一個(gè)“脫穎而出”,因?yàn)槲疑硖幤渲?。?wèn)題不解決,我就沒(méi)法思考和工作,自然就沒(méi)法活了!

      更何況還有兩個(gè)更可怕的事情。

      其一:量子力學(xué)搞了一百多年,為了處理好混雜性問(wèn)題,把質(zhì)量和速度結(jié)合到能量上去了,為了調(diào)和量子力學(xué)與相對(duì)論的矛盾,又搞出一個(gè)量子場(chǎng)論,再七搞八搞又有了蟲(chóng)洞和羅森橋,最后把四維的時(shí)空彎曲成允許時(shí)間旅行的樣子,恨不得馬上造成那可怕的時(shí)間旅行機(jī)器。唯一阻止那些“愛(ài)因斯坦”們“瞎胡鬧”的就是因果關(guān)系,因?yàn)榘职志褪前职?,兒子就是兒子。那么大?shù)據(jù)會(huì)不會(huì)通過(guò)正視混雜性,放棄因果關(guān)系最后反而搞出時(shí)間機(jī)器,讓爸爸不再是爸爸,兒子不再是兒子了呢?

      其二:人和機(jī)器的根本區(qū)別在于人有邏輯思維而機(jī)器沒(méi)有?!洞髷?shù)據(jù)時(shí)代》也擔(dān)心“最后做出決策的將是機(jī)器而不是人”。如果真的那一天因?yàn)榉艞夁壿嬎季S而出現(xiàn)科幻電影上描述的機(jī)器主宰世界消滅人類(lèi)的結(jié)果,那我還不如現(xiàn)在就趁早跳樓。

      還好我知道自己對(duì)什么統(tǒng)計(jì)學(xué)、量子力學(xué)、邏輯學(xué)和大數(shù)據(jù)來(lái)說(shuō)都是門(mén)外漢,也許上面一大篇都是在胡說(shuō)八道,所謂的擔(dān)心根本不存在。但問(wèn)題出現(xiàn)了,還是解決的好,不然沒(méi)法睡著覺(jué)。自己解決不了就只能依靠專(zhuān)家來(lái)指點(diǎn)迷津。

      第五篇:大數(shù)據(jù)時(shí)代讀書(shū)報(bào)告

      這本書(shū)里主要介紹的是大數(shù)據(jù)在現(xiàn)代商業(yè)運(yùn)作上的應(yīng)用,以及它對(duì)現(xiàn)代商業(yè)運(yùn)作的影響?!?大數(shù)據(jù)時(shí)代》這本書(shū)的結(jié)構(gòu)框架遵從了學(xué)術(shù)性書(shū)籍的普遍方式。也既,從現(xiàn)象入手,繼而通過(guò)對(duì)現(xiàn)象的解剖提出對(duì)這一現(xiàn)象的解釋。然后在通過(guò)解釋在對(duì)未來(lái)進(jìn)行預(yù)測(cè),并對(duì)未來(lái)可能出現(xiàn)的問(wèn)題提出自己看法與對(duì)策。

      下面來(lái)重點(diǎn)介紹《大數(shù)據(jù)時(shí)代》這本書(shū)的主要內(nèi)容。

      《大數(shù)據(jù)時(shí)代》開(kāi)篇就講了google通過(guò)人們?cè)谒阉饕嫔纤阉麝P(guān)鍵字留下的數(shù)據(jù)提前成功的預(yù)測(cè)了2009年美國(guó)的h1n1的爆發(fā)地與傳播方向以及可能的潛在患者的事情。google的預(yù)測(cè)比政府提前將近一個(gè)月,相比之下政府只能夠在流感爆發(fā)一兩個(gè)周之后才可以弄到相關(guān)的數(shù)據(jù)。同時(shí)google的預(yù)測(cè)與政府?dāng)?shù)據(jù)的相關(guān)性高達(dá)97%,這也就意味著google預(yù)測(cè)數(shù)據(jù)的置信區(qū)間為3%,這個(gè)數(shù)字遠(yuǎn)遠(yuǎn)小于傳統(tǒng)統(tǒng)計(jì)學(xué)上的常規(guī)置信區(qū)間5%!而這個(gè)數(shù)字就是大數(shù)據(jù)時(shí)代預(yù)測(cè)結(jié)果的相對(duì)準(zhǔn)確性與事件的可預(yù)測(cè)性的最好證明!通過(guò)這一事以及其他的案例,維克托提出了在大數(shù)據(jù)時(shí)代“樣本=總體”的思想。我們都知道當(dāng)樣本無(wú)限趨近于總體的時(shí)候,通過(guò)計(jì)算得到的描述性數(shù)據(jù)將無(wú)限的趨近于事件本身的性質(zhì)。而之前采取的“樣本<總體”的做法很大程度上無(wú)法做到更進(jìn)一步的描述事物,因?yàn)橹暗臅r(shí)代數(shù)據(jù)的獲取與存儲(chǔ)處理本身有很大的難度只導(dǎo)致人們采取抽樣的方式來(lái)測(cè)量事物。而互聯(lián)網(wǎng)終端與計(jì)算機(jī)的出現(xiàn)使數(shù)據(jù)的獲取、存儲(chǔ)與處理難度大大降低,因而相對(duì)準(zhǔn)確性更高的“樣本=總體”的測(cè)算方式將成為大數(shù)據(jù)時(shí)代的主流,同時(shí)大數(shù)據(jù)時(shí)代本身也是建立在大批量數(shù)據(jù)的存儲(chǔ)與處理的基礎(chǔ)之上的。

      接下來(lái),維克多又通過(guò)了ibm追求高精確性的電腦翻譯計(jì)劃的失敗與google只是將所有出現(xiàn)過(guò)的相應(yīng)的文字語(yǔ)句掃描并儲(chǔ)存在詞庫(kù)中,所以無(wú)論需要翻譯什么,只要有聯(lián)系google詞庫(kù)就會(huì)出現(xiàn)翻譯,雖然有的時(shí)候的翻譯很無(wú)厘頭,但是大多數(shù)時(shí)候還是正確的,所以google的電腦翻譯的計(jì)劃的成功,表明大數(shù)據(jù)時(shí)代對(duì)準(zhǔn)確性的追求并不是特別明顯,但是相反大數(shù)據(jù)時(shí)代是建立在大數(shù)據(jù)的基礎(chǔ)住上的,所以大數(shù)據(jù)時(shí)代追求的是全方位覆蓋的數(shù)字測(cè)度而不管其準(zhǔn)確性到底有多高,因?yàn)榇罅康臄?shù)據(jù)會(huì)湮埋少數(shù)有問(wèn)題的數(shù)據(jù)所帶來(lái)的影響。同時(shí)大量的數(shù)據(jù)也會(huì)無(wú)限的逼近事物的原貌。

      之后,維克托又預(yù)測(cè)了一個(gè)在大數(shù)據(jù)時(shí)代催生的重要職業(yè)——數(shù)據(jù)科學(xué)家,這是一群數(shù)學(xué)家、統(tǒng)計(jì)學(xué)與編程家的綜合體,這一群人將能夠從獲取的數(shù)據(jù)中得到任何他們想要的結(jié)果。換言之,只要數(shù)據(jù)充足我們的一切外在的與內(nèi)在的我們不想讓他人知道的東西都見(jiàn)會(huì)在這一群家伙的面前展現(xiàn)得淋漓盡致。所以為了避免個(gè)人隱私在大數(shù)據(jù)時(shí)代被這一群人利用,維克托建議將這一群人分為兩部分,一部分使用數(shù)據(jù)為商業(yè)部門(mén)服務(wù),而另一群人則負(fù)責(zé)審查這一些人是否合法的獲得與應(yīng)用數(shù)據(jù),是否侵犯了個(gè)人隱私。無(wú)論如何,大數(shù)據(jù)時(shí)代將會(huì)到來(lái),不管我們接受還是不接受!而且這兩年,大數(shù)據(jù)這個(gè)詞突然變得很火,不僅出現(xiàn)在阿里巴巴、谷歌等互聯(lián)網(wǎng)公司的戰(zhàn)略規(guī)劃中,同時(shí)在我國(guó)國(guó)務(wù)院和其他國(guó)家的政府報(bào)告中多次提及,無(wú)疑成為當(dāng)今互聯(lián)網(wǎng)世界中的新寵兒。我對(duì)大數(shù)據(jù)一直好奇已久,閱讀了很多資料仍不得其解,直到讀完《大數(shù)據(jù)時(shí)代》才有了粗略的認(rèn)識(shí)。

      我側(cè)重于從第一部分中的這三個(gè)觀點(diǎn)談?wù)勛约旱目捶?,這三個(gè)觀點(diǎn)可以說(shuō)是哲學(xué)上說(shuō)的世界觀,這三個(gè)觀點(diǎn)可以說(shuō)是哲學(xué)上說(shuō)的世界觀,因?yàn)槭澜缬^決定方法論,所以這三個(gè)觀點(diǎn)對(duì)傳統(tǒng)看法的顛覆,就會(huì)導(dǎo)致各種變革的發(fā)生。首先是第一個(gè),作者認(rèn)為在抽樣研究時(shí)期,由于研究條件的欠缺,只能以少量的數(shù)據(jù)獲取最大的信息,而在大數(shù)據(jù)時(shí)代,我們可以獲得海量的數(shù)據(jù),抽樣自然就失去它的意義了。放棄了隨機(jī)分析法這種捷徑,采用所有的數(shù)據(jù)。作者用大數(shù)據(jù)與喬布斯的癌癥治療例子說(shuō)明了使用全部數(shù)據(jù)而非樣本的意義,列舉了日本“相撲”等來(lái)證明使用全體數(shù)據(jù)的重要性。這個(gè)觀點(diǎn)足以這個(gè)觀點(diǎn)足以引起統(tǒng)計(jì)學(xué)乃至社會(huì)文明的變革,因?yàn)榻y(tǒng)計(jì)抽樣和幾何學(xué)定理、萬(wàn)有引力一樣被看做文明得以建立牢固的基石。我對(duì)這個(gè)觀點(diǎn)還是比較認(rèn)同的,如果真能收集到整體的數(shù)據(jù)而且分析數(shù)據(jù)的工具也足夠先進(jìn),自然是全體數(shù)據(jù)研究得出的結(jié)果更令人信服。但是這個(gè)觀點(diǎn)也過(guò)于絕對(duì),就算是在大數(shù)據(jù)時(shí)代要想收集到全體數(shù)據(jù)還是不太可能實(shí)現(xiàn)的,因?yàn)槭占w數(shù)據(jù)要付出的代價(jià)有時(shí)會(huì)很大。比如說(shuō),你要檢測(cè)食品中致癌物質(zhì)是否超標(biāo),你不可能每一件食品你都檢測(cè)一遍吧。

      第二,要效率不要絕對(duì)的精確。作者說(shuō),執(zhí)迷于精確性是信息缺乏時(shí)代和模擬時(shí)代的產(chǎn)物,只有5%的數(shù)據(jù)是結(jié)構(gòu)化且能適用于傳統(tǒng)數(shù)據(jù)庫(kù)的。如果不接受混亂,剩下95%的非結(jié)構(gòu)化數(shù)據(jù)都無(wú)法被利用。作者是基于數(shù)據(jù)不可能百分之百正確的考慮而做出這樣的判斷的,如果采用小數(shù)據(jù)一個(gè)數(shù)據(jù)的錯(cuò)誤就會(huì)導(dǎo)致結(jié)果的誤差很大,但是如果數(shù)據(jù)足夠多、數(shù)據(jù)足夠雜那得出的結(jié)果就越靠近正確答案。大數(shù)據(jù)時(shí)代要求我們重新審視精確性的優(yōu)劣,甚至還說(shuō)到大數(shù)據(jù)不僅讓我們不再期待精確性,也讓我們無(wú)法實(shí)現(xiàn)精確性。谷歌翻譯的成功很好地證明了這一點(diǎn),谷歌的翻譯系統(tǒng)不像candide那樣精確地翻譯每一句話,它谷歌翻譯之所以?xún)?yōu)于ibm的

      candide系統(tǒng)并不是因?yàn)樗鼡碛懈玫乃惴C(jī)制,和微軟的班科和布里爾一樣,谷歌翻譯增加了各種各樣的數(shù)據(jù),并且接受了有錯(cuò)誤的數(shù)據(jù)。第三個(gè)觀點(diǎn),不是因果性,而是相關(guān)性,這是這本書(shū)中爭(zhēng)議最大的一個(gè)觀點(diǎn),不僅是讀者,就算是本書(shū)的譯者也在序言中明確地說(shuō)到他不認(rèn)同“相關(guān)關(guān)系比因果關(guān)系更重要”的觀點(diǎn)。作者覺(jué)得相關(guān)關(guān)系對(duì)于預(yù)測(cè)一些事情已經(jīng)足夠了,不用花大力氣去研究他們的因果關(guān)系。作者用林登的亞馬遜推薦系統(tǒng)的成功,證實(shí)了大數(shù)據(jù)在分析相關(guān)性方面的優(yōu)勢(shì)以及在銷(xiāo)售中獲得的成功。沃爾瑪也是充分利用并挖掘各類(lèi)數(shù)據(jù)信息的代表,從啤酒和尿布的案例,以及作者舉的有 關(guān)蛋撻和颶風(fēng)天氣的案例,都說(shuō)明了掌握了相關(guān)關(guān)系對(duì)于他們策略的幫助。一句話,知道是什么就夠了,不用知道為什么。很明顯作者所舉的例子都是屬于商業(yè)領(lǐng)域的,但是對(duì)于其他領(lǐng)域來(lái)說(shuō)這個(gè)觀點(diǎn)就值得商榷了。比如說(shuō),在科學(xué)研究領(lǐng)域,你需要知其然也需要知道其所以然,找到事件發(fā)生的原理。用文中的一個(gè)例子說(shuō)明,喬布斯測(cè)出整個(gè)基因圖譜來(lái)治療癌癥,但是你治療癌癥你必須知道癌癥發(fā)病的原理,知道哪一段基因?qū)е铝诉@種疾病,不可能只是說(shuō)收集各種數(shù)據(jù),然后利用其相關(guān)性來(lái)判斷哪里出現(xiàn)了問(wèn)題

      作者在書(shū)中把大數(shù)據(jù)說(shuō)的很厲害,在最后一部分分析大數(shù)據(jù)帶來(lái)無(wú)數(shù)好處的同時(shí)帶來(lái)的不良影響以及如何面對(duì)這些影響。用麥克納馬拉的例子來(lái)說(shuō)明對(duì)數(shù)據(jù)過(guò)度依賴(lài)所帶來(lái)的后果。也用《少數(shù)派的報(bào)告》這部電影來(lái)說(shuō)明如果癡迷于數(shù)據(jù)會(huì)導(dǎo)致我們將生活在一個(gè)沒(méi)有獨(dú)立選擇和自由意志的社會(huì),如果一切變?yōu)楝F(xiàn)實(shí),我們將被禁錮在大數(shù)據(jù)的可能性之中。所以書(shū)中提出了幾種解決方法,一種是使用數(shù)據(jù)時(shí)征詢(xún)數(shù)據(jù)所有個(gè)人的知曉和授權(quán)。第二個(gè)技術(shù)途徑就是匿名化。毫無(wú)疑問(wèn),大數(shù)據(jù)將會(huì)給社會(huì)管理帶來(lái)巨大的變革。

      大數(shù)據(jù)給人類(lèi)社會(huì)的方方面面帶來(lái)了巨大的變革,這是社會(huì)發(fā)展的潮流,不可逆轉(zhuǎn),我們只有順應(yīng)這種潮流,在思想上和技能上做好準(zhǔn)備才能成為時(shí)代的弄潮兒。對(duì)于一家公司或一個(gè)國(guó)家,要從根本上改變思維和觀念,盡早適應(yīng)這種潮流。

      最后,附上一段來(lái)自原著的結(jié)語(yǔ):

      大數(shù)據(jù)并不是一個(gè)充斥著算法和機(jī)器的冰冷世界,人類(lèi)的作用依然無(wú)法被完全替代。大數(shù)據(jù)為我們提供的不是最終答案,只是參考答案,幫助是暫時(shí)的,而更好的方法和答案還在不久的未來(lái)。篇二:《大數(shù)據(jù)時(shí)代》讀書(shū)報(bào)告

      讀書(shū)報(bào)告

      ——讀《大數(shù)據(jù)時(shí)代》

      坦白地說(shuō),這是我第一本看了睡不著的書(shū),我還記得第一次閱讀時(shí)的興奮和激動(dòng),就像一場(chǎng)頭腦風(fēng)暴。書(shū)里的事例是那么的鮮活與生動(dòng),完全顛覆我的思維方式,打破了我大腦中解決問(wèn)題原有的枷鎖。這本書(shū)讓我明白了太多~~~ 它讓我明白生活必須要主動(dòng)。有些人碰到了不公就自認(rèn)倒霉,能干一點(diǎn)的可能還會(huì)去討個(gè)說(shuō)法,但并沒(méi)有解決實(shí)際問(wèn)題,這一次可能挽回了那么一點(diǎn)點(diǎn)的損失,但下次遇到了仍是如此,無(wú)限循環(huán)。當(dāng)你絞盡腦汁為了節(jié)約成本而提前一個(gè)月去購(gòu)買(mǎi)一張你自以為廉價(jià)的飛機(jī)票,回頭卻發(fā)現(xiàn),比那些只提前一天購(gòu)買(mǎi)的人所付的錢(qián)還要高出很多時(shí),不知你會(huì)怎么想?是被動(dòng)的接受還是想方法讓現(xiàn)實(shí)變得更美好? 它讓我更好地去理解現(xiàn)實(shí)生活的很多情況?,F(xiàn)在才理解,為什么網(wǎng)絡(luò)上有這么多驗(yàn)證碼的存在,為什么社交網(wǎng)要用實(shí)名制注冊(cè),為什么有這么多的“我猜你喜歡”~~~ 雖然我很喜歡那些“黑匣子”,會(huì)讓我感覺(jué)很神奇,但當(dāng)我真正理解的他的原理時(shí),其實(shí)更讓我興奮不已。原來(lái)谷歌翻譯背后是這樣操作的,原來(lái)那些每天時(shí)不時(shí)闖進(jìn)我們眼球的廣告并非偶然,原來(lái)預(yù)測(cè)流感不需要疾控中心而是網(wǎng)絡(luò)詞條,原來(lái)電影在開(kāi)播前就已經(jīng)知道了收視率和票房~~~ 當(dāng)然以上這些相當(dāng)抓人眼球,但這只是大數(shù)據(jù)的表面,其真正的價(jià)值遠(yuǎn)不僅如此。人類(lèi)總是以為自己很強(qiáng)大,能控制一切,當(dāng)然最好還能預(yù)測(cè)未來(lái)。其實(shí)大數(shù)據(jù)真的可以做到,雖然不可能很精確。在我看來(lái)這樣更好,大致結(jié)果可以意料,這就夠了,如果發(fā)現(xiàn)結(jié)果不盡如人意,我們可以提前控制。當(dāng)然還會(huì)有我們意想不到的情況發(fā)生,這樣會(huì)讓未來(lái)更充滿想象,更加充滿期待。

      它讓我懂得不能墨守成規(guī),也不能自以為是。大數(shù)據(jù)環(huán)境是那些微型企業(yè)發(fā)展的福地,它是行業(yè)競(jìng)爭(zhēng)重新洗牌的動(dòng)力源泉。在大數(shù)據(jù)面前,小公司不需要妄自菲薄,大的商業(yè)帝國(guó)也只有打氣十二分的精神才可能讓自己立于不敗之地。

      他讓我知道沒(méi)有做不得,只有想不到?,F(xiàn)在的賺取資本的方式已經(jīng)不再是單靠苦力就可以解決問(wèn)題的時(shí)代了,看見(jiàn)朋友圈里的那些做代購(gòu)的,都在自我催眠“不要看我們現(xiàn)在是微商~~~微商將來(lái)前途無(wú)量~~~·”我一直都抱著看看不說(shuō)話的心態(tài),難免也會(huì)哂笑,真的不知道他們和菜場(chǎng)賣(mài)菜的有什么本質(zhì)區(qū)別~~~現(xiàn)在是一個(gè)依靠知識(shí)科技來(lái)富國(guó)強(qiáng)兵的時(shí)代了,真正的優(yōu)勢(shì)來(lái)源于你提前想到了別人還沒(méi)去想的,提早完成了別人還沒(méi)有籌備的計(jì)劃。

      他讓我學(xué)會(huì)世界上沒(méi)有光桿司令,我們必須學(xué)會(huì)合作。一個(gè)人的能力是有限的,一個(gè)人的時(shí)間也是有限的,同樣公司,國(guó)家都是一樣的。我們知道谷歌,亞馬遜,facebook以及中國(guó)的阿里巴巴,百度,新浪這些企業(yè)都很強(qiáng)大,可是他們?nèi)匀辉诓粩嗍召?gòu)合并整合其他一些小的公司,為的是引用他們的科技技術(shù)來(lái)強(qiáng)大自己的事業(yè)版圖。

      它還教會(huì)我在機(jī)會(huì)面前必須要眼疾手快。在你還在猶豫不決或是自我陶醉的時(shí)候,你的對(duì)手已經(jīng)用一個(gè)非常低廉的價(jià)格得到了他想要翻身的王牌,當(dāng)你發(fā)現(xiàn)時(shí),要么花大血本去換取一張相似的王牌,要與他赤身搏斗。大部分情況下那些聰明的人往往會(huì)選擇前者,因?yàn)樗麄冎缹幙蔀樽约含F(xiàn)在的失誤埋單也不會(huì)讓自己靠近萬(wàn)丈深淵。因?yàn)槿魡适Я酥鲃?dòng)權(quán),那么很有可能導(dǎo)致的結(jié)果就是,那個(gè)原來(lái)看起來(lái)微不足道的“小木樁”卻扳倒了你這體積龐大的“大象”。

      說(shuō)了這么多大數(shù)據(jù)給我的啟示,其實(shí)就是想突出大數(shù)據(jù)背后的那種神奇的力量。在近代我們似乎與每一樣新的科技都失之交臂,但是這一次我們似乎還有機(jī)會(huì)和時(shí)代同步伐,甚至如果我們足夠重視,可能還會(huì)走在時(shí)代的前沿。雖然我們現(xiàn)在誰(shuí)都沒(méi)有把握中國(guó)到底會(huì)利用大數(shù)據(jù)到什么程度,但已經(jīng)有好多像周濤一樣的有志之士看好中國(guó)在利用大數(shù)據(jù)上的實(shí)力,并且付諸了他們的努力。他們一直都堅(jiān)信以前的落后僅僅是時(shí)間上的后知后覺(jué),他們?cè)谶@一次想

      要做到與世界同步,和歐美同步發(fā)行此書(shū),在最早一刻就向大家推廣大數(shù)據(jù)這一新名詞,向大家灌輸著大數(shù)據(jù)的思維。對(duì)此,我也很慶幸,在恰當(dāng)?shù)臅r(shí)間點(diǎn)與大數(shù)據(jù)的偶遇。

      當(dāng)然,世界上沒(méi)有十全十美的東西,再好的發(fā)明總是有它的缺陷,大數(shù)據(jù)也不會(huì)例外。舍恩伯格這個(gè)對(duì)大數(shù)據(jù)最有權(quán)威發(fā)言權(quán)的人,既然有能力將大數(shù)據(jù)的好處講得淋漓盡致,毫無(wú)疑問(wèn)自然也是最清楚大數(shù)據(jù)危險(xiǎn)的人。我很尊敬他的嚴(yán)謹(jǐn)和坦誠(chéng),他在細(xì)致入微地解釋大數(shù)據(jù)革命性?xún)?yōu)勢(shì)的同時(shí),毫無(wú)修飾地點(diǎn)明了大數(shù)據(jù)的劣根性。他很準(zhǔn)確地說(shuō)明了如果我們?yōu)E用或誤用數(shù)據(jù),我們將會(huì)受到毀滅性的打擊,后果將會(huì)如何不堪設(shè)想,并且這篇幅一點(diǎn)都不敷衍。作者非常專(zhuān)業(yè),他并沒(méi)有像某些專(zhuān)家一樣,一味地鼓吹自己的“一家之言”。而是在我們頭腦發(fā)熱,一哄而上之前,就給我們非常而且深刻的警醒。這也正是大數(shù)據(jù)思維的其中之一:饋前控制。

      讀完這本書(shū)以后,我有的確一點(diǎn)蠢蠢欲動(dòng),因?yàn)樗屛矣X(jué)得大數(shù)據(jù)并沒(méi)有像想象的那么遙不可及。書(shū)中說(shuō),會(huì)好好利用大數(shù)據(jù)的有三種人:第一種是擁有龐大數(shù)據(jù)庫(kù)的政府或者商業(yè)機(jī)構(gòu),他們之前只是不知道那些塵封已久的數(shù)據(jù)還可以創(chuàng)造巨大的價(jià)值。第二種是利用技術(shù)手段,讓數(shù)據(jù)發(fā)揮它獨(dú)特功能,從而幫他們解決實(shí)際問(wèn)題的數(shù)據(jù)分析學(xué)家,統(tǒng)計(jì)師,精算師和其他一些有關(guān)于處理數(shù)據(jù)的相關(guān)人員,他們非常了解數(shù)據(jù)的狀態(tài),結(jié)構(gòu)和特征。的確這兩類(lèi)人實(shí)力雄厚,前者擁有數(shù)據(jù)本身,而后者擁有技術(shù)。但他們有著同樣的短板,那就是他們沒(méi)有更為創(chuàng)新,靈動(dòng)的視野,他們很難或者說(shuō)沒(méi)有更多的時(shí)間去發(fā)現(xiàn)那些數(shù)據(jù)的真正力量。因?yàn)樗麄冇刑嗟乃季S定式,但種種利用大數(shù)據(jù)的成功事例表明,每次數(shù)據(jù)創(chuàng)造的奇跡總在那么的偶然和不經(jīng)意之間。而這正是我們第三種人的長(zhǎng)處,我們沒(méi)有思維定式,更有閑暇的時(shí)間來(lái)感受生活,激發(fā)靈感。篇三:大數(shù)據(jù)時(shí)代讀書(shū)筆記

      大數(shù)據(jù)時(shí)代——讀書(shū)筆記

      一、引論

      1.大數(shù)據(jù)時(shí)代的三個(gè)轉(zhuǎn)變: 1.可以分析更多的數(shù)據(jù),處理和某個(gè)現(xiàn)象相關(guān)的所有數(shù)據(jù),而不是隨機(jī)采樣 2.不熱衷于精確度

      3.不熱衷與尋找因果關(guān)系 2.習(xí)慣:用來(lái)決策的信息必須是少量而精確的。實(shí)際:數(shù)據(jù)量變大,數(shù)據(jù)處理速度變快,數(shù)據(jù)不在精確

      3.危險(xiǎn):不是隱私的泄露而是未來(lái)行動(dòng)的預(yù)判

      二、大數(shù)據(jù)時(shí)代的思維變革 1.原因:沒(méi)有意識(shí)到處理大規(guī)模數(shù)據(jù)的能力,假設(shè)信息匱乏,發(fā)展一些使用少量信息的技

      術(shù)(隨機(jī)采樣)

      1.1086年 末日審判書(shū) 英國(guó)對(duì)人的記載 2.約翰·格朗特:統(tǒng)計(jì)學(xué),采樣分析精確性隨著采樣隨機(jī)性上升而大幅上升,與樣本數(shù)

      量關(guān)系不大

      3.1890年,穿孔卡片制表機(jī),人口普查 4.隨機(jī)采樣有固有的缺陷 1.采樣過(guò)程中存在偏差 2.采樣不適合考察子類(lèi)別

      3.只能得出實(shí)現(xiàn)設(shè)計(jì)好的問(wèn)題的結(jié)果 4.忽視了細(xì)節(jié)考察

      2.全數(shù)據(jù)模式:樣本=總體 1.通過(guò)異常量判斷信用卡詐騙 2.大數(shù)據(jù)分析:不用隨機(jī)抽樣,而是采用所有數(shù)據(jù)。不是絕對(duì)意義而是相對(duì)意義。

      (xroom信用卡詐騙,日本相撲比賽)3.多樣性的價(jià)值(社區(qū)外聯(lián)系很多》社區(qū)內(nèi)聯(lián)系很多)3.混雜性而非精確性 1.葡萄樹(shù)溫度測(cè)量:數(shù)據(jù)變多,雖然可能有錯(cuò)誤數(shù)據(jù),但總體而言會(huì)更加精確。2.包容錯(cuò)誤有更大好處

      3.word語(yǔ)法檢查:語(yǔ)料庫(kù)》算法發(fā)展 4.google翻譯:讓計(jì)算機(jī)自己估算對(duì)應(yīng)關(guān)系,尋找成千上萬(wàn)對(duì)譯

      結(jié)論:大數(shù)據(jù)的簡(jiǎn)單算法好過(guò)小數(shù)據(jù)的復(fù)雜算法 5.大數(shù)據(jù)讓我們不執(zhí)著于也無(wú)法執(zhí)著于精確 6.mit的通貨緊縮軟件:即時(shí)的大數(shù)據(jù) 7.標(biāo)簽:不精確

      8.想要獲得大規(guī)模數(shù)據(jù)的好處,混亂是一種標(biāo)準(zhǔn)途經(jīng) 9.新的數(shù)據(jù)庫(kù):大部分?jǐn)?shù)據(jù)是非結(jié)構(gòu)化的,無(wú)法被利用 10.hadoop:與mapreduce系統(tǒng)相對(duì)的開(kāi)源式分布系統(tǒng),輸出結(jié)果不精確,但是非常快 結(jié)論:相比于依賴(lài)小數(shù)據(jù)和精確性的時(shí)代,大數(shù)據(jù)因?yàn)楦鼜?qiáng)調(diào)數(shù)據(jù)的完整性和混雜性,幫助我們進(jìn)一步接近事情的真相?!安糠帧焙汀贝_切“的吸引力是可以理解的。但是當(dāng)我們的視野局限在我們可以分析和確定的數(shù)據(jù)上時(shí),我們對(duì)世界的整體影響就會(huì)產(chǎn)生偏差和錯(cuò)誤。不僅失去了盡力收集一切數(shù)據(jù)和活力,也失去了從不同角度觀察時(shí)間的權(quán)利。

      三、不是因果是相關(guān) 1.知道是什么就夠了,不需要知道為什么。1.亞馬遜放棄書(shū)評(píng)組,使用大數(shù)據(jù)預(yù)測(cè)人們的未來(lái)購(gòu)書(shū)需求 2.2.在小數(shù)據(jù)世界,相關(guān)關(guān)系有用,但是大數(shù)據(jù)背景,相關(guān)關(guān)系大放異彩。通過(guò)找關(guān)聯(lián) 物,相關(guān)關(guān)系可以幫助我們捕捉現(xiàn)在和預(yù)測(cè)未來(lái) 1.a和b經(jīng)常一起發(fā)生,那么a發(fā)生時(shí)可以預(yù)測(cè)b發(fā)生 2.例子:沃爾瑪把颶風(fēng)用具和蛋撻放在一起 3.過(guò)時(shí)的尋找關(guān)聯(lián)物的方法 a)原因:數(shù)據(jù)少且收集花時(shí)間 b)在建立,應(yīng)用假想和選擇關(guān)聯(lián)物時(shí)容易犯錯(cuò)誤 c)結(jié)論:我們不需要人工選擇關(guān)聯(lián)物 3.大數(shù)據(jù)的相關(guān)分析法更準(zhǔn)確,更快 1.例子:fico我們知道你明天會(huì)做什么 2.伊百麗:根據(jù)個(gè)人信用卡交易記錄預(yù)測(cè)個(gè)人收入,防止逃稅 3.aviva:根據(jù)生活方式數(shù)據(jù)預(yù)測(cè)疾病 4.美國(guó)零售商target:通過(guò)購(gòu)買(mǎi)習(xí)慣預(yù)測(cè)是否懷孕 4.通過(guò)找出新種類(lèi)數(shù)據(jù)的相互聯(lián)系解決日常需要:找到關(guān)聯(lián)物并監(jiān)控,我們可以預(yù)知未來(lái)

      1.例子:ups與汽車(chē)修理預(yù)測(cè) 2.新生兒健康監(jiān)測(cè):肉眼看不到,但是計(jì)算機(jī)能看到 5.當(dāng)收集分析和儲(chǔ)存數(shù)據(jù)的成本較高時(shí),應(yīng)當(dāng)適當(dāng)丟棄一些數(shù)據(jù) 6.數(shù)據(jù)的非線性關(guān)系 1.幸福的非線性關(guān)系 7.快速思維模式使人們偏向于用因果關(guān)系看待周?chē)囊磺?,因此?jīng)常對(duì)世界產(chǎn)生錯(cuò)誤認(rèn)識(shí)。這也使大腦為了避免辛苦思考而產(chǎn)生的捷徑。大數(shù)據(jù)會(huì)經(jīng)常被用來(lái)證明我們習(xí)慣的思維方式是錯(cuò)誤的。8.證明因果關(guān)系的實(shí)驗(yàn)開(kāi)銷(xiāo)大,難于操作;相關(guān)關(guān)系很有用,不僅是因?yàn)槟転槲覀兲峁┬碌囊暯?,而且提供的視角都很清晰。一旦我們考慮因果關(guān)系,這些視角會(huì)被蒙蔽。9.大數(shù)據(jù)并非是理論消亡的時(shí)代。

      四、一切皆可量化 1.莫里的信息交換計(jì)劃:總結(jié)所有船只的航海日志已獲得好的航線,為第一根大西洋電纜奠定基礎(chǔ)

      2.坐姿研究與汽車(chē)防盜系統(tǒng) 3.數(shù)據(jù)化

      1.把現(xiàn)象轉(zhuǎn)變成可指標(biāo)分析的量化形式的過(guò)程 2.計(jì)量和記錄促成了數(shù)據(jù): 1.阿拉伯?dāng)?shù)字 2.計(jì)數(shù)板 3.復(fù)式記賬法

      3.數(shù)字化與數(shù)據(jù)化的區(qū)別

      1.例子:google的數(shù)字圖書(shū)館:開(kāi)始使用掃描-》數(shù)字化,進(jìn)而光學(xué)識(shí)別-》數(shù)

      據(jù)化。google借此改進(jìn)自己的翻譯 2.文化組學(xué):定量分析揭示人類(lèi)行為 4.文字變成數(shù)據(jù):人可以閱讀,機(jī)器可以分析 5.方位變成數(shù)據(jù):需要一套標(biāo)準(zhǔn)的標(biāo)記系統(tǒng)和收集,記錄數(shù)據(jù)的工具。1. 始于古希臘

      2.1884年,國(guó)際子午線會(huì)議 3.1978年,全球定位系統(tǒng) 4.英國(guó)汽車(chē)保險(xiǎn)

      5. ups的最佳行車(chē)路線:減少左轉(zhuǎn) 6.收集用戶地理位置數(shù)據(jù),以便進(jìn)行忠誠(chéng)度計(jì)劃?;蛘呖梢灶A(yù)測(cè)交通情況 6.現(xiàn)實(shí)挖掘

      1.處理大量手機(jī)數(shù)據(jù),發(fā)現(xiàn)并預(yù)測(cè)人類(lèi)的行為。2.例子:預(yù)測(cè)流感隔離區(qū)域 3.例子:通過(guò)非洲預(yù)付費(fèi)用戶的位置信息和他們賬戶的資金,發(fā)現(xiàn)貧民窟是

      經(jīng)濟(jì)繁榮的跳板 7.溝通變成數(shù)據(jù)

      1.facebook:社交關(guān)系數(shù)據(jù)化

      號(hào)。新推特頻率可以預(yù)測(cè)電影票房

      可能性呈現(xiàn)正相關(guān) 8.萬(wàn)物數(shù)據(jù)化

      1.觸覺(jué)地板:適時(shí)開(kāi)關(guān)燈,確定身份,某人摔倒之后是否站起來(lái) 2.人體傳感器:監(jiān)控健康狀態(tài) 4.結(jié)論:世界的本質(zhì)是信息和數(shù)據(jù),大數(shù)據(jù)提供新視角。

      五、大數(shù)據(jù)的潛在價(jià)值 1.例子:captcha(驗(yàn)證碼,全自動(dòng)區(qū)分人類(lèi)和電腦的圖靈測(cè)試)與數(shù)據(jù)再利用。作者使用了新的驗(yàn)證碼recaptcha,人們從計(jì)算機(jī)光學(xué)字符識(shí)別程序無(wú)法識(shí)別的文本掃面項(xiàng)目中讀入單詞并輸出,知道他們都輸出正確后才確定(用來(lái)破譯數(shù)字化文本中不清楚的單詞)2.大數(shù)據(jù)時(shí)代,所有的數(shù)據(jù)都是有價(jià)值的。現(xiàn)在,我們能夠以較低成本獲取并存儲(chǔ)數(shù)據(jù)。數(shù)據(jù)的真實(shí)價(jià)值就像漂浮在海洋中的冰山,絕大部分隱藏在表面之下。3. 不同于物質(zhì)性的東西,數(shù)據(jù)的價(jià)值不會(huì)隨它的使用而減少,而且可不斷被處理。意味著數(shù)據(jù)的最終價(jià)值遠(yuǎn)遠(yuǎn)大于它的最初價(jià)值。在基本用途完成后,數(shù)據(jù)的價(jià)值仍然存在,數(shù)據(jù)的價(jià)值是其所有可能用途的總和。4.例子:ibm與電力汽車(chē)動(dòng)力系統(tǒng)的優(yōu)化預(yù)測(cè):大數(shù)據(jù)預(yù)測(cè)模型,甚至考慮天氣預(yù)報(bào) 5.數(shù)據(jù)再利用:

      1. 搜索關(guān)鍵詞,搜索結(jié)果預(yù)測(cè)夏天流行色 2.google保存語(yǔ)音翻譯記錄,開(kāi)發(fā)自己的語(yǔ)音識(shí)別技術(shù) 3.移動(dòng)運(yùn)營(yíng)商長(zhǎng)期使用大數(shù)據(jù)微調(diào)網(wǎng)絡(luò)性能 4.有些公司可能會(huì)收集到大量的數(shù)據(jù),但是他們并不急需使用,也不擅長(zhǎng)使用數(shù)據(jù),但是別的公司可以借此探尋數(shù)據(jù)的潛在價(jià)值 8.重組數(shù)據(jù) 1.例子:丹麥癌癥協(xié)會(huì)與手機(jī)致癌調(diào)查:使用所有的手機(jī)用戶信息和所有的中樞神經(jīng)系統(tǒng)腫瘤信息。

      隨著大數(shù)據(jù)的出現(xiàn),數(shù)據(jù)的總和比部分更有價(jià)值,當(dāng)我們將多個(gè)數(shù)據(jù)集的總和重組在一起,重組總和本身的價(jià)值也比單個(gè)總和更大 9.可拓展數(shù)據(jù) 1.google街景和gps采集,不僅將其用于基本用途,而且進(jìn)行了大量的二次利用。例如,對(duì)google自動(dòng)駕駛汽車(chē)的運(yùn)作 10.?dāng)?shù)據(jù)的折舊值

      1.隨著時(shí)間的推移,大多數(shù)數(shù)據(jù)都會(huì)失去一部分基礎(chǔ)用途,不應(yīng)用此破壞新數(shù)據(jù) 2.挑戰(zhàn):如何得知某些數(shù)據(jù)不再有價(jià)值 3.并非所有數(shù)據(jù)都會(huì)貶值。例子:google希望得到每年的同比數(shù)據(jù)

      結(jié)論:組織機(jī)構(gòu)應(yīng)收集盡可能多的使用數(shù)據(jù)并保存盡可能長(zhǎng)的時(shí)間。同時(shí)也應(yīng)該與第三方分享數(shù)據(jù)

      11.數(shù)據(jù)廢氣:用戶在線交互的副產(chǎn)品,包括瀏覽哪些頁(yè)面,停留多久,輸入信息等 1.數(shù)據(jù)再利用的方式很隱蔽 2.例子:google的拼寫(xiě)檢查:搜集每天處理的查詢(xún)中數(shù)據(jù)搜索框的錯(cuò)誤拼寫(xiě) 3.例子:google的過(guò)濾噪音技術(shù):如果用戶點(diǎn)擊搜索結(jié)果靠后的鏈接,說(shuō)明這個(gè)結(jié)果更加有相關(guān)性,google會(huì)把這個(gè)頁(yè)面的排名相應(yīng)提升。4.當(dāng)用戶指出了各種自動(dòng)化程序的錯(cuò)誤,實(shí)際上是訓(xùn)練了系統(tǒng) 5.例子:巴諾與數(shù)據(jù)快照,電子書(shū)閱讀器捕捉人們閱讀書(shū)籍的習(xí)慣 6.例子:coursera通過(guò)捕捉學(xué)生犯的錯(cuò)誤來(lái)提示未來(lái)犯錯(cuò)誤者

      結(jié)論:數(shù)據(jù)廢氣可以成為公司的巨大競(jìng)爭(zhēng)優(yōu)勢(shì),和對(duì)手的強(qiáng)大進(jìn)入堡壘 12.開(kāi)放數(shù)據(jù) 1.最大的數(shù)據(jù)收集者:政府,可以強(qiáng)迫人們提供信息,但是信息利用效率低下。最好允許私人運(yùn)營(yíng)部門(mén)和社會(huì)大眾訪問(wèn)

      2.例子:flyontime網(wǎng)站,通過(guò)開(kāi)放的數(shù)據(jù)分析航班延誤可能性。3.給數(shù)據(jù)估值:從數(shù)據(jù)持有人在價(jià)值提取上所采取的不同策略入手,將數(shù)據(jù)授權(quán)給第三方

      三、角色定位:數(shù)據(jù),技術(shù)與思維 2.思維轉(zhuǎn)變的重要性 3.三種大數(shù)據(jù)公司

      1.基于數(shù)據(jù)本身的公司:twitter 大數(shù)據(jù)最值錢(qián)的是他本身,所以應(yīng)該優(yōu)先考慮數(shù)據(jù)擁有者

      例子:機(jī)票預(yù)訂系統(tǒng)ita不直接使用數(shù)據(jù):擔(dān)心暴露利潤(rùn)

      例子:mastercard通過(guò)大數(shù)據(jù)預(yù)測(cè)客戶的消費(fèi)習(xí)慣 2.基于技能的公司:咨詢(xún)公司,技術(shù)供應(yīng)商或者分析公司:teradata 例子:埃森哲公司利用大數(shù)據(jù)檢測(cè)汽車(chē)零件并節(jié)省費(fèi)用

      例子:微軟分析公司利用大數(shù)據(jù)降低病人的再入院率 3.基于思維的公司:創(chuàng)新思維

      例子:flightcaster飛機(jī)晚點(diǎn)預(yù)測(cè)

      例子:prismatic分析新聞并排序 4.大數(shù)據(jù)先驅(qū)者一般有跨學(xué)科的知識(shí) 5.例子:google和amazon三者兼?zhèn)? 6.全新的數(shù)據(jù)中間商:從各個(gè)地方搜集數(shù)據(jù),提取有用的信息進(jìn)行利用,并不威脅數(shù)據(jù)擁有者的利益

      1.社會(huì)需要定向廣告

      例子:inrix:分析各種汽車(chē)制造者的數(shù)據(jù)和用戶的數(shù)據(jù),提供衛(wèi)星導(dǎo)航服務(wù)

      汽車(chē)制造商們本身數(shù)據(jù)量不夠,自身也沒(méi)有技術(shù)利用大數(shù)據(jù),也并不介意數(shù)據(jù)會(huì)被中間商利用。同時(shí)可以提供失業(yè)率等相關(guān)數(shù)據(jù)

      例子:quantcast:收集用戶訪問(wèn)信息來(lái)測(cè)評(píng)用戶年齡等,之后發(fā)定向廣告

      例子:hcci收集醫(yī)療保單,分析美國(guó)醫(yī)療費(fèi)用上漲是否合理

      結(jié)論:

      1.數(shù)據(jù)價(jià)值的轉(zhuǎn)移:從技術(shù)到數(shù)據(jù)本身和大數(shù)據(jù)思維 2.傳統(tǒng)商業(yè)模式顛覆:交易數(shù)據(jù)而不是交易技術(shù) 3.傳統(tǒng)專(zhuān)家的光芒會(huì)被統(tǒng)計(jì)和數(shù)據(jù)學(xué)家取代,因?yàn)楹笳咧魂P(guān)心數(shù)據(jù) 1.例子:谷歌翻譯團(tuán)隊(duì)的工程師都不會(huì)說(shuō)出翻譯的語(yǔ)言 2.真正的專(zhuān)家不會(huì)消亡,但是主導(dǎo)地位會(huì)改變 3.專(zhuān)業(yè)技能只適用于小數(shù)據(jù)時(shí)代,因?yàn)槟鞘切枰揽恐庇X(jué)和經(jīng)驗(yàn)指導(dǎo),但是

      遭遇海量數(shù)據(jù)時(shí),可以通過(guò)數(shù)據(jù)挖掘得到更多 4.數(shù)據(jù)和統(tǒng)計(jì)學(xué)知識(shí)將成為現(xiàn)代工廠的基礎(chǔ),人類(lèi)的價(jià)值體現(xiàn)在交流上,以進(jìn)行廣泛而深刻的傳播

      1.例子:交互式游戲,會(huì)根據(jù)用戶來(lái)改良,以數(shù)據(jù)為基礎(chǔ)運(yùn)作 5.大數(shù)據(jù)決定企業(yè)核心競(jìng)爭(zhēng)力 1.數(shù)據(jù)規(guī)模決定價(jià)值

      2.例子:勞斯萊斯通過(guò)大數(shù)據(jù)監(jiān)測(cè)引擎,預(yù)測(cè)可能出問(wèn)題的引擎 3.例子:蘋(píng)果進(jìn)軍手機(jī) 4.大數(shù)據(jù)為小公司帶來(lái)了機(jī)遇:能享受非固有資產(chǎn)規(guī)模的好處,低成本傳播創(chuàng)新結(jié)果,只需要?jiǎng)?chuàng)新思維

      5.大數(shù)據(jù)擁有者會(huì)想辦法增加數(shù)據(jù)存儲(chǔ)量 6.消費(fèi)者成為數(shù)據(jù)擁有者并與中間商交易 7.大數(shù)據(jù)對(duì)中等規(guī)模的公司幫助不大:既沒(méi)有靈活性也沒(méi)有規(guī)模效應(yīng) 6.大數(shù)據(jù)撼動(dòng)國(guó)家競(jìng)爭(zhēng)力:西方世界優(yōu)勢(shì)減少

      四、大數(shù)據(jù)時(shí)代的管理

      1.大數(shù)據(jù)會(huì)帶來(lái)很多危險(xiǎn),因?yàn)槠浜诵乃枷胧怯靡?guī)模劇增來(lái)改變現(xiàn)狀。2.濫用大數(shù)據(jù)的力量會(huì)傷害人身安全 3.大數(shù)據(jù)的二次利用顛覆了隱私保護(hù)法:無(wú)法征得個(gè)人同意 4.如果所有人的信息在數(shù)據(jù)庫(kù)里,有意識(shí)地避免就是此地?zé)o銀三百兩 5.匿名化:交叉檢驗(yàn)會(huì)檢驗(yàn)出來(lái) 6.大數(shù)據(jù)預(yù)測(cè):罪責(zé)判定基于對(duì)個(gè)人未來(lái)行為的預(yù)測(cè)。大數(shù)據(jù)可能會(huì)否定人的自由意志 7.數(shù)據(jù)有其局限性,數(shù)據(jù)的質(zhì)量可能會(huì)很差,有誤導(dǎo)性。8.卓越的才華并不依賴(lài)數(shù)據(jù):apple喬布斯的才能

      五、掌握大數(shù)據(jù) 1.個(gè)人隱私保護(hù):從個(gè)人許可到讓數(shù)據(jù)使用者承擔(dān)責(zé)任,因?yàn)閷⒇?zé)任從民眾轉(zhuǎn)移到數(shù)據(jù)使用者很有意義因?yàn)閿?shù)據(jù)使用者比其他人更明白他們想怎么樣使用數(shù)據(jù),也因?yàn)樗麄兪亲畲罄娅@得者:監(jiān)管機(jī)制可以決定不同種類(lèi)的個(gè)人數(shù)據(jù)必須刪除的時(shí)間 2.信息模糊處理

      3.個(gè)人應(yīng)該為他們的行動(dòng)而非傾向負(fù)責(zé) 4.打破大數(shù)據(jù)的黑盒子:大數(shù)據(jù)算法師:評(píng)估數(shù)據(jù)源,分析數(shù)據(jù)工具,解讀運(yùn)算結(jié)果 1.外部算法師:審計(jì)大數(shù)據(jù)的準(zhǔn)確程度和有效性篇四:讀書(shū)筆記-《大數(shù)據(jù)時(shí)代》

      讀《大數(shù)據(jù)時(shí)代》 初次見(jiàn)到維克多·邁爾-舍恩伯格教授是在《對(duì)話》欄目中,當(dāng)時(shí)談及當(dāng)今各種科技信息的變化,然后在主持人的各種提問(wèn)下,我逐漸了解到“大數(shù)據(jù)”這個(gè)名詞,他也是現(xiàn)在對(duì)于大數(shù)據(jù)最有發(fā)言權(quán)的預(yù)言家。一位睿智的人總是能夠給人留下很深的印象。然后在中央財(cái)經(jīng)頻道的特別節(jié)目《指尖上的商機(jī)》系列節(jié)目中,也談及到大數(shù)據(jù)對(duì)于當(dāng)今時(shí)代的影響和蘊(yùn)藏的巨大商機(jī)。

      讀一本好書(shū)就像與智者交談。今天我翻讀《大數(shù)據(jù)時(shí)代》,細(xì)細(xì)品讀這位智者給我們的禮物。我們首先應(yīng)該明白一個(gè)概念“大數(shù)據(jù)”,他不是單單的說(shuō)數(shù)據(jù)很大,或者數(shù)據(jù)很多的意思,真正的意思是:不用隨機(jī)分析法這樣的捷徑,而采用所有數(shù)據(jù)的方法。它告訴我們一種超越現(xiàn)在的對(duì)于數(shù)據(jù)的一種分析方法,這個(gè)方法建立在盡可能多的數(shù)據(jù)上。下面讓我們合上此書(shū),讓他從我們的思想深處開(kāi)始發(fā)聲吧。

      首先,大數(shù)據(jù)時(shí)代是建立的基礎(chǔ)就是有一個(gè)很龐大的數(shù)據(jù)庫(kù),我們分析的對(duì)象不是抽取樣本,而是用全部的數(shù)據(jù)作為樣本,“樣本=總體”。這樣我們能夠把要調(diào)查的對(duì)象精確到每一個(gè)個(gè)體,我們能夠?qū)γ恳粋€(gè)個(gè)體提供個(gè)性化分析和服務(wù)。我們會(huì)擺脫抽樣樣本的誤差和失誤,同樣我們能夠細(xì)化我們研究的對(duì)象和分析的數(shù)據(jù)。我們分析的適合一個(gè)大的整體,也適合每一個(gè)個(gè)體。這是大數(shù)據(jù)分析的基礎(chǔ)。

      第二,大數(shù)據(jù)是由很多不同的紛繁復(fù)雜的數(shù)據(jù)匯總在一起的,我們必須接受他們的復(fù)雜性和不精確性,我們的研究方向除了尋找因果關(guān)系之外,增加了一種相關(guān)關(guān)系的研究。我們通過(guò)數(shù)據(jù)之間的關(guān)系,分析得到我們想要得到的結(jié)論或者是模型。在這里我們應(yīng)該重點(diǎn)看一下,相關(guān)關(guān)系是我們打開(kāi)的另一扇窗,而不能關(guān)閉因果關(guān)系的現(xiàn)在開(kāi)著的窗戶。我們開(kāi)始重視相關(guān)關(guān)系,但是不能放棄對(duì)于因果關(guān)系的研究。作者也在文中闡釋我們的生活還是需要因果關(guān)系的,甚至我們需要大數(shù)據(jù)算法師,我們需要了解“黑匣子”中的神秘。這是大數(shù)據(jù)時(shí)代我們應(yīng)該正確認(rèn)識(shí)的。

      第三,大數(shù)據(jù)的原始來(lái)源是用不同的方法收集,為了有盡可能多的數(shù)據(jù),我們現(xiàn)在有了電腦,搜索引擎,智能手機(jī),可穿戴設(shè)備,社交平臺(tái),還有無(wú)數(shù)的傳感器等等,我們可以把文字,位置,動(dòng)作,喜好等所有的世界進(jìn)行量化,他都可以用數(shù)字表示,這就是我們所有的紛繁復(fù)雜的原始數(shù)據(jù),他們是一座鉆石礦,由于無(wú)數(shù)種的相關(guān)組合可以不斷地挖掘出我們所需要的信息。這是我們不斷利用大數(shù)據(jù)的基礎(chǔ)。我們需要不斷更新的數(shù)據(jù)。

      第四,未來(lái)在過(guò)去的塵埃中。我們分析大數(shù)據(jù)最大的作用就是預(yù)測(cè)未來(lái),知道下一步你會(huì)做什么,知道下一個(gè)最危險(xiǎn)的事物或人。我們用什么方法預(yù)測(cè)未來(lái)。這是一個(gè)商業(yè),政府,甚至世界的時(shí)代,我們分析的方法就是動(dòng)用自己敏銳的思維發(fā)現(xiàn)相關(guān)性,然后動(dòng)用我們的數(shù)據(jù)分析工具對(duì)其進(jìn)行相關(guān)性分析,最后我們用統(tǒng)計(jì)學(xué)研究出一個(gè)模型。通過(guò)模型我們能夠預(yù)測(cè)未來(lái)。大數(shù)據(jù)分析的關(guān)鍵就在于數(shù)據(jù),思維和技術(shù)?,F(xiàn)在我們有快速分析的工具,正在不斷收集數(shù)據(jù),那么最重要的就是人類(lèi)的思維,一個(gè)能夠分析相關(guān)性,能夠創(chuàng)新使用數(shù)據(jù)的思維。在大數(shù)據(jù)時(shí)代我們需要把統(tǒng)計(jì)學(xué),軟件工程師和創(chuàng)新思維結(jié)合在一起的人才。

      第五,我們能夠知道每一個(gè)人的位置,喜好,關(guān)注什么,即將干什么等等,對(duì)于每個(gè)人來(lái)說(shuō)都是一個(gè)很可怕的事情,如果我們赤裸裸的暴露在陽(yáng)光之下,或者我們正在暴露中,我們的隱私應(yīng)該受到保護(hù),這也是大數(shù)據(jù)時(shí)代一個(gè)亟待解決的問(wèn)題,盡管我們匿名分析信息,到最后我們還是能夠精確到個(gè)人,我們需要有人負(fù)責(zé),這是安全問(wèn)題,自由和科技或商業(yè)的發(fā)展產(chǎn)生矛盾,我們應(yīng)該何去何從?我們擔(dān)憂的,相信會(huì)有人來(lái)解決。這涉及到我們每個(gè)人的利益。

      來(lái)暴露我們需要的產(chǎn)品;我們用百度、google來(lái)暴露我們所關(guān)注的事情。我想有好多雙眼睛正在盯著我們,只是我們還不知道。這是一件可怕的事情。

      下載大數(shù)據(jù)時(shí)代讀書(shū)心得word格式文檔
      下載大數(shù)據(jù)時(shí)代讀書(shū)心得.doc
      將本文檔下載到自己電腦,方便修改和收藏,請(qǐng)勿使用迅雷等下載。
      點(diǎn)此處下載文檔

      文檔為doc格式


      聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻(xiàn)自行上傳,本網(wǎng)站不擁有所有權(quán),未作人工編輯處理,也不承擔(dān)相關(guān)法律責(zé)任。如果您發(fā)現(xiàn)有涉嫌版權(quán)的內(nèi)容,歡迎發(fā)送郵件至:645879355@qq.com 進(jìn)行舉報(bào),并提供相關(guān)證據(jù),工作人員會(huì)在5個(gè)工作日內(nèi)聯(lián)系你,一經(jīng)查實(shí),本站將立刻刪除涉嫌侵權(quán)內(nèi)容。

      相關(guān)范文推薦

        大數(shù)據(jù)時(shí)代讀書(shū)心得體會(huì)

        《大數(shù)據(jù)時(shí)代》是英國(guó)維克托·邁爾-舍恩伯格教授的著作,這本書(shū)也被尊為國(guó)外大數(shù)據(jù)研究的先河之作。下面是帶來(lái)的大數(shù)據(jù)時(shí)代讀書(shū)心得,歡迎查看。大數(shù)據(jù)時(shí)代讀書(shū)心得體會(huì)范文1《......

        《大數(shù)據(jù)》讀書(shū)心得

        《大數(shù)據(jù)》讀書(shū)心得 進(jìn)入2012年大數(shù)據(jù)一詞越來(lái)越多地被提及,人們用它來(lái)描述和定義信息爆炸時(shí)代產(chǎn)生的海量數(shù)據(jù),并命名與之相關(guān)的技術(shù)發(fā)展與創(chuàng)新,人們對(duì)于海量數(shù)據(jù)的挖掘和運(yùn)用,......

        讀書(shū)報(bào)告——《大數(shù)據(jù)時(shí)代》觀后感

        讀書(shū)報(bào)告——《大數(shù)據(jù)時(shí)代》觀后感 大數(shù)據(jù)時(shí)代,一個(gè)被嚼爛的詞匯,不知從何時(shí)起,興起了數(shù)據(jù)科學(xué)的狂潮,本書(shū)核心論點(diǎn),第一,要全體不要抽樣,第二,要相關(guān)不要因果,第三,要效率不要精確。......

        市場(chǎng)營(yíng)銷(xiāo)讀書(shū)報(bào)告--《大數(shù)據(jù)時(shí)代》

        市場(chǎng)營(yíng)銷(xiāo)讀書(shū)報(bào)告--《大數(shù)據(jù)時(shí)代》 讀書(shū)報(bào)告題目:大數(shù)據(jù)時(shí)代的生活、工作和思維變革 書(shū)名:大數(shù)據(jù)時(shí)代作者:[英]維克托·邁爾-舍恩伯格,肯尼思·庫(kù)克耶 出版社:浙江人民出版社出版......

        大數(shù)據(jù)時(shí)代

        大數(shù)據(jù)時(shí)代近年來(lái),隨著互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)、智能手機(jī)及傳感器等的普及,信息流量有了爆發(fā)性的增長(zhǎng),兩會(huì)以后,互聯(lián)網(wǎng)里最熱的詞匯,就是李克強(qiáng)總理在政府工作在報(bào)告里面提到的“互......

        大數(shù)據(jù)時(shí)代

        “大”數(shù)據(jù)時(shí)代 眾所周知,數(shù)據(jù)本身就蘊(yùn)藏著價(jià)值,但是將有用的數(shù)據(jù)與沒(méi)有價(jià)值的數(shù)據(jù)進(jìn)行區(qū)分看起來(lái)可能是一個(gè)棘手的問(wèn)題。 顯然,您所掌握的人員情況、工資表和客戶記錄對(duì)于企業(yè)......

        大數(shù)據(jù)時(shí)代

        《大數(shù)據(jù)時(shí)代》讀書(shū)筆記 作者:邁爾舍恩伯格 出版發(fā)行:浙江人民出版社 版次:2013年1月第一版 讀者:物流一班、時(shí)菲陽(yáng) 一、作者觀點(diǎn) 谷歌有一個(gè)名為“谷歌流感趨勢(shì)”的工具,它通過(guò)......

        大數(shù)據(jù)時(shí)代來(lái)臨讀書(shū)月心得體會(huì)

        一部似乎還沒(méi)有寫(xiě)完的書(shū) ——讀《大數(shù)據(jù)時(shí)代》有感及所思 讀了《大數(shù)據(jù)時(shí)代》后,感覺(jué)到一個(gè)大變革的時(shí)代將要來(lái)臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯......