欧美色欧美亚洲高清在线观看,国产特黄特色a级在线视频,国产一区视频一区欧美,亚洲成a 人在线观看中文

  1. <ul id="fwlom"></ul>

    <object id="fwlom"></object>

    <span id="fwlom"></span><dfn id="fwlom"></dfn>

      <object id="fwlom"></object>

      學(xué)習(xí)《大數(shù)據(jù)時代》讀書心得

      時間:2019-05-12 16:04:40下載本文作者:會員上傳
      簡介:寫寫幫文庫小編為你整理了多篇相關(guān)的《學(xué)習(xí)《大數(shù)據(jù)時代》讀書心得》,但愿對你工作學(xué)習(xí)有幫助,當(dāng)然你在寫寫幫文庫還可以找到更多《學(xué)習(xí)《大數(shù)據(jù)時代》讀書心得》。

      第一篇:學(xué)習(xí)《大數(shù)據(jù)時代》讀書心得

      讀《大數(shù)據(jù)時代》心得體會

      根據(jù)公司《關(guān)于下發(fā)中國共產(chǎn)黨員全年學(xué)習(xí)計(jì)劃的通知》組織分公司全體黨員個人學(xué)習(xí)《大數(shù)據(jù)時代》,讀了《大數(shù)據(jù)時代》后,感覺到一個大變革的時代將要來臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結(jié)”或顛覆一些傳統(tǒng)上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強(qiáng)烈震撼,不禁戰(zhàn)栗起來。

      “在小數(shù)據(jù)時代,我們會假象世界是怎樣運(yùn)作的,然后通過收集和分析數(shù)據(jù)來驗(yàn)證這種假想?!薄半S著由假想時代到數(shù)據(jù)時代的過渡,我們也很可能認(rèn)為我們不在需要理論了?!睍袔缀蹩隙ㄒ嵏步y(tǒng)計(jì)學(xué)的理論和方法,也試圖通過引用《連線》雜志主編安德森的話“量子物理學(xué)的理論已經(jīng)脫離實(shí)際”來“終結(jié)”量子力學(xué)。對此我很高興,因?yàn)榻y(tǒng)計(jì)學(xué)和量子力學(xué)都是我在大學(xué)學(xué)習(xí)時學(xué)到抽筋都不能及格的課目。但這兩個理論實(shí)在太大,太權(quán)威,太基本了,我想我不可能靠一本書就能擺脫這兩個讓我頭疼一輩子的東西。作者其實(shí)也不敢旗幟鮮明地提出要顛覆它們的論點(diǎn),畢竟還是在前面加上了“很可能認(rèn)為”這樣的保護(hù)傘。

      近幾十年,我們總是在遇到各種各樣的新思維。在新思維面前我們首先應(yīng)該做到的就是要破和立,要改變自己的傳統(tǒng),跟上時代的腳步。即使腦子還跟不上,嘴巴上也必須跟上,否則可能會被扣上思想僵化甚至阻礙世界發(fā)展的大帽子。既然大數(shù)據(jù)是“通往未來的必然改變”,那我就必須“不受限于傳統(tǒng)的思維模式和特定領(lǐng)域里隱含的固有偏見”,跟作者一起先把統(tǒng)計(jì)學(xué)和量子力學(xué)否定掉再說。反正我也不喜歡、也學(xué)不會它們。

      當(dāng)我們?nèi)祟惖臄?shù)據(jù)收集和處理能力達(dá)到拍字節(jié)甚至更大之后,我們可以把樣本變成全部,再加上有能力正視混雜性而忽視精確性后,似乎真的可以拋棄以抽樣調(diào)查為基礎(chǔ)的統(tǒng)計(jì)學(xué)了。但是由統(tǒng)計(jì)學(xué)和量子力學(xué)以及其他很多“我們也很可能認(rèn)為我們不再需要的”理論上溯,它們幾乎都基于一個共同的基礎(chǔ)——邏輯。要是不小心把邏輯或者邏輯思維或者邏輯推理一起給“不再需要”的話,就讓我很擔(dān)心了!

      《大數(shù)據(jù)時代》第16頁“大數(shù)據(jù)的核心就是預(yù)測”。邏輯是——描述時空信息“類”與“類”之間長時間有效不變的先后變化關(guān)系規(guī)則。兩者似乎是做同一件事??纱髷?shù)據(jù)要的“不是因果關(guān)系,而是相關(guān)關(guān)系”,“知道是什么就夠了,沒必要知道為什么”,而邏輯學(xué)四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明確規(guī)定”任何事物都有其存在的充足理由。且邏輯推理三部分——?dú)w納邏輯、溯因邏輯和演繹邏輯都是基于因果關(guān)系。兩者好像又是對立的。在同一件事上兩種方法對立,應(yīng)該只有一個結(jié)果,就是要否定掉其中之一。這就是讓我很擔(dān)心的原因??晌覅s不能拭目以待,像旁觀者一樣等著哪一個“脫穎而出”,因?yàn)槲疑硖幤渲?。問題不解決,我就沒法思考和工作,自然就沒法活了!

      更何況還有兩個更可怕的事情。

      其一:量子力學(xué)搞了一百多年,為了處理好混雜性問題,把質(zhì)量和速度結(jié)合到能量上去了,為了調(diào)和量子力學(xué)與相對論的矛盾,又搞出一個量子場論,再七搞八搞又有了蟲洞和羅森橋,最后把四維的時空彎曲成允許時間旅行的樣子,恨不得馬上造成那可怕的時間旅行機(jī)器。唯一阻止那些“愛因斯坦”們“瞎胡鬧”的就是因果關(guān)系,因?yàn)榘职志褪前职?,兒子就是兒子。那么大?shù)據(jù)會不會通過正視混雜性,放棄因果關(guān)系最后反而搞出時間機(jī)器,讓爸爸不再是爸爸,兒子不再是兒子了呢?

      其二:人和機(jī)器的根本區(qū)別在于人有邏輯思維而機(jī)器沒有?!洞髷?shù)據(jù)時代》也擔(dān)心“最后做出決策的將是機(jī)器而不是人”。如果真的那一天因?yàn)榉艞夁壿嬎季S而出現(xiàn)科幻電影上描述的機(jī)器主宰世界消滅人類的結(jié)果,那我還不如現(xiàn)在就趁早跳樓。

      還好我知道自己對什么統(tǒng)計(jì)學(xué)、量子力學(xué)、邏輯學(xué)和大數(shù)據(jù)來說都是門外漢,也許上面一大篇都是在胡說八道,所謂的擔(dān)心根本不存在。但問題出現(xiàn)了,還是解決的好,不然沒法睡著覺。自己解決不了就只能依靠專家來指點(diǎn)迷津。

      第二篇:大數(shù)據(jù)時代讀書心得

      生活,工作以及思維的大變革

      ——讀《大數(shù)據(jù)時代》有感及所思

      讀了《大數(shù)據(jù)時代》后,感覺到一個大變革的時代將要來臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結(jié)”或顛覆一些傳統(tǒng)上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強(qiáng)烈震撼,不禁戰(zhàn)栗起來。

      本書從思維、商業(yè)、管理三個方面闡述了在大數(shù)據(jù)時代在下的變革,這些變革涉及到我們生活的方方面面,幾乎其影響程度可以與兩次工業(yè)革命相媲美。作者在第一部分提出了三個比較令人震驚的觀點(diǎn),也就是大數(shù)據(jù)的精髓在于我們分析信息時的三個轉(zhuǎn)變,這三個轉(zhuǎn)變將改變我們的理解和組建社會的方法。并且作者將生活,工作思維的大變革和這幾個方面緊緊聯(lián)系在一起。

      第一個轉(zhuǎn)變是,在大數(shù)據(jù)時代,我們可以分析更多的數(shù)據(jù),有時候甚至可以處理和某個特別現(xiàn)象相關(guān)的所有數(shù)據(jù),而不再依賴于隨機(jī)采樣。也就是說樣本等于總體;第二個轉(zhuǎn)變是對研究數(shù)據(jù)不會追求精度,而且追求混雜性,小數(shù)據(jù)時代下,追求精確度是合理的,因?yàn)槲覀兪占臄?shù)據(jù)很少,所以要越精確越好,包括如今仍然也在使用這種辦法;但是在某些時代,尤其是在大數(shù)據(jù)時代背景下,快速獲得一個大概輪廓和發(fā)展脈絡(luò),要比精確性重要得多,既然選擇了整體性,肯定要忽視細(xì)節(jié)和確定性;第三個改變是不是因果關(guān)系而是相關(guān)關(guān)系,在大數(shù)據(jù)時代,我們更需要了解一個東西是什么,而不是為什么,要找到關(guān)聯(lián)無,通過一個良好的關(guān)聯(lián)物的相關(guān)關(guān)系可以幫助我們捕捉預(yù)測未來。

      這三個方面是大數(shù)據(jù)時代所給我們帶來的思維上的改變,所謂思路決定出路,思路有了創(chuàng)新,有了拓展,相應(yīng)的社會也就會有很大的變化。緊接著第二部分作者從萬事萬物數(shù)據(jù)化和數(shù)據(jù)交叉復(fù)用的巨大價值兩個方面,講述驅(qū)動大數(shù)據(jù)戰(zhàn)車在材質(zhì)和智力方面向前滾動的最根本動力。第三部分則是闡述了大數(shù)據(jù)時代下的弊端以及在管理上的措施。個人認(rèn)為本書的精髓部分是第一部分,第一部分的三個觀點(diǎn)涉及的面很廣,包括統(tǒng)計(jì)學(xué)、邏輯學(xué)、哲學(xué)等。后兩個部分都是以第一部分這三個觀點(diǎn)為基礎(chǔ)展開闡述的。

      這本書給我感觸最深的就是這三個轉(zhuǎn)變,或者說是三個觀點(diǎn),可以說是哲學(xué)上說的世界觀,因?yàn)槭澜缬^決定方法論,所以這三個觀點(diǎn)對傳統(tǒng)看法的顛覆,就會導(dǎo)致各種變革的發(fā)生。首先是第一個,作者認(rèn)為在抽樣研究時期,由于研究條件的欠缺,只能以少量的數(shù)據(jù)獲取最大的信息,而在大數(shù)據(jù)時代,我們可以獲得海量的數(shù)據(jù),抽樣自然就失去它的意義了。放棄了隨機(jī)分析法這種捷徑,采用所有的數(shù)據(jù)。作者用大數(shù)據(jù)與喬布斯的癌癥治療例子說明了使用全部數(shù)據(jù)而非樣本的意義,列舉了日本“相撲”等來證明使用全體數(shù)據(jù)的重要性。這個觀點(diǎn)足以引起統(tǒng)計(jì)學(xué)乃至社會文明的變革,因?yàn)榻y(tǒng)計(jì)抽樣和幾何學(xué)定理、萬有引力一樣被看做文明得以建立牢固的基石。我對這個觀點(diǎn)還是比較認(rèn)同的,如果真能收集到整體的數(shù)據(jù)而且分析數(shù)據(jù)的工具也足夠先進(jìn),自然是全體數(shù)據(jù)研究得出的結(jié)果更令人信服。但是這個觀點(diǎn)也過于絕對,就算是在大數(shù)據(jù)時代要想收集到全體數(shù)據(jù)還是不太可能實(shí)現(xiàn)的,因?yàn)槭占w數(shù)據(jù)要付出的代價有時會很大。比如說,你要檢測食品中致癌物質(zhì)是否超標(biāo),你不可能每一件食品你都檢測一遍吧。

      第二,要效率不要絕對的精確。作者說,執(zhí)迷于精確性是信息缺乏時代和模擬時代的產(chǎn)物,只有5%的數(shù)據(jù)是結(jié)構(gòu)化且能適用于傳統(tǒng)數(shù)據(jù)庫的。如果不接受混亂,剩下95%的非結(jié)構(gòu)化數(shù)據(jù)都無法被利用。作者是基于數(shù)據(jù)不可能百分之百正確的考慮而做出這樣的判斷的,如果采用小數(shù)據(jù)一個數(shù)據(jù)的錯誤就會導(dǎo)致結(jié) 果的誤差很大,但是如果數(shù)據(jù)足夠多、數(shù)據(jù)足夠雜那得出的結(jié)果就越靠近正確答案。大數(shù)據(jù)時代要求我們重新審視精確性的優(yōu)劣,甚至還說到大數(shù)據(jù)不僅讓我們不再期待精確性,也讓我們無法實(shí)現(xiàn)精確性。谷歌翻譯的成功很好地證明了這一點(diǎn),谷歌的翻譯系統(tǒng)不像Candide那樣精確地翻譯每一句話,它谷歌翻譯之所以優(yōu)于IBM的Candide系統(tǒng)并不是因?yàn)樗鼡碛懈玫乃惴C(jī)制,和微軟的班科和布里爾一樣,谷歌翻譯增加了各種各樣的數(shù)據(jù),并且接受了有錯誤的數(shù)據(jù)。

      而在閱讀這本書時,發(fā)現(xiàn)這本書中爭議最大的一個觀點(diǎn),不僅是讀者,就算是本書的譯者也在序言中明確地說到他不認(rèn)同“相關(guān)關(guān)系比因果關(guān)系更重要”的觀點(diǎn)。作者覺得相關(guān)關(guān)系對于預(yù)測一些事情已經(jīng)足夠了,不用花大力氣去研究他們的因果關(guān)系。作者用林登的亞馬遜推薦系統(tǒng)的成功,證實(shí)了大數(shù)據(jù)在分析相關(guān)性方面的優(yōu)勢以及在銷售中獲得的成功。沃爾瑪也是充分利用并挖掘各類數(shù)據(jù)信息的代表,從啤酒和尿布的案例,以及作者舉的有關(guān)蛋撻和颶風(fēng)天氣的案例,都說明了掌握了相關(guān)關(guān)系對于他們策略的幫助。一句話,知道是什么就夠了,不用知道為什么。很明顯作者所舉的例子都是屬于商業(yè)領(lǐng)域的,但是對于其他領(lǐng)域來說這個觀點(diǎn)就值得商榷了。比如說,在科學(xué)研究領(lǐng)域,你需要知其然也需要知道其所以然,找到事件發(fā)生的原理。用文中的一個例子說明,喬布斯測出整個基因圖譜來治療癌癥,但是你治療癌癥你必須知道癌癥發(fā)病的原理,知道哪一段基因?qū)е铝诉@種疾病,不可能只是說收集各種數(shù)據(jù),然后利用其相關(guān)性來判斷哪里出現(xiàn)了問題。

      過度依賴所帶來的后果。也用《少數(shù)派的報(bào)告》這部電影來說明如果癡迷于數(shù)據(jù)會導(dǎo)致我們將生活在一個沒有獨(dú)立選擇和自由意志的社會,如果一切變?yōu)楝F(xiàn)實(shí),我們將被禁錮在大數(shù)據(jù)的可能性之中。所以書中提出了幾種解決方法,一種是使用數(shù)據(jù)時征詢數(shù)據(jù)所有個人的知曉和授權(quán)。第二個技術(shù)途徑就是匿名化。毫無疑問,大數(shù)據(jù)將會給社會管理帶來巨大的變革。

      在這個信息爆炸的時代,大數(shù)據(jù)給人類社會的方方面面帶來了巨大的變革,這是社會發(fā)展的潮流,不可逆轉(zhuǎn),我們只有順應(yīng)這種潮流,把握住大數(shù)據(jù)時代變革的思想,才能在時代潮流中成為佼佼者,在思維上思路上略高一籌,才能在行動中占得先機(jī)!

      第三篇:《大數(shù)據(jù)時代》讀書心得

      大數(shù)據(jù)時代,引領(lǐng)信息全球化

      ——讀《大數(shù)據(jù)時代》有感

      如今說起新媒體和互聯(lián)網(wǎng),必提大數(shù)據(jù),似乎不這樣說就OUT了。而且人云亦云的居多,不少談?wù)撜呱踔吝€沒有認(rèn)真讀過這方面的經(jīng)典著作——舍恩佰格的《大數(shù)據(jù)時代》。維克托·邁爾——舍恩伯格何許人也?他現(xiàn)任牛津大學(xué)網(wǎng)絡(luò)學(xué)院互聯(lián)網(wǎng)研究所治理與監(jiān)管專業(yè)教授,曾任哈佛大學(xué)肯尼迪學(xué)院信息監(jiān)管科研項(xiàng)目負(fù)責(zé)人。他的咨詢客戶包括微軟、惠普和IBM等全球頂級企業(yè),他是歐盟互聯(lián)網(wǎng)官方政策背后真正的制定者和參與者,他還先后擔(dān)任多國政府高層的智囊。這位被譽(yù)為:大數(shù)據(jù)時代的預(yù)言家“的牛津教授真牛!那么,這位大師說的都是金科玉律嗎?并不一定,讀大師的作品一定要做些功課才好讀懂,如果能做足功課又具備相應(yīng)的理論功底,就能與之進(jìn)行一場思想上的對話。

      粗淺認(rèn)識之我見

      舍恩伯格分三部分來討論大數(shù)據(jù),即思維變革、商業(yè)變革和管理變革。在第一部分“大數(shù)據(jù)時代的思維變革”中,舍恩伯格旗幟鮮明的亮出他的三個觀點(diǎn):

      一、更多:不是隨機(jī)樣本,而是全體數(shù)據(jù);

      二、更雜:不是精確性,而是混雜性;

      三、更好:不是因果關(guān)系,而是相關(guān)關(guān)系。對于第一個觀點(diǎn),我不敢茍同。一方面是對全體數(shù)據(jù)進(jìn)行處理,在技術(shù)和設(shè)備上有相當(dāng)高的難度。另一方面是不是都有此必要,對于簡單事實(shí)進(jìn)行判斷的數(shù)據(jù)分析難道也要采集全體數(shù)據(jù)嗎?我曾與香港城市大學(xué)的祝建華教授討論過。祝教授是傳播學(xué)研究方法和數(shù)據(jù)分析的專家,他認(rèn)為一定可以找到一種數(shù)理統(tǒng)計(jì)方法來進(jìn)行分析,并不一定需要全部數(shù)據(jù)。聯(lián)系到舍恩伯格第二個觀點(diǎn)中所說的相關(guān)關(guān)系,我理解他說的全體數(shù)據(jù)不是指數(shù)量而是指范圍,即大數(shù)據(jù)的隨機(jī)樣本不限于目標(biāo)數(shù)據(jù),還包括目標(biāo)以外的所有數(shù)據(jù)。我認(rèn)為大數(shù)據(jù)分析不能排除隨機(jī)抽樣,只是抽樣的方法和范圍要加以拓展。

      我同意舍恩伯格的第二觀點(diǎn),我認(rèn)為這是對他第一個觀點(diǎn)很好的補(bǔ)充,這也是對精準(zhǔn)傳播和精準(zhǔn)營銷的一種反思。“大數(shù)據(jù)的簡單算法比小數(shù)據(jù)的復(fù)雜算法更有效?!备哂泻暧^視野和東方哲學(xué)思維。對于舍恩伯格的第三個觀點(diǎn),我也不能完全贊同?!安皇且蚬P(guān)系,而是相關(guān)關(guān)系?!辈恍枰馈盀槭裁础?,只需要知道“是什么”。傳播即數(shù)據(jù),數(shù)據(jù)即關(guān)系。在小數(shù)據(jù)時代人們只關(guān)心因果關(guān)系,對相關(guān)關(guān)系認(rèn)識不足,大數(shù)據(jù)時代相關(guān)關(guān)系舉足輕重,如何強(qiáng)調(diào)都不為過,但不應(yīng)該完全排斥它。大數(shù)據(jù)從何而來?為何而用?如果我們完全忽略因果關(guān)系,不知道大數(shù)據(jù)產(chǎn)生的前因后果,也就消解了大數(shù)據(jù)的人文價值。如今不少學(xué)者為了闡述和傳播其觀點(diǎn)往往語出驚人,對舊有觀念進(jìn)行徹底的否定。

      世間萬物的復(fù)雜性多樣化并非非此即彼那么簡單,舍恩伯格也是這種二元對立的幼稚思維嗎?其實(shí)不然,讀者在閱讀時一定要看清楚他是在什么語境下說的,不要因囫圇吞棗的淺讀而陷入斷章取義的誤讀。比如說舍恩伯格在提出“不是因果關(guān)系,而是相關(guān)關(guān)系?!边@一論斷時,他在書中還說道:“在大多數(shù)情況下,一旦我們完成了對大數(shù)據(jù)的相關(guān)關(guān)系分析,而又不再滿足于僅僅知道‘是什么’時,我們就會繼續(xù)向更深層次研究的因果關(guān)系,找出背后的‘為什么’?!庇纱丝梢?,他說的全體數(shù)據(jù)和相關(guān)關(guān)系都在特定語境下的,是在數(shù)據(jù)挖掘中的選項(xiàng)。

      大數(shù)據(jù)研究的一大驅(qū)動力就是商用,舍恩伯格在第二部分里討論了大數(shù)據(jù)時代的商業(yè)變革。舍恩伯格認(rèn)為數(shù)據(jù)化就是一切皆可“量化”,大數(shù)據(jù)的定量分析有力地回答“是什么”這一問題,但仍然無法完全回答“為什么”。因此,我認(rèn)為并不能排除定性分析和質(zhì)化研究。數(shù)據(jù)創(chuàng)新可以創(chuàng)造價值,這是毫無疑問的。舍恩伯格在討論大數(shù)據(jù)的角色定位時仍把它置于數(shù)據(jù)應(yīng)用的商業(yè)系統(tǒng)中,而沒有把它置于整個社會系統(tǒng)里,但他在第二部分大數(shù)據(jù)時代的管理變革中討論了這個問題。在風(fēng)險社會中信息安全問題日趨凸顯,數(shù)據(jù)獨(dú)裁與隱私保護(hù)成為一對矛盾。如何擺脫大數(shù)據(jù)的困境?舍恩伯格在最后一節(jié)“掌控”中試圖回答,但基本上屬于老生常談。我想,或許凱文·凱利的《失控》可以幫助我們解答這個問題?至少可以提供更多的思考維度。正如舍恩伯格在結(jié)語中所道:“大數(shù)據(jù)并不是一個充斥著算法和機(jī)器的冰冷世界,人類的作用依然無法被完全替代。大數(shù)據(jù)為我們提供的不是最終答案,只是參考答案,幫助是暫時的,而更好的方法和答案還在不久的未來?!敝x謝舍恩伯格!讓大數(shù)據(jù)討論從自然科學(xué)回到人文社科。由此推斷,《大數(shù)據(jù)時代》不是最終答案,也不是標(biāo)準(zhǔn)答案,只是參考答案。

      此外,在閱讀此書之前還必須具備一些數(shù)據(jù)科學(xué)的基本知識和基本概念,比如說什么叫數(shù)據(jù)?什么叫大數(shù)據(jù)?數(shù)據(jù)分析與數(shù)據(jù)挖掘的區(qū)別,數(shù)字化與數(shù)據(jù)化有什么不同?讀前做些功課讀起來就比較好懂了。

      淺薄之語抒我意

      概念是研究的邏輯起點(diǎn),“大數(shù)據(jù)”到底是什么?在百度上搜索到的解釋是,“大數(shù)據(jù)(big data),或稱巨量資料,指的是所涉及的資料量規(guī)模巨大到無法透過目前主流軟件工具,在合理時間內(nèi)達(dá)到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營決策更積極目的的資訊。”大數(shù)據(jù)的4V特點(diǎn):數(shù)量(Volume)、速度(Velocity)、品種(Variety)和真實(shí)性(Veracity)。但舍恩伯格認(rèn)為大數(shù)據(jù)并非一個確切的概念。他在書中的一段詮釋更具人文色彩和社會意義:“大數(shù)據(jù)是人們獲得新的認(rèn)知、創(chuàng)造新的價值的源泉;大數(shù)據(jù)還是改變市場、組織機(jī)構(gòu),以及政府與公民關(guān)系的方法。”其實(shí),概念的界定要看研究者從哪個角度來研究它而定。

      科學(xué)家的治學(xué)態(tài)度是嚴(yán)謹(jǐn)?shù)?,而人文學(xué)家更具有想象力。一些對大數(shù)據(jù)不甚了然的人往往夸大了它的作用,甚至把它神化。舍恩伯格認(rèn)為大數(shù)據(jù)的核心是預(yù)測?!按髷?shù)據(jù)不是要教機(jī)器像人一樣思考。相反,把數(shù)學(xué)算法運(yùn)用到海量的數(shù)據(jù)上來預(yù)期事情發(fā)生的可能性?!鄙岫鞑裆踔敛换乇艽髷?shù)據(jù)所產(chǎn)生的負(fù)面影響,他在第七章里談到讓數(shù)據(jù)主宰一切的隱憂。我覺得這是實(shí)事求是的科學(xué)態(tài)度。在量子力學(xué)里有一個測不準(zhǔn)原理:一個微觀粒子的某些物理量(如位置和動量,或方位角與動量矩,還有時間和能量等),不可能同時具有確定的數(shù)值,其中一個量越確定,另一個量的不確定程度就越大。它是解釋微觀世界的物理現(xiàn)象,信息社會中的大數(shù)據(jù)會不會也有類似情況呢?如果我們再把凱文·凱利的《失控》對比來讀的話就更有意思了,這樣我們對整個物質(zhì)世界及至人類社會就有了更全面更深刻的洞察,從物理王國到生物世界,再到信息社會。從公共衛(wèi)生到商業(yè)應(yīng)用,從個人隱私到政府管理,大數(shù)據(jù)無處不在。與此同時,從哪個角度探討用什么方法研究,舍恩伯格都不會忘記大數(shù)據(jù)服務(wù)人類造福人類的終極目的和價值所在?!按髷?shù)據(jù)并不是一個充斥著運(yùn)算法則和機(jī)器的冰冷世界,其中仍需要人類扮演重要角色。人類獨(dú)有的弱點(diǎn)、錯覺、錯誤都是十分必要的,因?yàn)檫@些特性的另一頭牽著的是人類的創(chuàng)造力、直覺和天賦。偶爾也會帶來屈辱或固執(zhí)的同樣混亂的大腦運(yùn)作,也能帶來成功,或在偶然間促成我們的偉大。這提示我們應(yīng)該樂于接受類似的不準(zhǔn)確,因?yàn)椴粶?zhǔn)確正是我們之所以為人的特征之一?!庇弥袊拋碚f就是“人無完人”,人類在收獲大數(shù)據(jù)帶來的紅利的同時也要承受它帶來的危害。這不是對立統(tǒng)一的辯證唯物主義?我把它看作帶著歐洲批判學(xué)派色彩的科學(xué)發(fā)展觀。問題是研究的價值基點(diǎn),“大數(shù)據(jù)”不是舍恩伯格研究的問題,而是研究對象,他研究的是數(shù)據(jù)處理和信息管理問題,同時也討論信息安全和網(wǎng)絡(luò)倫理問題,還引發(fā)哲學(xué)上的思考,哲學(xué)史上爭論不休的世界可知論和不可知論轉(zhuǎn)變?yōu)閷?shí)證科學(xué)中的具體問題。可知性是絕對的,不可知性是相對的?!按髷?shù)據(jù)”之所以為大是因它引發(fā)人類生活、工作和思維的大變革,從這個意義上來看,《大數(shù)據(jù)時代》的意義不僅在于它討論了若干重大問題,而且對研究者開出了一個問題清單,從而引發(fā)更多人來探討這些有趣的問題。

      《大數(shù)據(jù)時代》實(shí)際上主要是一本討論數(shù)據(jù)挖掘的書,數(shù)據(jù)挖掘與數(shù)據(jù)分析是不同的概念,數(shù)據(jù)挖掘一般是指從大量的數(shù)據(jù)中自動搜索隱藏于其中的有著特殊關(guān)系性的信息的過程。數(shù)據(jù)挖掘通常與計(jì)算機(jī)科學(xué)有關(guān),并通過統(tǒng)計(jì)、在線分析處理、情報(bào)檢索、機(jī)器學(xué)習(xí)、專家系統(tǒng)(依靠過去的經(jīng)驗(yàn)法則)和模式識別等諸多方法來實(shí)現(xiàn)上述目標(biāo)。而數(shù)據(jù)分析的目的是把隱沒在一大批看來雜亂無章的數(shù)據(jù)中的信息集中、萃取和提煉出來,以找出所研究對象的內(nèi)在規(guī)律。數(shù)據(jù)挖掘主要運(yùn)用計(jì)算機(jī)來進(jìn)行處理,而數(shù)據(jù)分析既要用計(jì)算機(jī)也要人工分析,是計(jì)算機(jī)科學(xué)與人文價值判斷的統(tǒng)一結(jié)合。換言之,《大數(shù)據(jù)時代》并不是一本討論大數(shù)據(jù)所有問題的書。

      《大數(shù)據(jù)時代》也是一本討論互聯(lián)網(wǎng)發(fā)展的書,從數(shù)字化到數(shù)據(jù)化,同時有濃厚的未來學(xué)色彩。當(dāng)文字變成數(shù)據(jù),我們進(jìn)入了互聯(lián)網(wǎng);當(dāng)方位變成數(shù)據(jù),我們進(jìn)入了物聯(lián)網(wǎng);當(dāng)溝通變成數(shù)據(jù),我們進(jìn)入了下一代互聯(lián)網(wǎng)。一切可量化,萬物皆數(shù)據(jù),正是當(dāng)今互聯(lián)網(wǎng)世界的真實(shí)寫照。面對于這樣的世界及世界的未來,在《大數(shù)據(jù)時代》出現(xiàn)最多的詞是“思維”和“方法”,因此也可以把這本書視為思維科學(xué)應(yīng)用研究的書。

      此外,在閱讀此書之前還必須具備一些數(shù)據(jù)科學(xué)的基本知識和基本概念,比如說什么叫數(shù)據(jù)?什么叫大數(shù)據(jù)?數(shù)據(jù)分析與數(shù)據(jù)挖掘的區(qū)別,數(shù)字化與數(shù)據(jù)化有什么不同?讀前做些功課讀起來就比較好懂了。

      走出去,理論聯(lián)系實(shí)際之我看

      今年的9月30日,總書記將他命名為“烈士紀(jì)念日”。在新一屆黨中央領(lǐng)導(dǎo)班子的領(lǐng)導(dǎo)下,舉國上下開展了系列的調(diào)研、講解、討論創(chuàng)新驅(qū)動發(fā)展戰(zhàn)略。包括總書記、李克強(qiáng)總理在內(nèi)的七位常委全部出動來到中關(guān)村,這是歷史上沒有過的,百度、聯(lián)想和小米的負(fù)責(zé)人,有了一次直面最高層匯報(bào)工作的機(jī)會。雷軍和柳傳志,講解的都是本公司的各種情況,李彥宏則沒有講百度的廣告業(yè)務(wù)發(fā)展得如何好,而是講起了大數(shù)據(jù)。在講解中,李彥宏認(rèn)為大數(shù)據(jù)有兩個重要價值,一是促進(jìn)信息消費(fèi),加快經(jīng)濟(jì)轉(zhuǎn)型升級;二是關(guān)注社會民生,帶動社會管理創(chuàng)新。這些價值也是目前黨和國家領(lǐng)導(dǎo)人最為重視的,可見《大數(shù)據(jù)時代》既有理論價值也有現(xiàn)實(shí)意義。當(dāng)今大數(shù)據(jù)正在影響著新聞傳媒業(yè),大數(shù)據(jù)新聞、大數(shù)據(jù)營銷、輿情分析、受眾(用戶)研究??數(shù)據(jù)分析師變身新聞編輯,大數(shù)據(jù)正改變新聞生產(chǎn)流程、大數(shù)據(jù)在創(chuàng)造傳媒新業(yè)態(tài)?!安环料胂笠幌?,隨著數(shù)據(jù)的進(jìn)一步增加,坐擁用戶資源的新媒體們完全有能力通過數(shù)據(jù)挖掘,分析用戶癖好,向電視臺定制一部電視劇甚至向好萊塢定制一部電影。到那個時候,電視臺一如那些家電廠商們,曾經(jīng)產(chǎn)業(yè)鏈的上游‘王者’,將徹底成為一個產(chǎn)業(yè)鏈最低端的內(nèi)容代工廠?!比欢?,情形也遠(yuǎn)沒有人們想象的那么樂觀,李彥宏指出目前多數(shù)所謂的大數(shù)據(jù)公司其實(shí)還是空殼子,因?yàn)閿?shù)據(jù)還沒有完全開放。他認(rèn)為必須在政府層面上推動才能真正實(shí)現(xiàn)大數(shù)據(jù)的開發(fā)與利用。我在討論大數(shù)據(jù)時代的輿情監(jiān)測與預(yù)警時說道:“經(jīng)典自由主義傳播學(xué)說對媒體的定位:秉持公正、客觀立場的媒體被稱為代表公眾監(jiān)督政府行為的‘看門狗’。其實(shí),媒體既是公眾利益也是國家利益的‘看門狗’。要看好門就要瞭望、洞察社情民意,傳統(tǒng)媒體信息反饋渠道單一,視野、人力十分有限。而開放互動的新媒體平臺卻大有可為。作為公共信息發(fā)布平臺的微博可以成為政府及時了解社情民意,從而選擇正確治理路徑的‘導(dǎo)盲犬’?!边z憾的是目前我國的數(shù)據(jù)平臺還沒有完全開放,真正的大數(shù)據(jù)時代還沒有到來。

      與國內(nèi)不少教科書寫法的專著相比,國外的書寫得更有趣,尤其是大學(xué)者寫的,不僅視野開闊,而且能夠深入淺出?!洞髷?shù)據(jù)時代》不到22萬字,卻有上百個學(xué)術(shù)和商業(yè)的實(shí)例,豐富翔實(shí)的例子讓讀者感到通俗易懂,深奧的理論看起來也不費(fèi)勁。這恐怕與舍恩伯格既是學(xué)者也是專家,既有理論又有實(shí)踐有關(guān)。反觀我們些學(xué)者故弄玄虛而示高明,實(shí)際上是把讀者拒之門外。我覺得優(yōu)秀的科學(xué)家也應(yīng)該是一個科普作家,優(yōu)秀的學(xué)者也應(yīng)該是一個不錯的傳播者。當(dāng)然國外學(xué)術(shù)著作也有一個翻譯問題,這本書譯得還不錯。此外,《大數(shù)據(jù)時代》還附有不少IT界名流的推薦意見,雖是出版商的發(fā)行所為,對解讀此書也不無益處。

      除了《大數(shù)據(jù)時代》,舍恩伯格還有一本《刪除》也值得一讀。要研究大數(shù)據(jù)不能只讀一本書,該書譯者周濤教授還推薦了三部國內(nèi)出版的大數(shù)據(jù)方面的專著:《證析》、《大數(shù)據(jù)》、《個性化:商業(yè)的未來》。相比《大數(shù)據(jù)時代》的宏大視野,這些書就大數(shù)據(jù)某一局部問題給出深刻的介紹和洞見。我也推薦讀一讀中國工程院李國杰院士和中科院計(jì)算所副總工程學(xué)旗合寫的文章《大數(shù)據(jù)研究:未來科技及經(jīng)濟(jì)社會發(fā)展的重大戰(zhàn)略領(lǐng)域——大數(shù)據(jù)的研究現(xiàn)狀與科學(xué)思考》。

      雖說開卷有益,但是由于每個人的時間精力有限,對于一個研究者來說,不讀什么書甚至比讀什么書更重要。我認(rèn)為書有三種:有用的書,主要是應(yīng)用類的專業(yè)書;無用的書,主要是形而上的思想類;無字的書,人間百態(tài),社會現(xiàn)實(shí)??善氐粦?yīng)偏廢。對于學(xué)生來講這三類“書”都該讀一些,對于研究者則要讀哪些解決關(guān)鍵問題的書,《大數(shù)據(jù)時代》就是這樣一部書。當(dāng)然,并非第一個讀者都是研究大數(shù)據(jù)的,但進(jìn)入大數(shù)據(jù)時代,還有什么東西與數(shù)據(jù)完全沒有關(guān)系呢?麥肯錫全球研究機(jī)構(gòu)認(rèn)為,未來十年里有12項(xiàng)對經(jīng)濟(jì)發(fā)展產(chǎn)生重大影響的技術(shù),其中包括三項(xiàng)新媒體技術(shù):移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)和云計(jì)算。這三項(xiàng)新媒體技術(shù)都與大數(shù)據(jù)密切相關(guān),而這些新媒體新技術(shù)的發(fā)展都影響著當(dāng)今的新聞傳播業(yè)。閱讀此書至少給我們研究新聞傳播學(xué)帶來一些啟迪。我覺得一本書的價值不在于讓你頂禮膜拜,而是引發(fā)廣泛而深入的討論。

      “凡是過去,皆為序曲?!弊x完此書,我們對大數(shù)據(jù)的認(rèn)識才剛剛開始。

      第四篇:大數(shù)據(jù)時代讀書心得

      一部似乎還沒有寫完的書

      ——讀《大數(shù)據(jù)時代》有感及所思

      讀了《大數(shù)據(jù)時代》后,感覺到一個大變革的時代將要來臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結(jié)”或顛覆一些傳統(tǒng)上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強(qiáng)烈震撼,不禁戰(zhàn)栗起來。“在小數(shù)據(jù)時代,我們會假象世界是怎樣運(yùn)作的,然后通過收集和分析數(shù)據(jù)來驗(yàn)證這種假想。”“隨著由假想時代到數(shù)據(jù)時代的過渡,我們也很可能認(rèn)為我們不在需要理論了?!睍袔缀蹩隙ㄒ嵏步y(tǒng)計(jì)學(xué)的理論和方法,也試圖通過引用《連線》雜志主編安德森的話“量子物理學(xué)的理論已經(jīng)脫離實(shí)際”來“終結(jié)”量子力學(xué)。對此我很高興,因?yàn)榻y(tǒng)計(jì)學(xué)和量子力學(xué)都是我在大學(xué)學(xué)習(xí)時學(xué)到抽筋都不能及格的課目。但這兩個理論實(shí)在太大,太權(quán)威,太基本了,我想我不可能靠一本書就能擺脫這兩個讓我頭疼一輩子的東西。作者其實(shí)也不敢旗幟鮮明地提出要顛覆它們的論點(diǎn),畢竟還是在前面加上了“很可能認(rèn)為”這樣的保護(hù)傘。

      近幾十年,我們總是在遇到各種各樣的新思維。在新思維面前我們首先應(yīng)該做到的就是要破和立,要改變自己的傳統(tǒng),跟上時代的腳步。即使腦子還跟不上,嘴巴上也必須跟上,否則可能會被扣上思想僵化甚至阻礙世界發(fā)展的大帽子。既然大數(shù)據(jù)是“通往未來的必然改變”,那我就必須“不受限于傳統(tǒng)的思維模式和特定領(lǐng)域里隱含的固

      有偏見”,跟作者一起先把統(tǒng)計(jì)學(xué)和量子力學(xué)否定掉再說。反正我也不喜歡、也學(xué)不會它們。

      當(dāng)我們?nèi)祟惖臄?shù)據(jù)收集和處理能力達(dá)到拍字節(jié)甚至更大之后,我們可以把樣本變成全部,再加上有能力正視混雜性而忽視精確性后,似乎真的可以拋棄以抽樣調(diào)查為基礎(chǔ)的統(tǒng)計(jì)學(xué)了。但是由統(tǒng)計(jì)學(xué)和量子力學(xué)以及其他很多“我們也很可能認(rèn)為我們不再需要的”理論上溯,它們幾乎都基于一個共同的基礎(chǔ)——邏輯。要是不小心把邏輯或者邏輯思維或者邏輯推理一起給“不再需要”的話,就讓我很擔(dān)心了!

      《大數(shù)據(jù)時代》第16頁“大數(shù)據(jù)的核心就是預(yù)測”。邏輯是——描述時空信息“類”與“類”之間長時間有效不變的先后變化關(guān)系規(guī)則。兩者似乎是做同一件事。可大數(shù)據(jù)要的“不是因果關(guān)系,而是相關(guān)關(guān)系”,“知道是什么就夠了,沒必要知道為什么”,而邏輯學(xué)四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明確規(guī)定”任何事物都有其存在的充足理由。且邏輯推理三部分——?dú)w納邏輯、溯因邏輯和演繹邏輯都是基于因果關(guān)系。兩者好像又是對立的。在同一件事上兩種方法對立,應(yīng)該只有一個結(jié)果,就是要否定掉其中之一。這就是讓我很擔(dān)心的原因。

      可我卻不能拭目以待,像旁觀者一樣等著哪一個“脫穎而出”,因?yàn)槲疑硖幤渲?。問題不解決,我就沒法思考和工作,自然就沒法活了!

      更何況還有兩個更可怕的事情。

      其一:量子力學(xué)搞了一百多年,為了處理好混雜性問題,把質(zhì)量

      和速度結(jié)合到能量上去了,為了調(diào)和量子力學(xué)與相對論的矛盾,又搞出一個量子場論,再七搞八搞又有了蟲洞和羅森橋,最后把四維的時空彎曲成允許時間旅行的樣子,恨不得馬上造成那可怕的時間旅行機(jī)器。唯一阻止那些“愛因斯坦”們“瞎胡鬧”的就是因果關(guān)系,因?yàn)榘职志褪前职?,兒子就是兒子。那么大?shù)據(jù)會不會通過正視混雜性,放棄因果關(guān)系最后反而搞出時間機(jī)器,讓爸爸不再是爸爸,兒子不再是兒子了呢?

      其二:人和機(jī)器的根本區(qū)別在于人有邏輯思維而機(jī)器沒有?!洞髷?shù)據(jù)時代》也擔(dān)心“最后做出決策的將是機(jī)器而不是人”。如果真的那一天因?yàn)榉艞夁壿嬎季S而出現(xiàn)科幻電影上描述的機(jī)器主宰世界消滅人類的結(jié)果,那我還不如現(xiàn)在就趁早跳樓。

      還好我知道自己對什么統(tǒng)計(jì)學(xué)、量子力學(xué)、邏輯學(xué)和大數(shù)據(jù)來說都是門外漢,也許上面一大篇都是在胡說八道,所謂的擔(dān)心根本不存在。但問題出現(xiàn)了,還是解決的好,不然沒法睡著覺。自己解決不了就只能依靠專家來指點(diǎn)迷津。

      所以想向《大數(shù)據(jù)時代》的作者提一個合理化建議:把這本書繼續(xù)寫下去,至少加一個第四部分——大數(shù)據(jù)時代的邏輯思維。

      合纖部車民

      2013年11月10日

      第五篇:大數(shù)據(jù)時代讀書報(bào)告

      這本書里主要介紹的是大數(shù)據(jù)在現(xiàn)代商業(yè)運(yùn)作上的應(yīng)用,以及它對現(xiàn)代商業(yè)運(yùn)作的影響?!?大數(shù)據(jù)時代》這本書的結(jié)構(gòu)框架遵從了學(xué)術(shù)性書籍的普遍方式。也既,從現(xiàn)象入手,繼而通過對現(xiàn)象的解剖提出對這一現(xiàn)象的解釋。然后在通過解釋在對未來進(jìn)行預(yù)測,并對未來可能出現(xiàn)的問題提出自己看法與對策。

      下面來重點(diǎn)介紹《大數(shù)據(jù)時代》這本書的主要內(nèi)容。

      《大數(shù)據(jù)時代》開篇就講了google通過人們在搜索引擎上搜索關(guān)鍵字留下的數(shù)據(jù)提前成功的預(yù)測了2009年美國的h1n1的爆發(fā)地與傳播方向以及可能的潛在患者的事情。google的預(yù)測比政府提前將近一個月,相比之下政府只能夠在流感爆發(fā)一兩個周之后才可以弄到相關(guān)的數(shù)據(jù)。同時google的預(yù)測與政府?dāng)?shù)據(jù)的相關(guān)性高達(dá)97%,這也就意味著google預(yù)測數(shù)據(jù)的置信區(qū)間為3%,這個數(shù)字遠(yuǎn)遠(yuǎn)小于傳統(tǒng)統(tǒng)計(jì)學(xué)上的常規(guī)置信區(qū)間5%!而這個數(shù)字就是大數(shù)據(jù)時代預(yù)測結(jié)果的相對準(zhǔn)確性與事件的可預(yù)測性的最好證明!通過這一事以及其他的案例,維克托提出了在大數(shù)據(jù)時代“樣本=總體”的思想。我們都知道當(dāng)樣本無限趨近于總體的時候,通過計(jì)算得到的描述性數(shù)據(jù)將無限的趨近于事件本身的性質(zhì)。而之前采取的“樣本<總體”的做法很大程度上無法做到更進(jìn)一步的描述事物,因?yàn)橹暗臅r代數(shù)據(jù)的獲取與存儲處理本身有很大的難度只導(dǎo)致人們采取抽樣的方式來測量事物。而互聯(lián)網(wǎng)終端與計(jì)算機(jī)的出現(xiàn)使數(shù)據(jù)的獲取、存儲與處理難度大大降低,因而相對準(zhǔn)確性更高的“樣本=總體”的測算方式將成為大數(shù)據(jù)時代的主流,同時大數(shù)據(jù)時代本身也是建立在大批量數(shù)據(jù)的存儲與處理的基礎(chǔ)之上的。

      接下來,維克多又通過了ibm追求高精確性的電腦翻譯計(jì)劃的失敗與google只是將所有出現(xiàn)過的相應(yīng)的文字語句掃描并儲存在詞庫中,所以無論需要翻譯什么,只要有聯(lián)系google詞庫就會出現(xiàn)翻譯,雖然有的時候的翻譯很無厘頭,但是大多數(shù)時候還是正確的,所以google的電腦翻譯的計(jì)劃的成功,表明大數(shù)據(jù)時代對準(zhǔn)確性的追求并不是特別明顯,但是相反大數(shù)據(jù)時代是建立在大數(shù)據(jù)的基礎(chǔ)住上的,所以大數(shù)據(jù)時代追求的是全方位覆蓋的數(shù)字測度而不管其準(zhǔn)確性到底有多高,因?yàn)榇罅康臄?shù)據(jù)會湮埋少數(shù)有問題的數(shù)據(jù)所帶來的影響。同時大量的數(shù)據(jù)也會無限的逼近事物的原貌。

      之后,維克托又預(yù)測了一個在大數(shù)據(jù)時代催生的重要職業(yè)——數(shù)據(jù)科學(xué)家,這是一群數(shù)學(xué)家、統(tǒng)計(jì)學(xué)與編程家的綜合體,這一群人將能夠從獲取的數(shù)據(jù)中得到任何他們想要的結(jié)果。換言之,只要數(shù)據(jù)充足我們的一切外在的與內(nèi)在的我們不想讓他人知道的東西都見會在這一群家伙的面前展現(xiàn)得淋漓盡致。所以為了避免個人隱私在大數(shù)據(jù)時代被這一群人利用,維克托建議將這一群人分為兩部分,一部分使用數(shù)據(jù)為商業(yè)部門服務(wù),而另一群人則負(fù)責(zé)審查這一些人是否合法的獲得與應(yīng)用數(shù)據(jù),是否侵犯了個人隱私。無論如何,大數(shù)據(jù)時代將會到來,不管我們接受還是不接受!而且這兩年,大數(shù)據(jù)這個詞突然變得很火,不僅出現(xiàn)在阿里巴巴、谷歌等互聯(lián)網(wǎng)公司的戰(zhàn)略規(guī)劃中,同時在我國國務(wù)院和其他國家的政府報(bào)告中多次提及,無疑成為當(dāng)今互聯(lián)網(wǎng)世界中的新寵兒。我對大數(shù)據(jù)一直好奇已久,閱讀了很多資料仍不得其解,直到讀完《大數(shù)據(jù)時代》才有了粗略的認(rèn)識。

      我側(cè)重于從第一部分中的這三個觀點(diǎn)談?wù)勛约旱目捶?,這三個觀點(diǎn)可以說是哲學(xué)上說的世界觀,這三個觀點(diǎn)可以說是哲學(xué)上說的世界觀,因?yàn)槭澜缬^決定方法論,所以這三個觀點(diǎn)對傳統(tǒng)看法的顛覆,就會導(dǎo)致各種變革的發(fā)生。首先是第一個,作者認(rèn)為在抽樣研究時期,由于研究條件的欠缺,只能以少量的數(shù)據(jù)獲取最大的信息,而在大數(shù)據(jù)時代,我們可以獲得海量的數(shù)據(jù),抽樣自然就失去它的意義了。放棄了隨機(jī)分析法這種捷徑,采用所有的數(shù)據(jù)。作者用大數(shù)據(jù)與喬布斯的癌癥治療例子說明了使用全部數(shù)據(jù)而非樣本的意義,列舉了日本“相撲”等來證明使用全體數(shù)據(jù)的重要性。這個觀點(diǎn)足以這個觀點(diǎn)足以引起統(tǒng)計(jì)學(xué)乃至社會文明的變革,因?yàn)榻y(tǒng)計(jì)抽樣和幾何學(xué)定理、萬有引力一樣被看做文明得以建立牢固的基石。我對這個觀點(diǎn)還是比較認(rèn)同的,如果真能收集到整體的數(shù)據(jù)而且分析數(shù)據(jù)的工具也足夠先進(jìn),自然是全體數(shù)據(jù)研究得出的結(jié)果更令人信服。但是這個觀點(diǎn)也過于絕對,就算是在大數(shù)據(jù)時代要想收集到全體數(shù)據(jù)還是不太可能實(shí)現(xiàn)的,因?yàn)槭占w數(shù)據(jù)要付出的代價有時會很大。比如說,你要檢測食品中致癌物質(zhì)是否超標(biāo),你不可能每一件食品你都檢測一遍吧。

      第二,要效率不要絕對的精確。作者說,執(zhí)迷于精確性是信息缺乏時代和模擬時代的產(chǎn)物,只有5%的數(shù)據(jù)是結(jié)構(gòu)化且能適用于傳統(tǒng)數(shù)據(jù)庫的。如果不接受混亂,剩下95%的非結(jié)構(gòu)化數(shù)據(jù)都無法被利用。作者是基于數(shù)據(jù)不可能百分之百正確的考慮而做出這樣的判斷的,如果采用小數(shù)據(jù)一個數(shù)據(jù)的錯誤就會導(dǎo)致結(jié)果的誤差很大,但是如果數(shù)據(jù)足夠多、數(shù)據(jù)足夠雜那得出的結(jié)果就越靠近正確答案。大數(shù)據(jù)時代要求我們重新審視精確性的優(yōu)劣,甚至還說到大數(shù)據(jù)不僅讓我們不再期待精確性,也讓我們無法實(shí)現(xiàn)精確性。谷歌翻譯的成功很好地證明了這一點(diǎn),谷歌的翻譯系統(tǒng)不像candide那樣精確地翻譯每一句話,它谷歌翻譯之所以優(yōu)于ibm的

      candide系統(tǒng)并不是因?yàn)樗鼡碛懈玫乃惴C(jī)制,和微軟的班科和布里爾一樣,谷歌翻譯增加了各種各樣的數(shù)據(jù),并且接受了有錯誤的數(shù)據(jù)。第三個觀點(diǎn),不是因果性,而是相關(guān)性,這是這本書中爭議最大的一個觀點(diǎn),不僅是讀者,就算是本書的譯者也在序言中明確地說到他不認(rèn)同“相關(guān)關(guān)系比因果關(guān)系更重要”的觀點(diǎn)。作者覺得相關(guān)關(guān)系對于預(yù)測一些事情已經(jīng)足夠了,不用花大力氣去研究他們的因果關(guān)系。作者用林登的亞馬遜推薦系統(tǒng)的成功,證實(shí)了大數(shù)據(jù)在分析相關(guān)性方面的優(yōu)勢以及在銷售中獲得的成功。沃爾瑪也是充分利用并挖掘各類數(shù)據(jù)信息的代表,從啤酒和尿布的案例,以及作者舉的有 關(guān)蛋撻和颶風(fēng)天氣的案例,都說明了掌握了相關(guān)關(guān)系對于他們策略的幫助。一句話,知道是什么就夠了,不用知道為什么。很明顯作者所舉的例子都是屬于商業(yè)領(lǐng)域的,但是對于其他領(lǐng)域來說這個觀點(diǎn)就值得商榷了。比如說,在科學(xué)研究領(lǐng)域,你需要知其然也需要知道其所以然,找到事件發(fā)生的原理。用文中的一個例子說明,喬布斯測出整個基因圖譜來治療癌癥,但是你治療癌癥你必須知道癌癥發(fā)病的原理,知道哪一段基因?qū)е铝诉@種疾病,不可能只是說收集各種數(shù)據(jù),然后利用其相關(guān)性來判斷哪里出現(xiàn)了問題

      作者在書中把大數(shù)據(jù)說的很厲害,在最后一部分分析大數(shù)據(jù)帶來無數(shù)好處的同時帶來的不良影響以及如何面對這些影響。用麥克納馬拉的例子來說明對數(shù)據(jù)過度依賴所帶來的后果。也用《少數(shù)派的報(bào)告》這部電影來說明如果癡迷于數(shù)據(jù)會導(dǎo)致我們將生活在一個沒有獨(dú)立選擇和自由意志的社會,如果一切變?yōu)楝F(xiàn)實(shí),我們將被禁錮在大數(shù)據(jù)的可能性之中。所以書中提出了幾種解決方法,一種是使用數(shù)據(jù)時征詢數(shù)據(jù)所有個人的知曉和授權(quán)。第二個技術(shù)途徑就是匿名化。毫無疑問,大數(shù)據(jù)將會給社會管理帶來巨大的變革。

      大數(shù)據(jù)給人類社會的方方面面帶來了巨大的變革,這是社會發(fā)展的潮流,不可逆轉(zhuǎn),我們只有順應(yīng)這種潮流,在思想上和技能上做好準(zhǔn)備才能成為時代的弄潮兒。對于一家公司或一個國家,要從根本上改變思維和觀念,盡早適應(yīng)這種潮流。

      最后,附上一段來自原著的結(jié)語:

      大數(shù)據(jù)并不是一個充斥著算法和機(jī)器的冰冷世界,人類的作用依然無法被完全替代。大數(shù)據(jù)為我們提供的不是最終答案,只是參考答案,幫助是暫時的,而更好的方法和答案還在不久的未來。篇二:《大數(shù)據(jù)時代》讀書報(bào)告

      讀書報(bào)告

      ——讀《大數(shù)據(jù)時代》

      坦白地說,這是我第一本看了睡不著的書,我還記得第一次閱讀時的興奮和激動,就像一場頭腦風(fēng)暴。書里的事例是那么的鮮活與生動,完全顛覆我的思維方式,打破了我大腦中解決問題原有的枷鎖。這本書讓我明白了太多~~~ 它讓我明白生活必須要主動。有些人碰到了不公就自認(rèn)倒霉,能干一點(diǎn)的可能還會去討個說法,但并沒有解決實(shí)際問題,這一次可能挽回了那么一點(diǎn)點(diǎn)的損失,但下次遇到了仍是如此,無限循環(huán)。當(dāng)你絞盡腦汁為了節(jié)約成本而提前一個月去購買一張你自以為廉價的飛機(jī)票,回頭卻發(fā)現(xiàn),比那些只提前一天購買的人所付的錢還要高出很多時,不知你會怎么想?是被動的接受還是想方法讓現(xiàn)實(shí)變得更美好? 它讓我更好地去理解現(xiàn)實(shí)生活的很多情況?,F(xiàn)在才理解,為什么網(wǎng)絡(luò)上有這么多驗(yàn)證碼的存在,為什么社交網(wǎng)要用實(shí)名制注冊,為什么有這么多的“我猜你喜歡”~~~ 雖然我很喜歡那些“黑匣子”,會讓我感覺很神奇,但當(dāng)我真正理解的他的原理時,其實(shí)更讓我興奮不已。原來谷歌翻譯背后是這樣操作的,原來那些每天時不時闖進(jìn)我們眼球的廣告并非偶然,原來預(yù)測流感不需要疾控中心而是網(wǎng)絡(luò)詞條,原來電影在開播前就已經(jīng)知道了收視率和票房~~~ 當(dāng)然以上這些相當(dāng)抓人眼球,但這只是大數(shù)據(jù)的表面,其真正的價值遠(yuǎn)不僅如此。人類總是以為自己很強(qiáng)大,能控制一切,當(dāng)然最好還能預(yù)測未來。其實(shí)大數(shù)據(jù)真的可以做到,雖然不可能很精確。在我看來這樣更好,大致結(jié)果可以意料,這就夠了,如果發(fā)現(xiàn)結(jié)果不盡如人意,我們可以提前控制。當(dāng)然還會有我們意想不到的情況發(fā)生,這樣會讓未來更充滿想象,更加充滿期待。

      它讓我懂得不能墨守成規(guī),也不能自以為是。大數(shù)據(jù)環(huán)境是那些微型企業(yè)發(fā)展的福地,它是行業(yè)競爭重新洗牌的動力源泉。在大數(shù)據(jù)面前,小公司不需要妄自菲薄,大的商業(yè)帝國也只有打氣十二分的精神才可能讓自己立于不敗之地。

      他讓我知道沒有做不得,只有想不到?,F(xiàn)在的賺取資本的方式已經(jīng)不再是單靠苦力就可以解決問題的時代了,看見朋友圈里的那些做代購的,都在自我催眠“不要看我們現(xiàn)在是微商~~~微商將來前途無量~~~·”我一直都抱著看看不說話的心態(tài),難免也會哂笑,真的不知道他們和菜場賣菜的有什么本質(zhì)區(qū)別~~~現(xiàn)在是一個依靠知識科技來富國強(qiáng)兵的時代了,真正的優(yōu)勢來源于你提前想到了別人還沒去想的,提早完成了別人還沒有籌備的計(jì)劃。

      他讓我學(xué)會世界上沒有光桿司令,我們必須學(xué)會合作。一個人的能力是有限的,一個人的時間也是有限的,同樣公司,國家都是一樣的。我們知道谷歌,亞馬遜,facebook以及中國的阿里巴巴,百度,新浪這些企業(yè)都很強(qiáng)大,可是他們?nèi)匀辉诓粩嗍召徍喜⒄掀渌恍┬〉墓?,為的是引用他們的科技技術(shù)來強(qiáng)大自己的事業(yè)版圖。

      它還教會我在機(jī)會面前必須要眼疾手快。在你還在猶豫不決或是自我陶醉的時候,你的對手已經(jīng)用一個非常低廉的價格得到了他想要翻身的王牌,當(dāng)你發(fā)現(xiàn)時,要么花大血本去換取一張相似的王牌,要與他赤身搏斗。大部分情況下那些聰明的人往往會選擇前者,因?yàn)樗麄冎缹幙蔀樽约含F(xiàn)在的失誤埋單也不會讓自己靠近萬丈深淵。因?yàn)槿魡适Я酥鲃訖?quán),那么很有可能導(dǎo)致的結(jié)果就是,那個原來看起來微不足道的“小木樁”卻扳倒了你這體積龐大的“大象”。

      說了這么多大數(shù)據(jù)給我的啟示,其實(shí)就是想突出大數(shù)據(jù)背后的那種神奇的力量。在近代我們似乎與每一樣新的科技都失之交臂,但是這一次我們似乎還有機(jī)會和時代同步伐,甚至如果我們足夠重視,可能還會走在時代的前沿。雖然我們現(xiàn)在誰都沒有把握中國到底會利用大數(shù)據(jù)到什么程度,但已經(jīng)有好多像周濤一樣的有志之士看好中國在利用大數(shù)據(jù)上的實(shí)力,并且付諸了他們的努力。他們一直都堅(jiān)信以前的落后僅僅是時間上的后知后覺,他們在這一次想

      要做到與世界同步,和歐美同步發(fā)行此書,在最早一刻就向大家推廣大數(shù)據(jù)這一新名詞,向大家灌輸著大數(shù)據(jù)的思維。對此,我也很慶幸,在恰當(dāng)?shù)臅r間點(diǎn)與大數(shù)據(jù)的偶遇。

      當(dāng)然,世界上沒有十全十美的東西,再好的發(fā)明總是有它的缺陷,大數(shù)據(jù)也不會例外。舍恩伯格這個對大數(shù)據(jù)最有權(quán)威發(fā)言權(quán)的人,既然有能力將大數(shù)據(jù)的好處講得淋漓盡致,毫無疑問自然也是最清楚大數(shù)據(jù)危險的人。我很尊敬他的嚴(yán)謹(jǐn)和坦誠,他在細(xì)致入微地解釋大數(shù)據(jù)革命性優(yōu)勢的同時,毫無修飾地點(diǎn)明了大數(shù)據(jù)的劣根性。他很準(zhǔn)確地說明了如果我們?yōu)E用或誤用數(shù)據(jù),我們將會受到毀滅性的打擊,后果將會如何不堪設(shè)想,并且這篇幅一點(diǎn)都不敷衍。作者非常專業(yè),他并沒有像某些專家一樣,一味地鼓吹自己的“一家之言”。而是在我們頭腦發(fā)熱,一哄而上之前,就給我們非常而且深刻的警醒。這也正是大數(shù)據(jù)思維的其中之一:饋前控制。

      讀完這本書以后,我有的確一點(diǎn)蠢蠢欲動,因?yàn)樗屛矣X得大數(shù)據(jù)并沒有像想象的那么遙不可及。書中說,會好好利用大數(shù)據(jù)的有三種人:第一種是擁有龐大數(shù)據(jù)庫的政府或者商業(yè)機(jī)構(gòu),他們之前只是不知道那些塵封已久的數(shù)據(jù)還可以創(chuàng)造巨大的價值。第二種是利用技術(shù)手段,讓數(shù)據(jù)發(fā)揮它獨(dú)特功能,從而幫他們解決實(shí)際問題的數(shù)據(jù)分析學(xué)家,統(tǒng)計(jì)師,精算師和其他一些有關(guān)于處理數(shù)據(jù)的相關(guān)人員,他們非常了解數(shù)據(jù)的狀態(tài),結(jié)構(gòu)和特征。的確這兩類人實(shí)力雄厚,前者擁有數(shù)據(jù)本身,而后者擁有技術(shù)。但他們有著同樣的短板,那就是他們沒有更為創(chuàng)新,靈動的視野,他們很難或者說沒有更多的時間去發(fā)現(xiàn)那些數(shù)據(jù)的真正力量。因?yàn)樗麄冇刑嗟乃季S定式,但種種利用大數(shù)據(jù)的成功事例表明,每次數(shù)據(jù)創(chuàng)造的奇跡總在那么的偶然和不經(jīng)意之間。而這正是我們第三種人的長處,我們沒有思維定式,更有閑暇的時間來感受生活,激發(fā)靈感。篇三:大數(shù)據(jù)時代讀書筆記

      大數(shù)據(jù)時代——讀書筆記

      一、引論

      1.大數(shù)據(jù)時代的三個轉(zhuǎn)變: 1.可以分析更多的數(shù)據(jù),處理和某個現(xiàn)象相關(guān)的所有數(shù)據(jù),而不是隨機(jī)采樣 2.不熱衷于精確度

      3.不熱衷與尋找因果關(guān)系 2.習(xí)慣:用來決策的信息必須是少量而精確的。實(shí)際:數(shù)據(jù)量變大,數(shù)據(jù)處理速度變快,數(shù)據(jù)不在精確

      3.危險:不是隱私的泄露而是未來行動的預(yù)判

      二、大數(shù)據(jù)時代的思維變革 1.原因:沒有意識到處理大規(guī)模數(shù)據(jù)的能力,假設(shè)信息匱乏,發(fā)展一些使用少量信息的技

      術(shù)(隨機(jī)采樣)

      1.1086年 末日審判書 英國對人的記載 2.約翰·格朗特:統(tǒng)計(jì)學(xué),采樣分析精確性隨著采樣隨機(jī)性上升而大幅上升,與樣本數(shù)

      量關(guān)系不大

      3.1890年,穿孔卡片制表機(jī),人口普查 4.隨機(jī)采樣有固有的缺陷 1.采樣過程中存在偏差 2.采樣不適合考察子類別

      3.只能得出實(shí)現(xiàn)設(shè)計(jì)好的問題的結(jié)果 4.忽視了細(xì)節(jié)考察

      2.全數(shù)據(jù)模式:樣本=總體 1.通過異常量判斷信用卡詐騙 2.大數(shù)據(jù)分析:不用隨機(jī)抽樣,而是采用所有數(shù)據(jù)。不是絕對意義而是相對意義。

      (xroom信用卡詐騙,日本相撲比賽)3.多樣性的價值(社區(qū)外聯(lián)系很多》社區(qū)內(nèi)聯(lián)系很多)3.混雜性而非精確性 1.葡萄樹溫度測量:數(shù)據(jù)變多,雖然可能有錯誤數(shù)據(jù),但總體而言會更加精確。2.包容錯誤有更大好處

      3.word語法檢查:語料庫》算法發(fā)展 4.google翻譯:讓計(jì)算機(jī)自己估算對應(yīng)關(guān)系,尋找成千上萬對譯

      結(jié)論:大數(shù)據(jù)的簡單算法好過小數(shù)據(jù)的復(fù)雜算法 5.大數(shù)據(jù)讓我們不執(zhí)著于也無法執(zhí)著于精確 6.mit的通貨緊縮軟件:即時的大數(shù)據(jù) 7.標(biāo)簽:不精確

      8.想要獲得大規(guī)模數(shù)據(jù)的好處,混亂是一種標(biāo)準(zhǔn)途經(jīng) 9.新的數(shù)據(jù)庫:大部分?jǐn)?shù)據(jù)是非結(jié)構(gòu)化的,無法被利用 10.hadoop:與mapreduce系統(tǒng)相對的開源式分布系統(tǒng),輸出結(jié)果不精確,但是非???結(jié)論:相比于依賴小數(shù)據(jù)和精確性的時代,大數(shù)據(jù)因?yàn)楦鼜?qiáng)調(diào)數(shù)據(jù)的完整性和混雜性,幫助我們進(jìn)一步接近事情的真相。“部分”和”確切“的吸引力是可以理解的。但是當(dāng)我們的視野局限在我們可以分析和確定的數(shù)據(jù)上時,我們對世界的整體影響就會產(chǎn)生偏差和錯誤。不僅失去了盡力收集一切數(shù)據(jù)和活力,也失去了從不同角度觀察時間的權(quán)利。

      三、不是因果是相關(guān) 1.知道是什么就夠了,不需要知道為什么。1.亞馬遜放棄書評組,使用大數(shù)據(jù)預(yù)測人們的未來購書需求 2.2.在小數(shù)據(jù)世界,相關(guān)關(guān)系有用,但是大數(shù)據(jù)背景,相關(guān)關(guān)系大放異彩。通過找關(guān)聯(lián) 物,相關(guān)關(guān)系可以幫助我們捕捉現(xiàn)在和預(yù)測未來 1.a和b經(jīng)常一起發(fā)生,那么a發(fā)生時可以預(yù)測b發(fā)生 2.例子:沃爾瑪把颶風(fēng)用具和蛋撻放在一起 3.過時的尋找關(guān)聯(lián)物的方法 a)原因:數(shù)據(jù)少且收集花時間 b)在建立,應(yīng)用假想和選擇關(guān)聯(lián)物時容易犯錯誤 c)結(jié)論:我們不需要人工選擇關(guān)聯(lián)物 3.大數(shù)據(jù)的相關(guān)分析法更準(zhǔn)確,更快 1.例子:fico我們知道你明天會做什么 2.伊百麗:根據(jù)個人信用卡交易記錄預(yù)測個人收入,防止逃稅 3.aviva:根據(jù)生活方式數(shù)據(jù)預(yù)測疾病 4.美國零售商target:通過購買習(xí)慣預(yù)測是否懷孕 4.通過找出新種類數(shù)據(jù)的相互聯(lián)系解決日常需要:找到關(guān)聯(lián)物并監(jiān)控,我們可以預(yù)知未來

      1.例子:ups與汽車修理預(yù)測 2.新生兒健康監(jiān)測:肉眼看不到,但是計(jì)算機(jī)能看到 5.當(dāng)收集分析和儲存數(shù)據(jù)的成本較高時,應(yīng)當(dāng)適當(dāng)丟棄一些數(shù)據(jù) 6.數(shù)據(jù)的非線性關(guān)系 1.幸福的非線性關(guān)系 7.快速思維模式使人們偏向于用因果關(guān)系看待周圍的一切,因此經(jīng)常對世界產(chǎn)生錯誤認(rèn)識。這也使大腦為了避免辛苦思考而產(chǎn)生的捷徑。大數(shù)據(jù)會經(jīng)常被用來證明我們習(xí)慣的思維方式是錯誤的。8.證明因果關(guān)系的實(shí)驗(yàn)開銷大,難于操作;相關(guān)關(guān)系很有用,不僅是因?yàn)槟転槲覀兲峁┬碌囊暯?,而且提供的視角都很清晰。一旦我們考慮因果關(guān)系,這些視角會被蒙蔽。9.大數(shù)據(jù)并非是理論消亡的時代。

      四、一切皆可量化 1.莫里的信息交換計(jì)劃:總結(jié)所有船只的航海日志已獲得好的航線,為第一根大西洋電纜奠定基礎(chǔ)

      2.坐姿研究與汽車防盜系統(tǒng) 3.數(shù)據(jù)化

      1.把現(xiàn)象轉(zhuǎn)變成可指標(biāo)分析的量化形式的過程 2.計(jì)量和記錄促成了數(shù)據(jù): 1.阿拉伯?dāng)?shù)字 2.計(jì)數(shù)板 3.復(fù)式記賬法

      3.數(shù)字化與數(shù)據(jù)化的區(qū)別

      1.例子:google的數(shù)字圖書館:開始使用掃描-》數(shù)字化,進(jìn)而光學(xué)識別-》數(shù)

      據(jù)化。google借此改進(jìn)自己的翻譯 2.文化組學(xué):定量分析揭示人類行為 4.文字變成數(shù)據(jù):人可以閱讀,機(jī)器可以分析 5.方位變成數(shù)據(jù):需要一套標(biāo)準(zhǔn)的標(biāo)記系統(tǒng)和收集,記錄數(shù)據(jù)的工具。1. 始于古希臘

      2.1884年,國際子午線會議 3.1978年,全球定位系統(tǒng) 4.英國汽車保險

      5. ups的最佳行車路線:減少左轉(zhuǎn) 6.收集用戶地理位置數(shù)據(jù),以便進(jìn)行忠誠度計(jì)劃?;蛘呖梢灶A(yù)測交通情況 6.現(xiàn)實(shí)挖掘

      1.處理大量手機(jī)數(shù)據(jù),發(fā)現(xiàn)并預(yù)測人類的行為。2.例子:預(yù)測流感隔離區(qū)域 3.例子:通過非洲預(yù)付費(fèi)用戶的位置信息和他們賬戶的資金,發(fā)現(xiàn)貧民窟是

      經(jīng)濟(jì)繁榮的跳板 7.溝通變成數(shù)據(jù)

      1.facebook:社交關(guān)系數(shù)據(jù)化

      號。新推特頻率可以預(yù)測電影票房

      可能性呈現(xiàn)正相關(guān) 8.萬物數(shù)據(jù)化

      1.觸覺地板:適時開關(guān)燈,確定身份,某人摔倒之后是否站起來 2.人體傳感器:監(jiān)控健康狀態(tài) 4.結(jié)論:世界的本質(zhì)是信息和數(shù)據(jù),大數(shù)據(jù)提供新視角。

      五、大數(shù)據(jù)的潛在價值 1.例子:captcha(驗(yàn)證碼,全自動區(qū)分人類和電腦的圖靈測試)與數(shù)據(jù)再利用。作者使用了新的驗(yàn)證碼recaptcha,人們從計(jì)算機(jī)光學(xué)字符識別程序無法識別的文本掃面項(xiàng)目中讀入單詞并輸出,知道他們都輸出正確后才確定(用來破譯數(shù)字化文本中不清楚的單詞)2.大數(shù)據(jù)時代,所有的數(shù)據(jù)都是有價值的?,F(xiàn)在,我們能夠以較低成本獲取并存儲數(shù)據(jù)。數(shù)據(jù)的真實(shí)價值就像漂浮在海洋中的冰山,絕大部分隱藏在表面之下。3. 不同于物質(zhì)性的東西,數(shù)據(jù)的價值不會隨它的使用而減少,而且可不斷被處理。意味著數(shù)據(jù)的最終價值遠(yuǎn)遠(yuǎn)大于它的最初價值。在基本用途完成后,數(shù)據(jù)的價值仍然存在,數(shù)據(jù)的價值是其所有可能用途的總和。4.例子:ibm與電力汽車動力系統(tǒng)的優(yōu)化預(yù)測:大數(shù)據(jù)預(yù)測模型,甚至考慮天氣預(yù)報(bào) 5.數(shù)據(jù)再利用:

      1. 搜索關(guān)鍵詞,搜索結(jié)果預(yù)測夏天流行色 2.google保存語音翻譯記錄,開發(fā)自己的語音識別技術(shù) 3.移動運(yùn)營商長期使用大數(shù)據(jù)微調(diào)網(wǎng)絡(luò)性能 4.有些公司可能會收集到大量的數(shù)據(jù),但是他們并不急需使用,也不擅長使用數(shù)據(jù),但是別的公司可以借此探尋數(shù)據(jù)的潛在價值 8.重組數(shù)據(jù) 1.例子:丹麥癌癥協(xié)會與手機(jī)致癌調(diào)查:使用所有的手機(jī)用戶信息和所有的中樞神經(jīng)系統(tǒng)腫瘤信息。

      隨著大數(shù)據(jù)的出現(xiàn),數(shù)據(jù)的總和比部分更有價值,當(dāng)我們將多個數(shù)據(jù)集的總和重組在一起,重組總和本身的價值也比單個總和更大 9.可拓展數(shù)據(jù) 1.google街景和gps采集,不僅將其用于基本用途,而且進(jìn)行了大量的二次利用。例如,對google自動駕駛汽車的運(yùn)作 10.?dāng)?shù)據(jù)的折舊值

      1.隨著時間的推移,大多數(shù)數(shù)據(jù)都會失去一部分基礎(chǔ)用途,不應(yīng)用此破壞新數(shù)據(jù) 2.挑戰(zhàn):如何得知某些數(shù)據(jù)不再有價值 3.并非所有數(shù)據(jù)都會貶值。例子:google希望得到每年的同比數(shù)據(jù)

      結(jié)論:組織機(jī)構(gòu)應(yīng)收集盡可能多的使用數(shù)據(jù)并保存盡可能長的時間。同時也應(yīng)該與第三方分享數(shù)據(jù)

      11.數(shù)據(jù)廢氣:用戶在線交互的副產(chǎn)品,包括瀏覽哪些頁面,停留多久,輸入信息等 1.數(shù)據(jù)再利用的方式很隱蔽 2.例子:google的拼寫檢查:搜集每天處理的查詢中數(shù)據(jù)搜索框的錯誤拼寫 3.例子:google的過濾噪音技術(shù):如果用戶點(diǎn)擊搜索結(jié)果靠后的鏈接,說明這個結(jié)果更加有相關(guān)性,google會把這個頁面的排名相應(yīng)提升。4.當(dāng)用戶指出了各種自動化程序的錯誤,實(shí)際上是訓(xùn)練了系統(tǒng) 5.例子:巴諾與數(shù)據(jù)快照,電子書閱讀器捕捉人們閱讀書籍的習(xí)慣 6.例子:coursera通過捕捉學(xué)生犯的錯誤來提示未來犯錯誤者

      結(jié)論:數(shù)據(jù)廢氣可以成為公司的巨大競爭優(yōu)勢,和對手的強(qiáng)大進(jìn)入堡壘 12.開放數(shù)據(jù) 1.最大的數(shù)據(jù)收集者:政府,可以強(qiáng)迫人們提供信息,但是信息利用效率低下。最好允許私人運(yùn)營部門和社會大眾訪問

      2.例子:flyontime網(wǎng)站,通過開放的數(shù)據(jù)分析航班延誤可能性。3.給數(shù)據(jù)估值:從數(shù)據(jù)持有人在價值提取上所采取的不同策略入手,將數(shù)據(jù)授權(quán)給第三方

      三、角色定位:數(shù)據(jù),技術(shù)與思維 2.思維轉(zhuǎn)變的重要性 3.三種大數(shù)據(jù)公司

      1.基于數(shù)據(jù)本身的公司:twitter 大數(shù)據(jù)最值錢的是他本身,所以應(yīng)該優(yōu)先考慮數(shù)據(jù)擁有者

      例子:機(jī)票預(yù)訂系統(tǒng)ita不直接使用數(shù)據(jù):擔(dān)心暴露利潤

      例子:mastercard通過大數(shù)據(jù)預(yù)測客戶的消費(fèi)習(xí)慣 2.基于技能的公司:咨詢公司,技術(shù)供應(yīng)商或者分析公司:teradata 例子:埃森哲公司利用大數(shù)據(jù)檢測汽車零件并節(jié)省費(fèi)用

      例子:微軟分析公司利用大數(shù)據(jù)降低病人的再入院率 3.基于思維的公司:創(chuàng)新思維

      例子:flightcaster飛機(jī)晚點(diǎn)預(yù)測

      例子:prismatic分析新聞并排序 4.大數(shù)據(jù)先驅(qū)者一般有跨學(xué)科的知識 5.例子:google和amazon三者兼?zhèn)? 6.全新的數(shù)據(jù)中間商:從各個地方搜集數(shù)據(jù),提取有用的信息進(jìn)行利用,并不威脅數(shù)據(jù)擁有者的利益

      1.社會需要定向廣告

      例子:inrix:分析各種汽車制造者的數(shù)據(jù)和用戶的數(shù)據(jù),提供衛(wèi)星導(dǎo)航服務(wù)

      汽車制造商們本身數(shù)據(jù)量不夠,自身也沒有技術(shù)利用大數(shù)據(jù),也并不介意數(shù)據(jù)會被中間商利用。同時可以提供失業(yè)率等相關(guān)數(shù)據(jù)

      例子:quantcast:收集用戶訪問信息來測評用戶年齡等,之后發(fā)定向廣告

      例子:hcci收集醫(yī)療保單,分析美國醫(yī)療費(fèi)用上漲是否合理

      結(jié)論:

      1.數(shù)據(jù)價值的轉(zhuǎn)移:從技術(shù)到數(shù)據(jù)本身和大數(shù)據(jù)思維 2.傳統(tǒng)商業(yè)模式顛覆:交易數(shù)據(jù)而不是交易技術(shù) 3.傳統(tǒng)專家的光芒會被統(tǒng)計(jì)和數(shù)據(jù)學(xué)家取代,因?yàn)楹笳咧魂P(guān)心數(shù)據(jù) 1.例子:谷歌翻譯團(tuán)隊(duì)的工程師都不會說出翻譯的語言 2.真正的專家不會消亡,但是主導(dǎo)地位會改變 3.專業(yè)技能只適用于小數(shù)據(jù)時代,因?yàn)槟鞘切枰揽恐庇X和經(jīng)驗(yàn)指導(dǎo),但是

      遭遇海量數(shù)據(jù)時,可以通過數(shù)據(jù)挖掘得到更多 4.數(shù)據(jù)和統(tǒng)計(jì)學(xué)知識將成為現(xiàn)代工廠的基礎(chǔ),人類的價值體現(xiàn)在交流上,以進(jìn)行廣泛而深刻的傳播

      1.例子:交互式游戲,會根據(jù)用戶來改良,以數(shù)據(jù)為基礎(chǔ)運(yùn)作 5.大數(shù)據(jù)決定企業(yè)核心競爭力 1.數(shù)據(jù)規(guī)模決定價值

      2.例子:勞斯萊斯通過大數(shù)據(jù)監(jiān)測引擎,預(yù)測可能出問題的引擎 3.例子:蘋果進(jìn)軍手機(jī) 4.大數(shù)據(jù)為小公司帶來了機(jī)遇:能享受非固有資產(chǎn)規(guī)模的好處,低成本傳播創(chuàng)新結(jié)果,只需要創(chuàng)新思維

      5.大數(shù)據(jù)擁有者會想辦法增加數(shù)據(jù)存儲量 6.消費(fèi)者成為數(shù)據(jù)擁有者并與中間商交易 7.大數(shù)據(jù)對中等規(guī)模的公司幫助不大:既沒有靈活性也沒有規(guī)模效應(yīng) 6.大數(shù)據(jù)撼動國家競爭力:西方世界優(yōu)勢減少

      四、大數(shù)據(jù)時代的管理

      1.大數(shù)據(jù)會帶來很多危險,因?yàn)槠浜诵乃枷胧怯靡?guī)模劇增來改變現(xiàn)狀。2.濫用大數(shù)據(jù)的力量會傷害人身安全 3.大數(shù)據(jù)的二次利用顛覆了隱私保護(hù)法:無法征得個人同意 4.如果所有人的信息在數(shù)據(jù)庫里,有意識地避免就是此地?zé)o銀三百兩 5.匿名化:交叉檢驗(yàn)會檢驗(yàn)出來 6.大數(shù)據(jù)預(yù)測:罪責(zé)判定基于對個人未來行為的預(yù)測。大數(shù)據(jù)可能會否定人的自由意志 7.數(shù)據(jù)有其局限性,數(shù)據(jù)的質(zhì)量可能會很差,有誤導(dǎo)性。8.卓越的才華并不依賴數(shù)據(jù):apple喬布斯的才能

      五、掌握大數(shù)據(jù) 1.個人隱私保護(hù):從個人許可到讓數(shù)據(jù)使用者承擔(dān)責(zé)任,因?yàn)閷⒇?zé)任從民眾轉(zhuǎn)移到數(shù)據(jù)使用者很有意義因?yàn)閿?shù)據(jù)使用者比其他人更明白他們想怎么樣使用數(shù)據(jù),也因?yàn)樗麄兪亲畲罄娅@得者:監(jiān)管機(jī)制可以決定不同種類的個人數(shù)據(jù)必須刪除的時間 2.信息模糊處理

      3.個人應(yīng)該為他們的行動而非傾向負(fù)責(zé) 4.打破大數(shù)據(jù)的黑盒子:大數(shù)據(jù)算法師:評估數(shù)據(jù)源,分析數(shù)據(jù)工具,解讀運(yùn)算結(jié)果 1.外部算法師:審計(jì)大數(shù)據(jù)的準(zhǔn)確程度和有效性篇四:讀書筆記-《大數(shù)據(jù)時代》

      讀《大數(shù)據(jù)時代》 初次見到維克多·邁爾-舍恩伯格教授是在《對話》欄目中,當(dāng)時談及當(dāng)今各種科技信息的變化,然后在主持人的各種提問下,我逐漸了解到“大數(shù)據(jù)”這個名詞,他也是現(xiàn)在對于大數(shù)據(jù)最有發(fā)言權(quán)的預(yù)言家。一位睿智的人總是能夠給人留下很深的印象。然后在中央財(cái)經(jīng)頻道的特別節(jié)目《指尖上的商機(jī)》系列節(jié)目中,也談及到大數(shù)據(jù)對于當(dāng)今時代的影響和蘊(yùn)藏的巨大商機(jī)。

      讀一本好書就像與智者交談。今天我翻讀《大數(shù)據(jù)時代》,細(xì)細(xì)品讀這位智者給我們的禮物。我們首先應(yīng)該明白一個概念“大數(shù)據(jù)”,他不是單單的說數(shù)據(jù)很大,或者數(shù)據(jù)很多的意思,真正的意思是:不用隨機(jī)分析法這樣的捷徑,而采用所有數(shù)據(jù)的方法。它告訴我們一種超越現(xiàn)在的對于數(shù)據(jù)的一種分析方法,這個方法建立在盡可能多的數(shù)據(jù)上。下面讓我們合上此書,讓他從我們的思想深處開始發(fā)聲吧。

      首先,大數(shù)據(jù)時代是建立的基礎(chǔ)就是有一個很龐大的數(shù)據(jù)庫,我們分析的對象不是抽取樣本,而是用全部的數(shù)據(jù)作為樣本,“樣本=總體”。這樣我們能夠把要調(diào)查的對象精確到每一個個體,我們能夠?qū)γ恳粋€個體提供個性化分析和服務(wù)。我們會擺脫抽樣樣本的誤差和失誤,同樣我們能夠細(xì)化我們研究的對象和分析的數(shù)據(jù)。我們分析的適合一個大的整體,也適合每一個個體。這是大數(shù)據(jù)分析的基礎(chǔ)。

      第二,大數(shù)據(jù)是由很多不同的紛繁復(fù)雜的數(shù)據(jù)匯總在一起的,我們必須接受他們的復(fù)雜性和不精確性,我們的研究方向除了尋找因果關(guān)系之外,增加了一種相關(guān)關(guān)系的研究。我們通過數(shù)據(jù)之間的關(guān)系,分析得到我們想要得到的結(jié)論或者是模型。在這里我們應(yīng)該重點(diǎn)看一下,相關(guān)關(guān)系是我們打開的另一扇窗,而不能關(guān)閉因果關(guān)系的現(xiàn)在開著的窗戶。我們開始重視相關(guān)關(guān)系,但是不能放棄對于因果關(guān)系的研究。作者也在文中闡釋我們的生活還是需要因果關(guān)系的,甚至我們需要大數(shù)據(jù)算法師,我們需要了解“黑匣子”中的神秘。這是大數(shù)據(jù)時代我們應(yīng)該正確認(rèn)識的。

      第三,大數(shù)據(jù)的原始來源是用不同的方法收集,為了有盡可能多的數(shù)據(jù),我們現(xiàn)在有了電腦,搜索引擎,智能手機(jī),可穿戴設(shè)備,社交平臺,還有無數(shù)的傳感器等等,我們可以把文字,位置,動作,喜好等所有的世界進(jìn)行量化,他都可以用數(shù)字表示,這就是我們所有的紛繁復(fù)雜的原始數(shù)據(jù),他們是一座鉆石礦,由于無數(shù)種的相關(guān)組合可以不斷地挖掘出我們所需要的信息。這是我們不斷利用大數(shù)據(jù)的基礎(chǔ)。我們需要不斷更新的數(shù)據(jù)。

      第四,未來在過去的塵埃中。我們分析大數(shù)據(jù)最大的作用就是預(yù)測未來,知道下一步你會做什么,知道下一個最危險的事物或人。我們用什么方法預(yù)測未來。這是一個商業(yè),政府,甚至世界的時代,我們分析的方法就是動用自己敏銳的思維發(fā)現(xiàn)相關(guān)性,然后動用我們的數(shù)據(jù)分析工具對其進(jìn)行相關(guān)性分析,最后我們用統(tǒng)計(jì)學(xué)研究出一個模型。通過模型我們能夠預(yù)測未來。大數(shù)據(jù)分析的關(guān)鍵就在于數(shù)據(jù),思維和技術(shù)。現(xiàn)在我們有快速分析的工具,正在不斷收集數(shù)據(jù),那么最重要的就是人類的思維,一個能夠分析相關(guān)性,能夠創(chuàng)新使用數(shù)據(jù)的思維。在大數(shù)據(jù)時代我們需要把統(tǒng)計(jì)學(xué),軟件工程師和創(chuàng)新思維結(jié)合在一起的人才。

      第五,我們能夠知道每一個人的位置,喜好,關(guān)注什么,即將干什么等等,對于每個人來說都是一個很可怕的事情,如果我們赤裸裸的暴露在陽光之下,或者我們正在暴露中,我們的隱私應(yīng)該受到保護(hù),這也是大數(shù)據(jù)時代一個亟待解決的問題,盡管我們匿名分析信息,到最后我們還是能夠精確到個人,我們需要有人負(fù)責(zé),這是安全問題,自由和科技或商業(yè)的發(fā)展產(chǎn)生矛盾,我們應(yīng)該何去何從?我們擔(dān)憂的,相信會有人來解決。這涉及到我們每個人的利益。

      來暴露我們需要的產(chǎn)品;我們用百度、google來暴露我們所關(guān)注的事情。我想有好多雙眼睛正在盯著我們,只是我們還不知道。這是一件可怕的事情。

      下載學(xué)習(xí)《大數(shù)據(jù)時代》讀書心得word格式文檔
      下載學(xué)習(xí)《大數(shù)據(jù)時代》讀書心得.doc
      將本文檔下載到自己電腦,方便修改和收藏,請勿使用迅雷等下載。
      點(diǎn)此處下載文檔

      文檔為doc格式


      聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻(xiàn)自行上傳,本網(wǎng)站不擁有所有權(quán),未作人工編輯處理,也不承擔(dān)相關(guān)法律責(zé)任。如果您發(fā)現(xiàn)有涉嫌版權(quán)的內(nèi)容,歡迎發(fā)送郵件至:645879355@qq.com 進(jìn)行舉報(bào),并提供相關(guān)證據(jù),工作人員會在5個工作日內(nèi)聯(lián)系你,一經(jīng)查實(shí),本站將立刻刪除涉嫌侵權(quán)內(nèi)容。

      相關(guān)范文推薦

        大數(shù)據(jù)時代讀書心得體會

        《大數(shù)據(jù)時代》是英國維克托·邁爾-舍恩伯格教授的著作,這本書也被尊為國外大數(shù)據(jù)研究的先河之作。下面是帶來的大數(shù)據(jù)時代讀書心得,歡迎查看。大數(shù)據(jù)時代讀書心得體會范文1《......

        《大數(shù)據(jù)》讀書心得

        《大數(shù)據(jù)》讀書心得 進(jìn)入2012年大數(shù)據(jù)一詞越來越多地被提及,人們用它來描述和定義信息爆炸時代產(chǎn)生的海量數(shù)據(jù),并命名與之相關(guān)的技術(shù)發(fā)展與創(chuàng)新,人們對于海量數(shù)據(jù)的挖掘和運(yùn)用,......

        讀書報(bào)告——《大數(shù)據(jù)時代》觀后感

        讀書報(bào)告——《大數(shù)據(jù)時代》觀后感 大數(shù)據(jù)時代,一個被嚼爛的詞匯,不知從何時起,興起了數(shù)據(jù)科學(xué)的狂潮,本書核心論點(diǎn),第一,要全體不要抽樣,第二,要相關(guān)不要因果,第三,要效率不要精確。......

        市場營銷讀書報(bào)告--《大數(shù)據(jù)時代》

        市場營銷讀書報(bào)告--《大數(shù)據(jù)時代》 讀書報(bào)告題目:大數(shù)據(jù)時代的生活、工作和思維變革 書名:大數(shù)據(jù)時代作者:[英]維克托·邁爾-舍恩伯格,肯尼思·庫克耶 出版社:浙江人民出版社出版......

        大數(shù)據(jù)時代

        大數(shù)據(jù)時代近年來,隨著互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)、智能手機(jī)及傳感器等的普及,信息流量有了爆發(fā)性的增長,兩會以后,互聯(lián)網(wǎng)里最熱的詞匯,就是李克強(qiáng)總理在政府工作在報(bào)告里面提到的“互......

        大數(shù)據(jù)時代

        “大”數(shù)據(jù)時代 眾所周知,數(shù)據(jù)本身就蘊(yùn)藏著價值,但是將有用的數(shù)據(jù)與沒有價值的數(shù)據(jù)進(jìn)行區(qū)分看起來可能是一個棘手的問題。 顯然,您所掌握的人員情況、工資表和客戶記錄對于企業(yè)......

        大數(shù)據(jù)時代

        《大數(shù)據(jù)時代》讀書筆記 作者:邁爾舍恩伯格 出版發(fā)行:浙江人民出版社 版次:2013年1月第一版 讀者:物流一班、時菲陽 一、作者觀點(diǎn) 谷歌有一個名為“谷歌流感趨勢”的工具,它通過......

        大數(shù)據(jù)時代來臨讀書月心得體會

        一部似乎還沒有寫完的書 ——讀《大數(shù)據(jù)時代》有感及所思 讀了《大數(shù)據(jù)時代》后,感覺到一個大變革的時代將要來臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯......