第一篇:電影大數(shù)據(jù)國際文獻綜述
電影大數(shù)據(jù)國際文獻綜述
【摘要】大數(shù)據(jù)是當前的一種熱點技術(shù),在越來越多的科學研究領(lǐng)域得到應(yīng)用。通過對國際前沿的電影大數(shù)據(jù)研究進行梳理,以近5年電影大數(shù)據(jù)相關(guān)的英文論文為樣本進行分析發(fā)現(xiàn),大數(shù)據(jù)在電影產(chǎn)業(yè)得到廣泛應(yīng)用。根據(jù)文獻的主題域,從票房預(yù)測、市場營銷、情感分析、推薦系統(tǒng)、產(chǎn)業(yè)經(jīng)濟、文化批評和文本分析方面,總結(jié)主要研究成果,為電影研究帶來新的視野。
【關(guān)鍵詞】電影;大數(shù)據(jù);社交媒體;人工智能
大數(shù)據(jù)是當前的一種熱點技術(shù),對社會影響巨大。越來越多的科學研究領(lǐng)域應(yīng)用大數(shù)據(jù),甚至一些人文學科也在開拓數(shù)據(jù)研究新理路。大數(shù)據(jù)的核心是運用計算機技術(shù),通過人們在互聯(lián)網(wǎng)上形成的分散的、非結(jié)構(gòu)化的數(shù)據(jù),發(fā)現(xiàn)傳統(tǒng)研究無法實現(xiàn)的規(guī)律。本文試圖對國際前沿的電影大數(shù)據(jù)研究進行梳理,總結(jié)研究成果,尤其是跨學科的理論,為電影研究帶來新的視野。
波德維爾(2000)以“中間層面理論”強調(diào)在“實證主義”思想指導下的電影形式關(guān)懷,提倡電影內(nèi)容生產(chǎn)的數(shù)據(jù)思維和計算過程。以互聯(lián)網(wǎng)、云計算等技術(shù)和平臺為核心的大數(shù)據(jù),為這種研究路徑提供了新的形式和方法。2013年,Netflix公司根據(jù)網(wǎng)絡(luò)用戶使用習慣,分析出導演、主演和劇情的交集,推出《紙牌屋》,獲得巨大成功。同年,谷歌的媒體與娛樂業(yè)首席分析師Andrea Chen與Reggie Panaligan聯(lián)合發(fā)布了《用谷歌搜索量化電影魔力》白皮書。以2012年間美國上映的近百部電影為研究對象,分析了影片上映前各時間段里用戶對各類電影信息的搜索行為數(shù)據(jù),揭示了電影相關(guān)搜索量與電影票房成績間存在的強相關(guān)性。國內(nèi)也快速應(yīng)用了大數(shù)據(jù),但主要在票房監(jiān)測和預(yù)測、營銷等方面。
本研究以2013年1月到2018年1月與電影大數(shù)據(jù)相關(guān)的英文文獻為樣本,通過對600多篇文獻進行篩選,最終選取76篇作為研究對象。根據(jù)文獻的主題域,我們劃分為票房預(yù)測、市場營銷、情感分析、推薦系統(tǒng)、產(chǎn)業(yè)經(jīng)濟、文化批評和文本分析六個方面。
一、票房預(yù)測
電影產(chǎn)業(yè)的高風險性使企業(yè)一直在尋找能夠準確預(yù)測收益的方法。然而,由于電影受到非常復雜的社會因素影響,即使是最有經(jīng)驗的電影人,也往往會無法準確把握。近年來,成本的不斷攀升,前兩周即完成主要票房收入的飽和式發(fā)行,家庭影像產(chǎn)品銷售的下降,以及媒介競爭的加劇,都使得電影的風險日益增強。不過,隨著人們互聯(lián)網(wǎng)應(yīng)用的深入,通過信息技術(shù)準確預(yù)測票房的可能性不斷提高。計算機專業(yè)較早地以不同的算法和變量組合,探索票房預(yù)測的規(guī)律。
傳統(tǒng)票房預(yù)測研究將預(yù)算、演員、導演、制片人、故事地點、編劇、上映時間、音樂、上映地點、目標觀眾和續(xù)集等因素作為變量。而基于大數(shù)據(jù)的研究則集中在社交媒體、搜索引擎和營銷活動等方面。
人們通過社交媒體,對電影進行評論,即消費者參與行為(Consumer engagement behavior,?稱CEB),產(chǎn)生大量數(shù)據(jù)。許多研究探討了CEB與票房之間的關(guān)聯(lián)性。Oh Chong等對美國電影及社交媒體活動進行分析,發(fā)現(xiàn)Facebook和YouTube上的CEB與票房總收入是正相關(guān)的;然而,在Twitter上卻沒有同樣的效果。他們認為,電影在多個渠道進行社交媒體傳播具有重要意義。[1]Huang Jianxiong等提出,專家評論和基于拉動式的用戶評論在電影上映的早期階段有影響,并且隨著時間的推移,影響會逐漸減小。相比之下,基于推送式的微博平臺的評論數(shù)量對以后的票房收入有影響。他們認為,網(wǎng)絡(luò)意見并不總是具有說服力和有用性。[2]不過,Baek Hyunmi等似乎獲得了與上述兩個研究不同的結(jié)果。他們以羅杰斯的創(chuàng)新擴散理論為框架,對多個社交媒體平臺進行比較,提出在電影上映的初期階段,Twitter對票房收入的影響更大,因為它具有高度的即時性和傳播性。雅虎在電影上映的后期,對電影的影響力更大,因為它具有很強的說服力。由于博客和YouTube包含了大眾媒體和人際傳播媒體的特點,在最初和后期階段對票房收入的影響沒有什么不同。[3]Ding Chao等聚焦Facebook的點贊行為,發(fā)現(xiàn)在上映前一周,點“贊”數(shù)量增加1%,則上映周票房增長約0.2%。越接近上映日期,提前點“贊”的效果就會變得越強。[4]Oh Sehwan等通過對YouTube上電影預(yù)告片的分析發(fā)現(xiàn),電影預(yù)告片的分享對電影的票房收入有積極的影響,在電影上映的早期階段,這一效果比在后期階段更大。[5]有些研究通過對比Android和iOS兩個系統(tǒng)平臺上發(fā)布的Twitter文章,探討了不同平臺對導演、劇情和音樂等的側(cè)重點。
有些研究將視野從單一的國內(nèi)市場,擴大到國際市場。Kim Sang Ho等通過對美國電影國內(nèi)和國際票房的分析,探討專家評論和網(wǎng)絡(luò)口碑(eWOM)與票房之間的關(guān)系。研究發(fā)現(xiàn),二者對國內(nèi)票房均有重要作用,而eWOM則對國際票房有影響。[6]
有些研究通過建立電影在社交媒體的情感關(guān)系模型,探討評論者情緒對票房的影響。Rui Huaxia團隊提出,Twitter上的正面評論可以促進票房增長,負面評論則阻礙票房增長。對電影銷售最強烈的影響來自于那些直接表達他們想看某部電影的推文。因為這類意圖明確的推文在電影銷售上具有雙重效果:作者自己購買行為的直接影響,以及通過替代認知效應(yīng)(awareness effect)或網(wǎng)絡(luò)口碑對接受者的說服性間接影響。[7]而有的研究則認為,用戶的購買意向可以帶來更準確的電影票房收入預(yù)測。
電影的發(fā)行渠道及破壞市場秩序的方式對票房的影響一直受到人們的關(guān)注。Kim Eun等對韓國電影市場的研究表明,較高的票房成績與較短的播放延遲對視頻點播(VOD)市場效果具有顯著作用。票房在網(wǎng)絡(luò)上的重要性可以用高質(zhì)量的評價、營銷或“點贊”行為等方面來解釋。[8]Kestutis Cerniauskas通過對BitTorrent網(wǎng)絡(luò)上電影分享的研究,探討該盜版方式對票房的影響。研究發(fā)現(xiàn),在電影發(fā)布后的最初幾周,文件共享與美國票房銷售有些許正面的關(guān)系,之后沒有任何效果。也就是說,電影分享不會減少票房收入,因為分享并非電影的替代品。[9]
此外,有的研究將歷史性的結(jié)構(gòu)性數(shù)據(jù)與社交媒體的非結(jié)構(gòu)性數(shù)據(jù)結(jié)合,進行交叉熵的傳播分析;還有的研究分析維基百科與票房之間的關(guān)系。就準確率而言,通過首映周末的數(shù)據(jù)分析之后的票房收入的預(yù)測方式最穩(wěn)定。
二、市場營銷
從文獻的學科分布來看,市場營銷也是電影大數(shù)據(jù)研究的一個熱點,其中跨媒體整合營銷是重要的一種路徑。Sattelberger Felix等以德國電影市場為例,分析了多平臺營銷策略,提出應(yīng)該盡可能多地增加吸引用戶的頁面和電影預(yù)告片。在不同用戶的不同平臺之間,存在著強大的路徑依賴關(guān)系,并且在不同的平臺之間的可互換性很高,這表明可以開發(fā)一種更簡化的監(jiān)控社交媒體的程序,以減少工作量和成本。另外,增加預(yù)告片的覆蓋范圍、點贊的次數(shù)和評論可相應(yīng)減少電影的負面評價。藝術(shù)電影應(yīng)該采用更為廣泛傳播的市場策略。對于大片來說,網(wǎng)絡(luò)搜索過程總是先于在線用戶交流。因此,在電影上映之前很久就提供有關(guān)電影的信息,這對于增加電影被網(wǎng)絡(luò)搜索引擎索引的可能性是至關(guān)重要的。[10]同樣,Nanda Madhumita等通過YouTube、Facebook和Twitter的數(shù)據(jù),探討了整合社會媒體推廣策略(integrative social media strategy)在寶萊塢電影產(chǎn)業(yè)中的成功作用。社交媒體宣傳策略的核心是開發(fā)合適的內(nèi)容,以匹配社交媒體平臺的獨特特征。Facebook的主要用途是通過組織有趣的活動來連接觀眾,Twitter則主要用來轉(zhuǎn)發(fā)來自觀眾的正面口碑。利用社交媒體平臺與觀眾建立情感聯(lián)系,通過宣傳觀眾與電影主角的身份認同是有效的宣傳策略。[11]
Weisfeld-Spolter Suri等則通過網(wǎng)絡(luò)口碑(eWOM)營銷與同步營銷傳播(MC)兩種關(guān)系營銷的作用比較發(fā)現(xiàn),并不是所有積極的口碑都比MC有更積極的影響。因為,并非所有的eWOM類型都具有相同的說服力和社區(qū)支持。來自C2C支持的社交網(wǎng)絡(luò)的影響力比B2C更有影響力,尤其是對多對多的eWOM通信來說。因此,SNS的贊助可能會導致信息源偏差,并影響嵌入在SNS中eWOM的說服性。[12]
有些研究重點考察電影營銷的不同階段。Chen Kun等以中國電影市場為研究對象,探討社會信息在不同產(chǎn)品發(fā)布階段的競爭效果。他們提出,競爭對手的社會觀點對產(chǎn)品的銷售很重要。搜索量緩和了社會觀點和產(chǎn)品銷售之間的影響。當搜索量足夠大的時候,對手負面觀點對票房的作用會相應(yīng)減少。[13]Yeujun Yoon運用馬爾可夫決策過程理論(decision process theory),以美國的電影行業(yè)數(shù)據(jù)和Twitter發(fā)布的數(shù)據(jù),分析在電影質(zhì)量評價階段,如何影響人們觀看一部電影的決定。研究發(fā)現(xiàn),在電影上映前為了吸引觀眾而進行大量的廣告宣傳,可能會適得其反,因為那樣提高了觀眾的期望值。[14]Gopinath Shyam等通過對美國不同區(qū)域市場的調(diào)查發(fā)現(xiàn),電影首映的表現(xiàn)受到預(yù)先發(fā)布的博客數(shù)量和廣告的影響,而放映后的表現(xiàn)受到放映后博客的評級和廣告的影響。在整個市場中,廣告和博客評級(放映后)的彈性比博客數(shù)量(提前發(fā)布)的彈性更大。實際應(yīng)用中,大部分電影公司的有限發(fā)行策略中,廣告和博客數(shù)量只達到了理想數(shù)據(jù)的一半。[15]Escoffier Nadine等認為,盡管群體智慧在沒有社會影響的情況下更準確,但在社會影響的條件下,其準確性會隨著時間的推移而增加。在電影上映前的評估中,由一小群人獨立評估產(chǎn)生的群體效應(yīng)的智慧比少數(shù)專家的評估更準確。因此,應(yīng)當以群體智慧來獲得對電影質(zhì)量的真實度量。在市場營銷階段,通過在線群體智慧,以形成積極的社會媒體影響。[16]
有些研究從觀眾滿意度的視角著眼。Chen Hongyu等認為社交媒體上的評論,即用戶生成內(nèi)容(UGC),具有天生的不完整性,因為沒有抓住不寫評論的用戶的意見。這些沉默的用戶可能與那些說話的人有系統(tǒng)性的差異。他們通過Blockbuster.com用戶的電影評論調(diào)查發(fā)現(xiàn),當用戶對電影不滿意時,他們發(fā)布評論的平均概率是0.06;而當用戶滿意時,則是0.23。因此,我們在分析UGC時如果忽視沉默的用戶,將導致效果的偏差。[17]
三、情感分析
大數(shù)據(jù)研究中,消費者的情感往往成為決定事物發(fā)展方向的重要因素。通過人工智能的算法,對電影評論的情感分析是研究的一個熱點。其中,電影評分與票房和社會影響力有著緊密聯(lián)系。
Lee Young-Jin等比較了陌生人和朋友對用戶生成影評的作用。研究發(fā)現(xiàn),陌生人群評分具有“羊群效應(yīng)”和差異化行為的雙重影響。用戶在評分時會受到之前電影主流評分的影響,跟隨主流,或者故意發(fā)表不同言論。相比之下,朋友的評分總是會引發(fā)“羊群效應(yīng)”。[18]Flanagin Andrew等提出,評分的等級與信任、依賴、對用戶生成內(nèi)容的可信性以及自己與他人的觀點一致等因素具有較強的關(guān)系。人們傾向于在信息量低的時候傾向于專家,但在信息量大的情況下傾向于用戶生成的信息。人們的?^點和行為意圖與他們所暴露的在線評級信息相一致。[19]當消費者遇到太多的正面評論時,他們可能會懷疑eWOM本身的可信度。因此,Jong HyupLee等通過對文本挖掘技術(shù)的分析,分析了評論文本情緒的熵。評論文本中的熵值對eWOM與電影票房銷售的關(guān)系有積極的緩和影響。刪除負面評論以提高產(chǎn)品銷量可能不會對在線零售商或相關(guān)方有所幫助。[20]
除了評分的情感分析,計算機專業(yè)研究的主流是影評語言的算法,而人文社會科學則通過情緒傾向探討其背后的社會現(xiàn)象。Oh Sanghee等通過多個社交媒體平臺,試圖分析用戶與匿名者分享他們的個人經(jīng)歷、信息和社會支持的動機。他們提出影響分享動機的10個因素有快樂、自我效能、學習、個人收獲、利他主義、移情、社會參與、社區(qū)利益、互惠和聲譽。這些因素都是基于對主要動機理論和模型的評價來確定社交媒體用戶的動機的。不同的信息內(nèi)容和不同的目的,不同的社交媒體有不同的動機。[21]有的研究從女性主義視角,認為強勢女性擔任主角并不會降低科幻電影的盈利能力。
四、推薦系統(tǒng)
大數(shù)據(jù)為商業(yè)社會帶來了一種重要行為方式,即智能推薦系統(tǒng)。人們在互聯(lián)網(wǎng)上產(chǎn)生的信息記錄,使企業(yè)可以把廣告精準地送達,甚至達到引導消費的效果。熱門電影及其相關(guān)信息的推薦成為該領(lǐng)域的研究熱點,主流的研究方法是計算機智能算法。在線協(xié)作電影推薦試圖通過在用戶或電影中捕捉與他們歷史相似的“鄰居”,來幫助用戶訪問他們喜歡的電影。然而,由于數(shù)據(jù)稀疏,隨著電影和用戶的快速增長,“鄰居”的選擇變得越來越困難。
還有一些研究運用混合模型電影推薦系統(tǒng)。Dixon Prem Daniel等提出一種利用智能手機用戶瀏覽歷史的模式,進行個性化電影推薦。瀏覽歷史和電影情節(jié)摘要被用來生成一個相似的分數(shù)。電影獲得的分數(shù)被合并到一個潛在的因素模型中,該模型可以計算潛在的用戶和項目特性。這個模型在使用用戶瀏覽歷史的情況下預(yù)測用戶的評分,并最終獲取與用戶喜歡的相似的電影。[22]此外,有些研究將年齡和性別等用戶信息作為電影推薦系統(tǒng)的評估要素。
五、產(chǎn)業(yè)經(jīng)濟
粉絲圈和眾籌都被認為是一個空間,被邊緣化的聲音可以對流行文化進行變革干預(yù),并對產(chǎn)生它的媒體行業(yè)做出反饋。Scott Suzanne等認為,盡管粉絲資助行為有可能催生行業(yè)和文化變革的作品,且在一定程度上影響媒體產(chǎn)業(yè)和粉絲文化,但我們需要審視這種變革干預(yù)的局限性,檢查粉絲金融、情感和創(chuàng)新投資各自的活動框架。盡管粉絲性質(zhì)的項目具備了在媒介文化上再造生產(chǎn)商和粉絲之間的道德經(jīng)濟。然而,其變革能力關(guān)系到他們接受或拒絕“粉絲參與”(fan participation)這個工業(yè)概念。[23]
互聯(lián)網(wǎng)協(xié)議電視(IPTV)和在線視頻點播(VOD)等視頻播放渠道的發(fā)展,正在使電影發(fā)行轉(zhuǎn)變?yōu)橐环N同步的結(jié)構(gòu)。Kaeun Song等在這些變化的市場條件下,分析了電影票房、IPTV和VOD服務(wù)的驅(qū)動因素,以確立新的發(fā)行模式。他們使用彈性理論,考慮不同的消費者風險,來解釋當面對不同程度和風險類型時,電影消費者如何在不同的電影播放渠道表現(xiàn)出不同的行為。他們將電影選擇的前提分為合理的(風險對沖)因素,如觀眾評價、場景熟悉度、明星效應(yīng)、出品國家,以及不合理的(誘人的)因素,包括專家評級和類型。[24]
六、文化批評和文本分析
在《美國魔力2.0》一文中,F(xiàn)riedman Alice T.指出,魅力分層概念(the layered notion of glamour),這個20世紀中期電影、建筑和流行文化耳熟能詳?shù)男g(shù)語,與當今社交媒體的超級公共世界(hyperpublic world)、網(wǎng)絡(luò)形象建構(gòu)和市場細分之間的關(guān)聯(lián)性與日俱增。長期以來,好萊塢形象的創(chuàng)造和消費,光鮮的廣告復制,對于敘事結(jié)構(gòu)、投射、表現(xiàn)和自我評估具有長期侵入的過程。這與我們的定制化Instagram信息流、“Facebook嫉妒”(Facebook envy)和其他形式的數(shù)字傳播、接收和監(jiān)視等文化方式有著重要的相似之處。越來越多的當代公共空間被塑造成一個用于生產(chǎn)和消費這些數(shù)據(jù)的平臺;隨之而來的是監(jiān)視技術(shù)的發(fā)展和建立可防御的私人空間都給物理和網(wǎng)絡(luò)環(huán)境的設(shè)計者帶來了新的挑戰(zhàn)。[25]此外,有研究者采用機器學習技術(shù)分析電影腳本的敘事流和敘事結(jié)構(gòu),從而探討敘事模式。
七、結(jié)論
從近年來的研究成果來看,大數(shù)據(jù)在電影產(chǎn)業(yè)得到廣泛應(yīng)用。我們應(yīng)當借鑒這些觀點,為電影研究提供新的視野和路徑。
(1)社交媒體是電影大數(shù)據(jù)研究的核心。Twitter、Facebook、YouTube、博客和微博等平臺是主要數(shù)據(jù)來源。用戶在社交媒體的CEB和UGC等行為,為票房預(yù)測、市場營銷、情感分析和智能推薦等研究提供了巨大的數(shù)據(jù)支持,使電影產(chǎn)業(yè)的預(yù)測和營銷獲得了更為有效的工具。不過,基于Google或百度等搜索引擎平臺的研究較少。雖然中國研究者貢獻了近20%的文獻。但是,對中國社交媒體的針對性研究,除微博外,其他主流平?_較少涉及。
(2)雅虎電影社區(qū)、Blockbuster.com等專業(yè)電影平臺也成為數(shù)據(jù)的重要來源。由于電影經(jīng)濟的特殊性和復雜性,跨平臺數(shù)據(jù)的混合研究,能夠在數(shù)據(jù)和效果上,提供更好的解決方案。
(3)從研究地域來看,出現(xiàn)了跨國市場研究。全球性的互聯(lián)網(wǎng)平臺為此提供了便利。近年來,中國電影市場是全球最活躍的市場,而且擁有發(fā)達的互聯(lián)網(wǎng)媒體和數(shù)據(jù)平臺。對于中國電影市場及其與其他國家的跨國研究,是一個非常有潛力的領(lǐng)域。
(4)從學科分布來看,計算機專業(yè)是電影大數(shù)據(jù)研究的主要領(lǐng)域。人文社會科學與計算機等跨學科結(jié)合,成為研究的一個新動向。越來越多的基于大數(shù)據(jù)的跨學科研究機構(gòu)產(chǎn)生。一些利用大數(shù)據(jù)的文化和文本研究呈現(xiàn)出新的活力。
(5)從方法論來看,多變量融合是解決復雜電影問題的一種有效途徑。而將大數(shù)據(jù)研究納入經(jīng)典理論框架之中,也是一種常見模式。
(6)與電視和互聯(lián)網(wǎng)結(jié)合的跨媒體研究,目前主要集中在IPTV和VOD等與電影發(fā)行相關(guān)的研究上。對于電影在視頻網(wǎng)站的長期性研究,以及消費產(chǎn)品授權(quán)的研究較少。隨著人工智能技術(shù)的發(fā)展,大數(shù)據(jù)研究將在這些方面提供更多的突破。
(7)雖然是大數(shù)據(jù)研究,但是,當前的研究樣本很多沒有與主流商業(yè)數(shù)據(jù)有效對接,數(shù)據(jù)量比較小。只有實現(xiàn)即時數(shù)據(jù)的分析,電影大數(shù)據(jù)研究才會有更好的結(jié)果。
[本文為國家社科基金重大項目“當代中國文化國際影響力的生成研究”(項目編號:16ZDA219);上海市新聞傳播高原學科課題成果]
參考文獻:
[1]Oh Chong,etc.Beyond likes and tweets:Consumer engagement behavior and movie box office in social media.Information & Management.2017,54(1):25-37.[2]Huang Jianxiong,etc.A Temporal Study of the Effects of Online Opinions:Information Sources Matter.Journal of Management Information Systems.2017,34(4):1169-1202.[3]Baek Hyunmi,etc.Electronic word-of-mouth,box office revenue and social media.Electronic Commerce Research & Applications.2017(22)13-23.[4]Ding Chao,etc.The Power of The“l(fā)ike”Button:The Impact of Social Media on Box Office.Decision Support Systems.2017,94:77-84.[5]Oh Sehwan,etc.Predictive value of video-sharing behavior:sharing of movie trailers and box-office revenue.Internet Research.2017,27(3):691-708.[6]Kim Sang Ho,etc.Exploring the Effects of Online Word of Mouth and Expert Reviews on Theatrical Movies' Box Office Success.Journal of Media Economics.2013,26(2):98-114.[7]Rui Huaxia,etc.Whose and what chatter matters?The effect of tweets on movie sales.Decision Support Systems.2013,55(4):863-870.[8]Kim Eun,etc.Online movie success in sequential markets.Telematics and Informatics.2017,34(7):987-995.[9]Kestutis Cerniauskas,etc.The effect of film sharing on P2P networks on box office sales.Blekinge Institute of Technology,2017.[10]Sattelberger Felix.Optimising Media Marketing Strategies in a Multi-platform World:an Inter-relational Approach to Pre-release Social Media Communication and Online Searching.Journal of Media Business Studies.2015,12(1):66-88.[11]Nanda Madhumita,etc.Innovation in social media strategy for movie success.Management Decision.2018,56(1):233-251.[12]Weisfeld-Spolter Suri,etc.An Integrative Approach to eWOM and Marketing Communications.Corporate Communications:An International Journal.2014,19(3):260-274.[13]Chen Kun,etc.Information Competition in Product Launch: Evidence from the Movie industry.Electronic Commerce Research & Applications.2017(26)81-88.[14]Yeujun Yoon,etc.The Impact of Word of Mouth via Twitter On Moviegoers' Decisions and Film Revenues:Revisiting Prospect Theory.Journal of Advertising Research.2017,57(2):144-158.[15]Gopinath Shyam,etc.Blogs,Advertising,and Local-Market Movie Box Office Performance.Management Science.2013,59(12):2635-2654.[16]Escoffier Nadine,etc.The Wisdom of Crowds in the Movie Industry:Towards New Solutions to Reduce Uncertainties.International Journal of Arts Management.2015,17(2):52-63.[17]Chen Hongyu,etc.De-Biasing the Reporting Bias in Social Media Analytics.Production & Operations Management.2016,25(5):849-865.[18]Lee Young-Jin,etc.Do I Follow My Friends or The Crowd?Information Cascades in Online Movie Ratings.Management Science.2015,61(9):2241-2258.[19]Flanagin Andrew,etc.Trusting Expert-versus User-generated Ratings Online.Computers in Human Behavior.2013,29(4):1626-1634.[20]Jong HyupLee,etc.The role of entropy of review text sentiments on online WOM and movie box office sales.Electronic Commerce Research and Applications.2017(22)42-52.[21]Oh Sanghee,etc.Motivations for sharing information and social support in social media.Journal of the Association for Information Science & Technology.2015,66(10):2045-2060.[22]Dixon Prem Daniel R,etc.A latent factor model based movie recommender using smartphone browsing history.International Conference on Research and Innovation in Information Systems.July,2017:1-6.[23]Scott Suzanne,etc.The moral economy of crowdfunding and the transformative capacity of fan-ancing.New Media & Society.2015,17(2):167-182.[24]Kaeun Song,etc.Dissecting movie performance across multiple distribution channels:An elastic justification theory perspective.Telematics and Informatics.2018,35(1):159-167.[25]Friedman Alice T.American Glamour 2.0:architecture,spectacle,and social media.Consumption,Markets & Culture.Dec2017,Vol.20 Issue 6,p575-584.(海?為上海大學新聞傳播學院副教授;海翔宇為上海大學新聞傳播學院碩士生)
編校:趙〓亮
第二篇:大數(shù)據(jù)時代 文獻綜述
姓名:李歡歡 學號:***4
一、前言
大數(shù)據(jù)是近年來出現(xiàn)在通信和計算機領(lǐng)域中的一個熱門關(guān)鍵詞。關(guān)于大數(shù)據(jù),尚未有一個統(tǒng)一的定義,但卻有兩個觀點能夠詮釋大數(shù)據(jù)的本質(zhì)。第一個觀點來自于Gartner公司的Merv Adrian在2011年第一季度刊登在Teradata Magazine上的一篇文章,文中指出“數(shù)據(jù)超出了常用硬件環(huán)境和軟件工具在可接受的時間內(nèi)為其用戶收集、管理和處理數(shù)據(jù)的能力”[1]。另一個觀點來自于麥肯錫全球數(shù)據(jù)分析研究所(Mckinsey Global Institute)在2011年6月發(fā)布的《大數(shù)據(jù):創(chuàng)新、競爭和生產(chǎn)力的下一個前沿》報告,報告中提出“大數(shù)據(jù)是指大小超出了典型數(shù)據(jù)庫軟件工具收集、存儲、管理和分析能力的數(shù)據(jù)集”[2]。麥肯錫稱:“數(shù)據(jù),已經(jīng)滲透到當今每一個行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素。人們對于海量數(shù)據(jù)的挖掘和應(yīng)用,預(yù)示著新一波生產(chǎn)率增長和消費者盈余浪潮的到來。”
大數(shù)據(jù)已經(jīng)深刻地影響到人們的生活、工作和學習。大數(shù)據(jù)的意義在于對由多種類型數(shù)據(jù)構(gòu)成的數(shù)據(jù)集體進行分析和研究,提取有利用價值的信息,從而幫助人們在解決問題時可以作出科學的決策。同樣大數(shù)據(jù)的威力強烈地沖擊著教育系統(tǒng),正在成為推動教育系統(tǒng)創(chuàng)新與變革的顛覆性力量。
智慧時代下大數(shù)據(jù)技術(shù)在教育
領(lǐng)域的應(yīng)用研究綜述
二、大數(shù)據(jù)技術(shù)在教育領(lǐng)域的應(yīng)用現(xiàn)狀分析 大數(shù)據(jù)定義與特征
大數(shù)據(jù)(bigdata),又稱巨量資料,海量資料,指的是所涉及的資料量規(guī)模巨大到無法透過目前主流軟件工具,在合理時間內(nèi)達到擷取、管理、處理并整理成為幫助企業(yè)經(jīng)營決策更積極目的的資訊。研究機構(gòu) Gartner[3]認為“大數(shù)據(jù)”是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。麥肯錫的定義: 大數(shù)據(jù)是指無法在一定時間內(nèi)用傳統(tǒng)數(shù)據(jù)庫軟件工具對其內(nèi)容進行采集、存儲、管理和分析的數(shù)據(jù)集合。無論哪種定義,我們可以看出,大數(shù)據(jù)并不是一種新的產(chǎn)品也不是一種新的技術(shù),大數(shù)據(jù)只是數(shù)字化時代出現(xiàn)的一種現(xiàn)象。
大數(shù)據(jù)的主要特點可以概括為4V+1C。4V包含了四個層面:第一,即 Volume(大容量),海量數(shù)據(jù),規(guī)模龐大,已躍升到 PB 級別;第二,Velocity(高速度),實時處理,處理速度快,涉及感知、傳輸、決策、控制開放式循環(huán)的大數(shù)據(jù),數(shù)據(jù)實時處理有著極高要求,通過傳統(tǒng)數(shù)據(jù)庫查詢方式得到的“當前結(jié)果”可能已沒有價值,這也是大數(shù)據(jù)和傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)本質(zhì)上的不同;第三,Variety(多樣性),數(shù)據(jù)類型繁多:網(wǎng)絡(luò)日志、視頻、地理位置信息、圖片等都是大數(shù)據(jù);第四,Veracity(低密度),數(shù)據(jù)價值大,但價值密度低。對海量數(shù)據(jù)挖掘分析,對未來趨勢與模式的可預(yù)測分析,深度復雜分析;“1C”即 Complexity,是通過數(shù)據(jù)庫處理持久存儲的數(shù)據(jù)不再適用于大數(shù)據(jù)處理,需要有新的方法來滿足異構(gòu)數(shù)據(jù)統(tǒng)一接入和實時數(shù)據(jù)處理的需求[4]。2 國內(nèi)研究現(xiàn)狀
對于“智慧時代下大數(shù)據(jù)技術(shù)在教育領(lǐng)域的應(yīng)用”國內(nèi)研究的現(xiàn)狀,我主要通過借助中國知網(wǎng)提供的論文發(fā)表數(shù)據(jù)進行分析。在中國知網(wǎng)中選擇“高級檢索”類型,并在檢索條件中選擇“主題”檢索,輸入“大數(shù)據(jù)”并含“教育”,截止到 2014年4月17日共檢索出303 條結(jié)果與之相關(guān),通過手工篩選,把會議報道等無關(guān)信息剔除掉,剩余160篇文章。
大數(shù)據(jù)在教育領(lǐng)域的應(yīng)用,與國外相比,國內(nèi)起步稍晚,還未形成整體力量。雖然2009年開始,大數(shù)據(jù)就成為了流行詞匯,但是它在教育領(lǐng)域的應(yīng)用是近3年才出現(xiàn)的。國內(nèi)最早的研究是從2012年開始的,相關(guān)論文只有5篇。但是2012年大數(shù)據(jù)成為時代發(fā)展的一個重要趨勢,這也直接影響到教育領(lǐng)域的專家學者開始關(guān)注。王震一[5]提出:今天的大數(shù)據(jù)就像當年發(fā)明顯微鏡一樣,人們從龐雜的海量數(shù)據(jù)中找到了前所未知的事物。正確面對這些關(guān)系復雜、形式多樣的結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化的教育數(shù)據(jù),形成一套涵蓋業(yè)務(wù)、技術(shù)和 IT 基礎(chǔ)架構(gòu)的全面解決方案來處理存儲、管理和分析教育大數(shù)據(jù),這就是信息化教育。
楊滿福和焦建利[6]提出“大數(shù)據(jù)加速教學研究成果向教學生產(chǎn)力轉(zhuǎn)化”,從產(chǎn)學研結(jié)合的意義上說,借助大數(shù)據(jù),教學研究與教學產(chǎn)品的改善與創(chuàng)新更緊密地聯(lián)結(jié)起來,理想的狀態(tài)是教學研究的價值在教學產(chǎn)品的優(yōu)化上快速得到體現(xiàn),最終教學研究成果束之高閣的不利局面將能得到改變,教學研究的成果也就能在一個全球化境域下提高教學的生產(chǎn)力。
劉雍潛和楊現(xiàn)民[7]提出“大數(shù)據(jù)時代區(qū)域教育均衡發(fā)展新思路”,在大數(shù)據(jù)時代背景下,區(qū)域教育均衡發(fā)展應(yīng)該以數(shù)據(jù)為基礎(chǔ),準確把握區(qū)域教育發(fā)展動態(tài),利用大數(shù)據(jù)技術(shù)從教育環(huán)境均衡教育資源均衡、教育機會均等和教育質(zhì)量均衡等四個方面提供科學依據(jù),進而促進區(qū)域教育均衡發(fā)展。
2013年至今是大數(shù)據(jù)在教育領(lǐng)域應(yīng)用研究的起步階段。隨著國家對教育信息化的快速推進和信息技術(shù)與教育教學的深度融合,我國教育事業(yè)的改革和創(chuàng)新發(fā)展離不開信息技術(shù)的支持和引領(lǐng)已經(jīng)越來越成為教育界的共識。2013年被媒體稱為中國的大數(shù)據(jù)元年。2014 年 3 月,教育部辦公廳印發(fā)的《2014 年教育信息化工作要點》中指出:加強對動態(tài)監(jiān)測、決策應(yīng)用、教育預(yù)測等相關(guān)數(shù)據(jù)資源的整合與集成,為教育決策提供及時和準確的數(shù)據(jù)支持,推動教育基礎(chǔ)數(shù)據(jù)在全國的共享[8]??梢?,教育大數(shù)據(jù)的應(yīng)用已被列入我國教育信息化的工作程序中,相信大數(shù)據(jù)將很快被推廣并與教育領(lǐng)域的深度融合,這是當前時代教育事業(yè)發(fā)展的必然趨勢。3 國外研究現(xiàn)狀
2012年3月底,美國奧巴馬政府宣布,白宮將投入2億美金的研發(fā)費用來推動大數(shù)據(jù)技術(shù)的發(fā)展,其主要目標是為了讓大數(shù)據(jù)技術(shù)更好地服務(wù)于科研、環(huán)境、生物醫(yī)藥、教育和國家安全領(lǐng)域,同時,明確地表示將主要用來鼓勵在數(shù)據(jù)采集、存儲、管理、分析和共享等方面的技術(shù)研發(fā),這直接刺激了全世界對“大數(shù)據(jù)”的關(guān)注[9]。此外,大數(shù)據(jù)還上過《紐約時報》和《華爾街日報》的專欄封面。2012年,美國國家教育部發(fā)布了《通過教育數(shù)據(jù)挖掘和學習分析促進教與學》報告,對美國國內(nèi)大數(shù)據(jù)教育應(yīng)用領(lǐng)域和案例,以及應(yīng)用實施所面臨的挑戰(zhàn)進行了詳細的介紹。
國外關(guān)于大數(shù)據(jù)在教育領(lǐng)域的應(yīng)用的論文發(fā)表時間也主要分布在近三年,研究內(nèi)容主要包括對教育數(shù)據(jù)挖掘、學習分析,個性化教育、教育方式的改善、學習策略探討、教育管理方式的改變、大數(shù)據(jù)對于教育的推動作用、數(shù)據(jù)驅(qū)動以及對圖書館建設(shè)、對教與學需求、評價方法的影響等方面。可見,雖然大數(shù)據(jù)在國外出現(xiàn)較早也備受重視,但是在教育領(lǐng)域中的應(yīng)用仍不夠深入,正如 Anthony G.Picciano[10]教授所說:教學應(yīng)用大數(shù)據(jù)分析處于起步階段,還需要幾年才能成熟,雖然大數(shù)據(jù)的存在被證明是該被重視的,但大數(shù)據(jù)并不是解決所有教育問題的靈丹妙藥,它只是給人們提供了擬定教育問題解決方案時的一部分決策參考。
綜上所說,我們可以看出,國內(nèi)外大數(shù)據(jù)在教育中應(yīng)用的研究還處于初級階段,研究的內(nèi)容不夠廣泛也不夠有深度,因此,還需要進一步加強大數(shù)據(jù)在教育中應(yīng)用的研究力度,希望能夠推動大數(shù)據(jù)在教育中的應(yīng)用與發(fā)展。
三、總結(jié)
通過以上的分析,我們可以發(fā)現(xiàn)大數(shù)據(jù)在教育領(lǐng)域有著很大的應(yīng)用空間,也是未來教育發(fā)展的必然趨勢。但是國內(nèi)外專家學者開展的相關(guān)研究,大多數(shù)集中在理論階段,不能夠運用到實際中來。具體的應(yīng)用理論還不夠成熟,實踐研究方面涉及的案例比較少。大數(shù)據(jù)時代,互聯(lián)網(wǎng)教育與學校教育將逐漸分離,正如電影院和電視機在初期競爭的時候水火不相容,而成熟后會各得其所。大數(shù)據(jù)提供了一種學校教育與互聯(lián)網(wǎng)教育共存的新模式。有人預(yù)言,大數(shù)據(jù)開創(chuàng)了一個教育的新時代,我們應(yīng)該積極迎接這個新時代,通過大數(shù)據(jù)來促進教育,進一步改善教學的方式與方法,進一步促進學生學習成績的提高。
四、參考文獻
[1]Merv Adrian.Big Data:it’s going mainstream and it’s your next opportunity[J].Teradata Magazine, 2011,(1):3-5.
[2]Manyika J, Chui M, Brown B, et al.Big data: The next frontier for innovation, competition, and productivity[R].USA:Mckinsey Global Institute, 2011.
[3]大數(shù)據(jù)[OL].
[4]大數(shù)據(jù)時代的特點[OL].
[7]劉雍潛,楊現(xiàn)民.大數(shù)據(jù)時代區(qū)域教育均衡發(fā)展新思路,電化教育研究,2014(05);
[8]教育部辦公廳關(guān)于印發(fā)《2014年教育信息化工作要點》的通知[OL].
第三篇:大數(shù)據(jù)未來發(fā)展的相關(guān)文獻
大數(shù)據(jù)未來發(fā)展的相關(guān)文獻
2015年,國務(wù)院印發(fā)《促進大數(shù)據(jù)發(fā)展行動綱要》,明確系統(tǒng)部署了大數(shù)據(jù)發(fā)展工作。
2015年,國務(wù)院辦公廳出臺《關(guān)于運用大數(shù)據(jù)加強對市場主體服務(wù)和監(jiān)管的若干意見》要求“充分運用大數(shù)據(jù)先進理念、技術(shù)和資源,加強對市場主體的服務(wù)和監(jiān)管,推進簡政放權(quán)和政府職能轉(zhuǎn)變,提高政府治理能力”。
2016年,國家“十三五”規(guī)劃綱要明確指出,實施國家大數(shù)據(jù)戰(zhàn)略,把大數(shù)據(jù)作為基礎(chǔ)性戰(zhàn)略資源,全面實施大數(shù)據(jù)發(fā)展行動,加快推動數(shù)據(jù)資源共享開放和開發(fā)應(yīng)用,助力產(chǎn)業(yè)轉(zhuǎn)型升級和社會治理創(chuàng)新。
2016年,住房和城鄉(xiāng)建設(shè)部發(fā)布的《2016~2020年建筑業(yè)信息化發(fā)展綱要》指出,全面提高建筑業(yè)信息化水平,增強大數(shù)據(jù)應(yīng)用能力。
2017年,工業(yè)和信息化部正式印發(fā)《大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃(2016~2020年)》,全面制定了十三五”期間大數(shù)據(jù)產(chǎn)業(yè)發(fā)展計劃大數(shù)據(jù)已經(jīng)發(fā)展成為我國的國家級發(fā)展戰(zhàn)略,其與各傳統(tǒng)行業(yè)的融合,將為傳統(tǒng)行業(yè)的變革帶來契機。2016年,在中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,李克強總理將大數(shù)據(jù)譽為“新時代的鉆石礦”,表明了發(fā)展大數(shù)據(jù)產(chǎn)業(yè)的價值。
第四篇:文獻3-大數(shù)據(jù)技術(shù)與應(yīng)用
大數(shù)據(jù)技術(shù)與應(yīng)用*
【摘要】:隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,特別是近年來云計算、物聯(lián)網(wǎng)、社交網(wǎng)絡(luò)等新興服務(wù)促使人類社會的數(shù)據(jù)種類和規(guī)模正以前所未有的速度增長,大數(shù)據(jù)時代正式到來.數(shù)據(jù)從簡單的處理對象開始轉(zhuǎn)變?yōu)橐环N基礎(chǔ)性資源,如何更好地管理和利用大數(shù)據(jù)已經(jīng)成為普遍關(guān)注的話題.大數(shù)據(jù)的規(guī)模效應(yīng)給數(shù)據(jù)存儲、管理以及數(shù)據(jù)分析帶來了極大的挑戰(zhàn),數(shù)據(jù)管理方式上的變革正在醞釀和發(fā)生.對大數(shù)據(jù)的產(chǎn)生背景和基本概念進行剖析,并對大數(shù)據(jù)的主要應(yīng)用作簡單對比.在此基礎(chǔ)上,闡述大數(shù)據(jù)處理的基本框架,并就云計算技術(shù)對于大數(shù)據(jù)時代數(shù)據(jù)管理所產(chǎn)生的作用進行分析.最后歸納總結(jié)大數(shù)據(jù)時代所面臨的新挑戰(zhàn)?!娟P(guān)鍵字】:大數(shù)據(jù)
發(fā)展趨勢 應(yīng)用 機遇和挑戰(zhàn)
一、大數(shù)據(jù)時代的背景
半個世紀以來,隨著計算機技術(shù)全面融入社會生活,信息爆炸已經(jīng)積累到了一個開始引發(fā)變革的程度。21世紀是數(shù)據(jù)信息大發(fā)展的時代,移動互聯(lián)、社交網(wǎng)絡(luò)、電子商務(wù)等極大拓展了互聯(lián)網(wǎng)的邊界和應(yīng)用范圍,各種數(shù)據(jù)正在迅速膨脹并變大。互聯(lián)網(wǎng)(社交、搜索、電商)、移動互聯(lián)網(wǎng)(微博)、物聯(lián)網(wǎng)(傳感器,智慧地球)、車聯(lián)網(wǎng)、GPS、醫(yī)學影像、安全監(jiān)控、金融(銀行、股市、保險)、電信(通話、短信)都在瘋狂產(chǎn)生著數(shù)據(jù)。2011年5 月,在“云計算相遇大數(shù)據(jù)” 為主題的EMC World 2011 會議中,EMC 拋出了Big Data概念。正如《紐約時報》2012年2月的一篇專欄中所稱,“大數(shù)據(jù)”時代已經(jīng)降臨,在商業(yè)、經(jīng)濟及其他領(lǐng)域中,決策將日益基于數(shù)據(jù)和分析而作出,而并非基于經(jīng)驗和直覺。哈佛大學社會學教授加里·金說:“這是一場革命,龐大的數(shù)據(jù)資源使得各個領(lǐng)域開始了量化進程,無論學術(shù)界、商界還是政府,所有領(lǐng)域都將開始這種進程?!?/p>
二、什么是大數(shù)據(jù)
大數(shù)據(jù)(Big Data)是指那些超過傳統(tǒng)數(shù)據(jù)庫系統(tǒng)處理能力的數(shù)據(jù)。它的數(shù)據(jù)規(guī)模和轉(zhuǎn)輸速度要求很高,或者其結(jié)構(gòu)不適合原本的數(shù)據(jù)庫系統(tǒng)。為了獲取大數(shù)據(jù)中的價值,我們必須選擇另一種方式來處理它。數(shù)據(jù)中隱藏著有價值的模式和信息,在以往需要相當?shù)臅r間和成本才能提取這些信息。如沃爾瑪或谷歌這類領(lǐng)先企業(yè)都要付高昂的代價才能從大數(shù)據(jù)中挖掘信息。而當今的各種資源,如硬件、云架構(gòu)和開源軟件使得大數(shù)據(jù)的處理更為方便和廉價。即使是在車庫中創(chuàng)業(yè)的公司也可以用較低的價格租用云服務(wù)時間了。對于企業(yè)組織來講,大數(shù)據(jù)的價值體現(xiàn)在兩個方面:分析使用和二次開發(fā)。對大數(shù)據(jù)進行分析能揭示隱藏其中的信息。例如零售業(yè)中對門店銷售、地理和社會信息的分析能提升對客戶的理解。對大數(shù)據(jù)的二次開發(fā)則是那些成功的網(wǎng)絡(luò)公司的長項。例如Facebook通過結(jié)合大量用戶信息,定制出高度個性化的用戶體驗,并創(chuàng)造出一種新的廣告模式。這種通過大數(shù)據(jù)創(chuàng)造出新產(chǎn)品和服務(wù)的商業(yè)行為并非巧合,谷歌、雅虎、亞馬遜和Facebook它們都是大數(shù)據(jù)時代的創(chuàng)新者。
(一)大數(shù)據(jù)的4V特征
大量化(Volume):企業(yè)面臨著數(shù)據(jù)量的大規(guī)模增長。例如,IDC最近的報告預(yù)測稱,到2020年,全球數(shù)據(jù)量將擴大50倍。目前,大數(shù)據(jù)的規(guī)模尚是一個不斷變化的指標,單一數(shù)據(jù)集的規(guī)模范圍從幾十TB到數(shù)PB不等。簡而言之,存儲1PB數(shù)據(jù)將需要兩萬臺配備50GB硬盤的個人電腦。此外,各種意想不到的來源都能產(chǎn)生數(shù)據(jù)。
多樣化(Variety):一個普遍觀點認為,人們使用互聯(lián)網(wǎng)搜索是形成數(shù)據(jù)多樣性的主要原因,這一看法部分正確。然而,數(shù)據(jù)多樣性的增加主要是由于新型多結(jié)構(gòu)數(shù)據(jù),以及包括網(wǎng)絡(luò)日志、社交媒體、互聯(lián)網(wǎng)搜索、手機通話記錄及傳感器網(wǎng)絡(luò)等數(shù)據(jù)類型造成。其中,部分傳感器安裝在火車、汽車和飛機上,每個傳感器都增加了數(shù)據(jù)的多樣性。
快速化(Velocity):高速描述的是數(shù)據(jù)被創(chuàng)建和移動的速度。在高速網(wǎng)絡(luò)時代,通過基于實現(xiàn)
軟件性能優(yōu)化的高速電腦處理器和服務(wù)器,創(chuàng)建實時數(shù)據(jù)流已成為流行趨勢。企業(yè)不僅需要了解如何快速創(chuàng)建數(shù)據(jù),還必須知道如何快速處理、分析并返回給用戶,以滿足他們的實時需求。根據(jù)IMS Research關(guān)于數(shù)據(jù)創(chuàng)建速度的調(diào)查,據(jù)預(yù)測,到2020年全球?qū)碛?20億部互聯(lián)網(wǎng)連接設(shè)備。價值(Value):大量的不相關(guān)信息,浪里淘沙卻又彌足珍貴。對未來趨勢與模式的可預(yù)測分析,深度復雜分析(機器學習、人工智能Vs傳統(tǒng)商務(wù)智能(咨詢、報告等)
三、大數(shù)據(jù)時代對生活、工作的影響
大數(shù)據(jù),其影響除了經(jīng)濟方面的,它同時也能在政治、文化等方面產(chǎn)生深遠的影響,大數(shù)據(jù)可以幫助人們開啟循“數(shù)”管理的模式,也是我們當下“大社會”的集中體現(xiàn),三分技術(shù),七分數(shù)據(jù),得數(shù)據(jù)者得天下。
“大數(shù)據(jù)”的影響,增加了對信息管理專家的需求。事實上,大數(shù)據(jù)的影響并不僅僅限于信息通信產(chǎn)業(yè),而是正在“吞噬”和重構(gòu)很多傳統(tǒng)行業(yè),廣泛運用數(shù)據(jù)分析手段管理和優(yōu)化運營的公司其實質(zhì)都是一個數(shù)據(jù)公司。麥當勞、肯德基以及蘋果公司等旗艦專賣店的位置都是建立在數(shù)據(jù)分析基礎(chǔ)之上的精準選址。而在零售業(yè)中,數(shù)據(jù)分析的技術(shù)與手段更是得到廣泛的應(yīng)用,傳統(tǒng)企業(yè)如沃爾瑪通過數(shù)據(jù)挖掘重塑并優(yōu)化供應(yīng)鏈,新崛起的電商如卓越亞馬遜、淘寶等則通過對海量數(shù)據(jù)的掌握和分析,為用戶提供更加專業(yè)化和個性化的服務(wù)。
大數(shù)據(jù)在個人隱私的方面,大量數(shù)據(jù)經(jīng)常含有一些詳細的潛在的能夠展示有關(guān)我們的信息,逐漸引起了我們對個人隱私的擔憂。一些處理大數(shù)據(jù)公司需要認真的對待這個問題。例如美國天睿資訊給人留下比較深刻印象的是他的一個科學家提出,我們不應(yīng)該簡單地服從法律方面的隱私保護問題,這些遠遠不夠的,公司都應(yīng)該遵從谷歌不作惡的原則,甚至更應(yīng)該做出更積極的努力。
四、大數(shù)據(jù)時代的發(fā)展方向、趨勢
根據(jù)ESM國際電子商情針對2013年大數(shù)據(jù)應(yīng)用現(xiàn)狀和趨勢的調(diào)查顯示:被調(diào)查者最關(guān)注的大數(shù)據(jù)技術(shù)中,排在前五位的分別是大數(shù)據(jù)分析(12.91%)、云數(shù)據(jù)庫(11.82%)、Hadoop(11.73%)、內(nèi)存數(shù)據(jù)庫(11.64%)以及數(shù)據(jù)安全(9.21%)。Hadoop已不再是人們心目中僅有的大數(shù)據(jù)技術(shù),而大數(shù)據(jù)分析成為最被關(guān)注的技術(shù)。從中可以看出,人們對大數(shù)據(jù)的了解已經(jīng)逐漸深入,關(guān)注的技術(shù)點也越來越多。既然大數(shù)據(jù)分析是最被關(guān)注的技術(shù)趨勢,那么大數(shù)據(jù)分析中的哪項功能是最重要的呢?從下圖可以看出,排在前三位的功能分別是實時分析(21.32%)、豐富的挖掘模型(17.97%)和可視化界面(15.91%)。2012年也曾做過類似的調(diào)查,當時選擇豐富的挖掘模型(27.22%)比實時分析(19.88%)多7.34%。短短一年時間內(nèi),企業(yè)對實時分析的需求激增,成就了很多以實時分析為創(chuàng)新技術(shù)的大數(shù)據(jù)廠商。從調(diào)查結(jié)果可以看出:企業(yè)在未來一兩年中有迫切部署大數(shù)據(jù)的需求,并且已經(jīng)從一開始的基礎(chǔ)設(shè)施建設(shè),逐漸發(fā)展為對大數(shù)據(jù)分析和整體大數(shù)據(jù)解決方案的需求。與此同時,大數(shù)據(jù)還面臨人才的缺乏的挑戰(zhàn),需要企業(yè)和高校聯(lián)合起來,培養(yǎng)數(shù)據(jù)領(lǐng)域的復合型人才,幫助企業(yè)打贏這場“數(shù)據(jù)戰(zhàn)”。
五、大數(shù)據(jù)的應(yīng)用
(一)行業(yè)拓展者,打造大數(shù)據(jù)行業(yè)基石
你IBM:IBM大數(shù)據(jù)提供的服務(wù)包括數(shù)據(jù)分析,文本分析,藍色云杉(混搭供電合作的網(wǎng)絡(luò)平臺);業(yè)務(wù)事件處理;IBM Mashup Center的計量,監(jiān)測,和商業(yè)化服務(wù)(MMMS)。IBM的大數(shù)據(jù)產(chǎn)品組合中的最新系列產(chǎn)品的InfoSphere bigInsights,基于Apache Hadoop。該產(chǎn)品組合包括:打包的Apache Hadoop的軟件和服務(wù),代號是bigInsights核心,用于開始大數(shù)據(jù)分析。軟件被稱為bigsheet,軟件目的是幫助從大量數(shù)據(jù)中輕松、簡單、直觀的提取、批注相關(guān)信息為金融,風險管理,媒體和娛樂等行業(yè)量身定做的行業(yè)解決方案 微軟:2011年1月與惠普(具體而言是HP數(shù)據(jù)庫綜合應(yīng)用部門)合作目標是開發(fā)了一系列
能夠提升生產(chǎn)力和提高決策速度的設(shè)備。
EMC:EMC 斬獲了紐交所和Nasdaq;大數(shù)據(jù)解決方案已包括40多個產(chǎn)品。
Oracle:Oracle大數(shù)據(jù)機與Oracle Exalogic中間件云服務(wù)器、Oracle Exadata數(shù)據(jù)庫云服務(wù)器以及Oracle Exalytics商務(wù)智能云服務(wù)器一起組成了甲骨文最廣泛、高度集成化系統(tǒng)產(chǎn)品組合。
(二)大數(shù)據(jù)促進了政府職能變革
重視應(yīng)用大數(shù)據(jù)技術(shù),盤活各地云計算中心資產(chǎn):把原來大規(guī)模投資產(chǎn)業(yè)園、物聯(lián)網(wǎng)產(chǎn)業(yè)園從政績工程,改造成智慧工程;在安防領(lǐng)域,應(yīng)用大數(shù)據(jù)技術(shù),提高應(yīng)急處置能力和安全防范能力;在民生領(lǐng)域,應(yīng)用大數(shù)據(jù)技術(shù),提升服務(wù)能力和運作效率,以及個性化的服務(wù),比如醫(yī)療、衛(wèi)生、教育等部門;解決在金融,電信領(lǐng)域等中數(shù)據(jù)分析的問題:一直得到得極大的重視,但受困于存儲能力和計算能力的限制,只局限在交易數(shù)型數(shù)據(jù)的統(tǒng)計分析。一方面大數(shù)據(jù)的應(yīng)用促進了政府職能變革,另一方面政府投入將形成示范效應(yīng),大大推動大數(shù)據(jù)的發(fā)展。
(三)打造“智慧城市”
美國奧巴馬政府在白宮網(wǎng)站發(fā)布《大數(shù)據(jù)研究和發(fā)展倡議》,提出“通過收集、處理龐大而復雜的數(shù)據(jù)信息,從中獲得知識和洞見,提升能力,加快科學、工程領(lǐng)域的創(chuàng)新步伐,強化美國國土安全,轉(zhuǎn)變教育和學習模式” ;中國工程院院士鄔賀銓說道,“智慧城市是使用智能計算技術(shù)使得城市的關(guān)鍵基礎(chǔ)設(shè)施的組成和服務(wù)更智能、互聯(lián)和有效,隨著智慧城市的建設(shè),社會將步入“大數(shù)據(jù)”時代?!?/p>
(四)未來,改變一切
未來,企業(yè)會依靠洞悉數(shù)據(jù)中的信息更加了解自己,也更加了解客戶。
數(shù)據(jù)的再利用:由于在信息價值鏈中的特殊位置,有些公司可能會收集到大量的數(shù)據(jù),但他們并不急需使用也不擅長再次利用這些數(shù)據(jù)。例如,移動電話運營商手機用戶的位置信息來傳輸電話信號,這對以他們來說,數(shù)據(jù)只有狹窄的技術(shù)用途。但當它被一些發(fā)布個性化位置廣告服務(wù)和促銷活動的公司再次利用時,則變得更有價值。
六、機遇和挑戰(zhàn)
大數(shù)據(jù)賦予了我們洞察未來的能力,但同時諸多領(lǐng)域的問題亟待解決,最重要的是每個人的信息都被互聯(lián)網(wǎng)所記錄和保留了下來,并且進行加工和利用,為人所用,而這正是我們所擔憂的信息安全隱患!更多的隱私、安全性問題:我們的隱私被二次利用了。多少密碼和賬號是因為“社交網(wǎng)絡(luò)”流出去的?
眼下中國互聯(lián)網(wǎng)熱門的話題之一就是互聯(lián)網(wǎng)實名制問題,我愿意相信這是個好事。畢竟我們?nèi)绻髦脸鲎约旱纳矸?,互?lián)網(wǎng)才能對我們的隱私給予更好保護。
第五篇:互聯(lián)網(wǎng)與大數(shù)據(jù)思維 的文獻綜述
【題名】互聯(lián)網(wǎng)和大數(shù)據(jù)思維
【作者】郭大蕾
【學號】
【系別】11級廣播電視新聞學
【前言】
“大數(shù)據(jù)”的提出由來已久,由于互聯(lián)網(wǎng)和信息技術(shù)的進步,各個領(lǐng)域的數(shù)據(jù)量都在迅猛增長,而通過數(shù)據(jù)的分析、開發(fā)和整合,人類現(xiàn)在可以發(fā)現(xiàn)新的知識、創(chuàng)造新的價值,從而帶來“大知識”、“大科技”、“大智能”、“大利潤”和“大發(fā)展”。伴隨我們的理念、思維方式、營銷方法論勢必也要進行變革,即所謂的大數(shù)據(jù)思維。而“美麗說”作為大型女性時尚社交網(wǎng)站,可以說是大數(shù)據(jù)思維運用中新型互聯(lián)網(wǎng)社交網(wǎng)站的典型案例。
大數(shù)據(jù),既是“因為小所以大”,也是“因為大所以小”。因為小所以大,是大數(shù)據(jù)的“有”。因為互聯(lián)網(wǎng)上有很細節(jié)、很海量的數(shù)據(jù),在互聯(lián)網(wǎng)的社會環(huán)境下可以通過技術(shù)方法在經(jīng)濟可承受的前提下把數(shù)據(jù)找回來。而因為大所以小,是大數(shù)據(jù)的“用”。由于有了豐富的數(shù)據(jù),各類互聯(lián)網(wǎng)媒體、服務(wù)才可以針對某一個特定用戶,給他提供更精準的服務(wù),將傳統(tǒng)的“一對多灌輸式的廣告”變?yōu)椤皞€性化推薦”。
“大數(shù)據(jù)”,其實并不是新的概念和現(xiàn)象。早在1980 年代,美國就有人提出了“大數(shù)據(jù)”的概念。30多年來,由于互聯(lián)網(wǎng)和信息技術(shù)的進步,各個領(lǐng)域的數(shù)據(jù)量都在迅猛增長,美國的企業(yè)界、學術(shù)界也不斷地對這個現(xiàn)象及其意義進行探討。最近這一兩年,“大數(shù)據(jù)”這個概念在美國變得越來越流行、越來越重要。2012年3月,美國聯(lián)邦政府宣布投入2億多美元啟動大數(shù)據(jù)的研發(fā)任務(wù),并把大數(shù)據(jù)定義為和歷史上的互聯(lián)網(wǎng)、超級計算同等重要的國家戰(zhàn)略。之所以上升到國家戰(zhàn)略的層面,是因為隨著數(shù)據(jù)的爆炸,數(shù)據(jù)的收集、保存、維護、共享、使用等等任務(wù),都成為橫跨各個領(lǐng)域、牽一發(fā)而動全身的現(xiàn)象和挑戰(zhàn)。但這些現(xiàn)象和挑戰(zhàn)的重中之重,還是因為人類分析和使用數(shù)據(jù)的能力大幅提高,通過數(shù)據(jù)的分析、開發(fā)和整合,人類現(xiàn)在可以發(fā)現(xiàn)新的知識、創(chuàng)造新的價值,從而帶來“大知識”、“大科技”、“大智能”、“大利潤”和“大發(fā)展”。
而我們一直生活在數(shù)據(jù)的世界里,但以往受限于技術(shù),主要應(yīng)用抽樣、局部、片面的數(shù)據(jù),或者在不能獲得實證數(shù)據(jù)的時候依賴經(jīng)驗、理論、假設(shè)等去發(fā)現(xiàn)未知領(lǐng)域的規(guī)律。而現(xiàn)在,互聯(lián)網(wǎng)推動了大數(shù)據(jù)由后臺走向前臺。
互聯(lián)網(wǎng)時代最大的意義在于可以做全流量的監(jiān)測。隨著各類社會行為迅速向互聯(lián)網(wǎng)遷移,物聯(lián)網(wǎng)、云計算、移動互聯(lián)網(wǎng)、車聯(lián)網(wǎng)、手機、平板電腦以及遍布各個角落的各種各樣的傳感器,使互聯(lián)網(wǎng)承載遠超以往的數(shù)據(jù)量。面對互聯(lián)網(wǎng)的海量信息,數(shù)據(jù)的作用將遠遠超出以往。
大數(shù)據(jù)具有導航儀的功用。對于營銷者來說,目標受眾、目標客戶是“誰”已經(jīng)不重要,重要的是TA的偏好特征和傳播相關(guān)信息的時機——根據(jù)數(shù)據(jù)判斷TA在什么時候需要什么。
我們也經(jīng)常把大數(shù)據(jù)比喻成顯微鏡,因為大數(shù)據(jù)提供了從更細的顆粒度層面認知世界的可能和條件。真正的大數(shù)據(jù),讓人類第一次有機會把來自不同地方、不同類型的數(shù)據(jù)聯(lián)結(jié)起來形成對一個事物的完整描述,就像顯微鏡一樣從更細的顆粒度層面認知世界。亞馬遜則將大數(shù)據(jù)喻為“糾錯器”:“長期以來,亞馬遜一直通過大數(shù)據(jù)分析,嘗試定位客戶和和獲取客戶反饋。在此過程中,你會發(fā)現(xiàn)數(shù)據(jù)越大,結(jié)果越好。為什么有的企業(yè)在商業(yè)上不斷犯錯?那是因為他們沒有足夠的數(shù)據(jù)對運營和決策提供支持。一旦進入大數(shù)據(jù)的世界,企業(yè)的手中將握有無限可能。”
互聯(lián)網(wǎng)時代,大數(shù)據(jù)還是發(fā)動機?;ヂ?lián)網(wǎng)不再只是媒體,更是用戶不斷轉(zhuǎn)化的平臺。相應(yīng)的,營銷由獨立轉(zhuǎn)為系統(tǒng)性工程,而數(shù)據(jù)在營銷全程中扮演的角色也必然要由參考工具轉(zhuǎn)向驅(qū)動發(fā)動機。數(shù)據(jù)驅(qū)動的精準營銷引擎,將顛覆傳統(tǒng)的營銷決策模式及營銷執(zhí)行過程,給網(wǎng)絡(luò)營銷行業(yè)乃至互聯(lián)網(wǎng)及傳統(tǒng)行業(yè)帶來革命性的沖擊。我們已看到,網(wǎng)絡(luò)營銷的大數(shù)據(jù)應(yīng)用正在加速前進。雖然以大數(shù)據(jù)支撐的RTB,實時競價)還在起步階段,壟斷媒體形成賣方市場、廣告主決策過程并非百分百取決于業(yè)務(wù)層面價值仍對RTB形成阻力,但RTB應(yīng)用越來越成熟,越來越成規(guī)模,百度、阿里等也都推出了自己的RTB平臺,都足以讓我們相信,RTB一定會成為未來網(wǎng)絡(luò)廣告的主流。而國內(nèi)的互聯(lián)網(wǎng)行業(yè),特別是騰訊、阿里、百度等領(lǐng)頭企業(yè)更在其他業(yè)務(wù)層面搜集、挖掘數(shù)據(jù),進行大數(shù)據(jù)應(yīng)用的準備和嘗試,更使大數(shù)據(jù)向網(wǎng)絡(luò)廣告之外的領(lǐng)域滲透。
隨著大數(shù)據(jù)時代的來臨,抽樣調(diào)查的主導地位將會被大數(shù)據(jù)思維之下的全樣本調(diào)查所取代,并被逐漸邊緣化。我們將有更高的機率準確認識、預(yù)測我們想要了解的事物,大至奧巴馬競選、奧斯卡獎項,小到客戶的購買傾向、網(wǎng)絡(luò)營銷,海量的大數(shù)據(jù)中隱藏著我們想要知道的一切。但是,伴隨著方法的變革,我們的理念、思維方式、營銷方法論勢必也要進行變革,即所謂的大數(shù)據(jù)思維,這對我們來說也是一種巨大的挑戰(zhàn)。
在互聯(lián)網(wǎng)時代下的今天,大數(shù)據(jù)思維已不僅是一種潮流和趨勢,更被具有前瞻性的企業(yè)引用到營銷中去,而“美麗說”作為大型女性時尚社交網(wǎng)站,可以說是大數(shù)據(jù)思維運用中
新型互聯(lián)網(wǎng)社交網(wǎng)站的典型案例。
近年,隨著電子商務(wù)的飛躍式發(fā)展,網(wǎng)上購物成為了年輕一代的主流消費習慣。淘寶、拍拍、當當、京東、凡客這些大型網(wǎng)上商城,為人們提供了琳瑯滿目、應(yīng)有盡有的商品選擇,可以說,幾乎現(xiàn)實生活中的所有物品或是服務(wù),下至大蔥、蒜頭,上至汽車、房子,甚至是空氣、土壤,你都能在網(wǎng)上買到。而每一樣商品又有數(shù)以千計的品類,哪樣商品好,又該如何選擇,這些傳統(tǒng)的電子商務(wù)無法解決用戶“買什么”的困擾。
作為消費領(lǐng)域的主流,一場電子商務(wù)的革命首先在女性時尚消費中掀起。據(jù)不完全數(shù)據(jù)統(tǒng)計,社交網(wǎng)站活躍用戶70%都是女性,可以說,女性是互聯(lián)網(wǎng)主體。她們擁有強烈的美麗需求和沖動,卻沒有網(wǎng)站可以很好地滿足她們。這時美麗說誕生了,這個以分享、交流購物為主題的大型女性時尚社交網(wǎng)站,每個用戶在接受資訊的同時,也是時尚資訊的發(fā)布者。用戶可以通過網(wǎng)站上被廣為收藏的商品,發(fā)現(xiàn)潮流的趨勢。而從另一方面看,這也是一種口碑營銷,女性不再為“買什么”而困擾,因為美麗說的姐妹們給出了建議。
創(chuàng)造分享交流的購物樂趣
美麗說的口號叫:“你可以在美麗說收藏、發(fā)現(xiàn)、分享你的美麗點滴”。女人的天性是通過分享能得到一種別人的贊美跟肯定,這是最大的分享動力,而前提是要在網(wǎng)絡(luò)上展示出“人”的形象。
以往,你在傳統(tǒng)門戶中得到的大都是關(guān)于時尚的資訊,一堆堆的網(wǎng)頁,根本沒有人關(guān)心發(fā)布帖子的人是誰。而在美麗說,網(wǎng)友可以從分享中得知關(guān)注的人的穿衣風格,可以尋找和自己風格相近的人,美麗說的達人模式也非常貼合草根階層,女孩子都希望自己成為眾人關(guān)注的焦點,特別是在網(wǎng)絡(luò)上,如果被人置頂為草根達人,那么該會員的積極性被極大的帶動了,也會發(fā)動身邊的朋友積極加入該平臺,一起分享快樂。
網(wǎng)友互動中發(fā)掘潮流
從時尚的角度出發(fā),傳統(tǒng)時尚媒體往往為品牌服務(wù),信息推送至上而下。而美麗說通過網(wǎng)友們的網(wǎng)站分享,利用數(shù)據(jù)統(tǒng)計出女孩子的穿衣風格和規(guī)律,把符合她風格的東西從上億商品中篩選出來,把最好的拿給用戶,提供風格建議,同時引導時尚消費。
口碑效應(yīng)的便捷式購物
美麗說網(wǎng)站的商品圖片、價格等信息來自于淘寶和凡客等電子商務(wù)平臺。例如,網(wǎng)友在淘寶發(fā)現(xiàn)“寶貝”,可以將這件“寶貝”的網(wǎng)址復制到美麗說發(fā)布,美麗說將自動抓取商品的價格、圖片、風格關(guān)鍵字等信息。而有用戶在美麗說發(fā)現(xiàn)這件“寶貝”,發(fā)現(xiàn)好多人在買這個,她將通過美麗說直達來源網(wǎng)站購買,整個過程非常便捷。
“美麗說”開啟社會化電子商務(wù)新時代據(jù)了解,目前美麗說已擁有600w會員資源,而這個數(shù)字還在以不可思議的數(shù)字遞增,其發(fā)展態(tài)勢可謂迅猛。美麗說成為了在中國最具代表性的社會化電子商務(wù)。在它之后,“愛物網(wǎng)”、“蘑菇街”、“超有feel”、“媽媽說”、“血拼吧”、“愛逛街”等社區(qū)化分享購物網(wǎng)站也相繼火了起來,成為了社交化購物的推動者,我們也可以在其中窺見出這塊市場的豐厚——未來的社會化電子商務(wù)將不僅僅局限于女性市場消費,它還將向各個不同的領(lǐng)域滲透,或是在每個領(lǐng)域都進行更精細的層次劃分??偟膩碚f,誰能將用戶體驗做到極致,誰就能在這塊蛋糕上分一杯羹。可以得知,沒有大數(shù)據(jù)的支撐就沒有大型時尚社交網(wǎng)絡(luò),由此也可以預(yù)見,未來的互聯(lián)網(wǎng)離不開大數(shù)據(jù)的支撐。
【總結(jié)】
隨著互聯(lián)網(wǎng)的飛速發(fā)展,數(shù)據(jù)的收集、保存、維護、共享、使用等等任務(wù),都成為橫跨各個領(lǐng)域、牽一發(fā)而動全身的現(xiàn)象和挑戰(zhàn)。數(shù)據(jù)正在迅速膨脹并變大,它決定著企業(yè)的未來發(fā)展,因此企業(yè)須順應(yīng)大數(shù)據(jù)時代的發(fā)展,運用大數(shù)據(jù)思維方式,迎接挑戰(zhàn),也為自身創(chuàng)作更多的機遇。
【參考文獻】
1.《什么是大數(shù)據(jù)時代的思維?》藍調(diào)(2013)
2.《大數(shù)據(jù)時代》維克托· 邁爾 ·舍恩伯格
3.《大數(shù)據(jù)時代來臨的思考-----機遇與挑戰(zhàn)并存》涉惠杰