第一篇:大數(shù)據(jù)時代已經(jīng)到來,你了解嗎
大數(shù)據(jù)時代已經(jīng)到來,你了解嗎?
一、大數(shù)據(jù)出現(xiàn)的背景
進入2012年,大數(shù)據(jù)(big data)一詞越來越多地被提及,人們用它來描述和定義信息爆炸時代產(chǎn)生的海量數(shù)據(jù),并命名與之相關的技術發(fā)展與創(chuàng)新。它已經(jīng)上過《紐約時報》《華爾街日報》的專欄封面,進入美國白宮官網(wǎng)的新聞,現(xiàn)身在國內(nèi)一些互聯(lián)網(wǎng)主題的講座沙龍中,甚至被嗅覺靈敏的證券公司等寫進了投資推薦報告。
數(shù) 據(jù)正在迅速膨脹并變大,它決定著企業(yè)的未來發(fā)展,雖然現(xiàn)在企業(yè)可能并沒有意識到數(shù)據(jù)爆炸性增長帶來問題的隱患,但是隨著時間的推移,人們將越來越多的意識 到數(shù)據(jù)對企業(yè)的重要性。大數(shù)據(jù)時代對人類的數(shù)據(jù)駕馭能力提出了新的挑戰(zhàn),也為人們獲得更為深刻、全面的洞察能力提供了前所未有的空間與潛力。
最 早提出大數(shù)據(jù)時代到來的是全球知名咨詢公司麥肯錫,麥肯錫稱:“數(shù)據(jù),已經(jīng)滲透到當今每一個行業(yè)和業(yè)務職能領域,成為重要的生產(chǎn)因素。人們對于海量數(shù)據(jù)的 挖掘和運用,預示著新一波生產(chǎn)率增長和消費者盈余浪潮的到來?!薄按髷?shù)據(jù)”在物理學、生物學、環(huán)境生態(tài)學等領域以及軍事、金融、通訊等行業(yè)存在已有時日,卻因為近年來互聯(lián)網(wǎng)和信息行業(yè)的發(fā)展而引起人們關注。
大數(shù)據(jù)在互聯(lián)網(wǎng)行業(yè)指的是這樣一種現(xiàn)象:互聯(lián)網(wǎng)公司在日常運營中生成、累積的用戶網(wǎng)絡行為數(shù)據(jù)。這些數(shù)據(jù)的規(guī)模是如此龐大,以至于不能用G或T來衡量,大數(shù)據(jù)的起始計量單位至少是P(1000個T)、E(100萬個T)或Z(10億個T)。
二、什么是大數(shù)據(jù)?
信息技術領域原先已經(jīng)有“海量數(shù)據(jù)”、“大規(guī)模數(shù)據(jù)”等概念,但這些概念只著眼于數(shù)據(jù)規(guī)模本身,未能充分反映數(shù)據(jù)爆發(fā)背景下的數(shù)據(jù)處理與應用需求,而“大數(shù)據(jù)”這一新概念不僅指規(guī)模龐大的數(shù)據(jù)對象,也包含對這些數(shù)據(jù)對象的處理和應用活動,是數(shù)據(jù)對象、技術與應用三者的統(tǒng)一。
1、大數(shù)據(jù)(bigdata),或稱巨量資料,指的是所涉及的資料量規(guī)模巨大到無法透過目前主流軟件工具,在合理時間內(nèi)達到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營決策更積極目的的資訊。大數(shù)據(jù)對象既可能是實際的、有限的數(shù)據(jù)集合,如某個政府部門或企業(yè)掌握的數(shù)據(jù)庫,也可能是虛擬的、無限的數(shù)據(jù)集合,如微博、微信、社交網(wǎng)絡上的全部信息。大數(shù)據(jù)是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。從數(shù)據(jù)的類別上看,“大數(shù)據(jù)”指的是無法使用傳統(tǒng)流程或工具處理或分析的信息。它定義了那些超出正常處理范圍和大小、迫使用戶采用非傳統(tǒng)處理方法的數(shù)據(jù)集。
亞馬遜網(wǎng)絡服務(AWS)、大數(shù)據(jù)科學家JohnRauser提到一個簡單的定義:大數(shù)據(jù)就是任何超過了一臺計算機處理能力的龐大數(shù)據(jù)量。研發(fā)小組對大數(shù)據(jù)的定義:“大數(shù)據(jù)是最大的 宣傳技術、是最時髦的技術,當這種現(xiàn)象出現(xiàn)時,定義就變得很混亂?!盞elly說:“大數(shù)據(jù)是可能不包含所有的 信息,但我覺得大部分是正確的。對大數(shù)據(jù)的一部分認知在于,它是如此之大,分析它需要多個工作負載,這是AWS的定義。
2、大數(shù)據(jù)技術,是指從各種各樣類型的大數(shù)據(jù)中,快速獲得有價值信息的技術的能力,包括數(shù)據(jù)采集、存儲、管理、分析挖掘、可視化等技術及其集成。適用于大數(shù)據(jù)的技術,包括大規(guī)模并行處理(MPP)數(shù)據(jù)庫,數(shù)據(jù)挖掘電網(wǎng),分布式文件系統(tǒng),分布式數(shù)據(jù)庫,云計算平臺,互聯(lián)網(wǎng),和可擴展的存儲系統(tǒng)。
3、大數(shù)據(jù)應用,是 指對特定的大數(shù)據(jù)集合,集成應用大數(shù)據(jù)技術,獲得有價值信息的行為。對于不同領域、不同企業(yè)的不同業(yè)務,甚至同一領域不同企業(yè)的相同業(yè)務來說,由于其業(yè)務 需求、數(shù)據(jù)集合和分析挖掘目標存在差異,所運用的大數(shù)據(jù)技術和大數(shù)據(jù)信息系統(tǒng)也可能有著相當大的不同。惟有堅持“對象、技術、應用”三位一體同步發(fā)展,才 能充分實現(xiàn)大數(shù)據(jù)的價值。
當你的技術達到極限時,也就是數(shù)據(jù)的極限”。大數(shù)據(jù)不是關于如何定義,最重要的是如何使用。最大的挑戰(zhàn)在于哪些技術能更好的使用數(shù)據(jù)以及大數(shù)據(jù)的應用情況如何。這與傳統(tǒng)的數(shù)據(jù)庫相比,開源的大數(shù)據(jù)分析工具的如Hadoop的崛起,這些非結構化的數(shù)據(jù)服務的價值在哪里。
三、大數(shù)據(jù)的類型和價值挖掘方法
1、大數(shù)據(jù)的類型大致可分為三類:
1)傳統(tǒng)企業(yè)數(shù)據(jù)(Traditionalenterprisedata):包括 CRM systems的消費者數(shù)據(jù),傳統(tǒng)的ERP數(shù)據(jù),庫存數(shù)據(jù)以及賬目數(shù)據(jù)等。2)機器和傳感器數(shù)據(jù)(Machine-generated/sensor data):包括呼叫記錄(CallDetail Records),智能儀表,工業(yè)設備傳感器,設備日志(通常是Digital exhaust),交易數(shù)據(jù)等。
3)社交數(shù)據(jù)(Socialdata):包括用戶行為記錄,反饋數(shù)據(jù)等。如Twitter,F(xiàn)acebook這樣的社交媒體平臺。
2、大數(shù)據(jù)挖掘商業(yè)價值的方法主要分為四種:
1)客戶群體細分,然后為每個群體量定制特別的服務。2)模擬現(xiàn)實環(huán)境,發(fā)掘新的需求同時提高投資的回報率。3)加強部門聯(lián)系,提高整條管理鏈條和產(chǎn)業(yè)鏈條的效率。4)降低服務成本,發(fā)現(xiàn)隱藏線索進行產(chǎn)品和服務的創(chuàng)新。
四、大數(shù)據(jù)的特點
業(yè)界通常用4個V(即Volume、Variety、Value、Velocity)來概括大數(shù)據(jù)的特征。具體來說,大數(shù)據(jù)具有4個基本特征:
1、是數(shù)據(jù)體量巨大
數(shù) 據(jù)體量(volumes)大,指代大型數(shù)據(jù)集,一般在10TB規(guī)模左右,但在實際應用中,很多企業(yè)用戶把多個數(shù)據(jù)集放在一起,已經(jīng)形成了PB級的數(shù)據(jù)量;百度資料表明,其新首頁導航每天需要提供的數(shù)據(jù)超過1.5PB(1PB=1024TB),這些數(shù)據(jù)如果打印出來將超過5千億張A4紙。有資料證實,到目前 為止,人類生產(chǎn)的所有印刷材料的數(shù)據(jù)量僅為200PB。
2、是數(shù)據(jù)類別大和類型多樣
數(shù)據(jù)類別(variety)大,數(shù)據(jù)來自多種數(shù)據(jù)源,數(shù)據(jù)種類和格式日漸豐富,已沖破了以前所限定的結構化 數(shù)據(jù)范疇,囊括了半結構化和非結構化數(shù)據(jù)?,F(xiàn)在的數(shù)據(jù)類型不僅是文本形式,更多的是圖片、視頻、音頻、地理位置信息等多類型的數(shù)據(jù),個性化數(shù)據(jù)占絕對多數(shù)。
3、是處理速度快
在數(shù)據(jù)量非常龐大的情況下,也能夠做到數(shù)據(jù)的實時處理。數(shù)據(jù)處理遵循“1秒定律”,可從各種類型的數(shù)據(jù)中快速獲得高價值的信息。
4、是價值真實性高和密度低
數(shù)據(jù)真實性(Veracity)高,隨著社交數(shù)據(jù)、企業(yè)內(nèi)容、交易與應用數(shù)據(jù)等新數(shù)據(jù)源的興趣,傳統(tǒng)數(shù)據(jù)源的局限被打破,企業(yè)愈發(fā)需要有效的信息之力以確保其真實性及安全性。以視頻為例,一小時的視頻,在不間斷的監(jiān)控過程中,可能有用的數(shù)據(jù)僅僅只有一兩秒。
五、大數(shù)據(jù)的作用
1、對大數(shù)據(jù)的處理分析正成為新一代信息技術融合應用的結點
移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、社交網(wǎng)絡、數(shù)字家庭、電子商務等是新一代信息技術的應用形態(tài),這些應用不斷產(chǎn)生大數(shù)據(jù)。云計算為這些海量、多樣化的大數(shù)據(jù)提供存儲和運算平臺。通過對不同來源數(shù)據(jù)的管理、處理、分析與優(yōu)化,將結果反饋到上述應用中,將創(chuàng)造出巨大的經(jīng)濟和社會價值。
大數(shù)據(jù)具有催生社會變革的能量。但釋放這種能量,需要嚴謹?shù)臄?shù)據(jù)治理、富有洞見的數(shù)據(jù)分析和激發(fā)管理創(chuàng)新的環(huán)境(Ramayya Krishnan,卡內(nèi)基·梅隆大學海因茲學院院長)。
2、大數(shù)據(jù)是信息產(chǎn)業(yè)持續(xù)高速增長的新引擎
面向大數(shù)據(jù)市場的新技術、新產(chǎn)品、新服務、新業(yè)態(tài)會不斷涌現(xiàn)。在硬件與集成設備領域,大數(shù)據(jù)將對芯片、存儲產(chǎn)業(yè)產(chǎn)生重要影響,還將催生一體化數(shù)據(jù)存儲處理服務器、內(nèi)存計算等市場。在軟件與服務領域,大數(shù)據(jù)將引發(fā)數(shù)據(jù)快速處理分析、數(shù)據(jù)挖掘技術和軟件產(chǎn)品的發(fā)展。
3、大數(shù)據(jù)利用將成為提高核心競爭力的關鍵因素
各 行各業(yè)的決策正在從“業(yè)務驅(qū)動” 轉(zhuǎn)變“數(shù)據(jù)驅(qū)動”。對大數(shù)據(jù)的分析可以使零售商實時掌握市場動態(tài)并迅速做出應對;可以為商家制定更加精準有效的營銷策略提供決策支持;可以幫助企業(yè)為消費 者提供更加及時和個性化的服務;在醫(yī)療領域,可提高診斷準確性和藥物有效性;在公共事業(yè)領域,大數(shù)據(jù)也開始發(fā)揮促進經(jīng)濟發(fā)展、維護社會穩(wěn)定等方面的重要作 用。
4、大數(shù)據(jù)時代科學研究的方法手段將發(fā)生重大改變
例如,抽樣調(diào)查是社會科學的基本研究方法。在大數(shù)據(jù)時代,可通過實時監(jiān)測、跟蹤研究對象在互聯(lián)網(wǎng)上產(chǎn)生的海量行為數(shù)據(jù),進行挖掘分析,揭示出規(guī)律性的東西,提出研究結論和對策。
六、大數(shù)據(jù)的商業(yè)價值
1、對顧客群體細分
“大數(shù)據(jù)”可以對顧客群體細分,然后對每個群體量體裁衣般的采取獨特的行動。瞄準特定的顧客群體來進行營銷和服務是商家一直以來的追求。云存儲的海量數(shù)據(jù)和“大數(shù)據(jù)”的分析技術使得對消費者的實時和極端的細分有了成本效率極高的可能。
2、模擬實境
運用“大數(shù)據(jù)”模擬實境,發(fā)掘新的需求和提高投入的回報率。現(xiàn)在越來越多的產(chǎn)品中都裝有傳感器,汽車和智能手機的普及使得可收集數(shù)據(jù)呈現(xiàn)爆炸性增長。Blog、Twitter、Facebook和微博等社交網(wǎng)絡也在產(chǎn)生著海量的數(shù)據(jù)。
云 計算和“大數(shù)據(jù)”分析技術使得商家可以在成本效率較高的情況下,實時地把這些數(shù)據(jù)連同交易行為的數(shù)據(jù)進行儲存和分析。交易過程、產(chǎn)品使用和人類行為都可以 數(shù)據(jù)化?!按髷?shù)據(jù)”技術可以把這些數(shù)據(jù)整合起來進行數(shù)據(jù)挖掘,從而在某些情況下通過模型模擬來判斷不同變量(比如不同地區(qū)不同促銷方案)的情況下何種方案 投入回報最高。
3、提高投入回報率 提高“大數(shù)據(jù)”成果在各相關部門的分享程度,提高整個管理鏈條和產(chǎn)業(yè)鏈條的投入回報率。“大數(shù)據(jù)”能力強的部門可以通過云計算、互聯(lián)網(wǎng)和內(nèi)部搜索引擎把”大數(shù)據(jù)”成果和“大數(shù)據(jù)”能力比較薄弱的部門分享,幫助他們利用“大數(shù)據(jù)”創(chuàng)造商業(yè)價值。
4、數(shù)據(jù)存儲空間出租
企 業(yè)和個人有著海量信息存儲的需求,只有將數(shù)據(jù)妥善存儲,才有可能進一步挖掘其潛在價值。具體而言,這塊業(yè)務模式又可以細分為針對個人文件存儲和針對企業(yè)用 戶兩大類。主要是通過易于使用的API,用戶可以方便地將各種數(shù)據(jù)對象放在云端,然后再像使用水、電一樣按用量收費。目前已有多個公司推出相應服務,如亞 馬遜、網(wǎng)易、諾基亞等。運營商也推出了相應的服務,如中國移動的彩云業(yè)務。
5、管理客戶關系
客 戶管理應用的目的是根據(jù)客戶的屬性(包括自然屬性和行為屬性),從不同角度深層次分析客戶、了解客戶,以此增加新的客戶、提高客戶的忠誠度、降低客戶流失 率、提高客戶消費等。對中小客戶來說,專門的CRM顯然大而貴。不少中小商家將飛信作為初級CRM來使用。比如把老客戶加到飛信群里,在群朋友圈里發(fā)布新 產(chǎn)品預告、特價銷售通知,完成售前售后服務等。
6、個性化精準推薦 在 運營商內(nèi)部,根據(jù)用戶喜好推薦各類業(yè)務或應用是常見的,比如應用商店軟件推薦、IPTV視頻節(jié)目推薦等,而通過關聯(lián)算法、文本摘要抽取、情感分析等智能分 析算法后,可以將之延伸到商用化服務,利用數(shù)據(jù)挖掘技術幫助客戶進行精準營銷,今后盈利可以來自于客戶增值部分的分成。以日常的“垃圾短信”為例,信息并不都是“垃圾”,因為收到的人并不需要而被視為垃圾。通過用戶行為數(shù)據(jù)進行分析后,可以給需要的人發(fā)送需要的信息,這樣“垃圾短信”就成了有價值的信息。在日本的麥當勞,用戶在手機上下載優(yōu)惠券,再去餐廳用運營商DoCoMo的手機錢包優(yōu)惠支付。運營商和麥當勞搜集相關消費信息,例如經(jīng)常買什么漢堡,去哪個店消費,消費頻次多少,然后精準推送優(yōu)惠券給用戶。
7、數(shù)據(jù)搜索
數(shù)據(jù)搜索是一個并不新鮮的應用,隨著“大數(shù)據(jù)”時代的到來,實時性、全范圍搜索的需求也就變得越來越強烈。我們需要能搜索各種社交網(wǎng)絡、用戶行為等數(shù)據(jù)。其商業(yè)應用價值是將實時的數(shù)據(jù)處理與分析和廣告聯(lián)系起來,即實時廣告業(yè)務和應用內(nèi)移動廣告的社交服務。運營商掌握的用戶網(wǎng)上行為信息,使得所獲取的數(shù)據(jù)“具備更全面維度”,更具商業(yè)價值。典型應用如中國移動的“盤古搜索”。
七、大數(shù)據(jù)對經(jīng)濟社會的重要影響
1、能夠推動實現(xiàn)巨大經(jīng)濟效益
比如對中國零售業(yè)凈利潤增長的貢獻,降低制造業(yè)產(chǎn)品開發(fā)、組裝成本等。預計2013年全球大數(shù)據(jù)直接和間接拉動信息技術支出將達1200億美元。
2、能夠推動增強社會管理水平
大數(shù)據(jù)在公共服務領域的應用,可有效推動相關工作開展,提高相關部門的決策水平、服務效率和社會管理水平,產(chǎn)生巨大社會價值。歐洲多個城市通過分析實時采集的交通流量數(shù)據(jù),指導駕車出行者選擇最佳路徑,從而改善城市交通狀況。
3、如果沒有高性能的分析工具,大數(shù)據(jù)的價值就得不到釋放 對大數(shù)據(jù)應用必須保持清醒認識,既不能迷信其分析結果,也不能因為其不完全準確而否定其重要作用。
1)由于各種原因,所分析處理的數(shù)據(jù)對象中不可避免地會包括各種錯誤數(shù)據(jù)、無用數(shù)據(jù),加之作為大數(shù)據(jù)技術核心的數(shù)據(jù)分析、人工智能等技術尚未完全成熟,所以對 計算機完成的大數(shù)據(jù)分析處理的結果,無法要求其完全準確。例如,谷歌通過分析億萬用戶搜索內(nèi)容能夠比專業(yè)機構更快地預測流感暴發(fā),但由于微博上無用信息的 干擾,這種預測也曾多次出現(xiàn)不準確的情況。2)必須清楚定位的是,大數(shù)據(jù)作用與價值的重點在于能夠引導和啟發(fā)大數(shù)據(jù)應用者的創(chuàng)新思維,輔助決策。簡單而言,若是處理一個問題,通常人能夠想到一種方法,而大數(shù)據(jù)能夠提供十種參考方法,哪怕其中只有三種可行,也將解決問題的思路拓展了三倍。
所以,客觀認識和發(fā)揮大數(shù)據(jù)的作用,不夸大、不縮小,是準確認知和應用大數(shù)據(jù)的前提。
八、總結
不管大數(shù)據(jù)的核心價值是不是預測,但是基于大數(shù)據(jù)形成決策的模式已經(jīng)為不少的企業(yè)帶來了盈利和聲譽。
1、從大數(shù)據(jù)的價值鏈條來分析,存在三種模式:
1)手握大數(shù)據(jù),但是沒有利用好;比較典型的是金融機構,電信行業(yè),政府機構等。2)沒有數(shù)據(jù),但是知道如何幫助有數(shù)據(jù)的人利用它;比較典型的是IT咨詢和服務企業(yè),比如,埃森哲,IBM,Oracle等。
3)既有數(shù)據(jù),又有大數(shù)據(jù)思維;比較典型的是Google,Amazon,Mastercard等。
2、未來在大數(shù)據(jù)領域最具有價值的是兩種事物:
1)擁有大數(shù)據(jù)思維的人,這種人可以將大數(shù)據(jù)的潛在價值轉(zhuǎn)化為實際利益;
2)還未有被大數(shù)據(jù)觸及過的業(yè)務領域。這些是還未被挖掘的油井,金礦,是所謂的藍海。大 數(shù)據(jù)是信息技術與專業(yè)技術、信息技術產(chǎn)業(yè)與各行業(yè)領域緊密融合的典型領域,有著旺盛的應用需求、廣闊的應用前景。為把握這一新興領域帶來的新機遇,需要不 斷跟蹤研究大數(shù)據(jù),不斷提升對大數(shù)據(jù)的認知和理解,堅持技術創(chuàng)新與應用創(chuàng)新的協(xié)同共進,加快經(jīng)濟社會各領域的大數(shù)據(jù)開發(fā)與利用,推動國家、行業(yè)、企業(yè)對于 數(shù)據(jù)的應用需求和應用水平進入新的階段。【編輯推薦】
大數(shù)據(jù)時代,數(shù)據(jù)資產(chǎn)成為核心競爭力
大數(shù)據(jù)時代的投資機遇有哪些
教育研究如何跟上大數(shù)據(jù)時代
大數(shù)據(jù)時代,石化企業(yè)應該如何進行數(shù)據(jù)分析
大數(shù)據(jù)時代:投資布局四維開拓
沒有做不到只有想不到 大數(shù)據(jù)時代拼的就是創(chuàng)意
【盤點】大數(shù)據(jù)時代中新出現(xiàn)的數(shù)據(jù)類型
第二篇:大數(shù)據(jù)時代的到來對體育的影響
大數(shù)據(jù)時代的到來對體育的影響
中圖分類號:G81 文獻標識:A 文章編號:1009-9328(2014)06-000-01
摘要由于科學實驗與互聯(lián)網(wǎng)的飛速發(fā)展,出現(xiàn)了大數(shù)據(jù)。在大數(shù)據(jù)時代,數(shù)據(jù)挖掘在體育領域中發(fā)揮了顯著的作用,從大量的數(shù)據(jù)集中去分析和挖掘潛在價值。數(shù)據(jù)就像一個神奇的鉆石礦,當它的首要價值被發(fā)掘后仍能不斷給予。它的真實價值就像漂浮在海洋中的冰山,第一眼只能看到冰山的一角,而絕大部分都隱藏在表面之下。
關鍵詞大數(shù)據(jù)體育影響
一、前沿
隨著科技的進步和人們生活的互聯(lián)網(wǎng)化,圍繞大數(shù)據(jù)的應用范疇將越來越多。如今“大數(shù)據(jù)”這個詞匯越來越火,但相當多的人并不清楚大數(shù)據(jù)究竟是什么。讓人們更能直接感受到大數(shù)據(jù)存在的場景卻是體育運動。
二、大數(shù)據(jù)概述
大數(shù)據(jù)(big data),或稱巨量資料,指的是所涉及的資料量規(guī)模巨大到無法通過目前主流軟件工具,在合理時間內(nèi)達到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營決策更積極目的的資訊。首先,大數(shù)據(jù)是結構化數(shù)據(jù)、半結構化數(shù)據(jù)與非結構化數(shù)據(jù)的總和。在如此龐大的數(shù)據(jù)中,只有10%的數(shù)據(jù)是存儲在數(shù)據(jù)庫中的結構化數(shù)據(jù),其余的則是郵件、視頻、微博、帖子、頁面等點擊等產(chǎn)生的大量的半結構化數(shù)據(jù)、非結構化數(shù)據(jù)。其次,大數(shù)據(jù)的“大”意義具有多樣性。再次,大數(shù)據(jù)的“數(shù)據(jù)”不是數(shù)據(jù)儲存,而是數(shù)據(jù)獲取與數(shù)據(jù)應用。不能只空談“大數(shù)據(jù)”的概念而不談“分析”,“分析”才是承接大數(shù)據(jù)的價值體現(xiàn)。
三、體育領域中的大數(shù)據(jù)
《點球成金》這部電影點醒了不少企業(yè)家,那些看似呆頭呆腦,缺乏運動細胞的數(shù)據(jù)分析人員原來都是火眼神探,那些看似無聊的數(shù)據(jù)下其實埋藏著金礦。在體育界,數(shù)據(jù)分析已經(jīng)走到了企業(yè)應用的前面,傳感器和3D雷達正采集著大量的運動員數(shù)據(jù),而數(shù)據(jù)分析的廣泛應用也促使職業(yè)體育內(nèi)部發(fā)生著廣泛而深刻的變化。從高爾夫到網(wǎng)球,從橄欖球到足球,數(shù)據(jù)分析如今正席卷職業(yè)體育界。每次擊球,每次揮桿都可能會影響整場比賽的結果。運動員和球隊如今越來越依靠數(shù)據(jù)分析來使他們更快更強。
IBM贊助網(wǎng)球賽事并提供技術支持始于1993年,在1998年,IBM就為美國網(wǎng)球公開賽提供了虛擬化技術。從2005年以來,IBM通過Slam Tracker追蹤了四大滿貫賽事八年來的全部8128場比賽,每場比賽收集4100萬個數(shù)據(jù)點。有了這些數(shù)據(jù),我們可以知道Ace球的數(shù)量,對比賽結果的影響很大,首先被破發(fā)的選手失敗的可能性很大。
在網(wǎng)球領域,大數(shù)據(jù)包括錦標賽、比賽和球員統(tǒng)計,基于數(shù)據(jù)挖掘可以告訴小威廉姆斯,要戰(zhàn)勝莎拉波娃,接對方一發(fā)的回球得分率要爭取超過36%;而莎拉波娃要打敗小威廉姆斯,接對方一發(fā)的回球得分率要爭取超過28%。在互聯(lián)網(wǎng)時代,數(shù)據(jù)的獲取相對容易,但分析挖掘出大量數(shù)據(jù)中存在的價值,仍是一個重要的課題。
美國目前大約已有20支NBA球隊,使用由IBM公司開發(fā)的數(shù)據(jù)挖掘應用軟件Advanced Scout系統(tǒng)來優(yōu)化他們的戰(zhàn)術組合。教練通過對球員及賽場采集的大量信息,通過數(shù)據(jù)分析來臨場決定替換球員。教練員可以在家里或在工作途中運用此工具對儲存在NBA中心服務器上的數(shù)據(jù)進行挖掘。在系統(tǒng)中,每場比賽的時間都按得分、搶斷、助攻、失誤等等指標被統(tǒng)計分析,且時間標記讓教練員方便借助回放和定位NBA比賽的錄影片段來幫助理解統(tǒng)計結果的含義。通過挖掘數(shù)據(jù)背后的含義,來制定每場比賽的排兵布陣,以及戰(zhàn)術打法。
在NBA的官方網(wǎng)站上,有專門的統(tǒng)計頁面,這里面把NBA歷史上收集的幾乎所有球員、球隊信息以非常易用的方式提供出來,后臺使用了SAP HANA這樣的內(nèi)存分析數(shù)據(jù)庫,以應對網(wǎng)站數(shù)以萬計的訪問者的訪問,提高隨機、靈活查詢的速度,提供了一種前所未有的用戶體驗,對上百個指標的不同過濾、統(tǒng)計、排序等等,可以定制分析報表,而不需要大量固化報表格式和場景。一個看似并不“高科技”的體育項目,都可以如此利用“大數(shù)據(jù)”的手段,以提供非常優(yōu)秀的用戶體驗,從數(shù)據(jù)收集到數(shù)據(jù)統(tǒng)計和挖掘,到優(yōu)秀的數(shù)據(jù)展現(xiàn),都值得其他項目向其學習。
大數(shù)據(jù)對體育的影響不僅僅表現(xiàn)在運動場上,隨著移動互聯(lián)和計算機技術的飛速發(fā)展,對大數(shù)據(jù)的信息挖掘在體育產(chǎn)業(yè)中的作用也不可小視。根據(jù)特定的客戶人群,向他們推送一些其他賽事的廣告信息,從而增加賽事門票銷售收益。數(shù)據(jù)挖掘從技術上可以判斷哪些是他們潛在的最有價值客戶、支持修改或重新制定產(chǎn)品推廣策略,從而把合適的產(chǎn)品推銷給需要他們的客戶群體,以便用最經(jīng)濟的促銷獲得最好的銷售結果。此外,對大數(shù)據(jù)的挖掘還可以對體育博彩線和運動員表現(xiàn)進行分析,成功找出其中的不正常交易。因此,建立系統(tǒng)的數(shù)據(jù)網(wǎng)絡,及時、有效地利用數(shù)據(jù)挖掘技術,可以更好推動體育產(chǎn)業(yè)的進一步發(fā)展。
用分析從大量的數(shù)據(jù)中尋找相關性模式,發(fā)現(xiàn)以前不為人知的、超越于平凡知識之上的、至關重要的新知識。這樣的新知識,是隱藏在表象之下的獲勝關鍵,是決定競爭結局的密碼,是價值,是財富,是自我實現(xiàn)之路。這才是為什么那大數(shù)據(jù)倍受追捧的原因。
參考文獻:
[1] 劉同.大數(shù)據(jù)、云計算彰顯智慧體育[J].互聯(lián)網(wǎng)周刊.2013(23):22-23.[2] 馮舉高.大數(shù)據(jù)加快體育科技創(chuàng)新[N].經(jīng)濟日報.2013-10-23004.[3] 徐?S,張輝.數(shù)據(jù)挖掘在體育領域中的應用[J].武漢體育學院學報.2012(11):27-30.[4] 袁博.體育與大數(shù)據(jù)[J].軟件和信息服務.2013(11):23.[5] 忻韋武.數(shù)據(jù)挖掘在體育領域中的應用探究[J].科技創(chuàng)新導報.2013(23):10-12.[6] 胡斐.數(shù)據(jù)挖掘在體育領域中的應用研究綜述[J].科技創(chuàng)新導報.2010(27):211-212.
第三篇:大數(shù)據(jù)時代
大數(shù)據(jù)時代
近年來,隨著互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)、智能手機及傳感器等的普及,信息流量有了爆發(fā)性的增長,兩會以后,互聯(lián)網(wǎng)里最熱的詞匯,就是李克強總理在政府工作在報告里面提到的“互聯(lián)網(wǎng)+”,大數(shù)據(jù)將會更廣泛的被運用到各個領域,越來越多的業(yè)內(nèi)人士開始談論“大數(shù)據(jù)”,如何利用大數(shù)據(jù),成為政府和眾多企業(yè)關心的熱點?
互聯(lián)網(wǎng)+《大數(shù)據(jù)》緊緊圍繞這些問題展開,幫您如何利用大數(shù)據(jù)為企業(yè)從戰(zhàn)略上面進行指導挖掘和預測,從戰(zhàn)術上進行營銷服務和安全措施,精彩我們共同期待。
第一篇大數(shù)據(jù)很熱,大數(shù)據(jù)不神秘(趨勢)有人說,如果你不知道大數(shù)據(jù),你就OUT了 --大數(shù)據(jù)到底有多熱 什么樣的數(shù)據(jù)算是大數(shù)據(jù) --大數(shù)據(jù)的特點和概念辨析 亂我心者,大數(shù)據(jù)之事多煩憂 --大數(shù)據(jù)并不象你想象的那樣神秘 身邊的大數(shù)據(jù)
--大數(shù)據(jù)就在你我身邊
案例分析:淘寶是如何利用大數(shù)據(jù)淘寶的 小結:不管你愿不愿意,大數(shù)據(jù)已經(jīng)在那里 電話:010---59002742 010--59004371 第二篇:認識大數(shù)據(jù) 1.什么是大數(shù)據(jù) 2.大數(shù)據(jù)應用的意義
3.大數(shù)據(jù)在企業(yè)經(jīng)營中應用的意義 4.對大數(shù)據(jù)的認識誤區(qū) 案例分析
第三篇:大數(shù)據(jù)時代變革 1:大數(shù)據(jù)時代的思維變革 2:大數(shù)據(jù)時代的商業(yè)變革 3:大數(shù)據(jù)時代的管理變革
第四篇:大數(shù)據(jù)在營銷中的運用 大數(shù)據(jù)精準營銷 1.什么是精確營銷 2.精確營銷的方法 實操教學+案例分析
第五篇:在技術中應用 數(shù)據(jù)挖掘
大數(shù)據(jù)的核心價值——挖掘 1.什么是數(shù)據(jù)挖掘? 2.數(shù)據(jù)挖掘的流程 3.數(shù)據(jù)挖掘解決的問題 結合現(xiàn)場實操教學+案例分析
第六篇:預測
大數(shù)據(jù)的核心價值——預測 1:如何預測? 案例分析
第七篇:大數(shù)據(jù)與云計算 1:什么是云計算
2:大數(shù)據(jù)與云計算的關系
第八篇:大數(shù)據(jù)的安全問題
大數(shù)據(jù)給信息安全帶來新的挑戰(zhàn)和機遇 大數(shù)據(jù)存儲安全策略 大數(shù)據(jù)應用安全策略 大數(shù)據(jù)管理安全策略
第四篇:大數(shù)據(jù)時代
“大”數(shù)據(jù)時代 眾所周知,數(shù)據(jù)本身就蘊藏著價值,但是將有用的數(shù)據(jù)與沒有價值的數(shù)據(jù)進行區(qū)分看起來可能是一個棘手的問題。
顯然,您所掌握的人員情況、工資表和客戶記錄對于企業(yè)的運轉(zhuǎn)至關重要,但是其他數(shù)據(jù)也擁有轉(zhuǎn)化為價值的力量。一段記錄人們?nèi)绾卧谀纳痰隇g覽購物的視頻、人們在購買您的服務前后的所作所為、如何通過社交網(wǎng)絡聯(lián)系您的客戶、是什么吸引合作伙伴加盟、客戶如何付款以及供應商喜歡的收款方式……所有這些場景都提供了很多指向,將它們抽絲剝繭,透過特殊的棱鏡觀察,將其與其他數(shù)據(jù)集對照,或者以與眾不同的方式分析解剖,就能讓您的行事方式發(fā)生天翻地覆的轉(zhuǎn)變。
大數(shù)據(jù)(big data),或稱巨量資料,指的是所涉及的資料量規(guī)模巨大到無法通過目前主流軟件工具,在合理時間內(nèi)達到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營決策更積極目的的資訊。
“大數(shù)據(jù)”這個術語最早期的引用可追溯到apache org的開源項目Nutch。當時,大數(shù)據(jù)用來描述為更新網(wǎng)絡搜索索引需要同時進行批量處理或分析的大量數(shù)據(jù)集。隨著谷歌MapReduce和Google File System(GFS)的發(fā)布,大數(shù)據(jù)不再僅用來描述大量的數(shù)據(jù),還涵蓋了處理數(shù)據(jù)的速度。
早在1980年,著名未來學家阿爾文·托夫勒便在《第三次浪潮》一書中,將大數(shù)據(jù)熱情地贊頌為“第三次浪 潮的華彩樂章”。不過,大約從2009年開始,“163大數(shù)據(jù)”才成為互聯(lián)網(wǎng)信息技術行業(yè)的流行詞匯。美國互聯(lián)網(wǎng)數(shù)據(jù)中心指出,互聯(lián)網(wǎng)上的數(shù)據(jù)每年將增長50%,每兩年便將翻一番,而目前世界上90%以上的數(shù)據(jù)是最近幾年才產(chǎn)生的。此外,數(shù)據(jù)又并非單純指人們在互聯(lián)網(wǎng)上發(fā)布的信息,全世界的工業(yè)設備、汽車、電表上有著無數(shù)的數(shù)碼傳感器,隨時測量和傳遞著有關位置、運動、震動、溫度、濕度乃至空氣中化學物質(zhì)的變化,也產(chǎn)生了海量的數(shù)據(jù)信息。
大數(shù)據(jù)技術的戰(zhàn)略意義不在于掌握龐大的數(shù)據(jù)信息,而在于對這些含有意義的數(shù)據(jù)進行專業(yè)化處理。換言之,如果把大數(shù)據(jù)比作一種產(chǎn)業(yè),那么這種產(chǎn)業(yè)實現(xiàn)盈利的關鍵,在于提高對數(shù)據(jù)的“加工能力”,通過“加工”實現(xiàn)數(shù)據(jù)的“增值”。
大數(shù)據(jù)就是互聯(lián)網(wǎng)發(fā)展到現(xiàn)今階段的一種表象或特征而已,沒有必要神話它或?qū)λ3志次分?,在以云計算為代表的技術創(chuàng)新大幕的襯托下,這些原本很難收集和使用的數(shù)據(jù)開始容易被利用起來了,通過各行各業(yè)的不斷創(chuàng)新,大數(shù)據(jù)會逐步為人類創(chuàng)造更多的價值。
第五篇:大數(shù)據(jù)時代
《大數(shù)據(jù)時代》讀書筆記
作者:邁爾舍恩伯格
出版發(fā)行:浙江人民出版社
版次:2013年1月第一版
讀者:物流一班、時菲陽
一、作者觀點
谷歌有一個名為“谷歌流感趨勢”的工具,它通過跟蹤搜索詞相關數(shù)據(jù)來判斷全美地區(qū)的流感情況。這就是一個典型的“大數(shù)據(jù)”的應用例子,舍恩伯格的這本《大數(shù)據(jù)時代》受到了廣泛的贊譽,他本人也因此書被視為大數(shù)據(jù)領域中的領軍人物。
作者提出了三點結論:第一,要盡可能分析事物相關的“全部”數(shù)據(jù),而不是之前的隨機抽樣,即“樣本=總體”。第二,要樂于接受數(shù)據(jù)的繁雜,而不應過分追求其精確性。第三,重視大數(shù)據(jù)呈現(xiàn)的“相關關系”,而不要執(zhí)于探索事物間的因果關系。
二、摘抄:
在甲型H1N1流感爆發(fā)的幾周前,互聯(lián)網(wǎng)巨頭谷歌公司的工程師們在《自然》雜志上發(fā)表了一篇引人注目的論文。它令公共衛(wèi)生官員們和計算機科學家們感到震驚。文中解釋了谷歌為什么能夠預測冬季流感的傳播:不僅是全美范圍的傳播,而且可以具體到特定的地區(qū)和州。谷歌通過觀察人們在網(wǎng)上的搜索記錄來完成這個預測,而這種方法以前一直是被忽略的。谷歌保存了多年來所有的搜索記錄,而且每天都會收到來自全球超過30億條的搜索指令,如此龐大的數(shù)據(jù)資源足以支撐和幫助它完成這項工作。
發(fā)現(xiàn)能夠通過人們在網(wǎng)上檢索的詞條辨別出其是否感染了流感后,谷歌公司把五千萬條美國人最頻繁檢索的詞條和美國疾控中心在03年至08年間季節(jié)性流感傳播時期的數(shù)據(jù)進行了比較。其他公司也曾試圖確定這些相關的詞條,但是他們?nèi)狈ο窆雀韫疽粯育嫶蟮臄?shù)據(jù)資源、處理能力和統(tǒng)計技術。
雖然谷歌公司的員工猜測,特定的檢索詞條是為了在網(wǎng)絡上得到關于流感的信息,如“哪些是治療咳嗽和發(fā)熱的藥物”,但是找出這些詞條并不是重點,他們也不知道哪些詞條更重要,更關鍵的是,他們建立的系統(tǒng)并不依賴于這樣的語義理解。他們設立的這個系統(tǒng)唯一關注的就是特定檢索詞條的頻繁使用與流感在時間和空間上的傳播之間的聯(lián)系。谷歌公司為了測試這些檢索詞條,總共處理了4.5億個不同的數(shù)字模型。在將得出的預測與07年、08年美國疾控中心記錄的實際流感病例進行對比后,谷歌公司發(fā)現(xiàn),他們的軟件發(fā)現(xiàn)了45條檢索詞條的組合,一旦將它們用于一個數(shù)學模型,他們的預測與官方數(shù)據(jù)的相關性高達97%。和疾控中心一樣,他們也能判斷出流感是從哪里傳播出來的,而且他們的判斷非常及時,不會像疾控中心一樣要在流感爆發(fā)一兩周之后才可以做到。
所以,09年甲型H1N1流感爆發(fā)的時候,與習慣性滯后的官方數(shù)據(jù)相比,谷歌成為了一個更有效、更及時的指示標。公共衛(wèi)生機構的官員獲得了非常有價值的數(shù)據(jù)信息。驚人的是,谷歌公司的方法甚
至不需要分發(fā)口腔試紙和聯(lián)系醫(yī)生——它是建立在大數(shù)據(jù)的基礎之上的。這是當今社會所獨有的一種新型能力:以一種前所未有的方式,通過對海量數(shù)據(jù)進行分析,獲得有巨大價值的產(chǎn)品和服務,或深刻的洞見。基于這樣的技術理念和數(shù)據(jù)儲備,下一次流感來襲的時候,世界將會擁有一種更好的預測工具,以預防流感的傳播。
三、感想:
看完本書有如下感想:
首先,作者站在理論的制高點上,條理清楚地闡述了大數(shù)據(jù)對人類的工作、生活、思維帶來的革新,大數(shù)據(jù)時代的三種典型的商業(yè)模式,以及大數(shù)據(jù)時代對于個人隱私保護、公共安全提出的挑戰(zhàn)。其次,文中的事例貼近現(xiàn)實生活,貼近時代,令讀者既印象深刻,又感同身受。此外,作者沒有使用大量的專業(yè)術語,沒有假裝一副專業(yè)的面孔??v觀全書,遣詞造句,均通俗易懂。
其次,作者認為大數(shù)據(jù)時代具有三個顯著特點。
一、人們研究與分析某個現(xiàn)象時,將使用全部數(shù)據(jù)而非抽樣數(shù)據(jù);
二、在大數(shù)據(jù)時代,不能一味地追求數(shù)據(jù)的精確性,而要適應數(shù)據(jù)的多樣性、豐富性、甚至要接受錯誤的數(shù)據(jù)。
三、了解數(shù)據(jù)之間的相關性,勝于對因果關系的探索。“是什么”比“為什么”重要。
最后,作者指出,隨著技術的發(fā)展,數(shù)據(jù)的存儲與處理成本顯著降低,人們現(xiàn)在有能力從支離破碎的、看似毫不相干的數(shù)據(jù)礦渣中抽煉出真知爍見。在大數(shù)據(jù)時代,三類公司將成為時代的寵兒。一是擁有大數(shù)據(jù)的公司與組織。如政府、銀行、電信公司、全球性互聯(lián)網(wǎng)公
司(阿里巴巴、淘寶網(wǎng))。二是擁有數(shù)據(jù)分析與處理技術的專業(yè)公司,如亞馬遜、谷歌。三是擁有創(chuàng)新思維的公司,他們可能既不掌握大數(shù)據(jù),也沒有專業(yè)技術,但卻擅長使用大數(shù)據(jù),從大數(shù)據(jù)中找到自己的理想天地。