第一篇:大數(shù)據(jù)時代數(shù)據(jù)挖掘技術(shù)教學(xué)研究論文
摘要:隨著大數(shù)據(jù)時代的到來,在大數(shù)據(jù)觀念不斷提出的今天,加強數(shù)據(jù)大數(shù)據(jù)挖掘及時的應(yīng)用已成為大勢所趨。那么在大數(shù)據(jù)教學(xué)過程中,我們必須掌握大數(shù)據(jù)與數(shù)據(jù)挖掘的內(nèi)涵,并對數(shù)據(jù)挖掘技術(shù)進行分析,從而明確大數(shù)據(jù)時代下數(shù)據(jù)挖掘技術(shù)的應(yīng)用領(lǐng)域,促進各項數(shù)據(jù)的處理,提高大數(shù)據(jù)處理能力。
關(guān)鍵詞:大數(shù)據(jù)時代;數(shù)據(jù)挖掘技術(shù);應(yīng)用
大數(shù)據(jù)是對全球的數(shù)據(jù)量較大的一個概括,且每年的數(shù)據(jù)增長速度較快。而數(shù)據(jù)挖掘,主要是從多種模糊而又隨機、大量而又復(fù)雜且不規(guī)則的數(shù)據(jù)中,獲得有用的信息知識,從數(shù)據(jù)庫中抽絲剝繭、轉(zhuǎn)換分析,從而掌握其潛在價值與規(guī)律。所以大數(shù)據(jù)時代下的數(shù)據(jù)處理技術(shù)要求更高,要想確保數(shù)據(jù)處理成效得到提升,就必須切實加強數(shù)據(jù)挖掘技術(shù)教學(xué)工作的開展,才能更好地促進數(shù)據(jù)處理職能的轉(zhuǎn)變,提高數(shù)據(jù)處理效率,優(yōu)化學(xué)生的學(xué)習(xí)成效。以下就大數(shù)據(jù)時代下的數(shù)據(jù)挖掘技術(shù)教學(xué)做出如下分析。
1大數(shù)據(jù)時代下數(shù)據(jù)挖掘技術(shù)的基礎(chǔ)教學(xué)方法分析
數(shù)據(jù)挖掘的過程實際就是對數(shù)據(jù)進行分析和處理,所以其基礎(chǔ)就在于數(shù)據(jù)的分析方法。要想確保分析方法的科學(xué)性,就必須確保所采用算法的科學(xué)性和可靠性,獲取數(shù)據(jù)潛在規(guī)律,并采取多元化的分析方法促進問題的解決和優(yōu)化。以下就幾種常見的數(shù)據(jù)分析教學(xué)方法做出簡要的說明。一是歸類法,主要是將沒有指向和不確定且抽象的數(shù)據(jù)信息予以集中,并對集中后的數(shù)據(jù)實施分類整理和編輯處理,從而確保所形成的數(shù)據(jù)源具有特征一致、表現(xiàn)相同的特點,從而為加強對其的研究提供便利。所以這一分析方法能有效的滿足各種數(shù)據(jù)信息處理。二是關(guān)聯(lián)法,由于不同數(shù)據(jù)間存在的關(guān)聯(lián)性較為隱蔽,采取人力往往難以找出其信息特征,所以需要預(yù)先結(jié)合信息關(guān)聯(lián)的表現(xiàn),對數(shù)據(jù)關(guān)聯(lián)管理方案進行制定,從而完成基于某種目的的前提下對信息進行處理,所以其主要是在一些信息處理要求高和任務(wù)較為復(fù)雜的信息處理工作之中。三是特征法,由于數(shù)據(jù)資源的應(yīng)用范圍較廣,所以需要對其特征進行挖掘。也就是采用某一種技術(shù),將具有相同特征的數(shù)據(jù)進行集中。例如采用人工神經(jīng)網(wǎng)絡(luò)技術(shù)時,主要是對大批量復(fù)雜的數(shù)據(jù)分析,對非常復(fù)雜的模式進行抽取或者對其趨勢進行分析。而采取遺傳算法,則主要是對其他評估算法的適合度進行評估,并結(jié)合生物進化的原理,對信息數(shù)據(jù)的成長過程進行虛擬和假設(shè),從而組建出半虛擬、半真實的信息資源。再如可視化技術(shù)則是為數(shù)據(jù)挖掘提供輔助,采取多種方式對數(shù)據(jù)的挖掘進行指導(dǎo)和表達[1]。
2大數(shù)據(jù)時代數(shù)據(jù)挖掘技術(shù)教學(xué)要點的分析
2.1數(shù)據(jù)挖掘技術(shù)流程分析
在數(shù)據(jù)挖掘教學(xué)過程中,其流程主要是以下幾點:首先做好數(shù)據(jù)準(zhǔn)備工作,主要是在挖掘數(shù)據(jù)之前,就引導(dǎo)學(xué)生對目標(biāo)數(shù)據(jù)進行準(zhǔn)確的定位,在尋找和挖掘數(shù)據(jù)之前,必須知道所需數(shù)據(jù)類型,才能避免數(shù)據(jù)挖掘的盲目性。在數(shù)據(jù)準(zhǔn)備時,應(yīng)根據(jù)系統(tǒng)的提示進行操作,在數(shù)據(jù)庫中輸入檢索條件和目標(biāo),對數(shù)據(jù)信息資源進行分類和清理,以及編輯和預(yù)處理。其次是在數(shù)據(jù)挖掘過程中,由于目標(biāo)數(shù)據(jù)信息已經(jīng)被預(yù)處理,所以就需要在挖掘處理過程中將其高效正確的應(yīng)用到管理機制之中,因而數(shù)據(jù)挖掘的過程十分重要,所以必須加強對其的處理。例如在數(shù)據(jù)挖掘中,引導(dǎo)學(xué)生結(jié)合數(shù)據(jù)挖掘目標(biāo)要求,針對性的選取科學(xué)而又合適的計算和分析方法,對數(shù)據(jù)信息特征與應(yīng)用價值等進行尋找和歸納。當(dāng)然,也可以結(jié)合程序應(yīng)用的需要,對數(shù)據(jù)區(qū)域進行固定,并在固定的數(shù)據(jù)區(qū)域內(nèi)分類的挖掘數(shù)據(jù),從而得到更具深度和內(nèi)涵以及價值的數(shù)據(jù)信息資源,并就挖掘到的數(shù)據(jù)結(jié)果進行分析和解釋,從結(jié)果中將具有使用價值和意義的規(guī)律進行提取,并還原成便于理解的數(shù)據(jù)語言。最后是切實加強管理和計算等專業(yè)知識的應(yīng)用,將數(shù)據(jù)挖掘技術(shù)實施中進行的總結(jié)和提取所獲得的數(shù)據(jù)信息與評估結(jié)果在現(xiàn)實之中應(yīng)用,從而對某個思想、決策是否正確和科學(xué)進行判斷,最終體現(xiàn)出數(shù)據(jù)挖掘及時的應(yīng)用價值,在激發(fā)學(xué)生學(xué)習(xí)興趣的同時促進教學(xué)成效的提升。
2.2挖掘后的數(shù)據(jù)信息資源分析
數(shù)據(jù)信息資源在挖掘后,其自身的職能作用將變得更加豐富,所以在信息技術(shù)環(huán)節(jié)下的數(shù)據(jù)挖掘技術(shù)隨著限定條件的變化,而將數(shù)據(jù)挖掘信息應(yīng)用于技術(shù)管理和決策管理之中,從而更好地彰顯數(shù)據(jù)在經(jīng)濟活動中的物質(zhì)性質(zhì)與價值變化趨勢,并結(jié)合數(shù)據(jù)變化特點和具體的表現(xiàn)規(guī)律,從而將數(shù)據(jù)信息的基本要素、質(zhì)量特點、管理要求等展示出來,所以其表現(xiàn)的形式十分豐富。因而在數(shù)據(jù)挖掘之后的信息在職能范圍和表現(xiàn)形式方式均得到了豐富和拓展,而這也在一定程度上體現(xiàn)了網(wǎng)絡(luò)擬定目標(biāo)服務(wù)具有較強的完整性,且屬于特殊的個體物品,同時也是對傳統(tǒng)數(shù)據(jù)挖掘技術(shù)的創(chuàng)新和發(fā)展,從而更好地滿足當(dāng)前大數(shù)據(jù)時代對信息進行數(shù)據(jù)化的處理,并對不同種類業(yè)務(wù)進行整合和優(yōu)化,從而促進數(shù)據(jù)挖掘技術(shù)服務(wù)的一體化水平。
2.3大數(shù)據(jù)背景下的數(shù)據(jù)挖掘技術(shù)的應(yīng)用必須注重信息失真的控制
數(shù)據(jù)挖掘技術(shù)的信息主要是源于大數(shù)據(jù)和社會,所以在當(dāng)前數(shù)據(jù)挖掘技術(shù)需求不斷加大的今天,為了更好地促進所挖掘數(shù)據(jù)信息的真實性,促進其個性化職能的發(fā)揮,必須在大數(shù)據(jù)背景下注重信息失真的控制,切實做好數(shù)據(jù)挖掘技術(shù)管理的各項工作。這就需要引導(dǎo)學(xué)生考慮如何確保數(shù)據(jù)挖掘技術(shù)在大數(shù)據(jù)背景下的職能得到有效的發(fā)揮,盡可能地促進數(shù)據(jù)挖掘技術(shù)信息資源的升級和轉(zhuǎn)型,以大數(shù)據(jù)背景為載體,促進整個業(yè)務(wù)和技術(shù)操作流程的一體化,從而更好地將所有數(shù)據(jù)資源的消耗和變化以及管理的科學(xué)性和有效性,這樣我們就能及時的找到資源的消耗源頭,從而更好地對數(shù)據(jù)資源的消耗效益進行評價,最終促進業(yè)務(wù)流程的優(yōu)化,并結(jié)合大數(shù)據(jù)背景對數(shù)據(jù)挖掘技術(shù)的職能進行拓展,促進其外部信息與內(nèi)部信息的合作,對數(shù)據(jù)挖掘技術(shù)信息的職能進行有效的控制,才能更好地促進信息失真的控制[2]。
3數(shù)據(jù)挖掘技術(shù)在不同行業(yè)中的應(yīng)用實踐
學(xué)習(xí)的最終目的是為了更好的應(yīng)用,隨著時代的發(fā)展,數(shù)據(jù)挖掘技術(shù)將在越來越多的行業(yè)中得以應(yīng)用。這就需要高校教師引導(dǎo)學(xué)生結(jié)合實際需要強化對其的應(yīng)用。例如在市場營銷行業(yè)中數(shù)據(jù)挖掘技術(shù)的應(yīng)用這主要是因為數(shù)據(jù)挖掘能有效的解析消費者的消費行為和消費習(xí)慣,從而利用其將銷售方式改進和優(yōu)化,最終促進產(chǎn)品銷量的提升。與此同時,通過對購物消費行為的分析,掌握客戶的忠誠度和消費意識等,從而針對性的改變營銷策略,同時還能找到更多潛在的客戶。再如在制造業(yè)中數(shù)據(jù)挖掘技術(shù)的應(yīng)用,其目的就在于對產(chǎn)品質(zhì)量進行檢驗。引導(dǎo)學(xué)生深入某企業(yè)實際,對所制造產(chǎn)品的數(shù)據(jù)進行研究,從而找出其存在的規(guī)則,并對其生產(chǎn)流程進行分析之后,對其生產(chǎn)的過程進行分析,從而更好地對生產(chǎn)質(zhì)量的影響因素進行分析,并促進其效率的提升。換言之,主要就是對各種生產(chǎn)數(shù)據(jù)進行篩選,從而得出有用的數(shù)據(jù)和知識,再采取決策樹算法進行統(tǒng)計決策,并從中選取正確決策,從而更好地對產(chǎn)品在市場中的流行程度,決定生產(chǎn)和轉(zhuǎn)型的方向。再如在教育行業(yè)中數(shù)據(jù)挖掘技術(shù)的應(yīng)用,主要是為了更好地對學(xué)習(xí)情況、教學(xué)評估和心里動向等數(shù)據(jù)進行分類和篩選,從而為學(xué)校的教學(xué)改革提供參考和支持。比如為了更好地對教學(xué)質(zhì)量進行評估,就需要對教學(xué)質(zhì)量有關(guān)項目進行整合與存儲,從而更好地促進其對教學(xué)質(zhì)量的評估,而這一過程中,就需要采取數(shù)據(jù)挖掘技術(shù)對有關(guān)教學(xué)項目中的數(shù)據(jù)進行挖掘和處理,促進其應(yīng)用成效的提升[3]。
4結(jié)語
綜上所述,在大數(shù)據(jù)背景下,數(shù)據(jù)挖掘技術(shù)已經(jīng)在各行各業(yè)中得到了廣泛的應(yīng)用,所以為了更好地滿足應(yīng)用的需要,在實際教學(xué)工作中,我們必須引導(dǎo)學(xué)生切實加強對其特點的分析,并結(jié)合實際需要,切實注重數(shù)據(jù)挖掘技術(shù)的應(yīng)用,才能促進其應(yīng)用成效的提升,最終達到學(xué)以致用的目的。
參考文獻:
[1]李平榮.大數(shù)據(jù)時代的數(shù)據(jù)挖掘技術(shù)與應(yīng)用[J].重慶三峽學(xué)院學(xué)報,2014,03:45-47.[2]歐陽柏成.大數(shù)據(jù)時代的數(shù)據(jù)挖掘技術(shù)探究[J].電腦知識與技術(shù),2015,15:3-4+9.[3]孔志文.大數(shù)據(jù)時代的數(shù)據(jù)挖掘技術(shù)與應(yīng)用[J].電子技術(shù)與軟件工程,2015,23:195.
第二篇:大數(shù)據(jù)時代下數(shù)據(jù)挖掘技術(shù)的應(yīng)用
摘要:大數(shù)據(jù)時代是信息時代的一個重要特征,實際上,在大數(shù)據(jù)時代的背景下進行數(shù)據(jù)挖掘技術(shù)的探究與應(yīng)用其實就是通過在巨大的信息群中不斷挖掘出具有一定價值意義的信息進行整合,在此基礎(chǔ)上對已整合的信息進行進一步的處理,以提高信息數(shù)據(jù)的價值。本文以此為出發(fā)點,就大數(shù)據(jù)時代下數(shù)據(jù)挖掘技術(shù)的應(yīng)用進行深入探究。
關(guān)鍵詞:大數(shù)據(jù) 數(shù)據(jù)挖掘 挖掘技術(shù)
中圖分類號:tp311 文獻標(biāo)識碼:a 文章編號:1007-9416(2016)05-0000-00
1數(shù)據(jù)挖掘與數(shù)據(jù)挖掘技術(shù)的方法分析
“數(shù)據(jù)海量、信息缺乏”是相當(dāng)多企業(yè)在數(shù)據(jù)大集中之后面臨的尷尬問題,由此而誕生的數(shù)據(jù)挖掘技術(shù)其實就是用以處理這一尷尬問題的技術(shù)。數(shù)據(jù)挖掘?qū)嶋H上是相對比較新型的一門學(xué)科,在幾十年的發(fā)展過程中,已經(jīng)不可同日而語。其實數(shù)據(jù)挖掘技術(shù)的本質(zhì)就是人工智能技術(shù),而數(shù)據(jù)挖掘技術(shù)的利用相對應(yīng)的就是指人工智能技術(shù)的開發(fā)與應(yīng)用,也就是說數(shù)據(jù)挖掘其實是依賴技術(shù)的提升來實現(xiàn)數(shù)據(jù)的整體創(chuàng)新的技術(shù),所以,整個數(shù)據(jù)挖掘技術(shù)實際上是非常具有信息價值的,它能夠幫助決策者更快的得到重要信息并作出決策,提高效率和準(zhǔn)確率,是非常重要的知識憑證,能夠在一定程度上提高當(dāng)下企業(yè)的整體競爭力。
數(shù)據(jù)挖掘技術(shù)的核心就是分析,通過分析方法的不同來解決不同類別的問題,以實現(xiàn)數(shù)據(jù)挖掘的潛在內(nèi)容。簡單來說就是對癥下藥以保證藥到病除。
1.1聚類分析法
簡單來說聚類分析就是通過將數(shù)據(jù)對象進行聚類分組,然后形成板塊,將毫無邏輯的數(shù)據(jù)變成了有聯(lián)系性的分組數(shù)據(jù),然后從其中獲取具有一定價值的數(shù)據(jù)內(nèi)容進行進一步的利用。由于這種分析方法不能夠較好的就數(shù)據(jù)類別、屬性進行分類,所以聚類分析法一般都運用在心理學(xué)、統(tǒng)計學(xué)、數(shù)據(jù)識別等方面。
1.2人工神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)是通過大批量的數(shù)據(jù)進行分析,而這種數(shù)據(jù)分析方式本身是建立在一定的數(shù)據(jù)模型基礎(chǔ)上的,因此通常都可以隨時根據(jù)數(shù)據(jù)需求進行分類,所以人工神經(jīng)網(wǎng)絡(luò)也是當(dāng)下數(shù)據(jù)挖掘技術(shù)中最常用的一種數(shù)據(jù)分析方式之一。
1.3關(guān)聯(lián)性分析法
有時數(shù)據(jù)本身存在一定的隱蔽性使得很難通過普通的數(shù)據(jù)分析法進行數(shù)據(jù)挖掘和利用,這就需要通過關(guān)聯(lián)性分析法完成對于數(shù)據(jù)信息的關(guān)聯(lián)性識別,來幫助人力完成對于數(shù)據(jù)分辨的任務(wù),這種數(shù)據(jù)分析方法通常是帶著某種目的性進行的,因此比較適用于對數(shù)據(jù)精準(zhǔn)度相對較高的信息管理工作。
1.4特征性數(shù)據(jù)分析法
網(wǎng)絡(luò)數(shù)據(jù)隨著信息時代的到來變成了數(shù)據(jù)爆炸式,其數(shù)據(jù)資源十分廣泛并且得到了一定的普及,如何就網(wǎng)絡(luò)爆炸式數(shù)據(jù)進行關(guān)于特性的分類就成為了當(dāng)下數(shù)據(jù)整理分類的主要內(nèi)容。在上文中提到的人工神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)分析也屬于這其中的一種,此外還有很多方法都是通過計算機來進行虛擬數(shù)據(jù)的分類,尋找數(shù)據(jù)之間存在的普遍規(guī)律性完成數(shù)據(jù)的特性分析從而進行進一步分類。
2大數(shù)據(jù)時代下數(shù)據(jù)挖掘技術(shù)的具體應(yīng)用
數(shù)據(jù)挖掘技術(shù)的具體流程就是先通過對于海量數(shù)據(jù)的保存,然后就已有數(shù)據(jù)中進行分析、整理、選擇、轉(zhuǎn)換等,數(shù)據(jù)的準(zhǔn)備工作是數(shù)據(jù)挖掘技術(shù)的前提,也是決定數(shù)據(jù)挖掘技術(shù)效率及質(zhì)量的主要因素。在完成數(shù)據(jù)準(zhǔn)備工作后進一步對數(shù)據(jù)進行挖掘,然后對數(shù)據(jù)進行評估,最后實現(xiàn)運用。因此,數(shù)據(jù)挖掘能夠運用到很多方面。
2.1市場營銷領(lǐng)域
市場營銷其實就是數(shù)據(jù)挖掘技術(shù)最早運用的領(lǐng)域,通常根據(jù)客戶的具體需求,進行客戶分析,將不同的消費習(xí)慣和消費特點的客戶進行簡單的分類管理,以此來保證商品能夠順利銷售,并提高個人銷售的成功率和業(yè)績。而銷售的范圍也從最初的超市購物擴展到了包括保險、銀行、電信等各個方面。
2.2科學(xué)研究領(lǐng)域
科學(xué)研究與實驗測試等都需要對數(shù)據(jù)進行關(guān)系分析為進一步的實驗和總結(jié)失敗做準(zhǔn)備,而實驗測試和科學(xué)研究產(chǎn)生的數(shù)據(jù)往往是巨大的,因此數(shù)據(jù)挖掘技術(shù)在科學(xué)研究領(lǐng)域也得以廣泛運用。通常都是通過科學(xué)研究內(nèi)容選擇數(shù)據(jù)挖掘技術(shù)分析法進行計算來找到數(shù)據(jù)中存在的規(guī)律,實現(xiàn)數(shù)據(jù)挖掘的部分價值――科學(xué)知識的分析與運用。
2.3電信業(yè)領(lǐng)域
隨著信息化時代的到來,電信產(chǎn)業(yè)也飛速發(fā)展起來,到目前為止,電信產(chǎn)業(yè)已經(jīng)形成了一個巨大的網(wǎng)絡(luò)信息載體,如何將其中信息數(shù)據(jù)進行整合就成為電信產(chǎn)業(yè)發(fā)展過程中的重要問題。而數(shù)據(jù)挖掘技術(shù)的運用則在一定程度上解決了這一問題,大量的數(shù)據(jù)通過數(shù)據(jù)挖掘技術(shù)得到了有效分類,并在這個過程中通過運算得出數(shù)據(jù)之間的關(guān)聯(lián)性,運用規(guī)律進一步進行數(shù)據(jù)分類。
2.4教育教學(xué)領(lǐng)域
教學(xué)評價、教學(xué)資源、學(xué)生個人基本信息等組成了教育教學(xué)領(lǐng)域的數(shù)據(jù)庫,利用數(shù)據(jù)挖掘技術(shù)來實現(xiàn)教學(xué)資源的優(yōu)化配置,對學(xué)生的個人信息整理歸檔,從而保證教育教學(xué)領(lǐng)域中數(shù)據(jù)整理的良好運作。
3結(jié)語
綜上所述,數(shù)據(jù)挖掘技術(shù)對于當(dāng)今社會的發(fā)展有著不可替代的作用,而如何改善當(dāng)下數(shù)據(jù)挖掘技術(shù)中存在的問題,進一步提高數(shù)據(jù)挖掘技術(shù)的質(zhì)量和效率就成為了數(shù)據(jù)挖掘技術(shù)進步的方向。本文通過對于數(shù)據(jù)挖掘與數(shù)據(jù)挖掘技術(shù)的方法分析和大數(shù)據(jù)時代下數(shù)據(jù)挖掘技術(shù)的具體應(yīng)用兩個方面對于數(shù)據(jù)挖掘技術(shù)進行了簡要的闡述和分析,相信在未來伴隨著科學(xué)技術(shù)的進一步發(fā)展,數(shù)據(jù)挖掘技術(shù)也將更加強大。
第三篇:大數(shù)據(jù)時代下數(shù)據(jù)挖掘技術(shù)與應(yīng)用
大數(shù)據(jù)時代下數(shù)據(jù)挖掘技術(shù)與應(yīng)用
【摘要】人類進入信息化時代以后,短短的數(shù)年時間,積累了大量的數(shù)據(jù),步入了大數(shù)據(jù)時代,數(shù)據(jù)技術(shù)也就應(yīng)運而生,成為了一種新的主流技術(shù)。而研究數(shù)據(jù)挖掘技術(shù)的理念、方法以及應(yīng)用領(lǐng)域,將對我國各個領(lǐng)域的未來帶來更多的機遇和挑戰(zhàn)。本文就大數(shù)據(jù)時代下數(shù)據(jù)挖掘技術(shù)與應(yīng)用進行探究。
【關(guān)鍵詞】大數(shù)據(jù),數(shù)據(jù)挖掘,互聯(lián)網(wǎng)
數(shù)據(jù)挖掘是一門新興的學(xué)科,它誕生于20世紀(jì)80年代,主要面向商業(yè)應(yīng)用的人工只能研究領(lǐng)域。從技術(shù)角度來看,數(shù)據(jù)挖掘就是從大量的復(fù)雜的、不規(guī)則的、隨機的、模糊的數(shù)據(jù)中獲取隱含的、人們事先沒有發(fā)覺的、有潛在價值和知識的過程。從商業(yè)角度來說,數(shù)據(jù)挖掘就是從龐大的數(shù)據(jù)庫中抽取、轉(zhuǎn)換、分析一些潛在規(guī)律和價值,從中獲取輔助商業(yè)決策的關(guān)鍵信息和有用知識。
1.數(shù)據(jù)挖掘的基本分析方法
分析方法是數(shù)據(jù)挖掘的核心工作,通過科學(xué)可靠的算法才能實現(xiàn)數(shù)據(jù)的挖掘,找出數(shù)據(jù)中潛在的規(guī)律,通過不同的分析方法,將解決不同類型的問題。目前常用的方法有聚類分析、特征數(shù)據(jù)分析法、關(guān)聯(lián)性分析等。
1.1聚類分析法。簡單來說聚類分析就是通過將數(shù)據(jù)對象進行聚類分組,然后形成板塊,將毫無邏輯的數(shù)據(jù)變成了有聯(lián)系性的分組數(shù)據(jù),然后從其中獲取具有一定價值的數(shù)據(jù)內(nèi)容進行進一步的利用。由于這種分析方法不能夠較好的就數(shù)據(jù)類別、屬性進行分類,所以聚類分析法一般都運用心理學(xué)、統(tǒng)計學(xué)、數(shù)據(jù)識別等方面。
1.2特征性數(shù)據(jù)分析法。網(wǎng)絡(luò)數(shù)據(jù)隨著信息時代的到來變成了數(shù)據(jù)爆炸式,其數(shù)據(jù)資源十分廣泛并且得到了一定的普及,如何就網(wǎng)絡(luò)爆炸式數(shù)據(jù)進行關(guān)于特性的分類就成為了當(dāng)下數(shù)據(jù)整理分類的主要內(nèi)容。此外還有很多方法都是通過計算機來進行虛擬數(shù)據(jù)的分類,尋找數(shù)據(jù)之間存在的普遍規(guī)律性完成數(shù)據(jù)的特性分析從而進行進一步分類。
1.3關(guān)聯(lián)性分析法。有時數(shù)據(jù)本身存在一定的隱蔽性使得很難通過普通的數(shù)據(jù)分析法進行數(shù)據(jù)挖掘和利用,這就需要通過關(guān)聯(lián)性分析法完成對于數(shù)據(jù)信息的關(guān)聯(lián)性識別,來幫助人力完成對于數(shù)據(jù)分辨的任務(wù),這種數(shù)據(jù)分析方法通常是帶著某種目的性進行的,因此比較適用于對數(shù)據(jù)精準(zhǔn)度相對較高的信息管理工作。
2.數(shù)據(jù)挖掘技術(shù)的應(yīng)用
數(shù)據(jù)挖掘技術(shù)的具體流程就是先通過對于海量數(shù)據(jù)的保存,然后就已有數(shù)據(jù)中進行分析、整理、選擇、轉(zhuǎn)換等,數(shù)據(jù)的準(zhǔn)備工作是數(shù)據(jù)挖掘技術(shù)的前提,也是決定數(shù)據(jù)挖掘技術(shù)效率及質(zhì)量的主要因素。在完成數(shù)據(jù)準(zhǔn)備工作后進一步對數(shù)據(jù)進行挖掘,然后對數(shù)據(jù)進行評估,最后實現(xiàn)運用。因此,數(shù)據(jù)挖掘能夠運用到很多方面。如數(shù)據(jù)量巨大的互聯(lián)網(wǎng)行業(yè)、天文學(xué)、氣象學(xué)、生物技術(shù),以及醫(yī)療保健、教育教學(xué)、銀行、金融、零售等行業(yè)。通過數(shù)據(jù)挖掘技術(shù)將大數(shù)據(jù)融合在各種社會應(yīng)用中,數(shù)據(jù)挖掘的結(jié)果參與到政府、企業(yè)、個人的決策中,發(fā)揮數(shù)據(jù)挖掘的社會價值,改變?nèi)藗兊纳罘绞?,最大化?shù)據(jù)挖掘的積極作用。以教育行業(yè)為例,探究數(shù)據(jù)挖掘技術(shù)在高校教育教學(xué)活動中的應(yīng)用。
2.1在高校管理中的應(yīng)用。數(shù)據(jù)挖掘技術(shù)在高校管理的內(nèi)容主要包括:高校招生錄取工作、貧困生選定以及優(yōu)秀生評定等。高校每年的招生工作是學(xué)??沙掷m(xù)發(fā)展的重要環(huán)節(jié),直接影響到高校教學(xué)質(zhì)量以及發(fā)展情況。比如數(shù)據(jù)挖掘技術(shù)在高校管理中的應(yīng)用主要是對學(xué)生高考成績、志愿填報、以及生源來源地等多方面信息進行整理分類匯總。具體步驟是通過進行數(shù)據(jù)的收集和預(yù)處理,建立相關(guān)數(shù)據(jù)模型,采用分類算法,提取和挖掘?qū)τ脩粲杏玫男畔?,然后進行數(shù)據(jù)挖掘的數(shù)據(jù)存儲形式。目前高校數(shù)據(jù)挖掘技術(shù)應(yīng)用的范圍比較廣泛,由于高校管理內(nèi)容比較復(fù)雜,因此在其管理內(nèi)容的每個小部分也開始利用數(shù)據(jù)挖掘技術(shù)進行管理,比如學(xué)生成績管理,課堂教學(xué)評價系統(tǒng)等。
2.2在高校課堂教學(xué)評價中的應(yīng)用。數(shù)據(jù)挖掘技術(shù)在高校課堂教學(xué)評價系統(tǒng)中的應(yīng)用主要也是利用關(guān)聯(lián)分析法。首先先對數(shù)據(jù)進行預(yù)處理工作,數(shù)據(jù)的預(yù)處理是數(shù)據(jù)挖掘技術(shù)的關(guān)鍵步驟,并且直接影響著數(shù)據(jù)挖掘技術(shù)的應(yīng)用效率。數(shù)據(jù)預(yù)處中要將教師的基本信息、教師教授課程以及教師的職稱、學(xué)歷、學(xué)生信息以及學(xué)生課表相關(guān)信息進行數(shù)據(jù)初始記錄。對于教師的評價內(nèi)容根據(jù)高校自身的條件和需求而定,學(xué)校教學(xué)評價管理部門登錄學(xué)校教務(wù)系統(tǒng)后,將學(xué)生所選擇的選項對應(yīng)轉(zhuǎn)換為教師的分值,通過計算機計算總分后得出教師的學(xué)期得分。學(xué)生對于教師教學(xué)的評價在一定程度上也反映了自己的學(xué)習(xí)情況,如對教師的評價為零分,則說明學(xué)生也否定了自己的學(xué)習(xí)效果。2.3在高校學(xué)生信息管理系統(tǒng)中的應(yīng)用。高校學(xué)生信息管理系統(tǒng)中管理要素主要是學(xué)校的領(lǐng)導(dǎo)、任課教師、學(xué)生以及家長。系統(tǒng)的功能要包括:對不同的用戶設(shè)置不同的使用權(quán)限;對學(xué)生的基本信息以及學(xué)生瀏覽管理網(wǎng)站的記錄要做到明確記錄;各個學(xué)院不同專業(yè)的學(xué)生課程要能準(zhǔn)確公布并允許學(xué)生根據(jù)實際情況修改;成績管理要能實現(xiàn)大批量添加及修改;還有比如評優(yōu)活動、黨務(wù)管理等具體功能。數(shù)據(jù)挖掘技術(shù)在高校學(xué)生信息管理系統(tǒng)中的應(yīng)用主要是利用決策樹的方法。學(xué)生信息管理的基本數(shù)據(jù)就是學(xué)生入學(xué)時填寫的基本信息表,內(nèi)容包括學(xué)生的姓名、學(xué)號、考勤以及學(xué)習(xí)成績等,這些都是學(xué)生特有的屬性,學(xué)生信息管理利用決策樹方法就是將學(xué)生的這些屬性作為決策元素,監(jiān)理不同的決策節(jié)點,實現(xiàn)對學(xué)生全方位的考核和評價,完整的了解到每位學(xué)生的具體信息。
2.4高校圖書館信息系統(tǒng)中的應(yīng)用。數(shù)據(jù)挖掘技術(shù)最基本的應(yīng)用就是通過對現(xiàn)有的數(shù)據(jù)進行分析來了解學(xué)校圖書館現(xiàn)有資源利用情況,為圖書館的未來建設(shè)提供可靠數(shù)據(jù)。數(shù)據(jù)挖掘技術(shù)能夠使圖書館資源得到極大程度的優(yōu)化整合。比如數(shù)據(jù)挖掘技術(shù)可以對檢索記錄進行整理,將手工數(shù)據(jù)轉(zhuǎn)變?yōu)殡娮訑?shù)據(jù)記錄。其最大的優(yōu)勢就是利用數(shù)據(jù)挖掘技術(shù)更加全面的分析總結(jié)數(shù)據(jù)庫資源,幫助圖書館管理人員對于圖書館信息的補充和調(diào)整,還能夠為高校圖書館的館藏工作建設(shè)提供有效的引導(dǎo)。數(shù)據(jù)挖掘還能應(yīng)用于圖書館的多媒體數(shù)字資源,多媒體數(shù)據(jù)挖掘技術(shù)能夠更為快捷和準(zhǔn)確的為讀者提供相應(yīng)的服務(wù)。
3.結(jié)語
數(shù)據(jù)挖掘技術(shù)是近幾年新產(chǎn)生的網(wǎng)絡(luò)技術(shù),可是它的廣泛應(yīng)用性受到了很多公司以及研究人員的喜愛。這些年來,伴隨著時間的推移以及網(wǎng)絡(luò)技術(shù)的不斷發(fā)展大數(shù)據(jù)挖掘技術(shù)不斷的被更新,開發(fā),而且在金融、管理、教學(xué)等行業(yè)中都得到了廣泛的應(yīng)用。我相信隨著網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,大數(shù)據(jù)挖掘技術(shù)的應(yīng)用面將會越來越廣。
【參考文獻】
[1] 董彩云,曲守寧.數(shù)據(jù)挖掘及其在高校教學(xué)系統(tǒng)中的應(yīng)用 [J].濟南大學(xué)學(xué)報(自然科學(xué)版),2004(1): 65-68.[2] 陸川,王靜靜.數(shù)據(jù)挖掘技術(shù)在高校教學(xué)管理中的應(yīng)用研究[J].北京:電腦開發(fā)與應(yīng)用,2009,3.[3]《中國電子科學(xué)研究院學(xué)報》編輯部.大數(shù)據(jù)時代[J].中國電子科技研究院學(xué)報,2013(01):41-43.[4]魏娟,梁靜國.基于數(shù)據(jù)挖掘技術(shù)的企業(yè)客戶關(guān)系管理(CRM)[J].商業(yè)研究,2005(07).
第四篇:大數(shù)據(jù)時代
大數(shù)據(jù)時代
近年來,隨著互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)、智能手機及傳感器等的普及,信息流量有了爆發(fā)性的增長,兩會以后,互聯(lián)網(wǎng)里最熱的詞匯,就是李克強總理在政府工作在報告里面提到的“互聯(lián)網(wǎng)+”,大數(shù)據(jù)將會更廣泛的被運用到各個領(lǐng)域,越來越多的業(yè)內(nèi)人士開始談?wù)摗按髷?shù)據(jù)”,如何利用大數(shù)據(jù),成為政府和眾多企業(yè)關(guān)心的熱點?
互聯(lián)網(wǎng)+《大數(shù)據(jù)》緊緊圍繞這些問題展開,幫您如何利用大數(shù)據(jù)為企業(yè)從戰(zhàn)略上面進行指導(dǎo)挖掘和預(yù)測,從戰(zhàn)術(shù)上進行營銷服務(wù)和安全措施,精彩我們共同期待。
第一篇大數(shù)據(jù)很熱,大數(shù)據(jù)不神秘(趨勢)有人說,如果你不知道大數(shù)據(jù),你就OUT了 --大數(shù)據(jù)到底有多熱 什么樣的數(shù)據(jù)算是大數(shù)據(jù) --大數(shù)據(jù)的特點和概念辨析 亂我心者,大數(shù)據(jù)之事多煩憂 --大數(shù)據(jù)并不象你想象的那樣神秘 身邊的大數(shù)據(jù)
--大數(shù)據(jù)就在你我身邊
案例分析:淘寶是如何利用大數(shù)據(jù)淘寶的 小結(jié):不管你愿不愿意,大數(shù)據(jù)已經(jīng)在那里 電話:010---59002742 010--59004371 第二篇:認(rèn)識大數(shù)據(jù) 1.什么是大數(shù)據(jù) 2.大數(shù)據(jù)應(yīng)用的意義
3.大數(shù)據(jù)在企業(yè)經(jīng)營中應(yīng)用的意義 4.對大數(shù)據(jù)的認(rèn)識誤區(qū) 案例分析
第三篇:大數(shù)據(jù)時代變革 1:大數(shù)據(jù)時代的思維變革 2:大數(shù)據(jù)時代的商業(yè)變革 3:大數(shù)據(jù)時代的管理變革
第四篇:大數(shù)據(jù)在營銷中的運用 大數(shù)據(jù)精準(zhǔn)營銷 1.什么是精確營銷 2.精確營銷的方法 實操教學(xué)+案例分析
第五篇:在技術(shù)中應(yīng)用 數(shù)據(jù)挖掘
大數(shù)據(jù)的核心價值——挖掘 1.什么是數(shù)據(jù)挖掘? 2.數(shù)據(jù)挖掘的流程 3.數(shù)據(jù)挖掘解決的問題 結(jié)合現(xiàn)場實操教學(xué)+案例分析
第六篇:預(yù)測
大數(shù)據(jù)的核心價值——預(yù)測 1:如何預(yù)測? 案例分析
第七篇:大數(shù)據(jù)與云計算 1:什么是云計算
2:大數(shù)據(jù)與云計算的關(guān)系
第八篇:大數(shù)據(jù)的安全問題
大數(shù)據(jù)給信息安全帶來新的挑戰(zhàn)和機遇 大數(shù)據(jù)存儲安全策略 大數(shù)據(jù)應(yīng)用安全策略 大數(shù)據(jù)管理安全策略
第五篇:大數(shù)據(jù)時代
“大”數(shù)據(jù)時代 眾所周知,數(shù)據(jù)本身就蘊藏著價值,但是將有用的數(shù)據(jù)與沒有價值的數(shù)據(jù)進行區(qū)分看起來可能是一個棘手的問題。
顯然,您所掌握的人員情況、工資表和客戶記錄對于企業(yè)的運轉(zhuǎn)至關(guān)重要,但是其他數(shù)據(jù)也擁有轉(zhuǎn)化為價值的力量。一段記錄人們?nèi)绾卧谀纳痰隇g覽購物的視頻、人們在購買您的服務(wù)前后的所作所為、如何通過社交網(wǎng)絡(luò)聯(lián)系您的客戶、是什么吸引合作伙伴加盟、客戶如何付款以及供應(yīng)商喜歡的收款方式……所有這些場景都提供了很多指向,將它們抽絲剝繭,透過特殊的棱鏡觀察,將其與其他數(shù)據(jù)集對照,或者以與眾不同的方式分析解剖,就能讓您的行事方式發(fā)生天翻地覆的轉(zhuǎn)變。
大數(shù)據(jù)(big data),或稱巨量資料,指的是所涉及的資料量規(guī)模巨大到無法通過目前主流軟件工具,在合理時間內(nèi)達到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營決策更積極目的的資訊。
“大數(shù)據(jù)”這個術(shù)語最早期的引用可追溯到apache org的開源項目Nutch。當(dāng)時,大數(shù)據(jù)用來描述為更新網(wǎng)絡(luò)搜索索引需要同時進行批量處理或分析的大量數(shù)據(jù)集。隨著谷歌MapReduce和Google File System(GFS)的發(fā)布,大數(shù)據(jù)不再僅用來描述大量的數(shù)據(jù),還涵蓋了處理數(shù)據(jù)的速度。
早在1980年,著名未來學(xué)家阿爾文·托夫勒便在《第三次浪潮》一書中,將大數(shù)據(jù)熱情地贊頌為“第三次浪 潮的華彩樂章”。不過,大約從2009年開始,“163大數(shù)據(jù)”才成為互聯(lián)網(wǎng)信息技術(shù)行業(yè)的流行詞匯。美國互聯(lián)網(wǎng)數(shù)據(jù)中心指出,互聯(lián)網(wǎng)上的數(shù)據(jù)每年將增長50%,每兩年便將翻一番,而目前世界上90%以上的數(shù)據(jù)是最近幾年才產(chǎn)生的。此外,數(shù)據(jù)又并非單純指人們在互聯(lián)網(wǎng)上發(fā)布的信息,全世界的工業(yè)設(shè)備、汽車、電表上有著無數(shù)的數(shù)碼傳感器,隨時測量和傳遞著有關(guān)位置、運動、震動、溫度、濕度乃至空氣中化學(xué)物質(zhì)的變化,也產(chǎn)生了海量的數(shù)據(jù)信息。
大數(shù)據(jù)技術(shù)的戰(zhàn)略意義不在于掌握龐大的數(shù)據(jù)信息,而在于對這些含有意義的數(shù)據(jù)進行專業(yè)化處理。換言之,如果把大數(shù)據(jù)比作一種產(chǎn)業(yè),那么這種產(chǎn)業(yè)實現(xiàn)盈利的關(guān)鍵,在于提高對數(shù)據(jù)的“加工能力”,通過“加工”實現(xiàn)數(shù)據(jù)的“增值”。
大數(shù)據(jù)就是互聯(lián)網(wǎng)發(fā)展到現(xiàn)今階段的一種表象或特征而已,沒有必要神話它或?qū)λ3志次分?,在以云計算為代表的技術(shù)創(chuàng)新大幕的襯托下,這些原本很難收集和使用的數(shù)據(jù)開始容易被利用起來了,通過各行各業(yè)的不斷創(chuàng)新,大數(shù)據(jù)會逐步為人類創(chuàng)造更多的價值。