第一篇:PDA在城市交通基礎(chǔ)設(shè)施數(shù)據(jù)采集中的應(yīng)用研究
PDA在城市交通基礎(chǔ)設(shè)施
數(shù)據(jù)采集中的應(yīng)用研究
王國英 陳 長 崔 鵬 孫立軍
(同濟大學 上海200092)
摘 要 針對城市交通基礎(chǔ)設(shè)施數(shù)據(jù)采集中的瓶頸問題,對個人數(shù)字助理(personal digital assistant,PDA)在交通基礎(chǔ)設(shè)施數(shù)據(jù)采集中的應(yīng)用進行研究,從數(shù)據(jù)結(jié)構(gòu)和軟件結(jié)構(gòu)兩方面進行
分析,介紹基于PDA的數(shù)據(jù)采集系統(tǒng)軟件的開發(fā)和應(yīng)用,該系統(tǒng)已在我國各大城市的城市交通基
礎(chǔ)設(shè)施的數(shù)據(jù)采集中得到應(yīng)用。
關(guān)鍵詞 PDA;城市交通基礎(chǔ)設(shè)施管理系統(tǒng);數(shù)據(jù)結(jié)構(gòu);軟件結(jié)構(gòu);軟件開發(fā)
中圖法分類號:U491.2文獻標識碼:B
收稿日期:2006-06-1
2個人數(shù)字助理(personal digital assistant,PDA)是一種數(shù)據(jù)采集的理想載體。它功能強大,幾乎具有普通臺式計算機的全部功能;小巧輕便,可供使用者隨身攜帶,可方便用戶進行二次開發(fā)。
自20世紀90年代PDA問世以來,美國就對
PDA在道路和橋梁數(shù)據(jù)采集方面的應(yīng)用展開了
研究[1],但至今還沒有成熟的產(chǎn)品問世。我國對
PDA的認識和了解稍晚一些,由于漢化問題難以
解決,至今還沒有成功地將PDA應(yīng)用于采集城
市交通基礎(chǔ)設(shè)施數(shù)據(jù)。針對城市交通基礎(chǔ)設(shè)施的特點,筆者對PDA在城市交通數(shù)據(jù)采集中的應(yīng)
用進行研究,重點對PDA數(shù)據(jù)采集系統(tǒng)的體系
結(jié)構(gòu)進行設(shè)計,并對其軟件開發(fā)中的幾個問題進
行闡述。
1PDA數(shù)據(jù)采集系統(tǒng)體系結(jié)構(gòu)
1.1 城市交通基礎(chǔ)設(shè)施管理系統(tǒng)(CTIMS)數(shù)據(jù)
結(jié)構(gòu)[2]
城市交通基礎(chǔ)設(shè)施管理系統(tǒng)(CTIMS)是一
個基于地理信息系統(tǒng)(GIS)的管理系統(tǒng),系統(tǒng)分
為空間數(shù)據(jù)模塊和屬性數(shù)據(jù)模塊,其中空間數(shù)據(jù)
模塊主要處理地理信息系統(tǒng)(GIS)中用到的地圖
及其相關(guān)的地理位置信息,屬性數(shù)據(jù)模塊主要處
理靜態(tài)信息,即交通設(shè)施的外觀形狀尺寸、結(jié)構(gòu)組
成、修建維護資料等。從軟件結(jié)構(gòu)方面看,對
CTIMS的數(shù)據(jù)管理分為圖層管理和信息管理,其
中圖層管理對空間數(shù)據(jù)進行操作,而信息管理則
對空間和屬性數(shù)據(jù)同時進行操作,實現(xiàn)空間數(shù)據(jù)
和屬性數(shù)據(jù)的完美結(jié)合。
1.2 PDA數(shù)據(jù)采集系統(tǒng)數(shù)據(jù)結(jié)構(gòu)
PDA數(shù)據(jù)采集系統(tǒng)涉及的信息包括交通基
礎(chǔ)設(shè)施的靜態(tài)信息和動態(tài)信息,其中,靜態(tài)信息來
源于CTIMS的屬性數(shù)據(jù)模塊,動態(tài)信息經(jīng)現(xiàn)場
采集得到。由于不同的城市交通基礎(chǔ)設(shè)施類型結(jié)
構(gòu)差異很大,因此,數(shù)據(jù)結(jié)構(gòu)研究的重點是針對不
同的基礎(chǔ)設(shè)施類型確定靜、動態(tài)數(shù)據(jù)的組成,并合理組織靜、動態(tài)數(shù)據(jù)的傳輸流程。
1.2.1 數(shù)據(jù)組成城市交通基礎(chǔ)設(shè)施種類繁多,筆者以數(shù)量較
大的3種設(shè)施:道路、橋梁和高架的靜、動態(tài)數(shù)據(jù)
組成為例進行闡述。
并不是CTIMS中所有的靜態(tài)信息都需要進
行現(xiàn)場采集,只有少量的、必要的靜態(tài)數(shù)據(jù)需要在現(xiàn)場進行校核或確認。為使這些靜態(tài)信息能充分
滿足數(shù)據(jù)通信和管理的需要,確定道路的靜態(tài)信
息為路名、起終點、路面類型、長寬和面積等;橋梁的靜態(tài)信息為橋梁名稱、所在路名、跨徑、總跨數(shù)、材料型式、梁結(jié)構(gòu)型式和梁數(shù)等7項;高架道路的靜態(tài)信息為高架名稱、起點墩臺號、終點墩臺號、材料型式、梁結(jié)構(gòu)型式和梁數(shù)等6項。
動態(tài)數(shù)據(jù)主要指城市交通基礎(chǔ)設(shè)施的損壞狀
況數(shù)據(jù),也是數(shù)據(jù)采集的重點。同時,由于數(shù)據(jù)采
集是為了設(shè)施技術(shù)狀況評價服務(wù)的,采集的動態(tài)
數(shù)據(jù)要滿足評價模型的需要,在這一指導原則下,道路的動態(tài)數(shù)據(jù)確定為路面的各項損壞狀況的定
量描述,如瀝青路面橫向裂縫的長度、密度等;橋
梁和高架橋的評價采用的是一種基于構(gòu)件的評價
方法[3-4]:即在進行數(shù)據(jù)采集時,先將橋梁和高架
橋按由全橋到各部位再到每個構(gòu)件進行逐層分
解,分別采集每個構(gòu)件的損壞狀況,而在評價分析
51PDA在城市交通基礎(chǔ)設(shè)施數(shù)據(jù)采集中的應(yīng)用研究——王國英 陳 長 崔 鵬 孫立軍時,又將橋梁和高架橋按由構(gòu)件到部位再到全橋
逐層進行綜合評價,直至得到全橋的評價結(jié)果,因
此確定橋梁和高架橋的動態(tài)數(shù)據(jù)為每個構(gòu)件的損
壞狀況的定量描述,如橋梁橋面鋪裝中損壞類型
為橋面積水的損壞嚴重程度。
隨著PDA硬件技術(shù)的不斷發(fā)展,為了實現(xiàn)
信息內(nèi)容和格式的完整性及多樣性,除了采用文
字形式的信息外,還可利用攝像頭采集圖像信息,利用GPS地理定位系統(tǒng)采集設(shè)施的地理位置信
息,這樣便可全方位、多角度地描述設(shè)施現(xiàn)行狀
況。
PDA數(shù)據(jù)采集系統(tǒng)的數(shù)據(jù)組成如表1所列。
表1 PDA數(shù)據(jù)采集系統(tǒng)的數(shù)據(jù)組成設(shè)施類型靜態(tài)信息動態(tài)信息
設(shè)施名稱
相對位置、構(gòu)件名
稱、結(jié)構(gòu)類型、材料
型式等
損壞類型、損壞
密度、損壞圖片、地理信息等
1.2.2 數(shù)據(jù)組織
PDA數(shù)據(jù)采集系統(tǒng)的數(shù)據(jù)組織主要處理兩
個方面問題:①PDA數(shù)據(jù)采集系統(tǒng)內(nèi)部數(shù)據(jù)的合理組織;②PDA與外部CTIMS之間的數(shù)據(jù)交換。
1)內(nèi)部數(shù)據(jù)組織。PDA數(shù)據(jù)采集系統(tǒng)內(nèi)部
數(shù)據(jù)組織的一個基本原則是先靜態(tài)后動態(tài),即首
先進行靜態(tài)數(shù)據(jù)的補充采集或二次確認。因為
PDA數(shù)據(jù)采集系統(tǒng)中所包含的靜態(tài)數(shù)據(jù)項是從
CTIMS獲得的,由于CTIMS中靜態(tài)數(shù)據(jù)的不完
備或不準確,就需要在PDA數(shù)據(jù)采集系統(tǒng)中補
充采集不完備的靜態(tài)數(shù)據(jù)或通過二次確認保證已
有靜態(tài)數(shù)據(jù)的準確性,為后續(xù)動態(tài)數(shù)據(jù)的采集做
好準備。
2)外部數(shù)據(jù)交換。PDA數(shù)據(jù)采集系統(tǒng)與
CTIMS之間的數(shù)據(jù)傳輸流程如圖1所示。
圖1PDA與CTIMS數(shù)據(jù)傳輸流程
PDA與外部系統(tǒng)的數(shù)據(jù)交換可通過PDA與
PC之間的數(shù)據(jù)接口實現(xiàn),PDA數(shù)據(jù)接口的功能
主要通過同步軟件實現(xiàn):將PDA與PC物理連接
后,通過分別安裝于PDA和PC上同步軟件即可
實現(xiàn)PDA與PC的同步通信;由于數(shù)據(jù)在這兩種
硬件載體上的存儲格式不一致,利用同步軟件中的數(shù)據(jù)格式轉(zhuǎn)換功能就可在數(shù)據(jù)傳輸?shù)耐瑫r實現(xiàn)
數(shù)據(jù)格式的轉(zhuǎn)換。
1.3 PDA數(shù)據(jù)采集系統(tǒng)軟件結(jié)構(gòu)
PDA數(shù)據(jù)采集系統(tǒng)軟件分為靜態(tài)數(shù)據(jù)導入、數(shù)據(jù)采集、靜態(tài)和動態(tài)數(shù)據(jù)導出等功能模塊。另
外,在線幫助模塊可在數(shù)據(jù)采集過程中幫助數(shù)據(jù)
采集人員甄別各類城市交通基礎(chǔ)設(shè)施的現(xiàn)行狀
況。PDA數(shù)據(jù)采集系統(tǒng)的軟件結(jié)構(gòu)如圖2所示。
圖2PDA數(shù)據(jù)采集系統(tǒng)軟件結(jié)構(gòu)圖軟件開發(fā)及應(yīng)用
2.1 軟硬件選擇
PC機操作系統(tǒng)為Microsoft Windows 2000,開發(fā)軟件為Microsoft eMbedded Visual Basic和
Pocket PC仿真器[5]。PDA操作系統(tǒng)為Windows
CE系列的Pocket PC 2002或Pocket PC 2003,采用的數(shù)據(jù)庫軟件為可與PC上的Microsoft Ac-
cess文件相互轉(zhuǎn)換的Pocket Access。圖像數(shù)據(jù)采
集工具為外置的130萬像素攝像頭,地理信息數(shù)
據(jù)采集利用帶藍牙功能的GPS。
2.2 數(shù)據(jù)庫的建立
Pocket Access無法直接在PC上進行編輯,首先采用PC上的Microsoft Access建立數(shù)據(jù)庫,然后再通過同步軟件轉(zhuǎn)換給PDA使用。
PDA數(shù)據(jù)采集系統(tǒng)的數(shù)據(jù)來源于CTIMS,又將采集的數(shù)據(jù)導回到CTIMS,故其數(shù)據(jù)庫的結(jié)
構(gòu)與CTIMS的數(shù)據(jù)庫結(jié)構(gòu)應(yīng)保持一致,以道路
PDA數(shù)據(jù)采集系統(tǒng)的數(shù)據(jù)庫為例,表
2、表3分別
為靜態(tài)數(shù)據(jù)庫和動態(tài)數(shù)據(jù)庫的結(jié)構(gòu),需說明的是,“損壞圖片”中存放的是圖片的路徑,為文本類型。
其中,靜態(tài)數(shù)據(jù)庫與動態(tài)數(shù)據(jù)庫之間的連接是通
過“路名-段起點-段止點”3個字段共同實現(xiàn)的。
2.3 軟件功能
PDA數(shù)據(jù)采集系統(tǒng)軟件的主要功能模塊為
數(shù)據(jù)導入模塊、數(shù)據(jù)采集模塊、數(shù)據(jù)導出模塊和在線幫助模塊。實現(xiàn)的主要功能包括以下幾方面。
1)PDA和PC的連接與同步。無論是從PC
52交通與計算機2006年第5期 第24卷 總132期表2 路面PDA數(shù)據(jù)采集系統(tǒng)靜態(tài)數(shù)據(jù)庫結(jié)構(gòu)
字段名路名段起點段止點路面類型調(diào)查長度調(diào)查寬度調(diào)查面積調(diào)查人員天氣日期 數(shù)據(jù)類型文本文本文本文本數(shù)字數(shù)字數(shù)字文本文本文本
表3 路面PDA數(shù)據(jù)采集系統(tǒng)動態(tài)數(shù)據(jù)庫結(jié)構(gòu)
字段名路名段起點段止點損壞類型損壞長度損壞寬度損壞密度損壞圖片地理信息 數(shù)據(jù)類型文本文本文本文本數(shù)字數(shù)字數(shù)字文本文本
向PDA導入數(shù)據(jù),還是從PDA向PC導出數(shù)據(jù),都需先將PDA和PC物理連接并實現(xiàn)兩者的同
步通信。PDA和PC物理連接是通過PDA和PC的USB硬件接口實現(xiàn)的,兩者的同步通信則通過
分別安裝于PDA和PC的同步應(yīng)用軟件實現(xiàn)。
2)數(shù)據(jù)導入。將城市交通基礎(chǔ)設(shè)施的靜態(tài)數(shù)
據(jù)從CTIMS導入到PDA數(shù)據(jù)采集系統(tǒng),同時完
成數(shù)據(jù)庫格式轉(zhuǎn)換。
3)數(shù)據(jù)采集。實現(xiàn)PDA數(shù)據(jù)采集系統(tǒng)的主
要功能,包括靜態(tài)數(shù)據(jù)的核實和確認,動態(tài)數(shù)據(jù)的采集。
4)數(shù)據(jù)導出。實現(xiàn)數(shù)據(jù)導入的逆過程,即將
采集好的靜、動態(tài)數(shù)據(jù)從PDA數(shù)據(jù)采集系統(tǒng)導
回到CTIMS,并完成數(shù)據(jù)庫格式轉(zhuǎn)換。
5)在線幫助。將所有損壞的定義、損壞等級的劃分和典型的損壞圖片等內(nèi)容以電子圖書的形
式存儲于PDA,方便用戶查閱。
2.4 軟件應(yīng)用
開發(fā)完成的PDA數(shù)據(jù)采集系統(tǒng)軟件運行良
好,并已在城市交通基礎(chǔ)設(shè)施檢測中得到應(yīng)用,尤
其是橋梁PDA數(shù)據(jù)采集系統(tǒng)已經(jīng)推廣應(yīng)用到北
京、貴陽、成都、長春、寧波、武漢、南通、沈陽、無
錫、合肥等城市的橋梁數(shù)據(jù)采集中[6]。體現(xiàn)了其便
捷、高效和安全的特點。
將PDA采集的數(shù)據(jù)導入CTIMS數(shù)據(jù)庫后,利用CTIMS對設(shè)施動態(tài)數(shù)據(jù)進行分析和評價,從而實現(xiàn)對城市交通基礎(chǔ)設(shè)施的科學管理。結(jié) 語
本文基于PDA解決了城市交通基礎(chǔ)設(shè)施管
理中數(shù)據(jù)采集的瓶頸問題,對PDA在數(shù)據(jù)采集
中應(yīng)用進行研究,從數(shù)據(jù)結(jié)構(gòu)和軟件結(jié)構(gòu)兩方面
進行了分析,并在此基礎(chǔ)上介紹了相應(yīng)軟件的開
發(fā)和應(yīng)用情況。PDA系統(tǒng)的開發(fā)使城市交通基礎(chǔ)
設(shè)施的管理更方便快捷,有利于實現(xiàn)動態(tài)管理。
參考文獻
[1]PDA-Based Field Data Collection For Pontis[C],International Bridge Conference, Pittsburgh,1995:
342-346
[2] 上海市市政工程管理處,同濟大學.上海市城市基
礎(chǔ)設(shè)施管理系統(tǒng)的研究及應(yīng)用總報告.上海,2005:
5-8;125-129
[3] 中華人民共和國建設(shè)部.CJJ99—2003,J281—2003
城市橋梁養(yǎng)護技術(shù)規(guī)范.北京:中國建筑工業(yè)出版
社,2004:14-18
[4] 孫立軍,楊 陽,張小寧,等.上海市城市橋梁管理
系統(tǒng)研究.華東公路,2000(2):34-37
[5] 李永隆.PDA程序設(shè)計.北京:清華大學出版社,2002:334-350
[6] 陳 長.交通基礎(chǔ)設(shè)施管理系統(tǒng)技術(shù)結(jié)構(gòu)研究.上
海:同濟大學,2004
Application of PDA to City Transportation
Infrastructure Management Data Collection
WANG Guoying CHEN Zhang CUI Peng SUN Lijun
(Tongji University,Shanghai20092)
Abstract:Aiming at the bottleneck problem of data collection in City Transportation Infrastructure Management
System(CTIMS), this paper dealt with the application of Personal Digital Assistant(PDA)to data collection.Then, the
data structure and program structure were analyzed.Moreover, the data collection system based on PDA was devel-
oped.The system has been successfully applied to city transportation infrastructure
data collections.Key words:PDA;City Transportation Infrastructure Management System;data structure;program structure;
software development
53PDA在城市交通基礎(chǔ)設(shè)施數(shù)據(jù)采集中的應(yīng)用研究——王國英 陳 長 崔 鵬 孫立軍
第二篇:淺談數(shù)據(jù)采集中如何規(guī)避風險
數(shù)據(jù)采集是計算機審計的第一個步驟,成功采集電子數(shù)據(jù)之后,才能進行數(shù)據(jù)清理、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)分析等工作。由于計算機系統(tǒng)的復(fù)雜性,可能在數(shù)據(jù)采集中發(fā)生意想不到的事故,給審計工作帶來了一定的風險,因此,審計人員在采集電子數(shù)據(jù)過程中,應(yīng)從以下方面注意規(guī)避風險。
一、做好審前調(diào)查,避免匆忙上陣。在計算機審計方式下,審前調(diào)查也尤為重要,應(yīng)提前對被審計單位的計算機系統(tǒng)、業(yè)務(wù)操作系統(tǒng)、數(shù)據(jù)庫系統(tǒng)進行詳細了解,從技術(shù)的角度考慮需要哪些數(shù)據(jù),所需要的數(shù)據(jù)能否獲取,以何種方式能夠有效獲取,防止因了解不深在實際采集過程中出現(xiàn)意外,也避免因考慮不周而多次、零星提出數(shù)據(jù)需求而延誤電子數(shù)據(jù)的獲取,或引起被審計單位的抵觸。
二、盡量要求由被審計單位進行數(shù)據(jù)采集。為規(guī)避審計風險和保護自身,審計人員一般不應(yīng)直接在被審計單位的計算機系統(tǒng)上進行操作。如果條件允許,應(yīng)在確定審計所需數(shù)據(jù)的具體內(nèi)容、獲取數(shù)據(jù)的可行方式后,提出書面的數(shù)據(jù)需求,交予被審計單位,要求被審計單位系統(tǒng)管理員自行采集電子數(shù)據(jù),或要求被審計單位聯(lián)絡(luò)軟件開發(fā)公司,由軟件開發(fā)公司派出人員,協(xié)助被審計單位完成數(shù)據(jù)采集工作,審計人員只需做好數(shù)據(jù)真實性、完整性驗證和現(xiàn)場監(jiān)督工作即可。
三、選擇好數(shù)據(jù)采集時間段。為了減輕被審計單位計算機信息系統(tǒng)的承載壓力,不應(yīng)在被審計單位業(yè)務(wù)繁忙時進行采集。比如用odbc的方法采集地稅數(shù)據(jù)時,會導致各客戶端無法順暢運行,業(yè)務(wù)基本處于癱瘓狀態(tài)。因此,一般應(yīng)根據(jù)采集數(shù)據(jù)量和采集方法,預(yù)測采集所需時間,選擇在中午或下班后等非工作時間段進行數(shù)據(jù)采集。
四、做好計算機系統(tǒng)和數(shù)據(jù)庫備份工作。數(shù)據(jù)采集前,應(yīng)使用被審計單位財務(wù)或業(yè)務(wù)軟件的數(shù)據(jù)備份功能或其他方法將數(shù)據(jù)庫進行備份,如果被審計單位的操作系統(tǒng)不夠穩(wěn)定,也應(yīng)根據(jù)實際情況進行備份,如利用ghost軟件備份windows操作系統(tǒng)。這樣,在出現(xiàn)意外故障時,能夠及時恢復(fù)被審計單位的計算機系統(tǒng)和數(shù)據(jù)庫數(shù)據(jù),避免數(shù)據(jù)丟失。
五、從客戶端采集數(shù)據(jù)。如果是要采集基于服務(wù)器結(jié)構(gòu)的oracle、informix、sysbase、db2等大型數(shù)據(jù)庫中的數(shù)據(jù)或者是基于unix等跨平臺的操作系統(tǒng)時,可采用odbc方法采集電子數(shù)據(jù),此種采集方法不需要在服務(wù)器上進行,而只需在客戶端上進行操作,或是在審計人員的筆記本電腦中安裝相關(guān)數(shù)據(jù)庫軟件后,將其接入被審計單位內(nèi)部局域網(wǎng),在筆記本電腦上完成采集操作。
六、確保移動存儲設(shè)備安全。在數(shù)據(jù)采集前,對將要使用的u盤、移動硬盤等移動存儲設(shè)備進行殺毒,保證無病毒,以免移動存儲設(shè)備中存在的病毒感染被審計單位的計算機。
七、盡量使用現(xiàn)場刻錄的方式存儲數(shù)據(jù)。在條件允許的情況下,數(shù)據(jù)采集完成后,使用只讀光盤進行數(shù)據(jù)存儲,并要求被審計單位在光盤上在加蓋印章,或是由被審計單位的系統(tǒng)管理員使用記號筆在光盤上簽字,以標志數(shù)據(jù)來源和采集日的數(shù)據(jù)狀態(tài),保證采集數(shù)據(jù)的真實性、完整性和安全性,如被審計單位對數(shù)據(jù)處理后的數(shù)據(jù)及數(shù)據(jù)分析結(jié)果產(chǎn)生疑義時,也可利用光盤中的原始數(shù)據(jù)為依據(jù)進行核對工作。
此外,數(shù)據(jù)采集成功之后,首先應(yīng)將制作采集數(shù)據(jù)的副本,在計算機審計過程中,只操作一個固定的副本。同時,應(yīng)確保獲取的被審計單位數(shù)據(jù)及與數(shù)據(jù)相關(guān)的技術(shù)文檔不被審計組內(nèi)外無關(guān)、無權(quán)人員獲知。
第三篇:大數(shù)據(jù)在高校個性化教育中的應(yīng)用研究(小編推薦)
本科畢業(yè)論文
《大數(shù)據(jù)在高校個性化教育中的應(yīng)用研究》
二零一五年四月
蘭州大學本科畢業(yè)論文
摘 要
在信息時代的今天,社會正在以驚人的速度產(chǎn)生海量數(shù)據(jù),這將對傳統(tǒng)教育模式產(chǎn)生巨大的影響。在數(shù)據(jù)量巨大、種類繁多、信息多樣化的大數(shù)據(jù)背景條件下,全球各大高校教學服務(wù)和數(shù)據(jù)利用方式將發(fā)生前所未有的變化,高校中匯聚著大量的信息。
大數(shù)據(jù)技術(shù)的到來,使各大高校實施個性化教育成為可能,真正實現(xiàn)從群體教育的方式轉(zhuǎn)向個體教育。利用大數(shù)據(jù)技術(shù),我們可以去關(guān)注每個學生個體的微觀表現(xiàn)。在高校教育中,學生們比中小學更加自由,也更需要這種監(jiān)督與個性化教育。大數(shù)據(jù)的到來,使跟蹤每一個學習者的詳細數(shù)據(jù)不再困難,從而實現(xiàn)了真正意義上的、全面細致的個性化教育。每一個學生都有機會獲得為自己量身定做的教學活動和資源;家長也將可以通過嶄新的視角掌握全面、真實的信息;教師也將可以從中獲取對教學的客觀反饋、對課程內(nèi)容和學生的學習過程進行評價、挖掘每一位學生的學習模式、改進個性化教學的手段;教育管理者則能夠更好地組織教育資源、制定教育改革的方向和措施;教育研究者也能借此技術(shù)轉(zhuǎn)變思路,開拓新的研究思維和路徑。盡管大數(shù)據(jù)為教育帶來了巨大的啟發(fā)和機遇,但是作為新鮮事物,許多與之相關(guān)的研究仍處于探索和嘗試階段,有待于在實踐過程中不斷完善。
關(guān)鍵詞:信息時代; 大數(shù)據(jù)技術(shù); 個體教育; 個性化教育;
蘭州大學本科畢業(yè)論文
目 錄
摘 要...............................................................1
蘭州大學本科畢業(yè)論文
蘭州大學本科畢業(yè)論文
關(guān)的研究目前仍處于探索和嘗試階段,有待于在實踐過程中不斷完善。
[2]
(二)課題研究方法
1.文獻分析
查閱文獻資料,對已有的大數(shù)據(jù)相關(guān)文獻進行閱讀、分析。通過查閱已有文獻,得知大數(shù)據(jù)概念,分析出大數(shù)據(jù)的特點以及大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)的區(qū)別;通過查閱大數(shù)據(jù)產(chǎn)生的背景,分析出大數(shù)據(jù)技術(shù)在個性化教育中的應(yīng)用;通過查閱國內(nèi)與國外(以美國為代表)大數(shù)據(jù)在高校個性化教育中的應(yīng)用現(xiàn)狀,做出國內(nèi)教育大數(shù)據(jù)反思,與國外的差距;大數(shù)據(jù)本身還在不斷分析研究階段,到底能為高校個性化教育帶來什么,還得繼續(xù)研究。
2.訪談法
通過與周圍朋友,以及其它高校朋友交流,去傾聽他們對于大數(shù)據(jù)技術(shù)的理解,以及他們對大數(shù)據(jù)技術(shù)的期望,去分析研究在目前我國應(yīng)該如果利用這一技術(shù)。
大數(shù)據(jù)在高校個性化教育中的應(yīng)用研究 的數(shù)據(jù)。
(3)產(chǎn)生速度快
數(shù)據(jù)的創(chuàng)建和移動速度都非???,這就對數(shù)據(jù)時效性要求特別高。在高速發(fā)展的信息時代,通過高速電腦處理器和服務(wù)器來快速創(chuàng)建實時數(shù)據(jù)流已成為流行趨勢。(4)價值密度低
數(shù)據(jù)信息量非常大,自然它的價值密度就不會很高。數(shù)據(jù)總量越大,價值密度就越低,兩者之間呈反比例,有些單條數(shù)據(jù)在大數(shù)據(jù)中可能沒有價值,無用數(shù)據(jù)太多,但它的綜合價值大。因此,如何用強大的數(shù)據(jù)挖掘算法更迅速地提取出有用信息,是大數(shù)據(jù)時代必須解決的難題之一。
(5)存儲要求高
規(guī)模巨大、類型多樣的數(shù)據(jù)自然對存儲帶來很大的問題。目前的存儲技術(shù)很難解決數(shù)據(jù)的異質(zhì)異構(gòu)、爆炸性增長帶來的存儲問題,已有的靜態(tài)的存儲方案已經(jīng)完全不能滿足數(shù)據(jù)的動態(tài)演化帶來的挑戰(zhàn)。因而在海量分布式存儲和查詢方面仍然需要做更進一步的研究。
(6)管理復(fù)雜
很顯然,大數(shù)據(jù)的數(shù)據(jù)量大、種類多樣、產(chǎn)生速度快、價值密度低、難存儲等特點,將直接為管理帶來很大的困難。
3.大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)的區(qū)別
大數(shù)據(jù)技術(shù)的到來,會讓許多我們曾經(jīng)沒有重視的,或者是因為技術(shù)與方法無法去收集的信息,現(xiàn)在都有可能作為“數(shù)據(jù)”進行收集并分析了,使得人們對于“數(shù)據(jù)”的理解更為深入了。
傳統(tǒng)數(shù)據(jù)的整理方式更能夠凸顯學生整體的水平。這些數(shù)據(jù)沒有必要、也不可能進行實時地采集,而是在階段性、周期性的評估中獲得。這些數(shù)據(jù)的收集,主要是通過考試或量表調(diào)查等形式進行獲得的,完全是在學生知情的情況下,自然會帶有很強的刻意性和壓迫性。
而大數(shù)據(jù)有能力去關(guān)注每個學生個體的微觀表現(xiàn):他在聽什么話的時候點頭,開小差的次數(shù),在不同的課堂上提問多少次,在一道題上停留了多久,在什么時候翻書,會向多少同班同學發(fā)起主動交流,等等。這些數(shù)據(jù)完全是在學生不自知的情況下被收集、觀察的,只需要借助一些特殊的設(shè)備與觀測技術(shù),不會影響學生任何的日常生活與學習,這將使得它的采集也非常的自然、真實。
綜上所述,我們可以從以下幾個方面對傳統(tǒng)數(shù)據(jù)與大數(shù)據(jù)進行比較區(qū)分:
[4]
蘭州大學本科畢業(yè)論文
(1)范圍不同
傳統(tǒng)數(shù)據(jù)反應(yīng)的是整體、宏觀的教育狀況,用于教育工作者進行重大的教育改革等;大數(shù)據(jù)可以分析每個學生個體實時的、微觀的課堂狀況,用于及時調(diào)整教育行為與實現(xiàn)個體化教育。(2)方式方法不同
傳統(tǒng)數(shù)據(jù)的收集、分析、存儲、分類等都已存在特定的規(guī)則,方法論也相較完整:而大數(shù)據(jù)的收集、分析等,由于大數(shù)據(jù)本身是新鮮東西,所以還沒有形成清新的方法、路徑以及評判標準。(3)對象不同
傳統(tǒng)數(shù)據(jù)來源于階段性的、整體性的評估,數(shù)據(jù)收集過程可能會產(chǎn)生很大誤差;大數(shù)據(jù)記錄的是過程性的、實時性的行為現(xiàn)象,用的是 大數(shù)據(jù)在高校個性化教育中的應(yīng)用研究
有固定的一個老師上一門課,每個人面對的都是一樣的老師,一樣的教材,一樣的學習任務(wù)。
通過以上特征,明顯能感覺到相比中小學,高校本身就注重個性化教育,但,要實現(xiàn)對每個個體進行不同的教育方式,只能通過大數(shù)據(jù)技術(shù)對每個人進行跟蹤、分析、研究,從而制定個性化的方案。
蘭州大學本科畢業(yè)論文
2.大數(shù)據(jù)可以實現(xiàn)過程性評估
教學評估應(yīng)該是過程性的,而非只看結(jié)果。如果我們想象,教師擁有每個學生的上課情況。期末時將這些數(shù)據(jù)匯總起來,就使得撰寫評語時有了更加豐富的素材與數(shù)據(jù)依據(jù),能對學生的發(fā)展提出建議。另一方面,這些數(shù)據(jù)也可以促使教師反思,自己在哪些地方需要改進。
如果是應(yīng)用信息化的課程載體對學生的行為進行記錄,而不是通過教師的觀察,就能真正實現(xiàn)大數(shù)據(jù)與課堂進程的結(jié)合。因此,大數(shù)據(jù)技術(shù)可以對每個學生在課堂中的微觀行為進行捕捉,幫助老師了解學生對知識的掌握程度以及感興趣程度,進而對老師的教學活動進行反饋。
3.大數(shù)據(jù)實現(xiàn)學生課外學習軌跡的積累
假如家長通過手機就能獲得學校的通知公告等信息,可以記錄孩子每天課余時間,包括孩子看過哪些書,去了哪里游玩,與誰在一起等等。便捷的積累下了非常有價值的數(shù)據(jù),從而可以有針對性地幫助家長發(fā)現(xiàn)一些現(xiàn)象。同時可以給他提出如何幫孩子減負的針對性的建議。而對于研究者,可以通過數(shù)據(jù)庫統(tǒng)計一個學校、一個區(qū)域的整體情況,獲得有價值的數(shù)據(jù)。所以說大數(shù)據(jù),還能夠讓我們更加了解學生課外學習的軌跡。
可以這樣說,大數(shù)據(jù)時代的到來,讓跟蹤每一個人的數(shù)據(jù)成為了可能,從而讓研究“人性”成為了可能,而對于教育研究者來說,我們將比任何時候都更接近發(fā)現(xiàn)全面的學生信息。[7]
(三)大數(shù)據(jù)在高校個性化教育中的應(yīng)用
1.學生方面
每個學生個體都有機會獲得為自己量身定做的教學活動和資源。以及聯(lián)系方式等基本信息,食堂消費、住宿晚歸等生活信息,選課、課后作業(yè)、借閱圖書、成績等學習信息,參與的社團、競賽、講座等信息;
2.家長方面
學生家長能通過嶄新的視角掌握全面、真實的學生信息。包括上課表現(xiàn)、成績情況、交流情況、師生互動等等。
3.教師方面
利用所收集的每個學生學習過程中的全面信息,從中獲取對教學的客觀反饋、對課程內(nèi)容和學習過程進行評價、挖掘?qū)W生的學習模式、改進個性化教學的手段。以及如何利用大數(shù)據(jù)技術(shù)輕松處理教學任務(wù)、課件等教學信息,論文著作、科學研究數(shù)據(jù)等科研信息;
大數(shù)據(jù)在高校個性化教育中的應(yīng)用研究
4.學校方面
學習可以利用大數(shù)據(jù)技術(shù)更好的管理學校的資產(chǎn)信息、師資信息、招生就業(yè)信息等。
5.教育管理者方面
教育管理者利用大數(shù)據(jù)技術(shù)更便捷地組織教育資源、制定教育改革的方向和措施。
6.教育研究者方面
能夠在大數(shù)據(jù)技術(shù)的影響下,轉(zhuǎn)變思路,開拓新的研究思維和路徑。
(四)國內(nèi)外教育大數(shù)據(jù)的現(xiàn)狀與未來發(fā)展趨勢
1.國內(nèi)大數(shù)據(jù)發(fā)展現(xiàn)狀
2011年以來,中國計算機學會、中國通信學會先后成立了大數(shù)據(jù)委員會,研究大數(shù)據(jù)中的科學與工程問題,科技部的《中國云科技發(fā)展“十二五”專項規(guī)劃》和工信部的《物聯(lián)網(wǎng)“十二五”發(fā)展規(guī)劃》等都把大數(shù)據(jù)技術(shù)重點予以支持。其中“十二五”規(guī)劃上,把信息處理技術(shù)作為關(guān)鍵技術(shù)創(chuàng)新工程被提出來,其包括海量數(shù)據(jù)存儲、數(shù)據(jù)挖掘、圖像視頻智能分析,都是大數(shù)據(jù)的重要組成部分。
中國三大通信運營商都在積極推進大數(shù)據(jù)應(yīng)用工作,并取得了較好的進展。電商企業(yè)阿里巴巴提出要做中國數(shù)據(jù)分析
蘭州大學本科畢業(yè)論文
件編輯聯(lián)盟曾號召政府部門和私人企業(yè)共同合作,投入3億歐元用于推動大數(shù)據(jù)領(lǐng)域的發(fā)展。眾所周知,法國在數(shù)學和統(tǒng)計學領(lǐng)域有獨一無二的優(yōu)勢。
日本正在針對大數(shù)據(jù)推廣的現(xiàn)狀、發(fā)展動向、面臨問題等進行探究,為解決社會公共問題作出貢獻。2013-2020年期間以發(fā)展開放公共數(shù)據(jù)和大數(shù)據(jù)為核心的日本新IT國家戰(zhàn)略,提出要把日本建設(shè)成為“世界最高水準的廣泛運用信息產(chǎn)業(yè)技術(shù)的社會”。
目前,不僅印度的小公司紛紛涉足大數(shù)據(jù)市場淘金,一些外包行業(yè)巨頭也開始進軍大數(shù)據(jù)市場。據(jù)統(tǒng)計,印度大數(shù)據(jù)行業(yè)規(guī)模在3年內(nèi)將達到12億美元,是目前規(guī)模的6倍,同時也是全球大數(shù)據(jù)行業(yè)平均增長速度的兩倍。
[9]3.國內(nèi)大數(shù)據(jù)發(fā)展展望
伴隨著大數(shù)據(jù)時代的來臨,世界各種對數(shù)據(jù)的重視達到前所未有的高度。按照世界經(jīng)濟論壇報告的看法,“大數(shù)據(jù)為新財富,價值堪比石油”。上面介紹了許多國外的動態(tài),自然需要思考本國可能采取的發(fā)展道路。2014年2月27日中央網(wǎng)絡(luò)安全和信息化領(lǐng)導小組宣告成立,組長習近平提出,沒有網(wǎng)絡(luò)安全就沒有國家安全,沒有信息化就沒有現(xiàn)代化。建設(shè)網(wǎng)絡(luò)強國,要有自己的技術(shù),有過硬的技術(shù);要有豐富全面的信息服務(wù),繁榮發(fā)展的網(wǎng)絡(luò)文化;要有良好的信息基礎(chǔ)設(shè)施,形成實力雄厚的信息經(jīng)濟;要有高素質(zhì)的網(wǎng)絡(luò)安全和信息化人才隊伍;要積極開展雙邊、多邊的互聯(lián)網(wǎng)國際交流合作。從話的另一面也說明,目前我們沒有過硬的技術(shù),網(wǎng)絡(luò)文化還有問題,基礎(chǔ)設(shè)施還是比較差,人才隊伍素質(zhì)不應(yīng)求,也沒有可靠的盟友,信息經(jīng)濟實力太弱。大數(shù)據(jù)是信息時代的“石油”、開發(fā)大數(shù)據(jù)資源的能力將影響未來核心競爭力。我國不能依靠別人修好路,只能靠自身加速前行,這種能力就是將數(shù)據(jù)轉(zhuǎn)化為信息和知識的速度與技術(shù),而這種轉(zhuǎn)化速度和技術(shù),則決定了大數(shù)據(jù)技術(shù)能力的高地。
(五)大數(shù)據(jù)在高校個性化教育中面臨的挑戰(zhàn)
同時也伴隨著不少問題和挑戰(zhàn)。
盡管大數(shù)據(jù)技術(shù)為高校個性化教育帶來諸多益處,也推動著教育理念的變革,但1.關(guān)于相關(guān)人才
要在高校有效利用大數(shù)據(jù)技術(shù),就需要來自數(shù)學、統(tǒng)計學或計算機工程等領(lǐng)域的眾多專業(yè)人員,如收集高質(zhì)量數(shù)據(jù)的專員、管理硬件的系統(tǒng)管理員、程序開發(fā)人員、數(shù)據(jù)分析員等等。這些人員不管是招募還是培訓都是很大的困難。
2.隱私問題
大數(shù)據(jù)時代的個性化服務(wù)要對每個個體的行為進行追蹤和分析,在收集到的大量信息中,也許會有個人無心公于世的個人隱私信息。此類信息的所有權(quán)和使用權(quán)的歸屬并不明確。
大數(shù)據(jù)在高校個性化教育中的應(yīng)用研究
3.數(shù)據(jù)主宰的隱憂
為了追求更好的學習成績基于學生以往的學業(yè)表現(xiàn)為其推薦課程,這在一定程度上可能導致學生只學習過于簡單的課程,不利于其挑戰(zhàn)性的激發(fā),學生也有可能被迫去放棄夢想而轉(zhuǎn)修一些實用課程。
4.數(shù)據(jù)真實性值得懷疑
當大數(shù)據(jù)普遍運用于高校時,雖然學生信息是在不自知的情況下被收集的,但普及之后大家就都會知道自己的行為會被記錄,而刻意去做一些事情,這樣收集到的信息就不會是本真的東西。
5.研究方法不成熟
大數(shù)據(jù)研究畢竟是一個比較新的領(lǐng)域,目前還沒有形成清晰的方法和路徑,同時也缺乏統(tǒng)一的標準,每個教育機構(gòu)都可能采用不同的運作形式,其運用效果值得懷疑。
蘭州大學本科畢業(yè)論文
結(jié) 論
總而言之,隨著大數(shù)據(jù)的發(fā)展,科技產(chǎn)業(yè)受到深刻影響,收集和解析數(shù)據(jù)的能力在近年來突飛猛進,其應(yīng)用范圍深入到生活的方方面面。無疑也將會對傳統(tǒng)教育模式產(chǎn)生巨大影響。將大數(shù)據(jù)技術(shù)應(yīng)用于高校個性化教育中,將會使傳統(tǒng)的整體教育發(fā)生翻天覆地的變化。傳統(tǒng)的高校教育是對人的社會責任能力教育,授教統(tǒng)一的內(nèi)容;而大數(shù)據(jù)帶來的個性化教育是認同個體生理基礎(chǔ)的差異,重視每個個體在教育中的中心地位,注重學生的獨立意識、自信心、主動性、創(chuàng)造性、向權(quán)威挑戰(zhàn)的精神和多種差異能力的培養(yǎng),學校要努力創(chuàng)造條件,讓每個個體充分發(fā)展這些能力。學生是其中最大的受益方,每一個學生都有機會獲得為自己量身定做的教學活動和資源;家長也可以通過嶄新的視角掌握全面、真實的教育信息;教師從中獲取對教學的客觀反饋、對課程內(nèi)容和學習過程進行評價、挖掘?qū)W生的學習模式、改進個性化教學的手段;教育管理者能夠更好地組織教育資源、制定教育改革的方向和措施;教育研究者能夠借此轉(zhuǎn)變思路,開拓新的研究思維和路徑。盡管大數(shù)據(jù)為教育帶來了巨大的啟發(fā)和機遇,但是作為新鮮事物,許多與之相關(guān)的研究仍處于探索和嘗試階段,有待于在實踐過程中不斷完善。
大數(shù)據(jù)在高校個性化教育中的應(yīng)用研究
參考文獻
[1]趙姝淳, 孫曙輝.大數(shù)據(jù)技術(shù)及其在教育領(lǐng)域的應(yīng)用[J].中小學信息技術(shù)教育, 2014,(3):64-66.[2]張燕南, 胡繼岳.關(guān)于大數(shù)據(jù)應(yīng)用于教育的思考[J].中國電力教育, 2013,(11):5-7.[3]張生.混合式學習環(huán)境下基于學習活動的形成性評價的理論與實踐[D].東北師范大學, 2008.[4]張韞.大數(shù)據(jù)改變教育(節(jié)選)[J].基礎(chǔ)教育論壇:文摘版, 2014,(11).[5]呂楠.個性化教育與大學生創(chuàng)新能力提升研究[J].重慶電子工程職業(yè)學院學報, 2013, 22(5):107-109.[6]楊妮.美國高中個性化教育策略及其啟示[J].教育導刊,2013,(1)[7]張韞.大數(shù)據(jù)改變教育[J].上海教育,2013,
第四篇:大數(shù)據(jù)在中國B2C電子商務(wù)精準營銷中的應(yīng)用研究
大數(shù)據(jù)在中國B2C電子商務(wù)精準營銷中的應(yīng)用研究
摘 要:進入21世紀,網(wǎng)上購物已經(jīng)成為一種潮流和時尚,也刺激和帶動了中國B2C電子商務(wù)的快速發(fā)展,京東商城就是一個典型的代表企業(yè)。大數(shù)據(jù)的出現(xiàn)為電子商務(wù)的進一步發(fā)展帶來了新的契機,因此研究大數(shù)據(jù)時代電子商務(wù)企業(yè)的精準營銷策略具有很高的實際應(yīng)用價值。
本論文的研究方法為定性研究,通過深度訪談的方法,以京東商城為具體研究對象進行研究。通過對京東商場的具體研究分析,理清B2C電子商務(wù)企業(yè)收集、整理、存儲和分析大數(shù)據(jù)的流程;分析用戶多次的購物記錄形成關(guān)系網(wǎng),知悉更多用戶的購買習慣和喜好;將客戶分為不同的類型,將個性化的信息推薦給客戶,以客戶為中心,進行實時營銷和精準營銷。但本文仍存在諸多不足之處,希望在后續(xù)研究中能使研究對象進一步細化,并且將案例研究進一步地深入。
關(guān)鍵詞:大數(shù)據(jù);電子商務(wù);精準營銷;京東商城緒論
從20世紀互聯(lián)網(wǎng)出現(xiàn)至今,互聯(lián)網(wǎng)已經(jīng)越來越融入人們的生活,不得不說,網(wǎng)購已經(jīng)成為了一種潮流和趨勢,已經(jīng)成為了相當一部分人生活中不可或缺的部分,同時,也帶動了中國電子商務(wù)的發(fā)展進程。
網(wǎng)絡(luò)交易規(guī)模的不斷擴大和增長,對于電子商務(wù)行業(yè)來說是一個難得的發(fā)展機會,但機遇與挑戰(zhàn)永遠是并存的。過去傳統(tǒng)的粗放式營銷方式開始逐漸轉(zhuǎn)變?yōu)榫珳适綘I銷,精準營銷就是在精準定位的基礎(chǔ)上,依托現(xiàn)代信息技術(shù)手段建立個性化的顧客溝通服務(wù)體系。這種精準式營銷方式主要特征就是以客戶為核心,營銷的目的就是實現(xiàn)與客戶之間的交易,只有制造出令客戶滿意的產(chǎn)品,充分滿足客戶的個性化需求,才能夠?qū)崿F(xiàn)交易,與客戶保持良好的合作關(guān)系,充分實現(xiàn)收益,獲得較高的投資回報。
隨著網(wǎng)絡(luò)的發(fā)展和技術(shù)的進步,從2009年開始大數(shù)據(jù)這個詞語越來越多地被人們所提及。不可否認,“大數(shù)據(jù)”一詞在整個世界范圍內(nèi)也越來越熱,“大數(shù)據(jù)”時代已經(jīng)來臨。2013年也被中國媒體廣泛稱之為 “大數(shù)據(jù)元年”。不得不說,大數(shù)據(jù)的時代已經(jīng)來臨了。京東(JD.com)是中國最大的自營式電商企業(yè),2014年5月,京東在美國納斯達克證券交易所正式掛牌上市,是中國第一個成功赴美上市的大型綜合型電商平臺,與騰訊、百度等中國互聯(lián)網(wǎng)巨頭共同躋身全球前十大互聯(lián)網(wǎng)公司排行榜。2014年,京東市場交易額達到2602億元人民幣,凈收入達到1150億元人民幣。
最近兩年,大數(shù)據(jù)在電信、醫(yī)療和公共交通方面已有應(yīng)用,但在B2C的電子商務(wù)網(wǎng)站方面還未得到廣泛的運用,所以本論文的研究問題可以歸納為兩個方面:
①如何通過大數(shù)據(jù)技術(shù)獲得有利于對B2C電子商務(wù)企業(yè)的顧客信息挖掘?
②如何將大數(shù)據(jù)技術(shù)分析處理后的數(shù)據(jù)運用于B2C電子商務(wù)企業(yè)的精準營銷中?
本文的研究目的總體可以分為以下三個方面:
①對于B2C類型的電子商務(wù)企業(yè)而言,收集的大數(shù)據(jù)主要包括消費者的購買行為,對其進行整理和分析,可以預(yù)測消費者的下次購買行為,可以為企業(yè)在精準營銷過程中節(jié)省大量的人力、財力和物力,減少成本擴大收益。此外,通過精準營銷能夠很好地維護企業(yè)和客戶之間的關(guān)系,提高客戶滿意度,真正做到以客戶為中心。京東商城就是通過大數(shù)據(jù)的分析,來維護與網(wǎng)購客戶的關(guān)系,提高客戶在京東商城購買產(chǎn)品的頻率和次數(shù),最終提高客戶對京東商城的忠誠度。
②對于消費者而言,B2C企業(yè)推送的產(chǎn)品信息更具有針對性,更符合自己所需購買產(chǎn)品的期望,減少搜索和尋找相關(guān)產(chǎn)品的時間,能及時快速地了解B2C企業(yè)的產(chǎn)品信息,幫助消費者做出購買決策,指導其消費行為。消費者收到京東商城發(fā)送的產(chǎn)品信息之后,直接就去京東商城的網(wǎng)站上面進行挑選和選購,節(jié)省許多時間和精力。
③精準營銷研究的側(cè)重點大多在于客戶關(guān)系管理方面的營銷策劃研究,基于行業(yè)的精準營銷也大多集中于銀行、圖書、消費品等相關(guān)領(lǐng)域,但是隨著大數(shù)據(jù)時代的來臨,電子商務(wù)網(wǎng)站的精準營銷研究相對來說就比較匱乏,這就使得本論文的研究更加具有創(chuàng)新性和實用性。
本論文主要以在B2C電子商務(wù)企業(yè)中非常有代表性的京東商城為研究對象,探索大數(shù)據(jù)在電子商務(wù)精準營銷中的應(yīng)用。
2013年可以稱為中國的“大數(shù)據(jù)元年”,以此計算,中國在大數(shù)據(jù)領(lǐng)域內(nèi)的研究還處于最初的起步階段,且處于宏觀研究的層面,對于應(yīng)用涉及的更加少。而且大數(shù)據(jù)的顯著4V特征:(規(guī)模(Volume)、快速(Velocity)、多樣(Variety)和價值(Value)由于數(shù)據(jù)的海量化,規(guī)模巨大化和多樣化,單個數(shù)據(jù)的價值密度就顯得較低,如何將大數(shù)據(jù)的海量化、多樣性的特點與精準營銷的精準性看似矛盾對立的兩個方面在營銷過程中充分完美地結(jié)合起來,最終成功實現(xiàn)營銷,這將是本文的研究創(chuàng)新點。文獻綜述
本章節(jié)通過對電子商務(wù)、大數(shù)據(jù)、精準營銷等概念進行文獻研究,然后通過大數(shù)據(jù)在電信行業(yè)和公共交通行業(yè)的應(yīng)用提供借鑒意義,為大數(shù)據(jù)能夠更好地服務(wù)于電子商務(wù)行業(yè)的后續(xù)應(yīng)用研究奠定基礎(chǔ)。
2.1 電子商務(wù)
電子商務(wù)這一提法最初是由歐洲、美國等西方發(fā)達國家提出的,但是經(jīng)過多年的發(fā)展和推廣,電子商務(wù)已經(jīng)在全世界的范圍內(nèi)遍地開戶,占領(lǐng)了相當大的市場份額,基于這種情況,世界上的眾多學者都開始針對電子商務(wù)進行了大量而細致的研究工作。
聯(lián)合國經(jīng)濟合作組織(2007)把電子商務(wù)定義為:“電子商務(wù)是用開放式的網(wǎng)絡(luò)作為交易的基礎(chǔ),并且依靠這一基礎(chǔ)開展企業(yè)與企業(yè)之間、消費者與消費者之間、企業(yè)與消費者之間的商業(yè)上的往來”。
Daniel Amor(2012)在《電子商務(wù):變革與演進》一書中提出的看法是:立足于電子商務(wù)帶來的機遇和挑戰(zhàn),對電子商務(wù)涵蓋的技術(shù)進行了評論,同時全是電子商務(wù)的核心理念,對于電子商務(wù)未來的發(fā)展前景進行了展望和評估。該書在對于電子商務(wù)的發(fā)展給予一定肯定的同時,也毫不避諱的提出了電子商務(wù)在發(fā)展過程中出現(xiàn)的諸多問題。
中國的電子商務(wù)企業(yè)相對于國外企業(yè)來說起步較晚,但是發(fā)展速度卻不慢,而且勁頭十足,但是,由于受到種種條件的制約,現(xiàn)階段中國電子商務(wù)企業(yè)的研究大多還只是停留在理論層面。
張婷,朱邦毅(2014)針對中國當前B2C電子商務(wù)市場進行研究的同時,總結(jié)了B2C電子商務(wù)的三種模式:垂直型、平臺型和綜合型。并在此基礎(chǔ)上,深入解析了各種模式的優(yōu)缺點和利弊后,得出以下結(jié)論:傳統(tǒng)的大中型企業(yè)開拓銷售渠道時比較適用于垂直型的模式;大中型企業(yè)在獲得企業(yè)長遠經(jīng)營利益方面比較實用綜合型模式;而平臺型的模式則是中小企業(yè)最初進入網(wǎng)絡(luò)交易市場的不二選擇。
截至目前為止,針對電子商務(wù)企業(yè)在理論與實踐方面的研究還非常少,這一領(lǐng)域還非常地薄弱,這就更加迫切地需要針對電子商務(wù)在B2C企業(yè)領(lǐng)域的實踐進行更加系統(tǒng)的研究。
2.2 大數(shù)據(jù)
20世紀互聯(lián)網(wǎng)出現(xiàn),特別是進入21世紀以來,互聯(lián)網(wǎng)的發(fā)展勢頭銳不可擋,無處不在的移動設(shè)備每時每刻都在產(chǎn)生著大量的數(shù)據(jù),信息的交互更是時時刻刻都在處理大量的數(shù)據(jù)。此時,對于數(shù)據(jù)處理的實時性和實效性都提出了更高的要求,傳統(tǒng)的處理手段已經(jīng)不能勝任。因此,大數(shù)據(jù)技術(shù)當之無愧地成為了一個最新的技術(shù)熱點,并引起了世界單位內(nèi)的廣泛關(guān)注。
維基百科對于大數(shù)據(jù)的定義是“大數(shù)據(jù)是一個常規(guī)軟件無法在一定時間內(nèi)對其內(nèi)容進行獲取、整理和分析的數(shù)據(jù)集合”。大數(shù)據(jù)與海量數(shù)據(jù)相比,在數(shù)據(jù)體量、復(fù)雜性和產(chǎn)生速度這三個方面相較于傳統(tǒng)數(shù)據(jù)的形態(tài)有了很大的超越,此外,也超越了傳統(tǒng)技術(shù)處理手段的范圍,還能夠帶來巨大的經(jīng)濟效益。
IBM公司將大數(shù)據(jù)的特征總結(jié)成為三個“V”:規(guī)模(Volume)、快速(Velocity)和多樣(Variety),但是更多的人則將其概括為四個“V”,即規(guī)模(volume)、快速(Velocity)、多樣(Variety)和價值(value)。
依據(jù)一般的信息處理流程,大數(shù)據(jù)的處理過程可以劃分為以下六個環(huán)節(jié),分別是數(shù)據(jù)收集、數(shù)據(jù)整理、數(shù)據(jù)存儲及管理、數(shù)據(jù)分析、數(shù)據(jù)顯化及產(chǎn)業(yè)應(yīng)用:
①數(shù)據(jù)收集。數(shù)據(jù)收集是大數(shù)據(jù)處理過程首要的一環(huán),也是基礎(chǔ)。
②數(shù)據(jù)整理。每年數(shù)據(jù)的產(chǎn)生量是非常大的,完成大量數(shù)據(jù)的收集工作之后,如何才能篩選出有用的數(shù)據(jù),并使有用的數(shù)據(jù)順利傳遞到下一環(huán)節(jié),是大數(shù)據(jù)處理過程中必要的并且非常重要的環(huán)節(jié)。
③數(shù)據(jù)存儲及管理。數(shù)據(jù)存儲和數(shù)據(jù)管理是環(huán)環(huán)相扣的,采用何種方式進行數(shù)據(jù)管理直接決定了數(shù)據(jù)存儲的方式,同時數(shù)據(jù)存儲的方式又決定了數(shù)據(jù)管理的深度和廣度。
④數(shù)據(jù)分析。開始比較早的傳統(tǒng)數(shù)據(jù)處理公司具有明顯的競爭優(yōu)勢,但是,以Cloudera為代表的基于開源軟件基礎(chǔ)構(gòu)架的數(shù)據(jù)分析公司由于能夠較好地滿足客戶的數(shù)據(jù)分析需求,在這幾年間取得了快速的發(fā)展。
⑤數(shù)據(jù)解讀。數(shù)據(jù)分析這一環(huán)節(jié),起步比較早的傳統(tǒng)數(shù)據(jù)處理公司同樣具有一定的競爭優(yōu)勢,通過在傳統(tǒng)業(yè)務(wù)之上融入新的知識,很快就成為該領(lǐng)域中的領(lǐng)頭羊。
⑥數(shù)據(jù)展示。這一環(huán)節(jié)中在一定程度上也可以稱之為數(shù)據(jù)應(yīng)用,大數(shù)據(jù)開始幫助管理實踐。
2.3 精準營銷
20世紀90年代,美國的萊斯特?偉門第一次提出了精準營銷的概念。Zabin和Brebach(2004)提出了精準營銷的4R法則,亦即正確的顧客(right customer),正確的信息(right message),正確的渠道(right channel)以及正確的時間(Right time),通過把正確的信息在正確的時間通過正確的渠道順利傳遞到正確的客戶手中,借此真正實現(xiàn)對目標客戶的購買決策形成有力影響,并促成營銷目標的順利達成。
劉征宇(2013)在《精準營銷方法研究》中提出精準營銷的方法應(yīng)該分為三大類,分別是基于數(shù)據(jù)庫營銷的方法、基于Internet的方法和借助其他渠道的方法三大類。姜何(2014)用精細化營銷來形容精準營銷,指出所謂的精細化管理是相較于粗放式管理而言的,實施精細化管理,就意味著要開展客戶細分,針對不同類型的客戶實施不同的營銷策略,充分了解客戶的個性化需求,為客戶提供所需的服務(wù),實現(xiàn)營銷目標。曹彩杰(2014)提出,精準營銷體系應(yīng)該以網(wǎng)絡(luò)和信息技術(shù)手段為核心,未來也許會替代傳統(tǒng)的營銷模式,并逐步發(fā)展成為現(xiàn)代企業(yè)管理營銷發(fā)展的新態(tài)勢。
中國三大電信運營商經(jīng)過多年的經(jīng)營,累積了大量的數(shù)據(jù)。目前大數(shù)據(jù)在電信行業(yè)中的應(yīng)用主要體現(xiàn)在網(wǎng)絡(luò)管理和優(yōu)化、市場與精準營銷和企業(yè)運營管理。目前面臨的問題是,電信行業(yè)發(fā)展好應(yīng)用大數(shù)據(jù)技術(shù)面臨的最大障礙不是技術(shù)能不能實現(xiàn)的問題,而是數(shù)據(jù)孤島無法充分共享的問題。所以,對于電信運營商來說,要真正的利用大數(shù)據(jù)并使其更好地服務(wù)于運營商,數(shù)據(jù)的統(tǒng)一和整合是第一步,也時最為重要的一步。
應(yīng)用大數(shù)據(jù)手段可以將海量的數(shù)據(jù)進行一個集合,通過把離散的數(shù)據(jù)需求集合成交通管理的體系,來滿足以往不能實現(xiàn)的需求。利用大數(shù)據(jù)技術(shù)可以收集來自各方面的信息,這一點同樣也可以應(yīng)用于交通管理方面,可以應(yīng)用大數(shù)據(jù)技術(shù)提升城市交通管理的水平,有效改善交通狀況。在利用大數(shù)據(jù)技術(shù)治理交通方面,美國等西方發(fā)達國家最具代表性,在國內(nèi)而言,深圳可以說是做得比較好的。
在B2C電子商務(wù)的精準營銷中,首先利用大數(shù)據(jù)對客戶進行“畫像”,通過在網(wǎng)上的交易記錄和購買情況,可以對客戶情況有一個大概的了解,可以算是“素描畫”。然后結(jié)合之前多次的交易情況,對客戶信息進一步的補充和完善,形成關(guān)系網(wǎng)或關(guān)系鏈,這樣客戶的“畫像”更加全面和形象,客戶的消費行為和消費喜好也有一定的預(yù)測和判斷。第三步就是制定銷售策略,將客戶分為不同的類型,通過郵件或短信,將個性化的信息推薦給客戶。最后就是評估大數(shù)據(jù)在精準營銷中的效果和作用,通過實施精準營銷前后的銷售額的變化對比,來進行驗證和證實。
研究方法
本論文采用深度訪談法作為研究方法,主要是基于以下兩個方面的考慮:
一是大數(shù)據(jù)的研究總體來說還是處于探索和研究階段,盡管很多個行業(yè)領(lǐng)域都在提及大數(shù)據(jù),但并未得到普及,大數(shù)據(jù)更多的對人們來說只是一個概念而已。
二是企業(yè)出于商業(yè)保密的原因,很多企業(yè)內(nèi)部的資料無從查找,為了能夠獲取更多詳實的內(nèi)部資料和數(shù)據(jù),需要對京東企業(yè)的內(nèi)部人員進行訪談。同時為了保證企業(yè)的正常利益,訪談內(nèi)容中關(guān)于京東企業(yè)的內(nèi)部資料和信息僅用于論文研究使用,不可用于商業(yè)用途。
內(nèi)容分析法(Content Analysis)是指來源于新聞傳播領(lǐng)域的一種分析方法,通過定性分析與定量分析相結(jié)合的方式,針對傳播內(nèi)容進行系統(tǒng)化的客觀分析,并且描述傳播內(nèi)容特征和檢驗傳播研究假設(shè)的一種研究方法。
本論文主要通過對訪談的形式,對相關(guān)人員進行訪問,并對訪談的內(nèi)容進行分析,將其運用于大數(shù)據(jù)在B2C電子商務(wù)精準營銷中的應(yīng)用研究。
本論文選取京東商城為研究對象,針對京東商城使用大數(shù)據(jù)在電子商務(wù)精準營銷中的應(yīng)用情況進行深入研究。之所以選擇京東商城為例,有三方面的原因:
①京東商城是中國目前最大的自營式電子商務(wù)企業(yè),已經(jīng)積累了大量的數(shù)據(jù)信息。京東商城無論從規(guī)模還是盈利能力,在B2C電商市場中都是很具有代表性和影響力的,具有研究的價值和意義。
②京東商城經(jīng)過多年的發(fā)展,在中國自營式B2C電商中的市場占有率高達一半,具有良好的消費者群眾基礎(chǔ),便于進行調(diào)查問卷的發(fā)放和收取工作,方便進行數(shù)據(jù)的收集,為后期進行數(shù)據(jù)分析奠定了基礎(chǔ)。
③京東商城盡管在行業(yè)中處于領(lǐng)先地位,但并非處于龍頭老大的地位,希望可以通過借助于大數(shù)據(jù)的契機來縮小與天貓商城的差距,更加鞏固京東商城在B2C電商市場中的地位。
鑒于以上三點,本文特意選擇京東商城作為研究對象,重點研究和分析其如何使用大數(shù)據(jù)在B2C電子商務(wù)精準營銷中進行應(yīng)用。研究過程
本章節(jié)將針對大數(shù)據(jù)在B2C電子商務(wù)中進行精準營銷的具體過程進行研究,這部分內(nèi)容可以劃分為兩個階段和三個過程。第一個階段是數(shù)據(jù)的收集和處理階段,第二個階段是數(shù)據(jù)的應(yīng)用階段。在數(shù)據(jù)的應(yīng)用階段可以劃分為三個過程:第一是運用大數(shù)據(jù)為客戶進行畫像,第二是補充完善客戶信息,形成關(guān)系網(wǎng)或者關(guān)系鏈,第三是制定營銷策略,首先將客戶分為不同的類型,針對不同類型的客戶采取不同的營銷策劃,確定營銷策劃后通過郵件或者短信的方式將個性化的信息推薦給客戶,真正做到以客戶為中心進行實時營銷和精準營銷。
4.1 大數(shù)據(jù)收集和處理階段
結(jié)合第二章節(jié)中已經(jīng)提及的數(shù)據(jù)收集和處理過程,將B2C電子商務(wù)中的數(shù)據(jù)收集和處理過程劃分為數(shù)據(jù)采集、數(shù)據(jù)清理、數(shù)據(jù)存儲及管理和數(shù)據(jù)分析四個部分。
對于B2C電子商務(wù)公司而言,在決定采集數(shù)據(jù)之前,必須明確哪些數(shù)據(jù)有用需要采集,哪些數(shù)據(jù)沒用不需要采集,這些數(shù)據(jù)必須區(qū)分開來,避免進行不必要的數(shù)據(jù)采集。經(jīng)過第一階段的數(shù)據(jù)收集工作,進入到數(shù)據(jù)整理的環(huán)節(jié)。數(shù)據(jù)整理,顧名思義,就是對收集到的數(shù)據(jù)進行處理,也可以成為數(shù)據(jù)預(yù)處理。在這個階段的主要工作就是做好數(shù)據(jù)處理前的所有準備工作,做好預(yù)備工作。
京東商城的用戶量每年都在快速遞增,大量用戶產(chǎn)生了大量的數(shù)據(jù)信息,所有這些用戶數(shù)據(jù)信息的存儲和管理也是至關(guān)重要的?,F(xiàn)在京東商城主要采用的是并行數(shù)據(jù)庫的方式來存儲和管理客戶的大數(shù)據(jù)。并行數(shù)據(jù)庫是高性能和高可用性的數(shù)據(jù)庫系統(tǒng),高性能體現(xiàn)在進行數(shù)據(jù)整理過程中,所需用的時間越來越短,處理的數(shù)據(jù)量也越來越大;高可用性指的就是并行數(shù)據(jù)庫的健壯性,換句話說,也就是并行數(shù)據(jù)庫在進行數(shù)據(jù)處理過沖的一個節(jié)點或多個節(jié)點部分失效或完全失效時,整個系統(tǒng)對外持續(xù)響應(yīng)的能力。
然而并行數(shù)據(jù)庫系統(tǒng)的最大缺點就是靈活性不好,彈性差,這種特點對于剛成立的公司企業(yè)、對于中小型企業(yè)來說運用起來是十分有利的。京東商城通過使用并行數(shù)據(jù)庫的方法,將客戶的詳細信息進行整理分類,便于后續(xù)的存儲及管理,同時也為下一步的數(shù)據(jù)分析奠定了基礎(chǔ)。
通過多種多樣的渠道收集的各種數(shù)據(jù),需要進行后續(xù)的整理和分析才能充分體現(xiàn)其價值,通過一定的分析得出的結(jié)果才能顯示出什么內(nèi)容是企業(yè)發(fā)展所需要的,并且使其產(chǎn)生一定的經(jīng)濟效益。對于京東商城而言,不同渠道收集到的數(shù)據(jù),數(shù)據(jù)分析方法也略有不同。京東商城通過多渠道和多種途徑來分析數(shù)據(jù),分析出用戶的特征、地域、教育程度、瀏覽器、網(wǎng)絡(luò)接入商、操作系統(tǒng)、終端類型等屬性,為大數(shù)據(jù)的運用做好準備。
4.2 大數(shù)據(jù)運用階段
在大數(shù)據(jù)運用階段主要包含三個過程,分別為:第一,運用大數(shù)據(jù)技術(shù)為客戶進行畫像;第二,對客戶信息進行完善補充,形成關(guān)系網(wǎng)或關(guān)系鏈;第三,制定銷售策略,將客戶分為不同的類型,通過郵件或短信,將個性化的信息推薦給客戶,更多地以客戶為中心,進行實時營銷和精準營銷。
用戶畫像可以很全面地展示一個用戶的全部信息,是B2C電子商務(wù)企業(yè)運用大數(shù)據(jù)的基礎(chǔ)。通過用戶畫像,京東商城無論是在精準營銷領(lǐng)域、搜索引擎領(lǐng)域,還是在廣告投放等其他各種應(yīng)用領(lǐng)域,都在原有的基礎(chǔ)上進一步提升精準度,提高了信息獲取的效率。京東商城通過一次購物記錄描繪出用戶的360畫像,但這個畫像相對來說是模糊的,不清晰的,需要通過更多的信息來核對,來彌補和完勝。大數(shù)據(jù)的關(guān)系網(wǎng)或關(guān)系鏈正好提供了這些數(shù)據(jù)和信息。
通過大數(shù)據(jù)的360度畫像和關(guān)系網(wǎng),京東商城對自己的客戶有了更詳細的了解和認識,為下一步大數(shù)據(jù)的銷售策略提供了極大的幫助和支持。通過大數(shù)據(jù)的分析,京東商城的營銷策略一方面以客戶為中心,另一方面借助于互聯(lián)網(wǎng)的優(yōu)勢進行實時營銷和精準營銷。
以客戶為中心,企業(yè)能更好地為客戶提供服務(wù),滿足客戶的合理需求,完成企業(yè)自身產(chǎn)品的銷售,并逐步在客戶中塑造出良好的企業(yè)信譽和口碑,為企業(yè)自身的長遠發(fā)展有很好的幫助和影響。京東商城對于用戶的網(wǎng)絡(luò)行為數(shù)據(jù)和用戶所發(fā)布的內(nèi)容數(shù)據(jù)非常重視,因為京東商城認為使用這些數(shù)據(jù)可以對客戶進行更加深入的了解并判斷客戶的潛在需求。因此京東商城每次推出新的產(chǎn)品或服務(wù)的時候,都可以快速的推向市場。而當產(chǎn)品和服務(wù)推出之后,京東商城會利用大數(shù)據(jù)技術(shù)對消費者在網(wǎng)站上留下的點擊、購買、評論和推薦等數(shù)據(jù)進行分析,對該款新產(chǎn)品或服務(wù)的受歡迎程度進行打分,還可以預(yù)測出消費者是否會為該產(chǎn)品或服務(wù)買單,根據(jù)預(yù)測的結(jié)果來決定是應(yīng)該繼續(xù)推廣這款產(chǎn)品或者服務(wù),或者是停止推向市場。
大數(shù)據(jù)時代用戶的多場景、多渠道、多樣化的需求已經(jīng)給傳統(tǒng)營銷產(chǎn)業(yè)帶來了影響和沖擊,也為營銷實時化帶來了新的機遇。面對這種機遇,京東商城應(yīng)該根據(jù)自身條件盡快制定有效的實時營銷策略,建立高效的實時營銷系統(tǒng),從而提高企業(yè)的服務(wù)水平,培育客戶的品牌忠誠度。
在大數(shù)據(jù)時代,隨著大數(shù)據(jù)技術(shù)的日趨成熟、數(shù)據(jù)量的日益增長、數(shù)據(jù)類型的豐富多樣使得更加深入的精準營銷成為一種可能和必然的發(fā)展趨勢,因此京東商城在進行營銷活動時需要依托大數(shù)據(jù),加大精準營銷在營銷活動中的比重,這樣能夠大幅降低營銷成本,顯著提高營銷效率。僅僅掌握大量的數(shù)據(jù)和信息并不具有太大的價值,只有對數(shù)據(jù)進行專業(yè)處理,挖掘出數(shù)據(jù)中間所隱藏的巨大價值才能體現(xiàn)大數(shù)據(jù)的戰(zhàn)略價值。而對大數(shù)據(jù)進行專業(yè)化處理和分析的最重要的方面就是進行數(shù)據(jù)挖掘。
通過本章的研究分析,可以看出京東商城在大數(shù)據(jù)時代下精準營銷的具體過程,歸納總結(jié)為兩個階段和三個過程。第一個階段就是京東商城進行數(shù)據(jù)收集和處理階段;第二個階段是京東商城運用大數(shù)據(jù)進行分析的階段。在京東商城運用大數(shù)據(jù)階段又分為三個過程:第一,京東商城利用大數(shù)據(jù)為客戶進行360度的客戶畫像;第二,京東商城對客戶信息進行完善補充,形成關(guān)系網(wǎng)或關(guān)系鏈。第三,京東商城制定銷售策略,將客戶分為不同的類型,通過郵件或短信,將個性化的信息推薦給客戶,更多地以客戶為中心,進行實時營銷和精準營銷。研究總結(jié)
本論文主要研究大數(shù)據(jù)在中國B2C電子商務(wù)精準營銷中的應(yīng)用研究,通過第四章的研究分析,本章節(jié)主要是從三個方面做出研究總結(jié),分別是研究結(jié)論、研究建議、研究局限與展望。
結(jié)合本論文第一章節(jié)中提出的兩個研究問題(如何通過大數(shù)據(jù)處理技術(shù),得到B2C電子商務(wù)企業(yè)所需的信息,以及如何將分析處理后的數(shù)據(jù)運用在B2C電子商務(wù)企業(yè)的精準營銷中),通過本論文的研究總結(jié),得出結(jié)論:京東商城主要采用的是并行數(shù)據(jù)庫的方式來對存儲和管理客戶的大數(shù)據(jù);京東商城受到QQ圈子的啟發(fā),將在京東商城網(wǎng)購用戶的所有購物記錄整合起來,形成京東商城網(wǎng)購用戶自己的購物圈子;將客戶分為不同的類型,將個性化的信息推薦給客戶,以客戶為中心,進行實時營銷和精準營銷。
在大數(shù)據(jù)時代,越來越多的用戶行為都會被記錄,這些都是數(shù)據(jù),而電商企業(yè)所擁有的用戶數(shù)據(jù)也會越來越多,面臨技術(shù)手段的漏洞,這些數(shù)據(jù)也同樣面臨泄露或被濫用的可能,將會對企業(yè)的形象、品牌和口碑等帶來重大的影響,營銷數(shù)據(jù)的安全和隱私權(quán)的保護已經(jīng)成為一個重要的課題和電商企業(yè)必須關(guān)注的問題。
隨著大數(shù)據(jù)時代的進一步到來,電商行業(yè)的不斷發(fā)展,新的大數(shù)據(jù)技術(shù)的涌現(xiàn),營銷理念的不斷變革,電商企業(yè)在大數(shù)據(jù)時代還會有新的營銷理念、營銷模式的不斷涌現(xiàn),需要進行更加客觀、更加全面的研究。本文的研究還有很多方面有必要做深入研究,可進一步細化研究對象,進一步深入案例研究,這也為筆者下一步進行研究指明了方向。
參考文獻:
[1]Author,Central C.,& Ambiga,Dhiraj D.(2013).Big Data,Big Analytics: Emerging Business Intelligence and Analytic Trends for Today's Businesses.[2]Frank,J.(2012).Ohlhorst.Big Data Analytics: Turning Big Data into Big Money(Wiley and SAS Business Series).[3]Bill Franks,B.(2012).Taming The Big Data Tidal Wave: Finding Opportunities in Huge Data Streams with Advanced Analytics.[4]Kotler,P.(2003).Marketing Management(11th ed.).Pearson Education,Inc.[5]Lapis(2012).Understanding Big Data.USA: The McGraw Hill Companies Viktor,MayerM.-Sch?nberger S.(2012).Big Data: A Revolution That Will Transform How We Live,Work,and Think.[6]萬后芬.市場營銷教程(第2版)[M].北京:高等教育出版社,2008.[7]王方華.市場營銷學[M].上海:上海人民出版社,2007.[8]王成文.電子商務(wù)環(huán)境下市場營銷的變化[J].法制與社會,2007,5.[9]王森林,吳志瑋.電子商務(wù)與企業(yè)成本競爭力[J].商場現(xiàn)代化,2007,6.[10]甘曉,李國杰.大數(shù)據(jù)成為信息科技新關(guān)注點[J].中國科學報,2012,3.[11]白云川.迎接大數(shù)據(jù)時代[J].中國制造業(yè)信息化,2011,12.[12]邊凌雁.4P營銷組合和7P營銷組合的比較研究[J].商場現(xiàn)代化,2007,2.[13]蘇蘭君.現(xiàn)代市場營銷能力培養(yǎng)與訓練[M].北京:北京郵電大學出版社,2005.[14]李鯉.數(shù)據(jù)挖掘在電子商務(wù)網(wǎng)絡(luò)營銷中的應(yīng)用研究[J].廣西大學報,2011,2.[15]楊涌斌.論精準營銷的實現(xiàn)[J].河南社會科學報,2012,4.[16]張玉祥.對市場營銷發(fā)展的新趨勢的研究[J].企業(yè)家天地,2007,4.[17]陳剛,李叢杉.關(guān)鍵時刻戰(zhàn)略:激活大數(shù)據(jù)營銷,2014.[18]陳娟.我國電子商務(wù)發(fā)展趨勢[J].創(chuàng)新科技,2006(8).[19]青虹宏.電子商務(wù)營銷[M].北京:中國鐵道出版社,2012.[20]高虹.淺談電子商務(wù)對傳統(tǒng)市場營銷的影響[J].電子商務(wù),2007,50.[21]涂子沛.大數(shù)據(jù)[M].廣西:廣西大學出版社,2012.[22]陶雪嬌,胡曉峰,劉洋.大數(shù)據(jù)研究綜述[J].系統(tǒng)仿真學報,2013,8.[23]舒爾茨.SIVA范式:搜索引擎觸發(fā)的營銷革命[M].北京:中信出版社,2014.導師:馬書明 副導師:戴友榆
第五篇:數(shù)據(jù)挖掘在圖書館用戶資源管理中的應(yīng)用研究_周倩
數(shù)據(jù)挖掘在圖書館用戶資源管理中的應(yīng)用研究
周 倩
(中科院文獻情報中心中科院研究生院,北京,100080)中42%的圖書館采用了數(shù)據(jù)挖掘技術(shù),而剩余的 58%的還沒有采用數(shù)據(jù)挖掘技術(shù)的圖書館中有 98%的表示它們將在不久的未來采用數(shù)據(jù)挖掘技 術(shù)。此外,調(diào)查還顯示,目前圖書館采用數(shù)據(jù)挖掘技 術(shù)的主要模式是基于用戶數(shù)據(jù)與基于用戶行為的數(shù) 據(jù)挖掘,各種數(shù)據(jù)挖掘軟件或工具的發(fā)展與成熟為 圖書館利用數(shù)據(jù)挖掘技術(shù)提供了便利的條件[8]。與國外圖書館相比,數(shù)據(jù)挖掘技術(shù)目前在我國 圖書館中并沒有大規(guī)模地使用,只有為數(shù)不多的圖 書館采用了此項技術(shù)。但國內(nèi)圖書館界已普遍認識 到,數(shù)據(jù)挖掘技術(shù)是圖書館現(xiàn)代化發(fā)展的關(guān)鍵技術(shù), 將對圖書館信息資源建設(shè)和個性化、知識化服務(wù)的 發(fā)展起到至關(guān)重要的作用。基于數(shù)據(jù)挖掘的圖書館用戶資源管理
從以上分析可看出,用戶資源管理是圖書館應(yīng)用 數(shù)據(jù)挖掘技術(shù)的主要領(lǐng)域之一,基于數(shù)據(jù)挖掘的圖書 館用戶資源管理主要體現(xiàn)兩層含義:一是圖書館利用 數(shù)據(jù)挖掘技術(shù)提高自身用戶資源管理的水平,實現(xiàn)分 析型用戶資源管理模式;二是圖書館以數(shù)據(jù)挖掘的需 求為牽引,組織好用戶資源管理的各項工作,從最初 用戶數(shù)據(jù)獲取開始就要以后期順利地實現(xiàn)數(shù)據(jù)挖掘 為目標,分析、設(shè)置好工作標準與內(nèi)容意義。3.1 用戶數(shù)據(jù)搜集與存儲
用戶資源管理的第一步工作是搜集用戶數(shù)據(jù)。要實現(xiàn)對用戶數(shù)據(jù)的有效挖掘的基本條件是要將搜 集到的數(shù)據(jù)以一致的模式存儲,建立用戶數(shù)據(jù)倉庫。因此,可以說用戶數(shù)據(jù)倉庫建設(shè)是圖書館用戶資源 管理的基礎(chǔ)。
(1)搜集用戶數(shù)據(jù)。用戶數(shù)據(jù)按數(shù)據(jù)類型可大
致分為用戶描述類數(shù)據(jù)、用戶需求類數(shù)據(jù)、用戶行為 類數(shù)據(jù)和用戶反饋類數(shù)據(jù)四個類。目前,隨著數(shù)字 圖書館的深入發(fā)展,圖書館獲取用戶數(shù)據(jù)的技術(shù)與 渠道不斷拓寬,既可以通過傳統(tǒng)方式獲取,也可以在 數(shù)字圖書館服務(wù)過程中獲取。
(2)構(gòu)建用戶數(shù)據(jù)倉庫。數(shù)據(jù)挖掘在集成、一
致、經(jīng)過清理的數(shù)據(jù)上才能更好地實現(xiàn),因此必須對 搜集到的圖書館用戶數(shù)據(jù),進行數(shù)據(jù)清理、數(shù)據(jù)變 換、數(shù)據(jù)集成和數(shù)據(jù)裝入等必要的數(shù)據(jù)處理過程,建 立一個整合的、結(jié)構(gòu)化的用戶數(shù)據(jù)倉庫,并及時更 新。圖書館通過多個渠道獲取的用戶數(shù)據(jù)中既有結(jié) 構(gòu)化的、也有非結(jié)構(gòu)化的。結(jié)構(gòu)化數(shù)據(jù)如用戶借閱 資料的數(shù)量、Web訪問日志等數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù) 如用戶反饋信息、用戶需求信息等。目前數(shù)據(jù)挖掘 的對象主要是結(jié)構(gòu)化數(shù)據(jù),因此,應(yīng)盡可能采用多種 方法對非結(jié)構(gòu)化的數(shù)據(jù)進行處理,將其轉(zhuǎn)化為結(jié)構(gòu) 化數(shù)據(jù)。
3.2 用戶多維特征分析和群體分類
(1)用戶多維特征分析。針對數(shù)據(jù)倉庫中的圖
書館用戶數(shù)據(jù),采用簡單關(guān)聯(lián)、時序關(guān)聯(lián)、因果關(guān)聯(lián) 等關(guān)聯(lián)分析與序列規(guī)則等數(shù)據(jù)分析與挖掘方法,對 圖書館用戶特征進行分析,挖掘用戶的隱性信息需 求,獲得對管理用戶與圖書館交互活動所必需的關(guān) 鍵性特征,并預(yù)測用戶未來的信息行為。圖書館用 戶特征主要由用戶的知識結(jié)構(gòu)特征、用戶的信息需 求特征和用戶的信息行為特征組成。知識結(jié)構(gòu)特征 說明了用戶目前對其專業(yè)領(lǐng)域或感興趣的專業(yè)領(lǐng)域 的知識掌握情況;用戶的信息需求特征表明了用戶 信息需求的專業(yè)范圍、載體、類型、語種以及用戶需 求的現(xiàn)有滿足程度等;用戶的信息行為特征反映了 用戶使用信息的習慣和模式,以及訪問信息的規(guī)律、特點和趨勢等。
(2)用戶群體聚類分類。對于圖書館用戶特征
進行多維分析的主要目標,并不是僅對單個用戶在 圖書館內(nèi)的信息行為進行分析,而是希望對具有相 似特征的用戶建立模型,進行圖書館用戶的有效分 類與聚類,發(fā)現(xiàn)各種虛擬用戶社區(qū),為針對不同類型 的用戶群提供不同的個性化服務(wù)方案[9]。對數(shù)據(jù)集 合的分類是數(shù)據(jù)挖掘技術(shù)的主要功能之一。圖書館 用戶分類是找出一組能夠描述用戶群體典型特征的 模型(或函數(shù)),以便能夠分類識別未知圖書館用戶 的歸屬或類別或預(yù)測未知圖書館用戶實例的歸屬類 別。分類挖掘所獲得的模型可以采用多種挖掘方式 獲得,按照難易程度分為分類規(guī)則(IF-THEN)、數(shù) 學公式(Mathematical formulae)、決策樹(Deci-siontrees)和神經(jīng)網(wǎng)絡(luò)等方法。圖書館用戶聚類分 析是把一組圖書館用戶按照相似性和差異性分為幾 個類別,其目的是使得屬于同一類別的用戶間的相 似性盡可能大,不同類別中的數(shù)據(jù)間的相似性盡可 能小。每一個聚類分析所獲得的圖書館用戶組可以 看成是一個同類別歸屬的用戶對象集合,然后對這 些同類別數(shù)據(jù)集通過分類,獲得相應(yīng)的分類預(yù)測模 型(規(guī)則)。由此,通過反復(fù)不斷地對所獲得的聚類 組進行聚類分析,可獲得初始圖書館用戶數(shù)據(jù)集合 的一個層次結(jié)構(gòu)模型。
3.3 面向用戶生命周期的數(shù)據(jù)挖掘
圖書館用戶生命周期主要由三個階段組成:用
戶的獲取、用戶的保持和用戶的流失。圖書館用戶 資源管理的主要目標是要最大限度地延長用戶的生 89 周 倩:數(shù)據(jù)挖掘在圖書館用戶資源管理中的應(yīng)用研究
Zhou Qian:A Study on the Application of Data Mining in the User Resources Management of Libraries 能真正以用戶使用的效益方式體現(xiàn)出來[2]。(2)用戶資源管理是圖書館個性化服務(wù)的重要基 礎(chǔ)。圖書館個性化信息服務(wù)的實質(zhì)就是一種以用戶 需求為中心的服務(wù)方式。一個圖書館的個性化服務(wù) 的通常步驟為:一是收集用戶的各種信息;二是分析 用戶數(shù)據(jù),創(chuàng)建符合用戶特性的訪問模式;三是結(jié)合 用戶特性,向用戶提供符合其特殊需求的個性化服 務(wù)[3]。圖書館用戶資源管理的本質(zhì)與目標是對用戶 信息及信息行為經(jīng)過深入的研究與分析,在滿足用戶 直接信息需求的基礎(chǔ)上,發(fā)掘用戶的潛在需求,使用 戶得到延伸的服務(wù)收益,以此給予用戶強烈的個性化 服務(wù)感受和“無縫式體驗”,提高滿意度,在實現(xiàn)用戶 價值最大化前提下實現(xiàn)用戶和圖書館雙贏。(3)用戶資源管理是圖書館知識管理的主要途
徑。圖書館實施知識管理的主要目的就是把最恰當 的知識在最恰當?shù)臅r候傳遞給最恰當?shù)挠脩?這正 是與用戶資源管理的最終目標相一致的。圖書館用 戶資源管理中含有大量可供共享的信息,包括用戶 基本信息、需求信息、服務(wù)活動信息、服務(wù)效果信息 以及在整個用戶生命周期中同圖書館交互活動的信 息。用戶的信息就像原材料一樣,被進行系統(tǒng)整理、分析后可以在圖書館內(nèi)部形成共享,從用戶信息變 為用戶知識?!坝脩簟?、“知識”和“管理”處在一個封 閉的循環(huán)系統(tǒng)中,圖書館運用這個循環(huán)體系中的用 戶知識,從與用戶的交互活動中實現(xiàn)其社會價值。1.3 圖書館用戶資源管理現(xiàn)狀分析
用戶資源管理在實際運作中可以大致分為兩個 層次。一是描述型用戶資源管理。它更多關(guān)注用戶 信息的組織和管理的簡單化,包括用戶與圖書館交 流渠道的集成,用戶信息的歸檔與簡單化的定量統(tǒng) 計。二是分析型用戶資源管理。這種管理方式強調(diào) 對用戶數(shù)據(jù)進行規(guī)范化存儲、提取、處理、解釋,產(chǎn)生 相關(guān)用戶知識報告??梢哉f,分析型的用戶資源管 理通過對用戶數(shù)據(jù)的分析,真實反映用戶的行為特 征和屬性,并據(jù)此進行各種推理和分析,為圖書館決 策和服務(wù)行為提供客觀依據(jù)。就目前而言,國內(nèi)大 多數(shù)圖書館用戶資源管理仍屬于描述型用戶資源管 理,還不能大范圍地實現(xiàn)對用戶屬性特征和信息行 為特征的整理和分析,不能廣泛地從用戶信息中發(fā) 現(xiàn)能夠反映其信息與服務(wù)需求特質(zhì)的模式或模型并 進行相關(guān)用戶的規(guī)?;诸惻c聚類。而數(shù)據(jù)挖掘技 術(shù)的發(fā)展與在圖書館的應(yīng)用則為圖書館解決上述問 題,突破描述型用戶資源管理的局限性,開展分析型 用戶資源管理提供了有力的支持和保障。2 圖書館研究與應(yīng)用數(shù)據(jù)挖掘技術(shù)概況
數(shù)據(jù)挖掘(Data Mining)是從大量、不完全、有噪
聲、模糊、隨機的數(shù)據(jù)中,抽取出隱含在其中的、人們 事先不知道但又是潛在的、有價值的知識、模型或規(guī) 則的過程,是一類深層次的數(shù)據(jù)分析方法。它根據(jù)數(shù) 據(jù)的微觀特征,發(fā)現(xiàn)其表征的、帶有普遍性的、較高層 次概念的知識,是信息優(yōu)勢成為知識優(yōu)勢的基礎(chǔ)工 程。數(shù)據(jù)挖掘是一門交叉學科,包括機器學習、數(shù)理
統(tǒng)計、神經(jīng)網(wǎng)絡(luò)、數(shù)據(jù)庫、模式識別、粗糙集、模糊數(shù)學 等相關(guān)技術(shù)。數(shù)據(jù)挖掘技術(shù)包括三個主要部分:算法 和技術(shù)、數(shù)據(jù)和建模能力;按照功能分為兩大類:預(yù)測 型(Predictive)模式和描述型(Descriptive)模式[4]。自20世紀90年代后期,圖書館開始高度關(guān)注 并研究數(shù)據(jù)挖掘技術(shù),并致力于將其引入到圖書館 的現(xiàn)代化建設(shè)中,有不少圖書館學專家提出了面向 圖書館的數(shù)據(jù)挖掘技術(shù)應(yīng)用理論與方法。例如: May Chau博士提出了幾種學術(shù)型圖書館與數(shù) 據(jù)挖掘的相關(guān)性理論模型,并且開發(fā)了圖書館網(wǎng)上 數(shù)據(jù)挖掘系統(tǒng),幫助用戶查找信息[5]。Kyle Baner-jee先生研究了數(shù)據(jù)挖掘技術(shù)幫助圖書館的不同方 式。在1998年,他提出,全文本、動態(tài)變化的數(shù)據(jù)庫 更適于采用數(shù)據(jù)挖掘技術(shù)[5]。2002年,Nicholson 和Stanton就圖書館中的數(shù)據(jù)挖掘過程提出了一個 專業(yè)術(shù)語“Bibliomining”(書目挖掘),指出書目挖掘 是在圖書館中,將數(shù)據(jù)挖掘技術(shù)、書目計量方法、統(tǒng) 計學理論與報告工具有機結(jié)合在一起,從基于行為 的信息與數(shù)據(jù)中獲取隱含的模式[5]。1996年,ALA 的《Library Administration and Management》期刊 出版了一期關(guān)于圖書館數(shù)據(jù)挖掘的特刊,當時在文 章中提到的數(shù)據(jù)主要來自圖書館自動化系統(tǒng),后來, 隨著數(shù)字圖書館的發(fā)展使得可以用于數(shù)據(jù)挖掘的數(shù) 據(jù)大幅度提高。鑒于此種情況,《Library Adminis-tration and Management》于2003年再次出版一期 以數(shù)字圖書館數(shù)據(jù)挖掘技術(shù)為主題的特刊,并列舉 了一些圖書館利用數(shù)據(jù)挖掘技術(shù)的實際案例[6]。2005年6月,OCLC公布了三個新的研究計劃,其 中之一就是數(shù)據(jù)挖掘研究計劃,其主要目標是通過 對WorldCat及其它數(shù)據(jù)源的挖掘,找到隱含的、有 用的信息,以此幫助圖書館管理者更好地做出館藏 建設(shè)與服務(wù)的決策[7]。
就圖書館利用數(shù)據(jù)挖掘技術(shù)的規(guī)模和應(yīng)用潛 力,研究圖書館聯(lián)盟(ARL)2003年曾做過一次調(diào) 查。ARL中的124個會員圖書館參加了此次調(diào)查, 其中有52%的圖書館反饋了調(diào)研表。調(diào)查顯示這 88 2006年第6期
圖書·情報·知識
[摘要] 用戶資源管理是現(xiàn)代圖書館資源管理的核心內(nèi)容,是圖書館實現(xiàn)個性化服務(wù)的重要基礎(chǔ)。
數(shù)據(jù)挖掘作為一種深層次的數(shù)據(jù)分析方法,可以從大量的數(shù)據(jù)中挖掘出反映用戶屬性特征和信息
行為特征的信息和規(guī)則,從而為圖書館用戶資源管理提供極大的幫助。基于數(shù)據(jù)挖掘的圖書館用
戶資源管理包括用戶數(shù)據(jù)搜集、用戶數(shù)據(jù)倉庫構(gòu)建、用戶多維特征分析和群體分類、面向用戶生命
周期的數(shù)據(jù)挖掘等主要內(nèi)容。
[關(guān)鍵詞] 數(shù)據(jù)挖掘 圖書館 用戶資源管理 應(yīng)用 個性化服務(wù) 數(shù)據(jù)倉庫 [中圖分類號]G252 [文獻標識碼]A [文章編號]1003-2797(2006)06-0087-04 [Abstract] The user resources management of libraries based on data mining should include the following methods:collecting user data,constructing user data warehouse,analyzing user char-acteristics and classifying group,data mining for the whole user life cycle and so on.[Key words] Data mining Library User resources management Application Personalized services Data warehouse 1 圖書館用戶資源管理
圖書館用戶是指利用圖書館信息資源及信息服 務(wù)的一切個體或群體。圖書館用戶資源是圖書館在 長期的信息服務(wù)過程中逐步形成的,是圖書館服務(wù) 能力在社會關(guān)系體系中的呈現(xiàn)。與圖書其它資源相 比,用戶資源有它特殊的性質(zhì),例如動態(tài)的伸縮性和 拓展性,對其它類型資源強烈的依附性。1.1 圖書館用戶資源管理的內(nèi)涵
在圖書館的發(fā)展歷程中,其資源的內(nèi)涵不斷拓 展,資源管理的內(nèi)容也不斷豐富。早期的圖書館資 源管理主要是指對有形的資產(chǎn)進行管理,包括文獻
資源管理、設(shè)備資源管理、人力資源管理、經(jīng)費管理、服務(wù)場所管理等。其后圖書館資源概念擴展到無形 資產(chǎn),包括服務(wù)品牌、圖書館文化等。但這種管理的 概念也僅僅局限于圖書館內(nèi)部。在現(xiàn)代信息社會, 伴隨著數(shù)字圖書館的發(fā)展,圖書館將“用戶”這種外 部資源納入到自身的資源管理體系中,把用戶作為 圖書館的一種資源進行有效的管理,并實現(xiàn)與圖書 館其它資源的整合。
從資源管理的理論層面上講,用戶資源管理是 對有使用價值的用戶資源,通過有效的管理與控制
[作者簡介] 周倩,女,1972年生,中國科學院文獻情報中 心及中科院研究生院在讀博士生,中國國防科技信息中心副 研究館員,發(fā)表論文20多篇。
程序,來實現(xiàn)圖書館某種服務(wù)效益的目標活動。從 實際工作層面上講,用戶資源管理主要是指對用戶 和圖書館之間的交互活動進行管理,具體包括用戶 信息管理、用戶服務(wù)活動管理、用戶后期支持管理。用戶信息管理的主要任務(wù)是系統(tǒng)地搜集、組織與存 儲用戶的相關(guān)信息,通過對用戶信息的統(tǒng)計和分析, 明確用戶信息需求和服務(wù)需求,劃分用戶群;用戶服 務(wù)活動管理則負責將對用戶在圖書館內(nèi)的信息行為 進行管理,針對用戶個性化需求,制定出圖書館相應(yīng) 的信息資源建設(shè)和服務(wù)策略,實現(xiàn)與用戶服務(wù)活動 相關(guān)的所有信息的集成;用戶后期支持管理主要是 對用戶接受服務(wù)后的情況進行跟蹤了解和分析,發(fā) 現(xiàn)問題,提出不斷修正和提高的方案[1]。1.2 用戶資源管理在圖書館中的重要地位(1)用戶資源管理是圖書館管理的核心。圖書
館管理主要包括三個方面:一是信息資源管理,即對 信息的搜集、加工、組織、開發(fā)利用等實施全壽命管 理;二是信息環(huán)境管理,主要包括信息技術(shù)管理、信 息政策管理、組織機構(gòu)管理、設(shè)施與經(jīng)費管理以及人 力資源管理;三是用戶資源管理。其中,用戶資源管 理是核心內(nèi)容,信息資源管理與信息環(huán)境管理必須 以用戶資源管理的要求和目標開展工作,因為只有 這樣才能將“用戶”作為一種資源有效地貫穿于圖書 館管理工作的全過程中,圖書館管理的效果與價值 87 命周期,抑制用戶的流失。
(1)用戶的獲取。圖書館要在競爭日益激烈的
服務(wù)環(huán)境中生存和壯大就需要不斷獲得新的用戶, 維持老的用戶,而當用戶數(shù)量不斷增長,用戶的細節(jié) 因素增多時,要為用戶提供更好的服務(wù)并贏得更多 的用戶只能依靠數(shù)據(jù)挖掘技術(shù)才能完成。利用數(shù)據(jù) 挖掘中的一些技術(shù)(如統(tǒng)計回歸、邏輯回歸、決策樹、神經(jīng)網(wǎng)絡(luò))揭示新用戶的行為習慣,生成預(yù)測模型和 建立評分模型,預(yù)測發(fā)現(xiàn)一些在不同情況下有相似 行為的新用戶,對潛在用戶進行篩選,有效增加服務(wù) 推廣效應(yīng),把潛在的用戶名單和這些用戶感興趣的 資源與服務(wù)系統(tǒng)地結(jié)合起來,為每一個用戶提供主 動化、個性化服務(wù),使?jié)撛谟脩艮D(zhuǎn)化為正式用戶,以 不斷地獲取新用戶。
(2)用戶的保持與流失。用戶保持與圖書館服
務(wù)能力息息相關(guān)。圖書館用戶流失的主要原因之一 就是圖書館對用戶的關(guān)懷和服務(wù)不夠,因此保持原 有用戶的工作對于圖書館來說變得非常重要。數(shù)據(jù) 挖掘技術(shù)可以對用戶數(shù)據(jù)倉庫中的大量數(shù)據(jù)進行分 析和處理,以識別、分析和評價用戶流失風險,分析 出用戶為什么會流失?哪些因素會導致用戶的流 失?用戶流失風險主要來自于何處?如何保留住圖 書館的高價值用戶?在用戶保持中,一般涉及3個 過程:首先,建立模型用來預(yù)測和識別潛在的流失用 戶;其次,通過數(shù)據(jù)挖掘識別潛在流失用戶中的圖書 館重要用戶;第三,利用聚類分析等方法對圖書館重 要用戶中的潛在流失者進行分析挖掘,識別其行為 模式等,從而有針對性地采取相應(yīng)的服務(wù)措施,保留 住用戶[10]。幾個相關(guān)問題的思考
首先是數(shù)據(jù)挖掘精度的問題。當前許多數(shù)據(jù)挖 掘系統(tǒng)或工具都是數(shù)據(jù)驅(qū)動的數(shù)據(jù)挖掘,僅僅是在 數(shù)據(jù)內(nèi)容上產(chǎn)生規(guī)則,因此來源數(shù)據(jù)的準確性對數(shù) 據(jù)挖掘精度將會產(chǎn)生很大的影響。此外,數(shù)據(jù)挖掘 不是萬能的,而只是一個工具,它只是幫助圖書館工 作人員更深入、更容易地分析數(shù)據(jù),它無法告訴你某 個用戶模型對你的圖書館的實際價值。而且數(shù)據(jù)挖 掘中得到的模型必須要在實踐中進行驗證。將本體 理論與數(shù)據(jù)挖掘技術(shù)相結(jié)合是有效解決數(shù)據(jù)挖掘精 度問題的一種途徑,因為基于用戶本體的數(shù)據(jù)挖掘 將利用領(lǐng)域知識或背景知識,可在高層次上進行數(shù) 據(jù)挖掘,產(chǎn)生高層次或多層次的規(guī)則,甚至是具有語 義意義的規(guī)則,同時可利用本體進行數(shù)據(jù)預(yù)處理,提 高待挖掘數(shù)據(jù)的質(zhì)量[11]。
其次是用戶隱私保護問題。在構(gòu)建用戶數(shù)據(jù)倉
庫的前期,對于用戶數(shù)據(jù)進行預(yù)處理階段要注意將顯 示用戶隱私的數(shù)據(jù)處理掉,例如對不愿透露自己IP 地址的用戶,如果日志記錄訪問時間為10:32/10-29-02,可以用102902-1032-A作為其IP地址代碼[12]。第三是數(shù)據(jù)挖掘系統(tǒng)嵌入圖書館其它應(yīng)用系統(tǒng) 的問題。目前數(shù)據(jù)挖掘技術(shù)正在不斷發(fā)展和成熟, 許多數(shù)據(jù)挖掘工具可以和圖書館相關(guān)應(yīng)用系統(tǒng)集 成,成為嵌入式的技術(shù)。參考文獻 周倩.構(gòu)建圖書館現(xiàn)代化CRM系統(tǒng).圖書情報工作, 2004(6)2 周倩.復(fù)合圖書館信息資源管理研究.圖書情報知識, 2003(5)3 馮是聰單松巍等.基于Web挖掘的個性化技術(shù)研究.Http://net.cs.pku.edu.cn/~webg/twpaper/fsch web personalize.pdf(2005-11-08)4 朱建平,張潤楚等.數(shù)據(jù)挖掘的發(fā)展及其特點.知識叢 林,2002(7)5 Scott Nicholson.Bibliomining for Automated Collection Development in a Digital Library Setting:Using Data Mining to Discover Web-Based Scholarly Research Works.Http://dlist.sir.arizona.edu/625/01/asisdiss.html(2005-10-26)6 Nicholson,Scott and Stanton,Jeffrey.Gaining Strategic Advantage through Bibliomining:Data Mining for Man-agement Decisions in Corporate,Special,Digital,and Traditional Libraries.Http://dlist.sir.arizona.edu/826/(2005-12-28)7 New OCLC Research projects:Curiouser,Data Mining, and WikiD(nee MetaWiki).Http://(2005-10-28)10楊中華.數(shù)據(jù)挖掘在客戶關(guān)系管理中的應(yīng)用研究.湖北 汽車工業(yè)學院學報,2004(1)11邢平平等.基于本體論的數(shù)據(jù)挖掘方法.計算機工程, 2001(5)12 Scott Nicholson.The Bibliomining Process:Data Ware-housing and Data Mining for Library Decision-Making(收稿日期:2006-04-10)