第一篇:C02 利用Python實(shí)現(xiàn)大數(shù)據(jù)分析與數(shù)據(jù)挖掘技術(shù)培訓(xùn)(5天)
Python實(shí)現(xiàn)大數(shù)據(jù)挖掘技術(shù)培訓(xùn)
【課程目標(biāo)】
Python已經(jīng)成為數(shù)據(jù)分析和數(shù)據(jù)挖掘的首選語(yǔ)言,作為除了Java、C/C++/C#外最受歡迎的語(yǔ)言。
本課程基于Python工具來(lái)實(shí)現(xiàn)大數(shù)據(jù)的數(shù)據(jù)分析和數(shù)據(jù)挖掘項(xiàng)目。基于業(yè)務(wù)問(wèn)題,在數(shù)據(jù)挖掘標(biāo)準(zhǔn)過(guò)程指導(dǎo)下,采用Python分析工具,實(shí)現(xiàn)數(shù)據(jù)挖掘項(xiàng)目的每一步操作,從數(shù)據(jù)預(yù)處理、數(shù)據(jù)建模、數(shù)據(jù)可視化,到最終數(shù)據(jù)挖掘結(jié)束,幫助學(xué)員掌握Python用于數(shù)據(jù)挖掘,提升學(xué)員的數(shù)據(jù)化運(yùn)營(yíng)及數(shù)據(jù)挖掘的能力。
通過(guò)本課程的學(xué)習(xí),達(dá)到如下目的:
1、全面掌握Python語(yǔ)言以及其編程思想。
2、掌握常用擴(kuò)展庫(kù)的使用,特別是數(shù)據(jù)挖掘相關(guān)庫(kù)的使用。
3、學(xué)會(huì)使用Python完成數(shù)據(jù)挖掘項(xiàng)目整個(gè)過(guò)程。
4、掌握利用Python實(shí)現(xiàn)可視化呈現(xiàn)。
5、掌握數(shù)據(jù)挖掘常見(jiàn)算法在Python中的實(shí)現(xiàn)?!臼谡n時(shí)間】
5天時(shí)間
(全部模塊講完需要5天時(shí)間,可以根據(jù)時(shí)間需求拆分內(nèi)容模塊)?!臼谡n對(duì)象】
業(yè)務(wù)支持部、IT系統(tǒng)部、大數(shù)據(jù)系統(tǒng)開(kāi)發(fā)部、大數(shù)據(jù)分析中心、網(wǎng)絡(luò)運(yùn)維部等相關(guān)技術(shù)人員。【學(xué)員要求】
課程為實(shí)戰(zhàn)課程,要求:
1、每個(gè)學(xué)員自備一臺(tái)便攜機(jī)(必須)。
2、便攜機(jī)中事先安裝好Excel 2010版本及以上。
3、便攜機(jī)中事先安裝好Python 3.6版本及以上。
注:講師現(xiàn)場(chǎng)提供開(kāi)源的安裝程序、擴(kuò)展庫(kù),以及現(xiàn)場(chǎng)分析的數(shù)據(jù)源。
【授課方式】
語(yǔ)言基礎(chǔ) +挖掘模型 +案例演練+開(kāi)發(fā)實(shí)踐+可視化呈現(xiàn)
采用互動(dòng)式教學(xué),圍繞業(yè)務(wù)問(wèn)題,展開(kāi)數(shù)據(jù)分析過(guò)程,全過(guò)程演練操作,讓學(xué)員在分析、分享、講授、總結(jié)、自我實(shí)踐過(guò)程中獲得能力提升?!菊n程大綱】
第一部分:Python語(yǔ)言基礎(chǔ)
目的:掌握基本的Python編程思想與編程語(yǔ)句,熟悉常用數(shù)據(jù)結(jié)構(gòu)的操作
1、Python簡(jiǎn)介
2、開(kāi)發(fā)環(huán)境搭建 ? Python的安裝 ? 擴(kuò)展庫(kù)的安裝
3、掌握Python的簡(jiǎn)單數(shù)據(jù)類(lèi)型 ?
字符串的使用及操作 ? 整數(shù)、浮點(diǎn)數(shù)
4、掌握基本語(yǔ)句:
? if、while、for、print等 ? 基本運(yùn)算:
? 函數(shù)定義、參數(shù)傳遞、返回值
5、掌握復(fù)雜的數(shù)據(jù)類(lèi)型:列表/元組
? 列表操作:訪問(wèn)、添加、修改、刪除、排序 ? 列表切片、復(fù)制等 ? 列表相關(guān)的函數(shù)、方法 ? 元組的應(yīng)用
6、復(fù)雜數(shù)據(jù)類(lèi)型:字典 ? 創(chuàng)建、訪問(wèn)、修改、刪除、遍歷 ? 字典函數(shù)和方法
7、復(fù)雜數(shù)據(jù)類(lèi)型:集合
8、掌握面向?qū)ο缶幊趟枷?? 創(chuàng)建類(lèi)、繼承類(lèi) ? 模塊
9、函數(shù)定義、參數(shù)傳遞、返回值10、11、標(biāo)準(zhǔn)庫(kù)與擴(kuò)展庫(kù)的導(dǎo)入 異常處理:try-except塊
演練:基本的Python編程語(yǔ)句
第二部分:Python語(yǔ)言與數(shù)據(jù)挖掘庫(kù)
目的:掌握數(shù)據(jù)集結(jié)構(gòu)及基本處理方法,進(jìn)一步鞏固Python語(yǔ)言
1、數(shù)據(jù)挖掘常用擴(kuò)展庫(kù)介紹 ? Numpy數(shù)組處理支持 ? Scipy矩陣計(jì)算模塊
? Matplotlib數(shù)據(jù)可視化工具庫(kù) ? Pandas數(shù)據(jù)分析和探索工具 ? StatsModels統(tǒng)計(jì)建模庫(kù) ? Scikit-Learn機(jī)器學(xué)習(xí)庫(kù) ? Keras深度學(xué)習(xí)(神經(jīng)網(wǎng)絡(luò))庫(kù) ? Gensim文本挖掘庫(kù)
2、數(shù)據(jù)集讀取與操作:讀取、寫(xiě)入 ? 讀寫(xiě)文本文件 ? 讀寫(xiě)CSV文件 ? 讀寫(xiě)Excel文件 ? 從數(shù)據(jù)庫(kù)獲取數(shù)據(jù)集
3、數(shù)據(jù)集的核心數(shù)據(jù)結(jié)構(gòu)(Pandas數(shù)據(jù)結(jié)構(gòu))? DataFrame對(duì)象及處理方法 ? Series對(duì)象及處理方法
演練:用Python實(shí)現(xiàn)數(shù)據(jù)的基本統(tǒng)計(jì)分析功能
第三部分:數(shù)據(jù)可視化處理
目的:掌握作圖擴(kuò)展庫(kù),實(shí)現(xiàn)數(shù)據(jù)可視化
1、常用的Python作圖庫(kù) ? Matplotlib庫(kù) ? Pygal庫(kù)
2、實(shí)現(xiàn)分類(lèi)匯總
演練:按性別統(tǒng)計(jì)用戶(hù)人數(shù)
演練:按產(chǎn)品+日期統(tǒng)計(jì)各產(chǎn)品銷(xiāo)售金額
3、各種圖形的畫(huà)法 ? 直方圖 ? 餅圖 ? 折線圖 ? 散點(diǎn)圖
4、繪圖的美化技巧
演練:用Python庫(kù)作圖來(lái)實(shí)現(xiàn)產(chǎn)品銷(xiāo)量分析,并可視化
第四部分:數(shù)據(jù)挖掘基礎(chǔ) 目的:掌握數(shù)據(jù)挖掘標(biāo)準(zhǔn)流程
1、數(shù)據(jù)挖掘概述
2、數(shù)據(jù)挖掘的標(biāo)準(zhǔn)流程(CRISP-DM)? 商業(yè)理解 ? 數(shù)據(jù)準(zhǔn)備 ? 數(shù)據(jù)理解 ? 模型建立 ? 模型評(píng)估 ? 模型應(yīng)用
3、數(shù)據(jù)挖掘常用任務(wù)與算法
案例:用大數(shù)據(jù)實(shí)現(xiàn)精準(zhǔn)營(yíng)銷(xiāo)的項(xiàng)目過(guò)程
第五部分:數(shù)據(jù)理解和數(shù)據(jù)準(zhǔn)備
目的:掌握數(shù)據(jù)預(yù)處理的基本環(huán)節(jié),以及Python的實(shí)現(xiàn)
1、數(shù)據(jù)預(yù)處理
? 異常值處理:3σ準(zhǔn)則,IQR準(zhǔn)則 ? 缺失值插補(bǔ):均值、拉格朗日插補(bǔ) ? 數(shù)據(jù)篩選/抽樣 ? 數(shù)據(jù)的離散化處理 ? 變量變換、變量派生
2、數(shù)據(jù)的基本分析
? 相關(guān)分析:原理、公式、應(yīng)用 ? 方差分析:原理、公式、應(yīng)用 ? 卡方分析:原理、公式、應(yīng)用 ? 主成分分析:降維
案例:用Python實(shí)現(xiàn)數(shù)據(jù)預(yù)處理及數(shù)據(jù)準(zhǔn)備
第四部分:分類(lèi)預(yù)測(cè)模型實(shí)戰(zhàn)
1、常見(jiàn)分類(lèi)預(yù)測(cè)的模型與算法
2、如何評(píng)估分類(lèi)預(yù)測(cè)模型的質(zhì)量 ? 查準(zhǔn)率 ? 查全率 ? ROC曲線
3、邏輯回歸分析模型 ? 邏輯回歸的原理 ? 邏輯回歸建模的步驟 ? 邏輯回歸結(jié)果解讀
案例:用sklearn庫(kù)實(shí)現(xiàn)銀行貸款違約預(yù)測(cè)
4、決策樹(shù)模型
? 決策樹(shù)分類(lèi)的原理 ? 決策樹(shù)的三個(gè)關(guān)鍵問(wèn)題 ? 決策樹(shù)算法與實(shí)現(xiàn) 案例:電力竊漏用戶(hù)自動(dòng)識(shí)別
5、人工神經(jīng)網(wǎng)絡(luò)模型(ANN)? 神經(jīng)網(wǎng)絡(luò)概述 ? 神經(jīng)元工作原理
? 常見(jiàn)神經(jīng)網(wǎng)絡(luò)算法(BP、LM、RBF、FNN等)案例:神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)產(chǎn)品銷(xiāo)量
6、支持向量機(jī)(SVM)? SVM基本原理 ? 維災(zāi)難與核心函數(shù)
案例:基于水質(zhì)圖像的水質(zhì)評(píng)價(jià)
7、貝葉斯分析 ? 條件概率 ? 常見(jiàn)貝葉斯網(wǎng)絡(luò)
第五部分:數(shù)值預(yù)測(cè)模型實(shí)戰(zhàn)
1、常用數(shù)值預(yù)測(cè)的模型 ? 通用預(yù)測(cè)模型:回歸模型
? 季節(jié)性預(yù)測(cè)模型:相加、相乘模型 ? 新產(chǎn)品預(yù)測(cè)模型:珀?duì)柷€與龔鉑茲曲線
2、回歸分析概念
3、常見(jiàn)回歸分析類(lèi)別
第六部分:聚類(lèi)分析(客戶(hù)細(xì)分)實(shí)戰(zhàn)
1、客戶(hù)細(xì)分常用方法
2、聚類(lèi)分析(Clustering)? 聚類(lèi)方法原理介紹及適用場(chǎng)景 ? 常用聚類(lèi)分析算法 ? 聚類(lèi)算法的評(píng)價(jià)
案例:使用SKLearn實(shí)現(xiàn)K均值聚類(lèi) 案例:使用TSNE實(shí)現(xiàn)聚類(lèi)可視化
3、RFM模型分析
? RFM模型,更深入了解你的客戶(hù)價(jià)值 ? RFM模型與市場(chǎng)策略 案例:航空公司客戶(hù)價(jià)值分析
第七部分:關(guān)聯(lián)規(guī)則分析實(shí)戰(zhàn)
1、關(guān)聯(lián)規(guī)則概述
2、常用關(guān)聯(lián)規(guī)則算法
3、時(shí)間序列分析
案例:使用apriori庫(kù)實(shí)現(xiàn)關(guān)聯(lián)分析 案例:中醫(yī)證型關(guān)聯(lián)規(guī)則挖掘
第八部分:案例實(shí)戰(zhàn)(學(xué)員主導(dǎo),老師現(xiàn)場(chǎng)指導(dǎo))
1、電商用戶(hù)行為分析及服務(wù)推薦
2、基于基站定位數(shù)據(jù)的商圈分析
結(jié)束:課程總結(jié)與問(wèn)題答疑。
第二篇:A31 大數(shù)據(jù)分析與數(shù)據(jù)挖掘能力提升實(shí)戰(zhàn)(5天)
大數(shù)據(jù)分析與數(shù)據(jù)挖掘能力提升實(shí)戰(zhàn)
【課程目標(biāo)】
本課程為綜合課程,包含基本的數(shù)據(jù)分析,到高級(jí)的數(shù)據(jù)挖掘,數(shù)據(jù)建模,以及大數(shù)據(jù)在市場(chǎng)營(yíng)銷(xiāo)方面的應(yīng)用,幫助企業(yè)的相關(guān)人員提升數(shù)據(jù)分析的綜合能力,解決業(yè)務(wù)問(wèn)題和企業(yè)決策問(wèn)題。
本課程從實(shí)際的業(yè)務(wù)需求出發(fā)(特別是市場(chǎng)營(yíng)銷(xiāo)領(lǐng)域的業(yè)務(wù)),結(jié)合行業(yè)的典型應(yīng)用特點(diǎn),圍繞實(shí)際的商業(yè)問(wèn)題,對(duì)數(shù)據(jù)分析及數(shù)據(jù)挖掘技術(shù)進(jìn)行了全面的介紹(從數(shù)據(jù)收集與處理,到數(shù)據(jù)分析與挖掘,再到數(shù)據(jù)可視化和報(bào)告撰寫(xiě)),通過(guò)大量的操作演練,幫助學(xué)員掌握數(shù)據(jù)分析和數(shù)據(jù)挖掘的思路、方法、表達(dá)、工具,從大量的企業(yè)經(jīng)營(yíng)數(shù)據(jù)中進(jìn)行分析,挖掘客戶(hù)行為特點(diǎn),幫助運(yùn)營(yíng)團(tuán)隊(duì)深入理解業(yè)務(wù)運(yùn)作,以達(dá)到提升學(xué)員的數(shù)據(jù)綜合分析能力,支撐運(yùn)營(yíng)決策的目的。
通過(guò)本課程的學(xué)習(xí),達(dá)到如下目的:
1、了解大數(shù)據(jù)的核心理念,以及大數(shù)據(jù)思維。
2、掌握數(shù)據(jù)分析的基礎(chǔ)知識(shí),掌握數(shù)據(jù)分析的基本過(guò)程。
3、學(xué)會(huì)數(shù)據(jù)分析的框架和思路,掌握常用數(shù)據(jù)分析方法來(lái)分析問(wèn)題。
4、掌握數(shù)據(jù)挖掘,數(shù)據(jù)建模,以及模型優(yōu)化,能夠解決商業(yè)問(wèn)題。
5、掌握常用分析和挖掘工具,學(xué)習(xí)使用Excel、SPSS、Modeler工具來(lái)做數(shù)據(jù)分析、數(shù)據(jù)挖掘,以及數(shù)據(jù)預(yù)處理和建模。
【授課時(shí)間】
5天時(shí)間
【授課對(duì)象】
市場(chǎng)營(yíng)銷(xiāo)部、業(yè)務(wù)支撐、經(jīng)營(yíng)分析部、網(wǎng)管/網(wǎng)優(yōu)中心、數(shù)據(jù)分析部等對(duì)業(yè)務(wù)數(shù)據(jù)分析有要求的相關(guān)人員。
【學(xué)員要求】
1、每個(gè)學(xué)員自備一臺(tái)便攜機(jī)(必須)。
2、便攜機(jī)中事先安裝好Excel 2010版本及以上(常規(guī)分析)。
3、便攜機(jī)中事先安裝好IBM SPSS Statistics v19版本及以上(數(shù)據(jù)挖掘)。
4、便攜機(jī)中事先安裝好IBM SPSS Modeler v19版本及以上(數(shù)據(jù)預(yù)處理和建模)。注:講師可以提供試用版本軟件及分析數(shù)據(jù)源。
【授課方式】
數(shù)據(jù)分析/挖掘基礎(chǔ) + 思路分解 + 方法講解 + 實(shí)際業(yè)務(wù)問(wèn)題分析 + 工具操作 采用互動(dòng)式教學(xué),圍繞業(yè)務(wù)問(wèn)題,展開(kāi)數(shù)據(jù)分析過(guò)程,全過(guò)程演練操作,讓學(xué)員在分析、分享、講授、總結(jié)、自我實(shí)踐過(guò)程中獲得能力提升。
不空談理論,不空談方法,以業(yè)務(wù)分析為核心,以解決問(wèn)題為目的。
一切不以解決業(yè)務(wù)問(wèn)題的數(shù)據(jù)分析/挖掘都是耍流氓!
【課程大綱】
第一部分:解構(gòu)大數(shù)據(jù)
1、大數(shù)據(jù)時(shí)代已經(jīng)來(lái)臨
2、大數(shù)據(jù)的三層理解
? 理論層:以數(shù)據(jù)為基礎(chǔ) ? 技術(shù)層:以平臺(tái)為手段 ? 應(yīng)用層:以應(yīng)用為導(dǎo)向
3、大數(shù)據(jù)的4V特征
4、大數(shù)據(jù)的核心價(jià)值
? 發(fā)現(xiàn)業(yè)務(wù)運(yùn)行規(guī)律 ? 預(yù)測(cè)事物未來(lái)
5、大數(shù)據(jù)在各行業(yè)是如何應(yīng)用的
? 醫(yī)療衛(wèi)生 ? 政治軍事 ? 行政執(zhí)法 ? 金融銀行 ? ……
6、數(shù)據(jù)分析的核心理念
? 數(shù)據(jù)變化意味著業(yè)務(wù)變化 ? 數(shù)據(jù)間關(guān)系意味著因素間的關(guān)系
7、大數(shù)據(jù)戰(zhàn)略 ? 大數(shù)據(jù)成為企業(yè)的核心資產(chǎn) ? 大數(shù)據(jù)成為業(yè)務(wù)創(chuàng)新的核心引擎 ? 從數(shù)據(jù)化運(yùn)營(yíng)到運(yùn)營(yíng)數(shù)據(jù)
8、大數(shù)據(jù)的思維變革
? 定量思維 ? 相關(guān)思維 ? 實(shí)驗(yàn)思維 ? ……
9、大數(shù)據(jù)的商業(yè)模式分析
10、大數(shù)據(jù)的人才培養(yǎng)
第二部分:數(shù)據(jù)分析篇
問(wèn)題:數(shù)據(jù)分析是神馬?數(shù)據(jù)分析基本過(guò)程?
1、數(shù)據(jù)分析面臨的常見(jiàn)問(wèn)題
2、認(rèn)識(shí)數(shù)據(jù)分析
? 什么是數(shù)據(jù)分析 ? 數(shù)據(jù)分析的三大作用 ? 數(shù)據(jù)分析的三大類(lèi)別 案例:喜歡賺“差價(jià)”的營(yíng)業(yè)員
3、數(shù)據(jù)分析的六步曲
? 明確目的 ? 收集數(shù)據(jù)
? 處理數(shù)據(jù)(預(yù)處理)? 分析數(shù)據(jù)
? 呈現(xiàn)數(shù)據(jù)(可視化)? 撰寫(xiě)報(bào)告
案例:終端精準(zhǔn)營(yíng)銷(xiāo)項(xiàng)目過(guò)程討論
4、數(shù)據(jù)分析師需要什么樣的能力 ? 懂業(yè)務(wù)、懂管理、懂分析、懂工具、懂呈現(xiàn)
5、大數(shù)據(jù)應(yīng)用系統(tǒng)的四層結(jié)構(gòu)
? 數(shù)據(jù)基礎(chǔ)層、數(shù)據(jù)模型層、業(yè)務(wù)模型層、業(yè)務(wù)應(yīng)用層
6、數(shù)據(jù)分析方法的層次
? 基本分析法(對(duì)比/分組/結(jié)構(gòu)/趨勢(shì)/…)? 綜合分析法(交叉/綜合評(píng)價(jià)/杜邦/漏斗/…)? 高級(jí)分析法(相關(guān)/方差/驗(yàn)證/回歸/時(shí)序/…)? 數(shù)據(jù)挖掘法(聚類(lèi)/分類(lèi)/關(guān)聯(lián)/RFM模型/…)
7、基本分析方法及其適用場(chǎng)景
? 對(duì)比分析(查看數(shù)據(jù)差距)
演練:按性別、省份、產(chǎn)品進(jìn)行分類(lèi)統(tǒng)計(jì) ? 分組分析(查看數(shù)據(jù)分布)演練:銀行信用卡月消費(fèi)分析(銀行)演練:呼叫中心接聽(tīng)電話效率分析(呼叫中心)演練:客服中心科學(xué)排班人數(shù)需求分析(客服中心)演練:客戶(hù)年齡分布分析 案例:排班后面隱藏的貓膩 ? 結(jié)構(gòu)分析(評(píng)估事物構(gòu)成)案例:用戶(hù)市場(chǎng)占比結(jié)構(gòu)分析
案例:物流費(fèi)用占比結(jié)構(gòu)分析(物流)? 趨勢(shì)分析(發(fā)現(xiàn)變化規(guī)律)案例:破解零售店銷(xiāo)售規(guī)律
8、綜合分析方法及其適用場(chǎng)景
? 交叉分析(兩維分析)演練:用戶(hù)性別+地域分布分析 ? 綜合評(píng)價(jià)法(多維指標(biāo)歸一)演練:人才選拔評(píng)價(jià)分析(HR)案例:南京丈母娘選女婿分析表格
? 杜邦分析法(關(guān)鍵因素分析-財(cái)務(wù)數(shù)據(jù)分析)案例:電信市場(chǎng)占有率分析
演練:服務(wù)水平提升分析(呼叫中心)案例:銷(xiāo)售額的影響因素分析(零售店/電商)
? 漏斗分析法(關(guān)鍵流程環(huán)節(jié)分析-流失率與轉(zhuǎn)化率分析)演練:終端銷(xiāo)售流程分析(電信營(yíng)業(yè)廳)案例:業(yè)務(wù)辦理流程優(yōu)化分析(銀行營(yíng)業(yè)廳)案例:物流配送效率分析(物流)
? 矩陣分析法(產(chǎn)品策略分析-象限圖分析法)案例:工作安排評(píng)估 案例:HR人員考核與管理 案例:波士頓產(chǎn)品策略分析
9、最合適的分析方法才是硬道理。
10、數(shù)據(jù)分析思路(如何細(xì)化業(yè)務(wù)問(wèn)題)
案例:利用5W2H來(lái)分析產(chǎn)品銷(xiāo)售情況
第三部分:概率與數(shù)理統(tǒng)計(jì)篇
1、數(shù)據(jù)統(tǒng)計(jì)指標(biāo)
? 集中程度:平均數(shù)/中位數(shù)/眾數(shù)
? 離散程度:全距/四分位距/標(biāo)準(zhǔn)差/四分位 ? 分布形態(tài):偏度/峰度 ? 正確理解各指標(biāo)的含義 案例:如何用Excel計(jì)算統(tǒng)計(jì)指標(biāo) 案例:如何用Excel畫(huà)直方圖
2、概率論基本知識(shí)
? 隨機(jī)事件與概率 ? 古典概率與條件概率 ? 全概率公式與貝葉斯公司 ? 概率分布函數(shù) ? 數(shù)學(xué)期望與方差 ? 大數(shù)定律與中心極限定理
3、參數(shù)檢驗(yàn)分析
? 假設(shè)檢驗(yàn)概述 ? 假設(shè)檢驗(yàn)步驟
? 樣本T檢驗(yàn)(單樣本、兩獨(dú)立樣本、兩配對(duì)樣本)及適用場(chǎng)景 案例:電信運(yùn)營(yíng)商ARPU值評(píng)估分析(單樣本)案例:營(yíng)銷(xiāo)活動(dòng)前后分析(兩配對(duì)樣本)案例:吸煙與膽固醇升高的分析(兩獨(dú)立樣本)
4、非參數(shù)檢驗(yàn)分析
? 非參數(shù)檢驗(yàn)概述
? 樣本檢驗(yàn)(單樣本、兩獨(dú)立樣本、兩相關(guān)樣本)案例:產(chǎn)品合格率檢驗(yàn)(單樣本-二項(xiàng)分布)
案例:訓(xùn)練新方法有效性檢驗(yàn)(兩配對(duì)樣本-符號(hào)/秩檢驗(yàn))案例:促銷(xiāo)方式效果檢驗(yàn)(多相關(guān)樣本-Friedman檢驗(yàn))案例:客戶(hù)滿(mǎn)意度差異檢驗(yàn)(多相關(guān)樣本-Cochran Q檢驗(yàn))
第四部分:高級(jí)數(shù)據(jù)分析
本篇包含三大內(nèi)容:影響因素分析,數(shù)值預(yù)測(cè)模型。
1、相關(guān)分析(衡量變量間的的相關(guān)性)
問(wèn)題:營(yíng)銷(xiāo)費(fèi)用會(huì)影響銷(xiāo)售額嗎?影響程度大嗎? ? 什么是相關(guān)關(guān)系
? 相關(guān)系數(shù):衡量相關(guān)程度的指標(biāo) ? 相關(guān)分析的步驟與計(jì)算公式 ? 相關(guān)分析應(yīng)用場(chǎng)景 演練:體重與腰圍的關(guān)系 演練:營(yíng)銷(xiāo)費(fèi)用與銷(xiāo)售額的關(guān)系
2、方差分析 問(wèn)題:哪些才是影響銷(xiāo)量的關(guān)鍵因素? ? 方差分析解決什么問(wèn)題
? 方差分析種類(lèi):?jiǎn)我蛩?雙因素可重復(fù)/雙因素?zé)o重復(fù) ? 方差分析的應(yīng)用場(chǎng)景 ? 如何解決方差分析結(jié)果
演練:產(chǎn)品擺放位置與銷(xiāo)量有關(guān)嗎?(單因素方差分析)案例:2015年大學(xué)生工資與父母職業(yè)的關(guān)系
3、回歸分析(預(yù)測(cè))
問(wèn)題:如何預(yù)測(cè)未來(lái)的銷(xiāo)售量(定量分析)? ? 回歸分析的基本原理和應(yīng)用場(chǎng)景
? 回歸分析的種類(lèi)(一元/多元、線性/曲線)? 回歸分析的幾種常用方法 ? 回歸分析的五個(gè)步驟與結(jié)果解讀
? 回歸預(yù)測(cè)結(jié)果評(píng)估(如何評(píng)估預(yù)測(cè)質(zhì)量,如何選擇最佳回歸模型)演練:散點(diǎn)圖找推廣費(fèi)用與銷(xiāo)售額的關(guān)系(一元線性回歸)演練:推廣費(fèi)用、辦公費(fèi)用與銷(xiāo)售額的關(guān)系(多元線性回歸)演練:最佳選擇的預(yù)測(cè)銷(xiāo)售額的回歸模型(一元曲線回歸)? 回歸分析(帶分類(lèi)變量)案例:汽車(chē)銷(xiāo)量的季度預(yù)測(cè)
演練:工齡、性別與終端銷(xiāo)量的關(guān)系 討論:終端銷(xiāo)售預(yù)測(cè)分析(營(yíng)業(yè)廳)
4、時(shí)序分析(預(yù)測(cè))
問(wèn)題:隨著時(shí)間變化,未來(lái)的銷(xiāo)量變化趨勢(shì)如何? ? 時(shí)序分析的應(yīng)用場(chǎng)景(基于時(shí)間的變化規(guī)律)? 移動(dòng)平均的預(yù)測(cè)原理 ? 指數(shù)平滑的預(yù)測(cè)原理
案例:銷(xiāo)售額的時(shí)序預(yù)測(cè)及評(píng)估 演練:產(chǎn)品銷(xiāo)量預(yù)測(cè)及評(píng)估 第五部分:建立預(yù)測(cè)模型與模型優(yōu)化(Excel工具)
本篇包含內(nèi)容:數(shù)值預(yù)測(cè)建模、模型優(yōu)化,季節(jié)性預(yù)測(cè)模型、S曲線預(yù)測(cè)模型。
1、常見(jiàn)預(yù)測(cè)模型類(lèi)別
? 數(shù)值預(yù)測(cè) ? 分類(lèi)預(yù)測(cè)
2、回歸分析建模
? 尋找最佳回歸擬合線來(lái)判斷和預(yù)測(cè)
? 模型優(yōu)化七步法(因素、異常值、相互作用、非線性關(guān)系…)案例:汽車(chē)銷(xiāo)量預(yù)測(cè)分析
案例:工齡、性別與銷(xiāo)量的回歸分析
3、季節(jié)性預(yù)測(cè)模型
? 季節(jié)性預(yù)測(cè)模型的參數(shù)
? 常用季節(jié)性預(yù)測(cè)模型(相加模型、相乘模型)案例:美國(guó)航空旅客里程的季節(jié)性趨勢(shì)分析 案例:產(chǎn)品銷(xiāo)售季節(jié)性趨勢(shì)預(yù)測(cè)分析
4、新產(chǎn)品銷(xiāo)量預(yù)測(cè)與S曲線
? 如何評(píng)估銷(xiāo)量增長(zhǎng)的拐點(diǎn)
? 常用模型(珀?duì)柷€、龔鉑茲曲線)
案例:預(yù)測(cè)IPad產(chǎn)品的銷(xiāo)售增長(zhǎng)拐點(diǎn),以及銷(xiāo)量上限
5、規(guī)劃求解與自定義模型 案例:大數(shù)據(jù)下的產(chǎn)品定價(jià)方法
案例:如何對(duì)客流量進(jìn)行建模及模型優(yōu)化
第五部分:數(shù)據(jù)挖掘篇(SPSS工具使用)
1、數(shù)據(jù)挖掘概述
2、數(shù)據(jù)挖掘的標(biāo)準(zhǔn)流程
? 商業(yè)理解 ? 數(shù)據(jù)準(zhǔn)備 ? 數(shù)據(jù)理解 ? 模型建立 ? 模型評(píng)估 ? 模型應(yīng)用
案例:通信客戶(hù)流失分析及預(yù)警模型
3、聚類(lèi)分析(市場(chǎng)細(xì)分與客戶(hù)細(xì)分)
問(wèn)題:如何實(shí)現(xiàn)客戶(hù)細(xì)分,開(kāi)發(fā)符合細(xì)分市場(chǎng)的新產(chǎn)品? ? 聚類(lèi)分析及其作用 ? 聚類(lèi)分析的種類(lèi) ? 層次聚類(lèi):發(fā)現(xiàn)多個(gè)類(lèi)別 ? R型聚類(lèi)與Q型聚類(lèi)的區(qū)別
演練:中國(guó)省市經(jīng)濟(jì)發(fā)展情況分析(Q型聚類(lèi))演練:裁判評(píng)分的標(biāo)準(zhǔn)衡量(R型聚類(lèi))? K均值聚類(lèi)
演練:寶潔公司如何選擇新產(chǎn)品試銷(xiāo)區(qū)域? 演練:如何評(píng)選優(yōu)秀員工?
4、分類(lèi)分析
案例:美國(guó)零售商(Target)如何預(yù)測(cè)少女懷孕
問(wèn)題:如何提取客戶(hù)流失者、拖欠貨款者的特征?如何預(yù)測(cè)其流失的概率?
? 分類(lèi)與聚類(lèi) ? 決策樹(shù)分類(lèi)的原理 ? 如何評(píng)估分類(lèi)性能
演練:識(shí)別銀行欠貨風(fēng)險(xiǎn),提取欠貨者的特征
5、關(guān)聯(lián)分析
案例:啤酒與尿布、颶風(fēng)與蛋撻
問(wèn)題:購(gòu)買(mǎi)面包的人是否也會(huì)購(gòu)買(mǎi)牛奶?他們同時(shí)購(gòu)買(mǎi)哪些產(chǎn)品? ? 關(guān)聯(lián)分析解決什么樣的問(wèn)題 ? 如何提取關(guān)聯(lián)規(guī)則 ? 關(guān)聯(lián)規(guī)則的應(yīng)用場(chǎng)景
案例:超市商品交叉銷(xiāo)售與布局優(yōu)化(關(guān)聯(lián)分析)
6、RFM模型
問(wèn)題:如何評(píng)估客戶(hù)的價(jià)值?如何針對(duì)不同客戶(hù)采取不同的營(yíng)銷(xiāo)策略? ? RFM模型介紹
? RFM的客戶(hù)細(xì)分框架理解 演練:淘寶客戶(hù)選擇促銷(xiāo)客戶(hù)的方式
演練:結(jié)合響應(yīng)模型,宜家IKE實(shí)現(xiàn)最大化營(yíng)銷(xiāo)利潤(rùn)
第六部分:數(shù)據(jù)挖掘?qū)崙?zhàn)篇(Modeler工具實(shí)操)
1、數(shù)據(jù)挖掘處理的一般過(guò)程
? 數(shù)據(jù)源?數(shù)據(jù)理解?數(shù)據(jù)準(zhǔn)備?探索分析?數(shù)據(jù)建模?模型評(píng)估
2、數(shù)據(jù)讀入
3、數(shù)據(jù)集成
? 變量合并(增加變量)? 數(shù)據(jù)追加(添加記錄)
4、數(shù)據(jù)理解
? 取值范圍限定 ? 重復(fù)數(shù)據(jù)處理 ? 缺失值處理 ? 無(wú)效值處理
? 離群點(diǎn)和極端值的修正 ? 數(shù)據(jù)質(zhì)量評(píng)估
5、數(shù)據(jù)準(zhǔn)備:數(shù)據(jù)處理
? 數(shù)據(jù)篩選:數(shù)據(jù)抽樣/選擇(減少樣本數(shù)量)? 數(shù)據(jù)精簡(jiǎn):數(shù)據(jù)分段/離散化(減少變量的取值)? 數(shù)據(jù)平衡:正反樣本比例均衡 ? 其它:排序、分類(lèi)匯總
6、數(shù)據(jù)準(zhǔn)備:變量處理
? 變量變換:原變量值更新 ? 變量派生:生成新的變量 ? 變量精簡(jiǎn):降維,減少變量個(gè)數(shù)
7、基本分析
? 單變量:數(shù)據(jù)基本描述分析
? 雙變量:相關(guān)分析、方差分析、卡方檢驗(yàn)(列聯(lián)檢驗(yàn))? 變量精簡(jiǎn):特征選擇、因子分析 案例:通信基本費(fèi)用與開(kāi)通月數(shù)的相關(guān)分析 案例:開(kāi)通月數(shù)對(duì)客戶(hù)流失的影響分析 案例:套餐類(lèi)型對(duì)對(duì)客戶(hù)流失的影響分析
8、特征選擇
? 特征選擇方法:選擇重要變量,剔除不重要的變量 ? 從變量本身考慮
? 從輸入變量與目標(biāo)變量的相關(guān)性考慮
9、因子分析(主成分分析)
? 因子分析的原理 ? 因子個(gè)數(shù)如何選擇 ? 如何解讀因子含義
案例:提取影響電信客戶(hù)流失的主成分分析
10、常見(jiàn)分類(lèi)預(yù)測(cè)模型 ? 分類(lèi)預(yù)測(cè)基本過(guò)程
? 如何評(píng)估分類(lèi)模型的性能(查準(zhǔn)率、查全率)
11、決策樹(shù)分類(lèi) ? 決策樹(shù)分類(lèi)原理
? 決策樹(shù)構(gòu)建的三個(gè)關(guān)鍵問(wèn)題 ? 決策樹(shù)算法
案例:識(shí)別銀行欠貨風(fēng)險(xiǎn),提取欠貨者的特征 案例:客戶(hù)流失預(yù)警與客戶(hù)挽留模型
12、神經(jīng)網(wǎng)絡(luò) ? 神經(jīng)網(wǎng)絡(luò)概述 ? 神經(jīng)元工作原理 ? BP反向傳播網(wǎng)絡(luò)(MLP)? 徑向基函數(shù)網(wǎng)絡(luò)(RBF)13、14、實(shí)戰(zhàn):電信客戶(hù)流失分析與預(yù)警模型 支持向量機(jī) 貝葉斯分類(lèi)
結(jié)束:課程總結(jié)與問(wèn)題答疑。
第三篇:高校教育大數(shù)據(jù)的分析挖掘與利用
高校教育大數(shù)據(jù)的分析挖掘與利用
摘 要,本文從高校教育大數(shù)據(jù)的匯聚融合與挖掘應(yīng)用的角度,分析了如何運(yùn)用教育大數(shù)據(jù)技術(shù)推動(dòng)大學(xué)管理和人才培養(yǎng)的創(chuàng)新改革的思路和方法。首先,分析了教育大數(shù)據(jù)對(duì)高校現(xiàn)代化、精細(xì)化、規(guī)范化管理的4個(gè)價(jià)值,其次,給出了高等教育大數(shù)據(jù)技術(shù)平臺(tái)的基本技術(shù)架構(gòu),第三,結(jié)合教育大數(shù)據(jù)實(shí)際應(yīng)用,介紹了陜西省高等教育質(zhì)量監(jiān)管大數(shù)據(jù)中心、MOOC中國(guó)、西安交通大學(xué)教學(xué)質(zhì)量綜合監(jiān)控與評(píng)價(jià)三個(gè)典型案例,最后,提出了教育大數(shù)據(jù)分析挖掘中的3項(xiàng)基礎(chǔ)性關(guān)鍵技術(shù)
關(guān)鍵詞,高等教育,大數(shù)據(jù),分析,挖掘
一、教育大數(shù)據(jù)分析挖掘的價(jià)值
高校大數(shù)據(jù)分析挖掘至少有四個(gè)典型價(jià)值, 一是使得大學(xué)的管理更加精準(zhǔn)高效,可以朝著智慧治理、分類(lèi)管理、過(guò)程監(jiān)控、趨勢(shì)預(yù)測(cè)、風(fēng)險(xiǎn)預(yù)警的方向發(fā)展,真正實(shí)現(xiàn)基于大數(shù)據(jù)分析規(guī)律的精準(zhǔn)治理,改變管理的模糊性, 二是可以更加準(zhǔn)確地分析評(píng)價(jià)課堂教學(xué)的質(zhì)量,過(guò)去我們對(duì)課堂、對(duì)老師的評(píng)價(jià)是定性和模糊的,而在大數(shù)據(jù)智慧課堂的模式下,可以真正實(shí)現(xiàn)采集樣本的持久化,采集方式 的多元化,挖掘手段的多樣化,分析技術(shù)多維度,通過(guò)這些方式可以提高課堂教學(xué)的質(zhì)量, 三是使得教和學(xué)更加智慧,更加有效。對(duì)學(xué)生來(lái)說(shuō),老師可以了解學(xué)生學(xué)習(xí)的進(jìn)展情況,發(fā)現(xiàn)學(xué)習(xí)興趣點(diǎn),以及對(duì)老師講的哪些內(nèi)容理解或者不理解,學(xué)習(xí)路徑分析及課程推薦等等。對(duì)教師而言,不僅可以跨??绲赜蚍窒硭说膬?yōu)秀課程,而且可以對(duì)學(xué)習(xí)者進(jìn)行精準(zhǔn)分類(lèi),進(jìn)行個(gè)性化指導(dǎo), 四是資源服務(wù)的個(gè)性化、精準(zhǔn)化推薦與服務(wù),學(xué)習(xí)績(jī)效的個(gè)性化評(píng)價(jià),以及個(gè)性化教學(xué)管理,個(gè)性化手機(jī)內(nèi)容推送等等,這些功能將有效提升教與學(xué)的效率和質(zhì)量
二、教育大數(shù)據(jù)技術(shù)平臺(tái)的總體設(shè)計(jì)
首先,我們對(duì)高等教育大數(shù)據(jù)技術(shù)平臺(tái)有一個(gè)總體的頂層設(shè)計(jì),如圖1所示。這不僅是學(xué)校自己要有一個(gè)大數(shù)據(jù)的管理平臺(tái)或者是數(shù)據(jù)中心,而且也是面向區(qū)域乃至全國(guó)的平臺(tái)。教育部評(píng)估中心正在努力建立國(guó)家級(jí)高等教育教學(xué)質(zhì)量監(jiān)控大數(shù)據(jù)中心,陜西省也是這樣考慮的。數(shù)據(jù)來(lái)自高校、教育管理部門(mén)以及行業(yè)、第三方、企業(yè)用人單位等等各方面采集的數(shù)據(jù),該數(shù)據(jù)平臺(tái)既有大學(xué)的業(yè)務(wù)數(shù)據(jù)、課程資源,也有政府部門(mén)的統(tǒng)計(jì)數(shù)據(jù),還有學(xué)生網(wǎng)上學(xué)習(xí)的日志數(shù)據(jù),用戶(hù)產(chǎn)生的UGC數(shù)據(jù),比如微信、微博、論壇等等的數(shù)據(jù),基于大數(shù)據(jù)平臺(tái),開(kāi)展面向?qū)W習(xí)者、面向高等教育管理機(jī)構(gòu)、教師、高校等提供服務(wù),并和教育部評(píng)估中心、主管部門(mén)等
進(jìn)行數(shù)據(jù)交換與對(duì)接
顯然,這樣一個(gè)大數(shù)據(jù)平臺(tái)必須是一個(gè)高性能的計(jì)算平臺(tái),沒(méi)有這樣的基礎(chǔ)設(shè)施一切無(wú)從談起,所以去年我們學(xué)?;撕艽蟮牧庾隽藘杉?一個(gè)是把校內(nèi)二級(jí)單位原來(lái)小的集群計(jì)算進(jìn)行整合,形成學(xué)校統(tǒng)一的高性能云計(jì)算平臺(tái),既面向校內(nèi)的科學(xué)研究、人才培養(yǎng)提供服務(wù),其實(shí)也可以為社會(huì)提供合作共建共享模式。目前,我們已建立了一種自我造血機(jī)制,四兩撥千斤,以這個(gè)平臺(tái)吸引更多的外部資源,努力擴(kuò)展平臺(tái)的性能和應(yīng)用
三、教育大數(shù)據(jù)分析挖掘的典型應(yīng)用案例
目前,我校的高性能平臺(tái)除了應(yīng)用于材料、航天、能動(dòng)、信息等大型科學(xué)計(jì)算之外,還開(kāi)展了以下三項(xiàng)典型的大數(shù)據(jù)應(yīng)用
案例1,陜西省高等教育質(zhì)量監(jiān)控與評(píng)估大數(shù)據(jù)應(yīng)用
圖2所示的是陜西省高等教育的整體架構(gòu)。其數(shù)據(jù)基礎(chǔ)是來(lái)自陜西省100多所高校的各種辦學(xué)狀態(tài)數(shù)據(jù),有將近700個(gè)表格,以及陜西省教育廳各個(gè)職能部處的各種各樣的管理數(shù)據(jù),此外還有行業(yè)第三方提供的數(shù)據(jù),包括招生、就業(yè)數(shù)據(jù)等等,這個(gè)平臺(tái)上我們開(kāi)展預(yù)測(cè)預(yù)警、查詢(xún)?cè)诰€分析、信息發(fā)布、統(tǒng)計(jì)決策等等,主要是為省級(jí)教育管理部門(mén)、評(píng)估機(jī)構(gòu)、教育管理機(jī)構(gòu)提供各種各樣的辦學(xué)狀況的分析、統(tǒng)計(jì)、關(guān)聯(lián)分析
建設(shè)全省高等教育大數(shù)據(jù)服務(wù)平臺(tái),實(shí)時(shí)采集各高校的辦學(xué)狀態(tài)數(shù)據(jù),其根本目的是為了匯聚全省各高校的辦學(xué)狀態(tài)數(shù)據(jù),打破數(shù)據(jù)孤島,融合各方數(shù)據(jù),實(shí)現(xiàn)橫向關(guān)聯(lián)比較、縱向歷史分析,提供精準(zhǔn)服務(wù),支持科學(xué)決策
首先,該平臺(tái)面向省教育廳提供了11項(xiàng)功能,從根本上解決了原來(lái)各處室間的數(shù)據(jù)孤島的問(wèn)題,實(shí)現(xiàn)了數(shù)據(jù)融合,橫向關(guān)聯(lián),縱向融通,這個(gè)數(shù)據(jù)和各個(gè)高校是實(shí)時(shí)融通的,為省教育廳領(lǐng)導(dǎo)和職能部處提供了領(lǐng)導(dǎo)儀表盤(pán)、各職能處室的專(zhuān)項(xiàng)服務(wù)、81張高基表及年報(bào)年鑒表格的自動(dòng)生成、績(jī)效分析、招生就業(yè)及辦學(xué)指標(biāo)計(jì)算、教育評(píng)估等功能,從根本上解決了數(shù)據(jù)碎片化及其治理問(wèn)題
其次,面向全省高校輔助決策,為高校領(lǐng)導(dǎo)以及校內(nèi)各個(gè)職能部處提供了系列功能,包括辦學(xué)情況綜合分析和在線查詢(xún),專(zhuān)業(yè)結(jié)構(gòu)分析比較,校級(jí)的教學(xué)質(zhì)量監(jiān)控評(píng)測(cè)體系,教師管理等等,這些功能非常實(shí)用,這是大學(xué)實(shí)現(xiàn)精細(xì)化、規(guī)范化、現(xiàn)代化管理的必備基礎(chǔ)。以我校為例,我們過(guò)去教師的數(shù)據(jù)可能在人事處、教務(wù)處、科研院等學(xué)校的職能部門(mén),采取本平臺(tái)以后,把教師有關(guān)的所有數(shù)據(jù)都進(jìn)行了融合,打通了所有原來(lái)割裂的數(shù)據(jù)。從去年開(kāi)始,我們學(xué)校的職稱(chēng)評(píng)聘,考核全部基于這一平臺(tái),全部在大數(shù)據(jù)里,建立健全了基于數(shù)據(jù)驅(qū)動(dòng)的精準(zhǔn)化服務(wù),解決了數(shù)據(jù)碎片化歷史遺留問(wèn)題,實(shí)現(xiàn)了從管理信息化向服務(wù)信息化的根本轉(zhuǎn)變
第三,為本科教育教學(xué)評(píng)估及專(zhuān)業(yè)認(rèn)證提供技術(shù)支撐。鑒于本平臺(tái)能提供比較全面的高校辦學(xué)狀態(tài)數(shù)據(jù),便于專(zhuān)家在進(jìn)校之前全面系統(tǒng)地掌握學(xué)校辦學(xué)的情況,找到問(wèn)題,精準(zhǔn)查看驗(yàn)證,提高效率,給高等教育評(píng)估提供了重要支持。基于本平臺(tái),我們成立了中國(guó)西部高等教育評(píng)估中心,接受陜西省教育廳指派的省屬本科高校的審核評(píng)估和專(zhuān)業(yè)論證。如果沒(méi)有這一高等教育大數(shù)據(jù)平臺(tái)的支撐,工作量和難度是極其巨大的,甚至難以實(shí)現(xiàn)
案例2,MOOC中國(guó)技術(shù)平臺(tái)
MOOC中國(guó)成立于2015年1月,到目前為止已經(jīng)有121所高校加入,理事單位40家,會(huì)員單位80家。該平臺(tái)的宗旨是,做政府想做的,做社會(huì)愿意做的,做單一高校做不了的事情。例如,真正解決校際資源共享、學(xué)分互認(rèn)等,開(kāi)拓遠(yuǎn)程教育國(guó)際化等未來(lái)發(fā)展的難題。圖3給出了MOOC中國(guó)的技術(shù)框架。其核心是互聯(lián)網(wǎng)+教育,實(shí)現(xiàn)互聯(lián)網(wǎng)教育從1.0到2.0的升級(jí)?;谶@一平臺(tái),既要開(kāi)展網(wǎng)絡(luò)教育業(yè)務(wù)的國(guó)際化,比如我們牽頭成立的“絲路大學(xué)聯(lián)盟”,其目的之一是借助MOOC中國(guó)平臺(tái),實(shí)現(xiàn)網(wǎng)絡(luò)教育業(yè)務(wù)的國(guó)際化,通過(guò)MOOC中國(guó)平臺(tái),面向“一帶一路”國(guó)家開(kāi)展開(kāi)放教育和技能培訓(xùn)
到目前為止,MOOC中國(guó)已經(jīng)有了9911門(mén)課程,用戶(hù)將近600萬(wàn),其中光IT培訓(xùn)的有500多萬(wàn),學(xué)歷教育在讀
學(xué)生50多萬(wàn)
案例3,西安交大教育教學(xué)大數(shù)據(jù)分析挖掘與應(yīng)用
學(xué)校非常重視教育信息化技術(shù)融入和應(yīng)用到教育教學(xué)之中,去年一次性建成了80個(gè)智能教室,把物聯(lián)網(wǎng)技術(shù)、云計(jì)算技術(shù)應(yīng)用于智能教室和教學(xué)一線,基于物聯(lián)網(wǎng)技術(shù)實(shí)現(xiàn)教室設(shè)備的集中管理、智能控制,同時(shí),將互聯(lián)網(wǎng)技術(shù)深度融入到教室的管理當(dāng)中,除了多媒體的直播錄制功能以外,還提供了學(xué)生考勤和專(zhuān)家的精準(zhǔn)督導(dǎo),通過(guò)云平臺(tái)來(lái)集中管理各個(gè)教室,比如說(shuō)開(kāi)投影機(jī)、關(guān)電源、關(guān)多媒體設(shè)備等等,都可以通過(guò)后端的云平臺(tái)集中管控,真正實(shí)現(xiàn)教室管理的數(shù)字化、智能化、精細(xì)化,提升了教學(xué)保障的能力,也大大提高了教室管理的效率。更重要的是,這些教學(xué)的過(guò)程數(shù)據(jù)可以全程采集下來(lái),獲得數(shù)據(jù),有了這些數(shù)據(jù),就可以做精準(zhǔn)化分析服務(wù),建立西安交大教學(xué)質(zhì)量大數(shù)據(jù)監(jiān)測(cè)中心 目前,我校的教學(xué)大數(shù)據(jù)主要包括兩大部分,一是教師在授課過(guò)程中的全程錄制的課堂實(shí)況,二是學(xué)生在學(xué)習(xí)過(guò)程中產(chǎn)生的大量日志數(shù)據(jù)。基于這個(gè)平臺(tái),我們可以開(kāi)展教育教學(xué)的大數(shù)據(jù)關(guān)聯(lián)分析,開(kāi)展課堂教學(xué)質(zhì)量的綜合評(píng)價(jià),實(shí)現(xiàn)正面激勵(lì)、負(fù)面懲戒、精準(zhǔn)督導(dǎo),實(shí)現(xiàn)教學(xué)評(píng)價(jià)從模糊宏觀到量化精準(zhǔn)、從每學(xué)期制到持續(xù)常態(tài)、從部分隨機(jī)到全面覆蓋、從事后評(píng)價(jià)到實(shí)時(shí)動(dòng)態(tài)的根本轉(zhuǎn)變。通過(guò)評(píng)價(jià)激勵(lì)老師敬畏課堂,評(píng)選精品課堂、示范課堂,在全校內(nèi)進(jìn)行正面
表彰,另外也作為教學(xué)質(zhì)量評(píng)價(jià)的重要依據(jù),包括教師的職稱(chēng)晉升,評(píng)選最喜愛(ài)的老師等等
此外,本系統(tǒng)還為學(xué)院領(lǐng)導(dǎo)和管理部門(mén)提供了針對(duì)性的信息服務(wù)與決策支持,以數(shù)據(jù)說(shuō)話,量化分析,改變了以前我們的模糊評(píng)價(jià),采取多維度、全覆蓋、持續(xù)化、精細(xì)化的過(guò)程評(píng)價(jià)與監(jiān)控
四、教育大數(shù)據(jù)分析挖掘的若干關(guān)鍵技術(shù)
首先,介紹一下大數(shù)據(jù)人工智能的基本原理。前段時(shí)間,AlphaGo戰(zhàn)勝世界圍棋冠軍這一故事炒得很熱。這對(duì)我們的教育科研工作者提出了一個(gè)重要的課題,到底人工智能會(huì)不會(huì)戰(zhàn)勝人類(lèi)的智能,將來(lái)教師存在的主要價(jià)值是否還有必要,863計(jì)劃正在研究一個(gè)項(xiàng)目,到2020年,人工智能軟件參加高考得分要超過(guò)一本線,這就是說(shuō),計(jì)算機(jī)教出來(lái)的機(jī)器軟件參加高考都能達(dá)到一本線以上。這就引起我們的思考,這是一個(gè)深層次的方向性問(wèn)題。當(dāng)然我們今天不是談這個(gè)問(wèn)題,而是我們要看看AlphaGO的原理,其核心是價(jià)值計(jì)算函數(shù),用收益函數(shù)來(lái)判斷圍棋下一步該落子到哪里其收益是最大的,其中采用了人工智能深度學(xué)習(xí)方法。AlphaGO并非天生聰明,其實(shí)他的智慧是分三步完成的, 第一步,給AlphaGO輸入了3000萬(wàn)個(gè)人類(lèi)圍棋高手的棋譜和走法,任何一個(gè)人是不可能記住3000萬(wàn)個(gè)棋局的,只有人工智能才能記住 第二步,AlphaGO自己和自己對(duì)弈,在對(duì)弈過(guò)程中找到自己的薄弱點(diǎn),進(jìn)而改進(jìn)和完善,這其實(shí)和人的學(xué)習(xí)原理類(lèi)似
第三步,才是人機(jī)對(duì)弈,從職業(yè)選手到世界圍棋冠軍,通過(guò)這樣不斷的對(duì)弈完善算法,校正學(xué)習(xí),使得AlphaGO具有強(qiáng)大的智能計(jì)算能力。AlphaGO的難點(diǎn)在哪,其關(guān)鍵在于在一個(gè)巨大的落子空間選一個(gè)最大的收益點(diǎn),或者落子點(diǎn),稱(chēng)之為MovePicker,函數(shù),這個(gè)空間很大,有10170次方,在如此龐大的計(jì)算空間中選擇最優(yōu)函數(shù),只能依靠高性能計(jì)算平臺(tái)
AlphaGo為我們研究大數(shù)據(jù)問(wèn)題提供了思路和啟發(fā)。我們?cè)谘芯拷逃髷?shù)據(jù)問(wèn)題中需要著力攻克以下理論與技術(shù)難題
第一,大數(shù)據(jù)造成了嚴(yán)重的認(rèn)知碎片化問(wèn)題。比如,大家在百度搜糖尿病會(huì)檢索出4440萬(wàn)個(gè)數(shù)據(jù)源,誰(shuí)也看不過(guò)來(lái),并且里面還有一大堆真假難辯的數(shù)據(jù)。所以,碎片化知識(shí)的聚合是一個(gè)非?;A(chǔ)的難題,高度的碎片化降低了知識(shí)的可用性,造成了分布性、動(dòng)態(tài)化、低質(zhì)化、無(wú)序化等典型的問(wèn)題
一方面是知識(shí)的碎片化,另一方面是每個(gè)人的興趣和需求還不一樣。所以,資源的碎片化整合以及個(gè)性化推薦是今后人工智能中的關(guān)鍵問(wèn)題。我們的思路是,一方面,我們要
從資源的角度把無(wú)序、分散、低質(zhì)的資源進(jìn)一步重組以后形成知識(shí)點(diǎn),形成有序的知識(shí)地圖,另一方面,要對(duì)學(xué)習(xí)過(guò)程進(jìn)行跟蹤,實(shí)現(xiàn)興趣、個(gè)性、情感等方面的動(dòng)態(tài)分析與挖掘,兩者結(jié)合起來(lái),建立基于用戶(hù)興趣和個(gè)性的資源推薦,最后實(shí)現(xiàn)個(gè)性化精準(zhǔn)過(guò)濾,通過(guò)知識(shí)地圖面向用戶(hù)提供導(dǎo)航學(xué)習(xí),從而緩碎片化知識(shí)的問(wèn)題。開(kāi)展這一研究也要建立龐大的基礎(chǔ)數(shù)據(jù),就像剛才講的AlphaGO,光靠智能軟件肯定不可能那么聰明,需要建立龐大的知識(shí)地圖、知識(shí)圖譜,并將其放到了國(guó)際開(kāi)源社區(qū)和開(kāi)放數(shù)據(jù)平臺(tái)之上 第二,碎片化知識(shí)的聚合問(wèn)題。其目的是解決“既見(jiàn)樹(shù)木,又見(jiàn)森林”的問(wèn)題,破解“學(xué)習(xí)迷航”、“認(rèn)知過(guò)載”的問(wèn)題。我們正在承擔(dān)國(guó)家自然科學(xué)基金重點(diǎn)項(xiàng)目,研究如何將多源、片面、無(wú)序的碎片化知識(shí)聚合成符合人類(lèi)認(rèn)知的知識(shí)森林,找出主題與主題之間的認(rèn)知關(guān)系,最后形成一個(gè)知識(shí)森林,其中需要解決主題分面樹(shù)的生成、碎片化知識(shí)的裝配、知識(shí)森林生成、學(xué)習(xí)路徑選擇與導(dǎo)航等有關(guān)知識(shí)地圖、知識(shí)圖譜構(gòu)建與應(yīng)用等許多基礎(chǔ)性關(guān)鍵技術(shù)
第三,學(xué)習(xí)行為的分析和挖掘技術(shù)。網(wǎng)上學(xué)習(xí)最大的好處我們可以把教師和學(xué)生所有的教與學(xué)的行為記錄下來(lái),討論、作業(yè)、習(xí)題、筆記及進(jìn)度記錄下來(lái),有了這些數(shù)據(jù),我們可以進(jìn)行后續(xù)分析,開(kāi)展學(xué)習(xí)行為的特征識(shí)別和規(guī)律發(fā)現(xiàn)等等,既可以跟蹤挖掘某個(gè)個(gè)體的學(xué)習(xí)規(guī)律,也可以找出一
個(gè)群體、一個(gè)小組的特征和規(guī)律。針對(duì)不同的課程,開(kāi)展課程點(diǎn)擊率、學(xué)習(xí)人群、知識(shí)關(guān)注點(diǎn)、學(xué)習(xí)時(shí)間等的分析與跟蹤,刻畫(huà)一個(gè)學(xué)生學(xué)習(xí)的過(guò)程,從時(shí)間、空間和課程知識(shí)導(dǎo)航的角度,甚至圍繞某個(gè)知識(shí)點(diǎn),研究學(xué)習(xí)者的特征、行為、交互等相互之間的關(guān)系,為老師深化課程改革、探索以學(xué)生為中心的教學(xué)設(shè)計(jì)具有非常重要的意義
教育是全人類(lèi)、全社會(huì)發(fā)展的基礎(chǔ)性事業(yè),隨著互聯(lián)網(wǎng)+技術(shù)全面滲透和深度融入教育教學(xué),不僅產(chǎn)生了大量的課程資源和學(xué)習(xí)內(nèi)容,而且還產(chǎn)生了巨量的教育教學(xué)管理數(shù)據(jù)、行為數(shù)據(jù)、服務(wù)數(shù)據(jù),蘊(yùn)藏著巨大的價(jià)值,亟需我們開(kāi)展深入研究,可謂前景廣闊,挑戰(zhàn)巨大,,編輯,王曉明,
第四篇:利用python輕松玩轉(zhuǎn)Excel,完成數(shù)據(jù)分析與統(tǒng)計(jì),學(xué)習(xí)心得分享
利用python輕松玩轉(zhuǎn)Excel,完成數(shù)據(jù)分析與統(tǒng)計(jì),學(xué)習(xí)心
得分享
寫(xiě)在前面這是我學(xué)習(xí)python寫(xiě)的第一個(gè)完整的腳本過(guò)程大概是從一頭懵逼,到滿(mǎn)是問(wèn)題,再到一個(gè)個(gè)解決問(wèn)題我沒(méi)有系統(tǒng)的學(xué)習(xí)過(guò)python阻礙我的問(wèn)題是什么,我就學(xué)什么這里尤為重要的一點(diǎn),就是需要清楚的知道自己需要什么對(duì)于一個(gè)初學(xué)者來(lái)說(shuō),這真的是很難有時(shí)候就算知道自己需要什么,也不知道該如何準(zhǔn)確的表達(dá)這是一個(gè)極為讓人迷茫和不知所措的過(guò)渡時(shí)期個(gè)人的總結(jié)有明確的目標(biāo)將大目標(biāo)分解成最小顆粒的小目標(biāo)針對(duì)小目標(biāo),一個(gè)個(gè)去解決舉例目標(biāo):有一份市面上主流機(jī)型使用某APP的兼容性測(cè)試報(bào)告,包括了詳細(xì)的手機(jī)信息,其中報(bào)告中“日志包”這一列是一個(gè)超鏈接,可以訪問(wèn)下載一個(gè)ZIP日志包,現(xiàn)需要檢查每一個(gè)日志文件里是否包含事先埋點(diǎn)的信息,并根據(jù)需要生成一份報(bào)告目標(biāo)分解:打開(kāi)excel測(cè)試報(bào)告訪問(wèn)“日志包”這一列的超鏈接,下載ZIP文件解壓ZIP文件,得到log文件利用正則表達(dá)式,在log文件里查找埋點(diǎn)信息,返回查找結(jié)果提取當(dāng)前行其它需要的信息生成最終結(jié)果文件實(shí)現(xiàn)腳本動(dòng)態(tài)打印處理進(jìn)度結(jié)果文件源碼獲取方式私信“數(shù)據(jù)分析與統(tǒng)計(jì)”源碼與兼容性報(bào)告
第五篇:案例7-2 天津聯(lián)通利用SAS數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)精細(xì)營(yíng)銷(xiāo)
案例7-2 天津聯(lián)通利用SAS數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)精細(xì)營(yíng)銷(xiāo)
啤酒和尿布,風(fēng)馬牛不相及,但細(xì)心的超市經(jīng)營(yíng)者發(fā)現(xiàn),把這兩件商品擺放在一起,比分置兩處,更能提升兩者的銷(xiāo)售額——因?yàn)橹苣┵?gòu)物的父親們會(huì)在買(mǎi)尿布的同時(shí),習(xí)慣性地拿瓶啤酒。——挖掘數(shù)據(jù),分析用戶(hù)購(gòu)買(mǎi)習(xí)慣,發(fā)現(xiàn)用戶(hù)潛在的需求以做決策的依據(jù),這就是BI的力量。
近四分之一個(gè)世紀(jì)以來(lái),SAS始終致力于將原始數(shù)據(jù)轉(zhuǎn)變成知識(shí)和洞察力,提供能夠?qū)?shù)據(jù)倉(cāng)庫(kù)技術(shù)、分析方法論和傳統(tǒng)的商業(yè)智能整合在一起的端到端的解決方案,以頂尖的技術(shù)和服務(wù)幫助客戶(hù)全面提升管理水平和決策能力,其專(zhuān)業(yè)和經(jīng)驗(yàn)獲得了全球財(cái)富500強(qiáng)中94%的客戶(hù)認(rèn)可。同時(shí),財(cái)富500強(qiáng)的經(jīng)營(yíng)智慧和他們對(duì)本行業(yè)的深刻洞察也幫助SAS獲得了對(duì)客戶(hù)所從事行業(yè)的寶貴經(jīng)驗(yàn)。
電信業(yè)競(jìng)爭(zhēng)日趨白熱化,運(yùn)營(yíng)商們推出新業(yè)務(wù)的節(jié)奏越來(lái)越快,過(guò)于激烈的競(jìng)爭(zhēng)使得決策不免倉(cāng)促,缺乏扎實(shí)的市場(chǎng)依據(jù),最后淪為“價(jià)格戰(zhàn)”。信息產(chǎn)業(yè)部前部長(zhǎng)、全國(guó)人大教科文衛(wèi)委員會(huì)副主任委員吳基傳最近對(duì)國(guó)內(nèi)電信市場(chǎng)“價(jià)格戰(zhàn)”的批評(píng)也正說(shuō)明了問(wèn)題的嚴(yán)重性。新的競(jìng)爭(zhēng)環(huán)境下、中國(guó)聯(lián)通香港上市后國(guó)際投資人對(duì)公司管理水平“國(guó)際化”和公司贏利能力水平的提升都提出了更高的要求,天津聯(lián)通感受到需求的迫切,引進(jìn)先進(jìn)的軟件和服務(wù)系統(tǒng),成為提升其管理科學(xué)化的重要步驟。
在全球市場(chǎng),SAS服務(wù)于眾多大型電信運(yùn)營(yíng)商,SAS的產(chǎn)品功能模塊建立在對(duì)這些電信運(yùn)營(yíng)商業(yè)務(wù)分析的基礎(chǔ)之上,更具備行業(yè)通用性。同時(shí),SAS也與上海、北京、浙江、河北等地的若干家電信運(yùn)營(yíng)商存在合作關(guān)系,對(duì)國(guó)內(nèi)運(yùn)營(yíng)商個(gè)性化的業(yè)務(wù)需求非常了解。兼具國(guó)際化的背景和本地化的經(jīng)驗(yàn),是天津聯(lián)通選擇SAS的重要原因。同時(shí),天津聯(lián)通認(rèn)為,商業(yè)智能軟件不僅投入較大,而且涉及企業(yè)的關(guān)鍵業(yè)務(wù)數(shù)據(jù),只有具備相當(dāng)資質(zhì)的大公司才值得信賴(lài),而SAS的資質(zhì)和實(shí)力無(wú)疑獲得了天津聯(lián)通的信任。
數(shù)據(jù)挖掘,幫助天津聯(lián)通實(shí)現(xiàn)營(yíng)銷(xiāo)精細(xì)化
顯然,在今天中國(guó)的電信市場(chǎng)上,粗放式的營(yíng)銷(xiāo)已經(jīng)無(wú)法確保市場(chǎng)回報(bào),營(yíng)銷(xiāo)精細(xì)化、科學(xué)化是運(yùn)營(yíng)商生存的唯一選擇,而精細(xì)化、科學(xué)化的營(yíng)銷(xiāo)決策需要情報(bào)支持系統(tǒng),電信運(yùn)營(yíng)商每天產(chǎn)生的業(yè)務(wù)數(shù)據(jù)不計(jì)其數(shù),這些數(shù)據(jù)之間是否存在諸如“尿布與啤酒”這樣的關(guān)系?這種關(guān)系又蘊(yùn)涵著哪些潛藏的商機(jī)??jī)H憑直覺(jué)和觀察,能經(jīng)營(yíng)小超市,但經(jīng)營(yíng)一家大型的電信企業(yè),就需要專(zhuān)業(yè)的商業(yè)智能軟件做決策支持,這正是SAS所擅長(zhǎng)的。
天津聯(lián)通根據(jù)其業(yè)務(wù)需要與企業(yè)的實(shí)際情況,選擇了SAS電信業(yè)智能解決方案中的三個(gè)組成部分:客戶(hù)挽留解決方案、電信業(yè)客戶(hù)細(xì)分解決方案、電信業(yè)交叉銷(xiāo)售和提升銷(xiāo)售解決方案。這三個(gè)項(xiàng)目的實(shí)施,分別幫助天津聯(lián)通解決三個(gè)決策的問(wèn)題:
第一,是預(yù)測(cè)哪些客戶(hù)最具有流失的傾向以及影響客戶(hù)流失的關(guān)鍵因素,通過(guò)預(yù)制的分析模型提供“流失記分”幫助識(shí)別風(fēng)險(xiǎn)客戶(hù),在客戶(hù)流失之前采取針對(duì)性措施來(lái)挽留他們。
第二,根據(jù)客戶(hù)可能的行為和潛在的盈利性對(duì)客戶(hù)進(jìn)行分類(lèi),制定更準(zhǔn)確的產(chǎn)品組合、更準(zhǔn)確的產(chǎn)品介紹和產(chǎn)品捆綁服務(wù)。
第三,從現(xiàn)有客戶(hù)中識(shí)別出有可能接受交叉銷(xiāo)售和提升銷(xiāo)售的客戶(hù)人選,評(píng)估客戶(hù)過(guò)去的購(gòu)買(mǎi)模式,預(yù)測(cè)客戶(hù)下一步可能購(gòu)買(mǎi)什么。
通過(guò)運(yùn)行該系統(tǒng),并對(duì)業(yè)務(wù)數(shù)據(jù)進(jìn)行分析,天津聯(lián)通制訂了更精細(xì)的營(yíng)銷(xiāo)策略,留住了利潤(rùn)貢獻(xiàn)最高的客戶(hù),并開(kāi)發(fā)了更有針對(duì)性的新業(yè)務(wù),提高了每用戶(hù)平均收入(ARPU-Average Revenue Per User),增強(qiáng)了贏利能力。
天津聯(lián)通的用戶(hù)對(duì)變化也有直接感受,一位入網(wǎng)4年多,每月消費(fèi)額在500元以上的老客戶(hù)評(píng)價(jià)說(shuō),“天津聯(lián)通推出的客戶(hù)關(guān)懷活動(dòng)讓我們感受到了作為老客戶(hù)的‘價(jià)值’,如果有人向我咨詢(xún),我會(huì)向他們推薦使用聯(lián)通的服務(wù)?!?/p>
專(zhuān)業(yè)服務(wù),授之以漁
盡管是一家國(guó)際型企業(yè),但是SAS在與天津聯(lián)通溝通過(guò)程中,服務(wù)團(tuán)隊(duì)還是讓天津聯(lián)通感覺(jué)到了溝通的融洽。從2000年到現(xiàn)在SAS一直致力于中國(guó)團(tuán)隊(duì)的建設(shè),目前有兩支團(tuán)隊(duì)已是相當(dāng)成熟,一個(gè)是技術(shù)支持和本地化開(kāi)發(fā)隊(duì)伍,另外一個(gè)就是致力于客戶(hù)關(guān)系管理、客戶(hù)商務(wù)智能分析的銷(xiāo)售隊(duì)伍。
天津聯(lián)通計(jì)費(fèi)營(yíng)帳中心數(shù)據(jù)挖掘項(xiàng)目經(jīng)理田龍認(rèn)為,SAS的技術(shù)人員非常專(zhuān)業(yè),具備豐富的電信行業(yè)經(jīng)驗(yàn)?!八麄兡軓膹?fù)雜的數(shù)據(jù)中找到有用的信息,用圖表的方式提供給我們,這些信息很容易看懂,并可以依此形成決策。他們對(duì)項(xiàng)目的把控能力也是一流的,系統(tǒng)交割清楚有序,并對(duì)我們的業(yè)務(wù)人員進(jìn)行了系統(tǒng)的培訓(xùn)?!痹赟AS的培訓(xùn)下,天津聯(lián)通的業(yè)務(wù)分析人員已經(jīng)能夠熟練掌握系統(tǒng)的運(yùn)行,獨(dú)立操作,從數(shù)據(jù)中找到他們真正需要的東西,而這種“授之以漁”,融咨詢(xún)、服務(wù)、培訓(xùn)為一體的模式,比單純銷(xiāo)售產(chǎn)品更加符合客戶(hù)的長(zhǎng)遠(yuǎn)利益。
同時(shí),SAS有著電信行業(yè)特有的數(shù)據(jù)結(jié)構(gòu)、電信領(lǐng)域的出色專(zhuān)家與業(yè)已證實(shí)的成功分析模型,這些都構(gòu)成了天津聯(lián)通智能化管理的基礎(chǔ)。先進(jìn)的數(shù)據(jù)挖掘方法論SEMMA幫助發(fā)掘真正的商業(yè)智能,為天津聯(lián)通的市場(chǎng)決策做支持,而系統(tǒng)本身具有的智能應(yīng)用、高可用性、高可靠性、高擴(kuò)展性等特性也充分滿(mǎn)足了客戶(hù)在相當(dāng)長(zhǎng)一段時(shí)間內(nèi)的需求。
提高決策成功率,降低總體擁有成本
越大的企業(yè),決策的成本越高,一次錯(cuò)誤的決策就可導(dǎo)致上千萬(wàn)乃至上億的損失,減低決策風(fēng)險(xiǎn),對(duì)于大企業(yè)有特別的重要的意義。而SAS的BI系統(tǒng),不僅幫助客戶(hù)提升了贏利能力,也通過(guò)變主觀決策為數(shù)據(jù)決策,減低了決策失誤的機(jī)率。SASBI系統(tǒng)不僅能滿(mǎn)足客戶(hù)當(dāng)前的需求,也能滿(mǎn)足當(dāng)用戶(hù)數(shù)量增加和業(yè)務(wù)規(guī)模擴(kuò)大時(shí)的需求,具備高可擴(kuò)展性,真正做到了總體擁有成本最低。
目前,這一智能解決方案的效果已經(jīng)被證實(shí)十分明顯,在新業(yè)務(wù)開(kāi)發(fā)方面,天津聯(lián)通原來(lái)每1000人的電話銷(xiāo)售成功率是40人,而現(xiàn)在這一數(shù)字提高到了200人,也就是說(shuō)成功率由原來(lái)的4%提高到了20%。
應(yīng)用效果評(píng)價(jià)
目前電信業(yè)的競(jìng)爭(zhēng)越來(lái)越激烈,迫使電信業(yè)必須從過(guò)去粗放式的營(yíng)銷(xiāo)模式轉(zhuǎn)向精細(xì)化、科學(xué)化管理。決策層要想盡快掌握和調(diào)整市場(chǎng)方向,就必須從每天產(chǎn)生的不計(jì)其數(shù)的業(yè)務(wù)數(shù)據(jù)中尋找出準(zhǔn)確、有效的數(shù)據(jù)。而SAS在數(shù)據(jù)挖掘領(lǐng)域技術(shù)不僅技術(shù)突出,而且其咨詢(xún)和實(shí)施顧問(wèn),由于長(zhǎng)期在電信行業(yè)摸爬滾打,有著豐富的行業(yè)經(jīng)驗(yàn)。另外,其電信行業(yè)特有的數(shù)據(jù)結(jié)構(gòu),以及系統(tǒng)本身具有的高可用性和高可擴(kuò)展性也滿(mǎn)足了客戶(hù)的需求。
值得一提的是,在項(xiàng)目實(shí)施期間SAS為用戶(hù)提供的業(yè)務(wù)流程和數(shù)據(jù)規(guī)范建議和意見(jiàn),以及“授之以漁”的實(shí)施方法也推動(dòng)了用戶(hù)對(duì)自身業(yè)務(wù)系統(tǒng)的優(yōu)化和深入認(rèn)識(shí)。天津聯(lián)通計(jì)費(fèi)營(yíng)帳中心數(shù)據(jù)挖掘項(xiàng)目經(jīng)理田龍也表示,“SAS 幫助我們發(fā)現(xiàn)隱藏在數(shù)據(jù)之后的問(wèn)題與機(jī)會(huì),我們的營(yíng)銷(xiāo)變得更有洞察力,準(zhǔn)確而迅速?!?/p>