第一篇:A15 CDA數(shù)據(jù)分析師認(rèn)證之?dāng)?shù)據(jù)挖掘?qū)崙?zhàn)培訓(xùn)
CDA數(shù)據(jù)分析師認(rèn)證之?dāng)?shù)據(jù)挖掘?qū)崙?zhàn)培訓(xùn)
【授課對象】
本課程為參加CDAII(建模分析師)認(rèn)證的數(shù)據(jù)分析與數(shù)據(jù)挖掘?qū)I(yè)人員,為數(shù)據(jù)挖掘高級班,要求有一定的數(shù)學(xué)基礎(chǔ),掌握概率論和統(tǒng)計(jì)理論基礎(chǔ),有一定的數(shù)據(jù)分析經(jīng)驗(yàn)。
適合于如下人員:數(shù)據(jù)分析師、大數(shù)據(jù)系統(tǒng)研發(fā)人員、大數(shù)據(jù)系統(tǒng)架構(gòu)師、業(yè)務(wù)支撐部等對業(yè)務(wù)數(shù)據(jù)分析與挖掘有專業(yè)要求的相關(guān)人員。【課程目標(biāo)】
CDA(Certified Data Analyst)全稱“注冊數(shù)據(jù)分析師”,由“CERTIFIED DATA ANALYST INSTITUTE(CDA數(shù)據(jù)分析師協(xié)會)”發(fā)起成立的職業(yè)簡稱,旨在培養(yǎng)正規(guī)化、科學(xué)化、專業(yè)化的數(shù)據(jù)分析人才隊(duì)伍,進(jìn)一步提升數(shù)據(jù)分析師的職業(yè)素養(yǎng)與能力水平,促進(jìn)數(shù)據(jù)分析行業(yè)的高質(zhì)量持續(xù)快速發(fā)展。CDA數(shù)據(jù)分析師面向商業(yè)職場數(shù)據(jù)分析,分為三個(gè)等級,在國內(nèi)由人大經(jīng)濟(jì)論壇主辦資格考試,通過考試者可以獲得CDA協(xié)會頒發(fā)的數(shù)據(jù)分析師資格證書,此證書代表數(shù)據(jù)分析師人才技能水平,為企業(yè)事業(yè)單位選拔和聘用專業(yè)人才的參考依據(jù)。
本課程為CDAII(建模分析師)課程培訓(xùn)大綱。本課程基于CDA的認(rèn)證知識要求,圍繞商業(yè)問題,全面介紹了數(shù)據(jù)挖掘的標(biāo)準(zhǔn)流程,數(shù)據(jù)預(yù)處理,數(shù)據(jù)挖掘方法,數(shù)據(jù)挖掘模型,模型評估,模型參數(shù)優(yōu)化,等等,使得學(xué)員掌握數(shù)據(jù)挖掘的方法、模型、工具。
通過本課程的學(xué)習(xí),達(dá)到如下目的:
1、了解數(shù)據(jù)分析與數(shù)據(jù)挖掘的基本知識,理解大數(shù)據(jù)思維方式。
2、掌握數(shù)據(jù)挖掘的基本過程和步驟,掌握數(shù)據(jù)挖掘的思路和框架。
3、能夠理解分析模型原理,掌握模型應(yīng)用場景,能夠利用模型解決復(fù)雜的商業(yè)問題。
4、掌握常用的數(shù)據(jù)模型,能夠根據(jù)商業(yè)問題選擇合適的分析模型。
5、熟悉SPSS基本操作,掌握分析操作,能夠解讀分析結(jié)果,并轉(zhuǎn)化為業(yè)務(wù)策略。
【授課時(shí)間】
4~5天時(shí)間 【學(xué)員要求】
1、每個(gè)學(xué)員自備一臺便攜機(jī)(必須)。
2、便攜機(jī)中事先安裝好Excel 2013軟件。
3、便攜機(jī)中事先安裝好SPSS v19軟件。注:講師可以提供試用版本軟件及分析數(shù)據(jù)源?!臼谡n方式】
基礎(chǔ)知識精講+案例講解 + 操作演練+ 實(shí)際業(yè)務(wù)問題分析 + SPSS實(shí)際操作 本課程突出數(shù)據(jù)挖掘的實(shí)際應(yīng)用,結(jié)合行業(yè)的典型應(yīng)用特點(diǎn),從實(shí)際問題入手,引出相關(guān)知識,進(jìn)行大數(shù)據(jù)的收集與處理;引導(dǎo)學(xué)員思考,構(gòu)建分析模型,進(jìn)行數(shù)據(jù)分析與挖掘,以及數(shù)據(jù)呈現(xiàn)與解讀,全過程演練操作,以達(dá)到提升學(xué)員的數(shù)據(jù)綜合分析能力,支撐運(yùn)營決策的目的?!菊n程大綱】
第一部分:數(shù)據(jù)集基礎(chǔ)知識(了解你的數(shù)據(jù)集)
1、數(shù)據(jù)集概述
2、數(shù)據(jù)集的類型
3、數(shù)據(jù)集屬性的類型
? 標(biāo)稱 ? 序數(shù) ? 度量
4、數(shù)據(jù)質(zhì)量三要素
? 準(zhǔn)確性 ? 完整性 ? 一致性
5、數(shù)據(jù)預(yù)處理的內(nèi)容
? 數(shù)據(jù)清理(缺失值、離群值的處理方法)? 數(shù)據(jù)歸約(維災(zāi)難、維歸約、主成分分析)? 特征子集選擇 ? 特征創(chuàng)建/屬性構(gòu)造 ? 數(shù)據(jù)離散化和二元化 ? 屬性/變量轉(zhuǎn)換
6、數(shù)據(jù)探索性分析
? 統(tǒng)計(jì)匯總 ? 可視化
演練:描述性分析(頻數(shù)、描述、探索、分類匯總)
第二部分:數(shù)據(jù)挖掘流程(基礎(chǔ),決定你的高度)
1、數(shù)據(jù)挖掘概述
2、數(shù)據(jù)挖掘的標(biāo)準(zhǔn)流程(CRISP-DM)
? 商業(yè)理解 ? 數(shù)據(jù)準(zhǔn)備 ? 數(shù)據(jù)理解 ? 模型建立 ? 模型評估 ? 模型應(yīng)用
案例:4G終端營銷項(xiàng)目挖掘過程分析 案例:客戶匹配度模型—數(shù)據(jù)建模
3、常用數(shù)據(jù)統(tǒng)計(jì)指標(biāo)
? 集中程度:均值、中位數(shù)、眾數(shù) ? 離開程度:方差、標(biāo)準(zhǔn)差、極差 ? 分布趨勢:偏度、峰度
? 理解分布:正態(tài)分布、T分布、F分布
4、SPSS基本操作(預(yù)處理)
? 數(shù)據(jù)導(dǎo)入
? 數(shù)據(jù)排序(排序個(gè)案)
? 重復(fù)數(shù)據(jù)處理(標(biāo)識重復(fù)個(gè)案)? 缺失值處理(替換缺失值)
? 生成新變量(計(jì)算變量、重新編碼)? 數(shù)據(jù)分組(分類匯總)? 數(shù)據(jù)合并(合并文件)演練:SPSS基本操作
第三部分:數(shù)據(jù)挖掘?qū)崙?zhàn)篇
1、參數(shù)檢驗(yàn)分析(樣本均值檢驗(yàn))
商業(yè)問題:如何驗(yàn)證營銷效果的有效性? ? 參數(shù)檢驗(yàn)概述
? 單樣本T檢驗(yàn) ? 兩獨(dú)立樣本T檢驗(yàn) ? 兩配對樣本T檢驗(yàn) ? 參數(shù)檢驗(yàn)原理以及步驟 ? 參數(shù)檢驗(yàn)適用場景
案例:電信運(yùn)營商的ARPU值評估分析(單樣本)案例:信用卡消費(fèi)金額評估分析(單樣本)
案例:營銷方式與產(chǎn)品銷量的影響分析(兩獨(dú)立樣本)案例:吸煙與膽固醇升高的分析(兩獨(dú)立樣本)案例:營銷方式有效性評估(兩配對樣本)案例:減肥效果評估(兩配對樣本)
2、非參數(shù)檢驗(yàn)分析(樣本分布檢驗(yàn))
商業(yè)問題:這些屬性數(shù)據(jù)的分布情況如何?如何從數(shù)據(jù)分布中看出問題?
? 非參數(shù)檢驗(yàn)概述
? 單樣本檢驗(yàn) ? 兩獨(dú)立樣本檢驗(yàn) ? 兩相關(guān)樣本檢驗(yàn) ? 兩配對樣本檢驗(yàn) ? 非參數(shù)檢驗(yàn)原理
? 卡方檢驗(yàn)、二項(xiàng)分布、游程檢驗(yàn)的原理及適用場景 案例:死亡分布檢驗(yàn)(單樣本-卡方檢驗(yàn))案例:產(chǎn)品合格率檢驗(yàn)(單樣本-二項(xiàng)分布)案例:身高分布差異檢驗(yàn)(單樣本-KS檢驗(yàn))案例:設(shè)備正常工作檢驗(yàn)(單樣本-隨機(jī)分布)案例:制造工藝差異檢驗(yàn)(兩獨(dú)立樣本-MW檢驗(yàn))
案例:訓(xùn)練新方法有效性檢驗(yàn)(兩配對樣本-符號/秩檢驗(yàn))案例:促銷方式效果檢驗(yàn)(多相關(guān)樣本-Friedman檢驗(yàn))案例:客戶滿意度差異檢驗(yàn)(多相關(guān)樣本-Cochran Q檢驗(yàn))案例:評委評判黑幕檢驗(yàn)(多相關(guān)樣本-Kendall W檢驗(yàn))
3、相關(guān)分析(相關(guān)程度計(jì)算)
商業(yè)問題:這兩個(gè)屬性是否會相互影響?影響程度大嗎? ? 相關(guān)分析概述 ? 計(jì)算相關(guān)系數(shù)的三個(gè)公式
案例:家庭生活開支的相關(guān)分析(Pearson簡單相關(guān)系數(shù))案例:營銷費(fèi)用與銷售額的相關(guān)分析 案例:哪些因素與汽車銷量有相關(guān)性 案例:腰圍與體重的相關(guān)分析(偏相關(guān)分析)
4、方差分析(影響因素分析)
商業(yè)問題:哪些才是影響銷量的關(guān)鍵因素? ? 方差分析原理 ? 方差分析的步驟 ? 方差分析適用場景 ? 如何解讀方差分析結(jié)果
案例:終端陳列位置對終端銷量的影響分析(單因素)案例:廣告形式、地區(qū)對銷量的影響因素分析(多因素)案例:2015年大學(xué)生工資與父母職業(yè)的關(guān)系 案例:飼料對生豬體重的影響分析(協(xié)方差分析)
5、回歸分析(預(yù)測分析)
商業(yè)問題:如何預(yù)測未來的銷售量(定量分析)? ? 回歸分析概述及適用場景 ? 回歸分析的檢驗(yàn)過程 ? 如何選擇最優(yōu)回歸模型 ? 解讀回歸分析結(jié)果
案例:推廣費(fèi)用、辦公費(fèi)用與銷售額的關(guān)系(線性回歸)
案例:人均現(xiàn)金消費(fèi)支出對人均食品消費(fèi)支出的影響(曲線回歸)? 帶分類變量的回歸分析
? 比如,如何預(yù)測隨著季節(jié)性變化的銷量情況 案例:員工工齡、性別與終端銷售的關(guān)系分析 案例:產(chǎn)品銷量的季節(jié)性變化預(yù)測
6、邏輯回歸分析(預(yù)測分析)
商業(yè)問題:如果評估用戶購買某產(chǎn)品的概率? ? 邏輯回歸分析原理 ? 邏輯回歸分析的適用場景
案例:客戶購買預(yù)測分析(二元邏輯回歸)案例:品牌選擇預(yù)測分析(多項(xiàng)邏輯回歸)
7、時(shí)間序列分析(預(yù)測分析)
商業(yè)問題:隨著時(shí)間變化,未來的銷量變化趨勢如何? ? 時(shí)序分析概述
? 移動平均MA模型 ? 指數(shù)平滑ES模型
? 自回歸滑動平均ARIMA模型 ? 季節(jié)分解模型 ? 時(shí)序分析適用場景
案例:汽車銷量預(yù)測分析(指數(shù)平滑)案例:上交所指數(shù)收益率預(yù)測分析(ARIMA)
案例:服裝銷售數(shù)據(jù)季節(jié)性趨勢預(yù)測分析(季節(jié)分解)
第四部分:高級數(shù)據(jù)挖掘方法
1、聚類分析(Clustering)
商業(yè)問題:我們的客戶有幾類?各類特征是什么? ? 聚類方法原理介紹 ? 聚類方法適用場景
? 系統(tǒng)聚類(層次聚類)算法原理 ? 如何判定最佳聚類類別數(shù)量
案例:數(shù)據(jù)聚類分析--小康指數(shù)劃分(Q型聚類)案例:變量聚類分析--裁判標(biāo)準(zhǔn)一致性分析(R型聚類)? K均值聚類(快速聚類)算法原理 案例:移動三大品牌細(xì)分市場合適嗎? 案例:如何評選優(yōu)秀員工(固定聚類中心)演練:如何選擇新產(chǎn)品試銷地點(diǎn)?
2、決策樹分類分析(Classification)
商業(yè)問題:這類客戶有什么特征?有什么潛在銷售機(jī)會? ? 決策樹原理介紹
? 構(gòu)建決策樹的三個(gè)關(guān)鍵問題
? 如何選擇最佳屬性來構(gòu)建節(jié)點(diǎn) ? 如何分裂變量 ? 修剪決策樹 ? 選擇最優(yōu)屬性
? 熵、基尼索引、分類錯(cuò)誤 ? 屬性劃分增益 ? 如何分裂變量
? 多元?jiǎng)澐峙c二元?jiǎng)澐?/p>
? 連續(xù)變量離散化(最優(yōu)劃分點(diǎn))? 修剪決策樹
? 剪枝原則 ? 預(yù)剪枝與后剪枝 ? 如何評估分類性能
案例:銀行低信用客戶特征分析(決策樹分類)
3、基于規(guī)則的分類
? 基于規(guī)則分類原理介紹 ? 評估規(guī)則的質(zhì)量
? 構(gòu)建分類規(guī)則:順序覆蓋法 ? 規(guī)則增長策略
4、最近鄰分類
5、樸素貝葉斯分類
? 貝葉斯分類原理 ? 計(jì)算類別屬性的條件概率 ? 估計(jì)連續(xù)屬性的條件概率 ? 預(yù)測分類概率(計(jì)算概率)案例:評估銀行用戶拖欠貨款的概率
6、人工神經(jīng)網(wǎng)絡(luò)(ANN)
? 神經(jīng)網(wǎng)絡(luò)基本原理 ? 神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu) ? ANN關(guān)鍵問題 ? MLP與RBF 案例:評估銀行用戶拖欠貨款的概率
7、判別分析
? 判別分析原理 ? 距離判別法 ? 典型判別法 ? 貝葉斯判別法
案例:MBA學(xué)生錄取判別分析 案例:上市公司類別評估
8、關(guān)聯(lián)分析(Association)
商業(yè)問題:購買A產(chǎn)品的顧客還常常要購買其他什么產(chǎn)品? ? 關(guān)聯(lián)規(guī)則原理介紹 ? 關(guān)聯(lián)規(guī)則的兩個(gè)關(guān)鍵參數(shù)
? 支持度 ? 置信度 ? Apriori算法介紹 ? FP-Growth算法介紹 ? 關(guān)聯(lián)規(guī)則適用場景
案例:商品套餐設(shè)計(jì)、商品交叉銷售(關(guān)聯(lián)分析)
9、客戶價(jià)值評估RFM模型
商業(yè)問題:如何評估客戶的價(jià)值?不同價(jià)值客戶的營銷策略有什么區(qū)別?
? RFM模型介紹
? RFM模型用戶分類與業(yè)務(wù)策略 ? RFM與客戶活躍度分析
案例:客戶價(jià)值如何評估(什么才是VIP用戶)案例:如何選擇促銷用戶(響應(yīng)模型與促銷)案例:回頭客用戶特征分析(決策樹分析)
10、主成分分析
? 主成分分析方法介紹 ? 主成分分析基本思想 ? 主成分分析步驟
案例:評估汽車購買者關(guān)注的哪些因素
第五部分:統(tǒng)計(jì)圖表篇(看圖說話)
1、柱狀圖/線圖/餅圖/高低圖/箱圖/散點(diǎn)圖/直方圖
2、圖形的表達(dá)及適用場景 案例:各種圖形繪制
實(shí)戰(zhàn)1:客戶流失預(yù)警與客戶挽留之真實(shí)數(shù)據(jù)分析實(shí)踐 實(shí)戰(zhàn)2:銀行信用風(fēng)險(xiǎn)分析
結(jié)束:課程總結(jié)與問題答疑。
第二篇:數(shù)據(jù)挖掘心得體會
心得體會
這次數(shù)據(jù)挖掘?qū)嶒?yàn)結(jié)束了,期間我們小組明確分工并積極去完成,雖然有點(diǎn)辛苦,但我感覺充實(shí)而有收獲感!
根據(jù)老師給的一些資料,我們決定采用SQL Server 2000中的Northwind數(shù)據(jù)庫里的數(shù)據(jù)作為我們的實(shí)驗(yàn)數(shù)據(jù)。根據(jù)表Order Details中的數(shù)據(jù),我們分別根據(jù)ProductID和OrderID字段,并結(jié)合我們規(guī)定的最小支持度閥值對數(shù)據(jù)進(jìn)行篩選。依次篩選出1項(xiàng)頻繁集、2項(xiàng)頻繁集和3項(xiàng)頻繁集,其中還會使用游標(biāo)的方式來遍歷2項(xiàng)集與3項(xiàng)集的候選集,分別選出2項(xiàng)頻繁集和3項(xiàng)頻繁集。
由于數(shù)據(jù)較多,因此過程比較復(fù)雜,要編寫很多的查詢語句,建立許多數(shù)據(jù)表,包括臨時(shí)表。開始不知道則操作,但經(jīng)過我們各自多次重復(fù)的建表與查詢,逐漸的理解和有了自己的思路。尤其是在運(yùn)用游標(biāo)的方法進(jìn)行遍歷這塊,因?yàn)槲覀儽容^陌生而不理解,操作時(shí)一時(shí)無法實(shí)現(xiàn)結(jié)果,但經(jīng)過我們在網(wǎng)上查詢了解相關(guān)知識,最終得以解決。
經(jīng)過該次實(shí)驗(yàn),使我對數(shù)據(jù)庫的操作更加熟練,而且還使我對課本上的“挖掘頻繁模式”這塊知識有了很好的掌握,今后我會多做實(shí)驗(yàn),使我在實(shí)際操作過程中學(xué)得更好!
第三篇:數(shù)據(jù)挖掘試題
《數(shù)據(jù)挖掘》總復(fù)習(xí)題
1.?dāng)?shù)據(jù)挖掘系統(tǒng)可以根據(jù)什么標(biāo)準(zhǔn)進(jìn)行分類?
答:根據(jù)挖掘的數(shù)據(jù)庫類型分類、根據(jù)挖掘的知識類型分類、根據(jù)挖掘所用的技術(shù)分類、根據(jù)應(yīng)用分類
2.知識發(fā)現(xiàn)過程包括哪些步驟?
答:數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)選擇、數(shù)據(jù)變換、數(shù)據(jù)挖掘、模式評估、知識表示3.什么是概念分層?
答:一個(gè)映射序列,將低層概念映射到更一般的較高層概念。4.多維數(shù)據(jù)模型上的 OLAP 操作包括哪些?
答:上卷、下鉆、切片和切塊、轉(zhuǎn)軸 / 旋轉(zhuǎn)、其他OLAP操作5.OLAP 服務(wù)器類型有哪幾種?
答:關(guān)系 OLAP 服務(wù)器(ROLAP)、多維 OLAP 服務(wù)器(MOLAP)、混合 OLAP 服務(wù)器(HOLAP)、特殊的 SQL 服務(wù)器6.?dāng)?shù)據(jù)預(yù)處理技術(shù)包括哪些?
答:聚集、抽樣、維規(guī)約、特征子集選擇、特征創(chuàng)建、離散化和二元化、變量變換。7. 什么是數(shù)據(jù)清理?
答:填寫缺失的值,平滑噪聲數(shù)據(jù),識別、刪除離群點(diǎn),解決不一致性 8. 什么是數(shù)據(jù)集成?
答:集成多個(gè)數(shù)據(jù)庫、數(shù)據(jù)立方體或文件 9.什么是數(shù)據(jù)歸約?
答:得到數(shù)據(jù)集的壓縮表示,它小得多,但可以得到相同或相近的結(jié)果 10.?dāng)?shù)據(jù)清理的內(nèi)容包括哪些?
答:缺失值、噪聲數(shù)據(jù)、數(shù)據(jù)平滑、聚類、回歸11.將下列縮略語復(fù)原
OLAP——on-line analytical processing DM——data mining
KDD——knowledge discovery in databases OLTP——on-line transaction processingDBMS——database management system DWT——discrete wavelet transform
(DMQL)--Data Mining Query Language 12.什么是數(shù)據(jù)挖掘?
答:簡單地說,數(shù)據(jù)挖掘是從大量數(shù)據(jù)中提取或挖掘知識。具體地說,數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際 應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和 知識的過程。13.什么是關(guān)聯(lián)規(guī)則? 答:(關(guān)聯(lián)規(guī)則是形如X→Y的蘊(yùn)涵式,其中且,X和Y分別稱為關(guān)聯(lián)規(guī)則的先導(dǎo)和后繼。)假設(shè)I是項(xiàng)的集合。給定一個(gè)交易數(shù)據(jù)庫,其中每個(gè)事務(wù)(Transaction)t是I的非空子集,即,每一個(gè)交易都與一個(gè)唯一的標(biāo)識符TID(Transaction ID)對應(yīng)。關(guān)聯(lián)規(guī)則在D中的支持度(support)是D中事務(wù)同時(shí)包含X、Y的百分比,即概率;置信度(confidence)是包含X的事務(wù)中同時(shí)又包含Y的百分比,即條件概率。關(guān)聯(lián)規(guī)則是有趣的,如果滿足最小支持度閾值和最小置信度閾值。這些閾值是根據(jù)挖掘需要人為設(shè)定。
(關(guān)聯(lián)規(guī)則反映一個(gè)事物與其它事物之間的相互依存性和關(guān)聯(lián)性,如果兩個(gè)事物或者多個(gè)事物之間存在一定的關(guān)聯(lián)關(guān)系,那么其中一個(gè)事物就能夠通過其他事物預(yù)測到。)15.什么是概念描述?什么是特征化?什么是屬性相關(guān)分析?
答:概念描述:用匯總的、簡潔的和精確的方式描述各個(gè)類和概念可能是有用的。特征化:是目標(biāo)類數(shù)據(jù)的一般特性或特征的匯總。
屬性相關(guān)分析:可能需要在分類和預(yù)測之前進(jìn)行,它試圖識別對于分類或預(yù)測過程無用的屬性。這些屬性應(yīng)當(dāng)排除。
16.什么是數(shù)據(jù)倉庫?其主要特征是什么?
答:數(shù)據(jù)倉庫是一個(gè)提供決策支持功能的數(shù)據(jù)庫,它與組織機(jī)構(gòu)的操作數(shù)據(jù)庫分別維護(hù)。它允許將各種應(yīng)用系統(tǒng)集成在一起,為統(tǒng)一的歷史數(shù)據(jù)分析提供堅(jiān)實(shí)的平臺,對信息處理提供支持。
特征:面向主題、數(shù)據(jù)集成、隨時(shí)間而變化、數(shù)據(jù)不易丟失(數(shù)據(jù)不易丟失是最明顯特征)17.什么是數(shù)據(jù)集市?
答:數(shù)據(jù)集市包含企業(yè)范圍數(shù)據(jù)的一個(gè)子集,對于特定的用戶群是有用的。其范圍限于選定的主題。
(是完整的數(shù)據(jù)倉庫的一個(gè)邏輯子集,而數(shù)據(jù)倉庫正是由所有的數(shù)據(jù)集市有機(jī)組合而成的)18.?dāng)?shù)據(jù)庫中的知識發(fā)現(xiàn)過程由哪幾個(gè)步驟組成?
答:數(shù)據(jù)清理、數(shù)據(jù)倉庫、任務(wù)相關(guān)數(shù)據(jù)、數(shù)據(jù)挖掘、模式評估、知識表示 19.典型的數(shù)據(jù)挖掘系統(tǒng)有哪幾個(gè)主要成分?
答:數(shù)據(jù)庫、數(shù)據(jù)倉庫、萬維網(wǎng)或其他信息庫;數(shù)據(jù)庫或數(shù)據(jù)倉庫服務(wù)器;知識庫;數(shù)據(jù)挖掘引擎;模式評估模塊;用戶界面
20.從軟件工程的觀點(diǎn)來看,數(shù)據(jù)倉庫的設(shè)計(jì)和構(gòu)造包含哪些步驟?
答:規(guī)劃、需求研究、問題分析、倉庫設(shè)計(jì)、數(shù)據(jù)集成和測試、部署數(shù)據(jù)倉庫。21.在數(shù)據(jù)挖掘系統(tǒng)中,為什么數(shù)據(jù)清理十分重要?
答: 臟數(shù)據(jù)的普遍存在,使得在大型數(shù)據(jù)庫中維護(hù)數(shù)據(jù)的正確性和一致性成為一個(gè)極其困難的任務(wù)。
22.臟數(shù)據(jù)形成的原因有哪些?
答:濫用縮寫詞、數(shù)據(jù)輸入錯(cuò)誤、數(shù)據(jù)中的內(nèi)嵌控制信息、不同的的慣用語、重復(fù)記錄、丟失值、拼寫變化、不同的計(jì)量單位、過時(shí)的編碼23.?dāng)?shù)據(jù)清理時(shí),對空缺值有哪些處理方法?
答:忽略元組、人工填寫缺失值、使用一個(gè)全局變量填充缺失值、使用屬性的平均值填充缺失值、使用與給定元組屬同一類的所有樣本的屬性均值、使用最可能的值填充缺失值 24.什么是數(shù)據(jù)變換?包括哪些內(nèi)容?
答:將數(shù)據(jù)轉(zhuǎn)換或統(tǒng)一成適合于挖掘的形式。包括:光滑、聚集、數(shù)據(jù)泛化、規(guī)范化、屬性構(gòu)造 25. 數(shù)據(jù)歸約的策略包括哪些?
答:數(shù)據(jù)立方體聚集、性子集選擇、維度歸約、數(shù)值歸約、離散化和概念分層產(chǎn)生 26.提高數(shù)據(jù)挖掘算法效率有哪幾種思路?
答:減少對數(shù)據(jù)的掃描次數(shù);縮小產(chǎn)生的候選項(xiàng)集;改進(jìn)對候選項(xiàng)集的支持度計(jì)算方法 27.假定屬性income的最小值與最大值分別為12000和980到區(qū)間[0.0,1.0],根據(jù) min-max 規(guī)范化,income的值73600將變?yōu)椋?631/551_。
28.假定屬性income的平均值和標(biāo)準(zhǔn)差分別為54000和16000,使用 Z-score 規(guī)范化,值73600被轉(zhuǎn)換為_1.225_。
29.假定A的值由-986到917.A的最大絕對值為986,使用小數(shù)定標(biāo)規(guī)范化,-986被規(guī)范化為_-0.986_
30.從結(jié)構(gòu)角度來看,有哪三種數(shù)據(jù)倉庫模型。答:企業(yè)倉庫、數(shù)據(jù)集市、虛擬倉庫
31.什么是聚類分析?它與分類有什么區(qū)別?
答:將物理或抽象對象的集合分組成為由類似的對象組成的多個(gè)類的過程 區(qū)別:分類有監(jiān)督 聚類無監(jiān)督 分類要靠學(xué)習(xí)聚類要靠啟發(fā)式搜索 32.與數(shù)據(jù)挖掘類似的術(shù)語有哪些?
答:數(shù)據(jù)庫中挖掘知識、知識提取、數(shù)據(jù)/模式分析、數(shù)據(jù)考古和數(shù)據(jù)捕撈。33.解釋下列術(shù)語 34.翻譯下列術(shù)語
Data Mining 數(shù)據(jù)挖掘Data warehousing 數(shù)據(jù)倉庫Data Mart 數(shù)據(jù)集市
drill-down 下鉆roll-up上卷OLAP 聯(lián)機(jī)分析處理Data cube 數(shù)據(jù)立方體 Association rule 關(guān)聯(lián)規(guī)則Data cleaning數(shù)據(jù)清理Data integration 數(shù)據(jù)集成 Data transformation數(shù)據(jù)變換Data reduction 數(shù)據(jù)歸約
35.可以對按季度匯總的銷售數(shù)據(jù)進(jìn)行___B___,來觀察按月匯總的數(shù)據(jù)。A 上卷 B 下鉆 C 切片 D 切塊
36.可以對按城市匯總的銷售數(shù)據(jù)進(jìn)行____A__,來觀察按國家總的數(shù)據(jù)。A 上卷 B 下鉆 C 切片 D 切塊
37.通過不太詳細(xì)的數(shù)據(jù)得到更詳細(xì)的數(shù)據(jù),稱為____B____。A 上卷 B 下鉆 C 細(xì)化 D 維規(guī)約
38.三層數(shù)據(jù)倉庫結(jié)構(gòu)中,從底層到尾層分別是_倉庫數(shù)據(jù)服務(wù)器、OLAP服務(wù)器、前端客戶層__。
42.常用的四種興趣度的客觀度量。
答:簡單性 確定性 實(shí)用性 新穎性43.四種常用的概念分層類型。
答:模式分層、集合分組分層、操作導(dǎo)出的分層、基于規(guī)則的分層45.如何理解現(xiàn)實(shí)世界的數(shù)據(jù)是“骯臟的”?答:不完整的、含噪聲的、不一致的、重復(fù)的 46.多維數(shù)據(jù)倉庫有哪幾種概念模型?
答:星形模式、雪花形模式或事實(shí)星座形模式。
48.在多路數(shù)組聚集算法中,如何盡量少地占用內(nèi)存?
答:將最小的平面放在內(nèi)存中,將最大的平面每次只是提取并計(jì)算一塊。49.給出方體的維數(shù),會計(jì)算各D方體有多少,總的方體個(gè)數(shù)有多少?2^n50.什么是離群點(diǎn)?離群點(diǎn)都需要?jiǎng)h除嗎?為什么?
答:離群點(diǎn):一些與數(shù)據(jù)的一般行為或模型不一致的孤立數(shù)據(jù)。不需要。通常離群點(diǎn)被作為“噪音”或異常被丟棄,但在欺詐檢測中卻可以通過對罕見事件進(jìn)行離群點(diǎn)分析而得到結(jié)論。
【51.所有模式都是有趣的嗎?
答:一個(gè)模式是有趣的,如果(1)它易于被人理解 ;(2)在某種程度上,對于新的或測試數(shù)據(jù)是有效的;(3)具有潛在效用;(4)新穎的;(5)符合用戶確信的某種假設(shè)?!?/p>
第四篇:項(xiàng)目數(shù)據(jù)分析師事務(wù)所
項(xiàng)目數(shù)據(jù)分析師事務(wù)所
1.事務(wù)所應(yīng)該是什么性質(zhì)的企業(yè)?命名有標(biāo)準(zhǔn)嗎?如何為事務(wù)所起一個(gè)規(guī)范的名稱?
答:申請事務(wù)所應(yīng)該具備獨(dú)立的法人資格,一般是以股份制形式成立的有限責(zé)任公司。協(xié)會對事務(wù)所的命名是有標(biāo)準(zhǔn)要求的,按照要求,事務(wù)所的全稱應(yīng)為:(城市名)市(事務(wù)所名稱)項(xiàng)目數(shù)據(jù)分析師事務(wù)所有限責(zé)任公司
2.在地方城市的工商局能注冊成“事務(wù)所”嗎?
答:事務(wù)所的注冊首先需要得到協(xié)會審批,之后才可以向地方工商部門申請注冊。按照協(xié)會流程,申請人需先申報(bào)事務(wù)所預(yù)備案,通過后,持協(xié)會出具的相關(guān)文件,向工商部門申請事務(wù)所核名。事務(wù)所名稱中必需包含“數(shù)據(jù)分析”和“事務(wù)所”字樣。目前還未遇到持協(xié)會文件在工商部門無法審批含有“事務(wù)所”名稱的地區(qū)。
3.事務(wù)所業(yè)務(wù)范圍?
答:事務(wù)所的業(yè)務(wù)范圍應(yīng)為:(包括但不限于:行業(yè)數(shù)據(jù)分析、投資數(shù)據(jù)分析、經(jīng)營數(shù)據(jù)分析、運(yùn)營風(fēng)險(xiǎn)數(shù)據(jù)分析、決策數(shù)據(jù)分析、編制項(xiàng)目數(shù)據(jù)分析報(bào)告等),戰(zhàn)略咨詢,營銷策劃,投融資設(shè)計(jì)與服務(wù)等。
4.成立事務(wù)所應(yīng)具備哪些基礎(chǔ)條件,按照哪些流程進(jìn)行?
答:成立事務(wù)所應(yīng)具備的基礎(chǔ)條件如下:
a)擁有一定數(shù)量的項(xiàng)目數(shù)據(jù)分析師(協(xié)會目前要求至少為5名以上),項(xiàng)目數(shù)據(jù)分析師必須持有協(xié)會頒發(fā)的《項(xiàng)目數(shù)據(jù)分析師證書》,并且證書在有效期內(nèi);
b)事務(wù)所注冊資金在50萬以上;
c)擁有一定的業(yè)務(wù)基礎(chǔ)及運(yùn)營思路,堅(jiān)持良好的商業(yè)誠信。
d)能夠遵守行業(yè)準(zhǔn)則,接受協(xié)會監(jiān)督管理。
成立事務(wù)所一般的流程是:
1)有成立事務(wù)所的想法后,要為成立事務(wù)所做一些前期準(zhǔn)備工作,比如聯(lián)絡(luò)幾個(gè)志同道和的項(xiàng)目數(shù)據(jù)分析師,并且憑借現(xiàn)有資源提前做一些市場調(diào)研,尋找業(yè)務(wù)需求,在具有一定業(yè)務(wù)基礎(chǔ)的條件下成立事務(wù)所;
2)向協(xié)會會員處咨詢?nèi)霑绞?,參加會員處定期組織的創(chuàng)業(yè)指導(dǎo)活動;
3)事務(wù)所預(yù)備案:到協(xié)會網(wǎng)站“下載中心”下載《數(shù)據(jù)分析事務(wù)所成立預(yù)備案及入會申請報(bào)告(格式)》,按要求填寫電子版各種表格,填寫后發(fā)郵件給會員處進(jìn)行初審,會員處反饋意見后按要求補(bǔ)充或調(diào)整表格內(nèi)容,完善后郵寄正式申報(bào)材料;
4)符合條件的預(yù)備案申請將由會員處統(tǒng)一出具面向當(dāng)?shù)毓ど滩块T的相關(guān)文件,由申請人持文件正本向當(dāng)?shù)毓ど叹肿龀龊嗣暾垼?/p>
5)通過正式核名并獲得營業(yè)執(zhí)照后,申請人需將之前填報(bào)的《數(shù)據(jù)分析事務(wù)所成立預(yù)備案及入會申請報(bào)告(格式)》正本加蓋公章后提交正式入會申請;
6)會員處按流程審核申請,并于10個(gè)工作日內(nèi)通知申請人審批結(jié)果;
7)協(xié)會向通過審批的事務(wù)所發(fā)放資質(zhì);
5.事務(wù)所需要協(xié)會批嗎?
答:事務(wù)所在到工商部門核名前,必須先到協(xié)會進(jìn)行預(yù)備案審批,申請人持相關(guān)文件才能得到工商部門的批準(zhǔn)。事務(wù)所申報(bào)資料準(zhǔn)備目錄:入會申請書;項(xiàng)目數(shù)據(jù)分析師名單及每名項(xiàng)目數(shù)據(jù)分析師的證書、身份證復(fù)印件;申請人簡歷及身份證復(fù)印件;團(tuán)體會員申請登記表;事務(wù)所章程;事務(wù)所運(yùn)營方案,經(jīng)中國商業(yè)聯(lián)合會數(shù)據(jù)分析專業(yè)委員會審批合格后方可辦理。
6.現(xiàn)在全國有事務(wù)所嗎?哪些地方有?有多少家?
答:目前全國一共60多家項(xiàng)目數(shù)據(jù)分析師事務(wù)所,事務(wù)所遍布全國10多個(gè)省市自治區(qū),比如北京、陜西、浙江、江西、山東、江蘇、新疆、甘肅等。
7.一般事務(wù)所有多少人從業(yè)?
答: 一般事務(wù)所的規(guī)模在15-20人左右,有些規(guī)模大的已經(jīng)發(fā)展到40人以上。目前,在協(xié)會已審批的數(shù)據(jù)分析事務(wù)所中,50%以上都是建立在原有的會計(jì)師事務(wù)所、資產(chǎn)評估事務(wù)所等基礎(chǔ)上的,根據(jù)以往的經(jīng)驗(yàn),建議事務(wù)所優(yōu)先選擇原有內(nèi)部人才進(jìn)行培養(yǎng)。這樣做主要是因?yàn)槭聞?wù)所原有人才對公司的忠誠度較高,對業(yè)務(wù)及流程更為熟悉,愿意與公司共同發(fā)展。因此,對業(yè)務(wù)及人員的穩(wěn)定會有很大促進(jìn)作用。
8.項(xiàng)目數(shù)據(jù)分析的業(yè)務(wù)都從哪里來?
答:目前事務(wù)所普遍的項(xiàng)目數(shù)據(jù)分析業(yè)務(wù)主要來源于以下幾個(gè)方面:
1)在當(dāng)?shù)刈龈鞣N有效的廣告和宣傳,會有項(xiàng)目主動找上你;
2)利用自身已有的客戶資源,去挖掘其進(jìn)一步的數(shù)據(jù)分析需求;
3)請求協(xié)會幫助,共同開發(fā)當(dāng)?shù)卣?、組織及相關(guān)資源,展開行業(yè)合作,為事務(wù)所在當(dāng)?shù)亻_展業(yè)務(wù)提供更多便利;
4)以上為事務(wù)所普遍采用的業(yè)務(wù)開拓方式,各事務(wù)所還需因地制宜,找到拓展地方市場最為有效的方法。
9.事務(wù)所能從事法定業(yè)務(wù)嗎?未來能從事法定業(yè)務(wù)嗎?
答:首先要說明項(xiàng)目數(shù)據(jù)分析師事務(wù)所現(xiàn)在沒有法定業(yè)務(wù),未來更不會有法定業(yè)務(wù)。針對這個(gè)老生常談的話題,說明三個(gè)問題:
1)中國的經(jīng)濟(jì)將越來越市場化,“反壟斷法”也出臺了,很多原來政府壟斷的行業(yè)現(xiàn)在也全面市場化了。所謂的法定業(yè)務(wù),總讓人不自覺地與“壟斷”相聯(lián)系,其實(shí)不然,真正的法定業(yè)務(wù)只可能是應(yīng)特種行業(yè)或特種業(yè)務(wù)的需要而產(chǎn)生的,它是因?yàn)槟承┬袠I(yè)不能完全放開市場而形成的特殊性質(zhì)的“壟斷”。政府有個(gè)很明確的觀點(diǎn):企業(yè)的市場行為應(yīng)該讓市場去鑒定和評價(jià)。所以,對于有著明確的全市場特征的數(shù)據(jù)分析業(yè)而言,這種特殊的壟斷是不可能形成的。
2)數(shù)據(jù)分析業(yè)務(wù)中很重要的一個(gè)特點(diǎn)是“預(yù)測”,它要求分析師具有很強(qiáng)的經(jīng)驗(yàn)性和判斷性,這與會計(jì)師行業(yè)的已發(fā)生的、歷史的數(shù)據(jù)有著本質(zhì)上的區(qū)別??茖W(xué)性和藝術(shù)性的高度一致是數(shù)據(jù)分析師們追求的目標(biāo),但這也意味著它無法具備“法定業(yè)務(wù)”中所要求的特有的公正性。
3)法定業(yè)務(wù)是國家相關(guān)部門賦予行業(yè)的部分特殊權(quán)力,同時(shí)一定也意味著相應(yīng)的監(jiān)督和限制,比如收費(fèi)的限制、業(yè)務(wù)范圍的限制等等,清晰的規(guī)范意味著利潤空間的固定和狹窄,而數(shù)據(jù)分析業(yè)恰恰由于其工作的復(fù)雜性和分析的多樣性,造成了其高利潤的行業(yè)特點(diǎn)。從某個(gè)角度上看,“法定業(yè)務(wù)”并不像想象的那么美好。
10.一年能接多少個(gè)業(yè)務(wù)?業(yè)務(wù)額都是多少?
答:由于各地經(jīng)濟(jì)發(fā)展水平不同,事務(wù)所之間的業(yè)務(wù)數(shù)量差距較大。目前事務(wù)所年業(yè)務(wù)額平均超過百萬。此外,事務(wù)所經(jīng)營能力強(qiáng)弱也會對業(yè)務(wù)量產(chǎn)生直接影響,以北京地區(qū)為例,一些事務(wù)所之間的業(yè)務(wù)量相差達(dá)2-3 倍之多。
11.事務(wù)所盈利嗎?能給我介紹業(yè)務(wù)嗎?
答:目前,絕大部分事務(wù)所都在盈利,行業(yè)整體發(fā)展形勢旺盛。但任何一個(gè)行業(yè)都存在優(yōu)勝劣汰,事務(wù)所的盈利是取決于事務(wù)所自身經(jīng)營能力強(qiáng)弱的,并不能因?yàn)樾袠I(yè)旺盛,就忽視事務(wù)所自身經(jīng)營能力的培養(yǎng)。事務(wù)所一旦加入成為協(xié)會會員單位,就將共享協(xié)會帶來的一些資源,比如業(yè)務(wù)資源和平臺資源。協(xié)會不定期接到客戶的咨詢電話,希望協(xié)會可以為他們推薦事務(wù)所來提供報(bào)告服務(wù),那么,協(xié)會會將這些業(yè)務(wù)根據(jù)客戶所在地及相關(guān)要求向他們推薦相對應(yīng)的事務(wù)所。同時(shí),協(xié)會搭建的包括項(xiàng)目數(shù)據(jù)分析服務(wù)平臺在內(nèi)的各種平臺資源,事務(wù)所也將共享,經(jīng)過評估如果有一些好的項(xiàng)目,事務(wù)所可通過協(xié)會平臺幫助客戶推薦投資機(jī)構(gòu),幫助其實(shí)現(xiàn)融資。
12.協(xié)會可以為事務(wù)所提供一些經(jīng)營上的幫助嗎?
答:協(xié)會對事務(wù)所的經(jīng)營幫助主要體現(xiàn)在支撐職能上,如不定期舉辦的創(chuàng)業(yè)指導(dǎo)以及為優(yōu)秀融資項(xiàng)目推薦投資機(jī)構(gòu)等。事務(wù)所可以經(jīng)常與協(xié)會溝通,對經(jīng)營中的困難及時(shí)反映,主動尋求協(xié)會的幫助。
13.什么是項(xiàng)目數(shù)據(jù)分析報(bào)告?
答:項(xiàng)目數(shù)據(jù)分析報(bào)告是確定項(xiàng)目投資價(jià)值的重要依據(jù)。它通過數(shù)據(jù)分析,量化展現(xiàn)項(xiàng)目的收益性、風(fēng)險(xiǎn)性,為決策提供了充分的支持。項(xiàng)目數(shù)據(jù)分析報(bào)告包含環(huán)境評價(jià)、國民經(jīng)濟(jì)評價(jià)、財(cái)務(wù)評價(jià)、社會效益評價(jià)四大體系,深受國內(nèi)外投融資機(jī)構(gòu)的信賴。隨著項(xiàng)目數(shù)據(jù)分析報(bào)告在中國越來越廣泛的應(yīng)用,目前,它已經(jīng)逐漸成為投資金融機(jī)構(gòu)進(jìn)行項(xiàng)目投資初始判斷的最佳依據(jù)。
14.項(xiàng)目數(shù)據(jù)分析報(bào)告及服務(wù)與商業(yè)計(jì)劃書和可行性研究報(bào)告的區(qū)別?
答:商業(yè)計(jì)劃書側(cè)重于對項(xiàng)目盈利模式進(jìn)行描述說明,理論性較高,主要用于論證項(xiàng)目盈利結(jié)構(gòu)的合理性;可行性研究報(bào)告?zhèn)戎赜趯?xiàng)目是否可行進(jìn)行論證,結(jié)論相對單一。項(xiàng)目數(shù)據(jù)分析報(bào)告是立足于項(xiàng)目收益與風(fēng)險(xiǎn)預(yù)測,運(yùn)用“定量”的精確分析思想來對項(xiàng)目進(jìn)行論證。通過數(shù)據(jù)采集和模型分析,不但論證了項(xiàng)目盈利模式的合理性、項(xiàng)目實(shí)踐的可行性,還對項(xiàng)目盈利能力及抗風(fēng)險(xiǎn)能力的強(qiáng)弱、項(xiàng)目投資價(jià)值進(jìn)行了深入評估,最終得出項(xiàng)目評價(jià)及建議。同時(shí),項(xiàng)目數(shù)據(jù)分析報(bào)告是帶著企業(yè)戰(zhàn)略目標(biāo)和發(fā)展理念去評價(jià)整個(gè)項(xiàng)目和經(jīng)營情況,更加符合企業(yè)自身特點(diǎn)的分析、判斷和評價(jià)。
第五篇:讀《數(shù)據(jù)挖掘與數(shù)據(jù)化運(yùn)營實(shí)戰(zhàn)》有感
讀《數(shù)據(jù)挖掘與數(shù)據(jù)化運(yùn)營實(shí)戰(zhàn)》有感
近幾年來“云計(jì)算”一詞剛被各大科技公司炒得熱火朝天的,這“云計(jì)算”還沒走遠(yuǎn),“大數(shù)據(jù)”又突襲而來。仿佛一夜間,各廠商都紛紛改旗換幟,推廣起“大數(shù)據(jù)”來了。于是乎,本書也將針對這一熱點(diǎn)技術(shù),向讀者闡述了什么是大數(shù)據(jù),什么是數(shù)據(jù)挖掘,如何實(shí)戰(zhàn)運(yùn)用。書中列舉了很多“高大上”的理論公式、專業(yè)名稱、實(shí)戰(zhàn)圖表,說實(shí)話,我也沒耐得下性子一一仔細(xì)專研,只是從廣義地角度去通讀了全書,了解到該書反映的現(xiàn)實(shí)中企業(yè)如何運(yùn)用大數(shù)據(jù)分析來實(shí)現(xiàn)營銷獲利的。
這本書對這個(gè)大規(guī)模產(chǎn)生、分享和應(yīng)用數(shù)據(jù)的新的大數(shù)據(jù)時(shí)代進(jìn)行了闡述和厘清,作者圍繞“要全體不要抽樣、要效率不要絕對精確、要相關(guān)不要因果”三大理念,通過數(shù)十個(gè)商業(yè)和學(xué)術(shù)案例,剖析了萬事萬物數(shù)據(jù)化和數(shù)據(jù)復(fù)用挖掘的巨大價(jià)值。
如作者所言“大數(shù)據(jù)開啟了一次重大時(shí)代轉(zhuǎn)型。就像望遠(yuǎn)鏡讓我們能夠感受宇宙,顯微鏡讓我們看清微生物一樣,大數(shù)據(jù)要改變的是,我們的生活方方面面以及理解世界的方式”。比如,谷歌通過全球搜索分析,比國際疾病控防中心更早更準(zhǔn)地預(yù)測了流感爆發(fā)。
在思維變革部分,作者講述的重點(diǎn)是:樣本=總體,我們需要對全部數(shù)據(jù)的占有和分析;因此,數(shù)據(jù)缺乏時(shí)代的精確性不必執(zhí)迷,接受混雜基于大數(shù)據(jù)的簡單算法比小數(shù)據(jù)的復(fù)雜算法更有效;樣本推斷的因果關(guān)系不重要了,知道“是什么”的相關(guān)關(guān)系,或者結(jié)果就可以了。
而讀完本書,對于我自己最受用的是什么呢?就是“大數(shù)據(jù)分析”這個(gè)理念,鑒于數(shù)據(jù)化營銷在當(dāng)今大數(shù)據(jù)時(shí)代已經(jīng)是眾多現(xiàn)代企業(yè)的普遍經(jīng)營戰(zhàn)略,熟悉掌握數(shù)據(jù)挖掘與數(shù)據(jù)分析的人才,是企業(yè)之中的寶貴財(cái)富。如果有時(shí)間我也將會細(xì)讀和鉆研書中的數(shù)據(jù)挖掘與分析技術(shù),掌握并精通,學(xué)習(xí)數(shù)據(jù)挖掘可以從企業(yè)不同層面的人的視角去分析企業(yè)的運(yùn)營情況,通過預(yù)警和預(yù)測分析,為企業(yè)的經(jīng)營決策提供支持,因?yàn)椋簲?shù)據(jù)不會騙人。