欧美色欧美亚洲高清在线观看,国产特黄特色a级在线视频,国产一区视频一区欧美,亚洲成a 人在线观看中文

  1. <ul id="fwlom"></ul>

    <object id="fwlom"></object>

    <span id="fwlom"></span><dfn id="fwlom"></dfn>

      <object id="fwlom"></object>

      案例7-2 天津聯(lián)通利用SAS數(shù)據(jù)挖掘技術(shù)實現(xiàn)精細營銷

      時間:2019-05-13 09:26:51下載本文作者:會員上傳
      簡介:寫寫幫文庫小編為你整理了多篇相關(guān)的《案例7-2 天津聯(lián)通利用SAS數(shù)據(jù)挖掘技術(shù)實現(xiàn)精細營銷》,但愿對你工作學(xué)習(xí)有幫助,當(dāng)然你在寫寫幫文庫還可以找到更多《案例7-2 天津聯(lián)通利用SAS數(shù)據(jù)挖掘技術(shù)實現(xiàn)精細營銷》。

      第一篇:案例7-2 天津聯(lián)通利用SAS數(shù)據(jù)挖掘技術(shù)實現(xiàn)精細營銷

      案例7-2 天津聯(lián)通利用SAS數(shù)據(jù)挖掘技術(shù)實現(xiàn)精細營銷

      啤酒和尿布,風(fēng)馬牛不相及,但細心的超市經(jīng)營者發(fā)現(xiàn),把這兩件商品擺放在一起,比分置兩處,更能提升兩者的銷售額——因為周末購物的父親們會在買尿布的同時,習(xí)慣性地拿瓶啤酒?!诰驍?shù)據(jù),分析用戶購買習(xí)慣,發(fā)現(xiàn)用戶潛在的需求以做決策的依據(jù),這就是BI的力量。

      近四分之一個世紀(jì)以來,SAS始終致力于將原始數(shù)據(jù)轉(zhuǎn)變成知識和洞察力,提供能夠?qū)?shù)據(jù)倉庫技術(shù)、分析方法論和傳統(tǒng)的商業(yè)智能整合在一起的端到端的解決方案,以頂尖的技術(shù)和服務(wù)幫助客戶全面提升管理水平和決策能力,其專業(yè)和經(jīng)驗獲得了全球財富500強中94%的客戶認可。同時,財富500強的經(jīng)營智慧和他們對本行業(yè)的深刻洞察也幫助SAS獲得了對客戶所從事行業(yè)的寶貴經(jīng)驗。

      電信業(yè)競爭日趨白熱化,運營商們推出新業(yè)務(wù)的節(jié)奏越來越快,過于激烈的競爭使得決策不免倉促,缺乏扎實的市場依據(jù),最后淪為“價格戰(zhàn)”。信息產(chǎn)業(yè)部前部長、全國人大教科文衛(wèi)委員會副主任委員吳基傳最近對國內(nèi)電信市場“價格戰(zhàn)”的批評也正說明了問題的嚴(yán)重性。新的競爭環(huán)境下、中國聯(lián)通香港上市后國際投資人對公司管理水平“國際化”和公司贏利能力水平的提升都提出了更高的要求,天津聯(lián)通感受到需求的迫切,引進先進的軟件和服務(wù)系統(tǒng),成為提升其管理科學(xué)化的重要步驟。

      在全球市場,SAS服務(wù)于眾多大型電信運營商,SAS的產(chǎn)品功能模塊建立在對這些電信運營商業(yè)務(wù)分析的基礎(chǔ)之上,更具備行業(yè)通用性。同時,SAS也與上海、北京、浙江、河北等地的若干家電信運營商存在合作關(guān)系,對國內(nèi)運營商個性化的業(yè)務(wù)需求非常了解。兼具國際化的背景和本地化的經(jīng)驗,是天津聯(lián)通選擇SAS的重要原因。同時,天津聯(lián)通認為,商業(yè)智能軟件不僅投入較大,而且涉及企業(yè)的關(guān)鍵業(yè)務(wù)數(shù)據(jù),只有具備相當(dāng)資質(zhì)的大公司才值得信賴,而SAS的資質(zhì)和實力無疑獲得了天津聯(lián)通的信任。

      數(shù)據(jù)挖掘,幫助天津聯(lián)通實現(xiàn)營銷精細化

      顯然,在今天中國的電信市場上,粗放式的營銷已經(jīng)無法確保市場回報,營銷精細化、科學(xué)化是運營商生存的唯一選擇,而精細化、科學(xué)化的營銷決策需要情報支持系統(tǒng),電信運營商每天產(chǎn)生的業(yè)務(wù)數(shù)據(jù)不計其數(shù),這些數(shù)據(jù)之間是否存在諸如“尿布與啤酒”這樣的關(guān)系?這種關(guān)系又蘊涵著哪些潛藏的商機?僅憑直覺和觀察,能經(jīng)營小超市,但經(jīng)營一家大型的電信企業(yè),就需要專業(yè)的商業(yè)智能軟件做決策支持,這正是SAS所擅長的。

      天津聯(lián)通根據(jù)其業(yè)務(wù)需要與企業(yè)的實際情況,選擇了SAS電信業(yè)智能解決方案中的三個組成部分:客戶挽留解決方案、電信業(yè)客戶細分解決方案、電信業(yè)交叉銷售和提升銷售解決方案。這三個項目的實施,分別幫助天津聯(lián)通解決三個決策的問題:

      第一,是預(yù)測哪些客戶最具有流失的傾向以及影響客戶流失的關(guān)鍵因素,通過預(yù)制的分析模型提供“流失記分”幫助識別風(fēng)險客戶,在客戶流失之前采取針對性措施來挽留他們。

      第二,根據(jù)客戶可能的行為和潛在的盈利性對客戶進行分類,制定更準(zhǔn)確的產(chǎn)品組合、更準(zhǔn)確的產(chǎn)品介紹和產(chǎn)品捆綁服務(wù)。

      第三,從現(xiàn)有客戶中識別出有可能接受交叉銷售和提升銷售的客戶人選,評估客戶過去的購買模式,預(yù)測客戶下一步可能購買什么。

      通過運行該系統(tǒng),并對業(yè)務(wù)數(shù)據(jù)進行分析,天津聯(lián)通制訂了更精細的營銷策略,留住了利潤貢獻最高的客戶,并開發(fā)了更有針對性的新業(yè)務(wù),提高了每用戶平均收入(ARPU-Average Revenue Per User),增強了贏利能力。

      天津聯(lián)通的用戶對變化也有直接感受,一位入網(wǎng)4年多,每月消費額在500元以上的老客戶評價說,“天津聯(lián)通推出的客戶關(guān)懷活動讓我們感受到了作為老客戶的‘價值’,如果有人向我咨詢,我會向他們推薦使用聯(lián)通的服務(wù)?!?/p>

      專業(yè)服務(wù),授之以漁

      盡管是一家國際型企業(yè),但是SAS在與天津聯(lián)通溝通過程中,服務(wù)團隊還是讓天津聯(lián)通感覺到了溝通的融洽。從2000年到現(xiàn)在SAS一直致力于中國團隊的建設(shè),目前有兩支團隊已是相當(dāng)成熟,一個是技術(shù)支持和本地化開發(fā)隊伍,另外一個就是致力于客戶關(guān)系管理、客戶商務(wù)智能分析的銷售隊伍。

      天津聯(lián)通計費營帳中心數(shù)據(jù)挖掘項目經(jīng)理田龍認為,SAS的技術(shù)人員非常專業(yè),具備豐富的電信行業(yè)經(jīng)驗?!八麄兡軓膹?fù)雜的數(shù)據(jù)中找到有用的信息,用圖表的方式提供給我們,這些信息很容易看懂,并可以依此形成決策。他們對項目的把控能力也是一流的,系統(tǒng)交割清楚有序,并對我們的業(yè)務(wù)人員進行了系統(tǒng)的培訓(xùn)。”在SAS的培訓(xùn)下,天津聯(lián)通的業(yè)務(wù)分析人員已經(jīng)能夠熟練掌握系統(tǒng)的運行,獨立操作,從數(shù)據(jù)中找到他們真正需要的東西,而這種“授之以漁”,融咨詢、服務(wù)、培訓(xùn)為一體的模式,比單純銷售產(chǎn)品更加符合客戶的長遠利益。

      同時,SAS有著電信行業(yè)特有的數(shù)據(jù)結(jié)構(gòu)、電信領(lǐng)域的出色專家與業(yè)已證實的成功分析模型,這些都構(gòu)成了天津聯(lián)通智能化管理的基礎(chǔ)。先進的數(shù)據(jù)挖掘方法論SEMMA幫助發(fā)掘真正的商業(yè)智能,為天津聯(lián)通的市場決策做支持,而系統(tǒng)本身具有的智能應(yīng)用、高可用性、高可靠性、高擴展性等特性也充分滿足了客戶在相當(dāng)長一段時間內(nèi)的需求。

      提高決策成功率,降低總體擁有成本

      越大的企業(yè),決策的成本越高,一次錯誤的決策就可導(dǎo)致上千萬乃至上億的損失,減低決策風(fēng)險,對于大企業(yè)有特別的重要的意義。而SAS的BI系統(tǒng),不僅幫助客戶提升了贏利能力,也通過變主觀決策為數(shù)據(jù)決策,減低了決策失誤的機率。SASBI系統(tǒng)不僅能滿足客戶當(dāng)前的需求,也能滿足當(dāng)用戶數(shù)量增加和業(yè)務(wù)規(guī)模擴大時的需求,具備高可擴展性,真正做到了總體擁有成本最低。

      目前,這一智能解決方案的效果已經(jīng)被證實十分明顯,在新業(yè)務(wù)開發(fā)方面,天津聯(lián)通原來每1000人的電話銷售成功率是40人,而現(xiàn)在這一數(shù)字提高到了200人,也就是說成功率由原來的4%提高到了20%。

      應(yīng)用效果評價

      目前電信業(yè)的競爭越來越激烈,迫使電信業(yè)必須從過去粗放式的營銷模式轉(zhuǎn)向精細化、科學(xué)化管理。決策層要想盡快掌握和調(diào)整市場方向,就必須從每天產(chǎn)生的不計其數(shù)的業(yè)務(wù)數(shù)據(jù)中尋找出準(zhǔn)確、有效的數(shù)據(jù)。而SAS在數(shù)據(jù)挖掘領(lǐng)域技術(shù)不僅技術(shù)突出,而且其咨詢和實施顧問,由于長期在電信行業(yè)摸爬滾打,有著豐富的行業(yè)經(jīng)驗。另外,其電信行業(yè)特有的數(shù)據(jù)結(jié)構(gòu),以及系統(tǒng)本身具有的高可用性和高可擴展性也滿足了客戶的需求。

      值得一提的是,在項目實施期間SAS為用戶提供的業(yè)務(wù)流程和數(shù)據(jù)規(guī)范建議和意見,以及“授之以漁”的實施方法也推動了用戶對自身業(yè)務(wù)系統(tǒng)的優(yōu)化和深入認識。天津聯(lián)通計費營帳中心數(shù)據(jù)挖掘項目經(jīng)理田龍也表示,“SAS 幫助我們發(fā)現(xiàn)隱藏在數(shù)據(jù)之后的問題與機會,我們的營銷變得更有洞察力,準(zhǔn)確而迅速?!?/p>

      第二篇:企業(yè)戰(zhàn)略-利用數(shù)據(jù)挖掘技術(shù)提高飯店競爭力

      ★★★文檔資源★★★

      內(nèi)容摘要:在日益劇烈的業(yè)內(nèi)競爭壓力下,飯店是否能制定并執(zhí)行切實可行的市場戰(zhàn)略,關(guān)鍵取決于該飯店管理者對其顧客的偏好、以及影響顧客行為的因素了解得是否正確和全面。數(shù)據(jù)挖掘技術(shù)正可以為飯店管理者提供這樣一個全面、深刻了解顧客行為的窗口。有效的運用數(shù)據(jù)挖掘工具,并將獲得的信息轉(zhuǎn)化為切實可行的措施,能夠給我們的飯店帶來優(yōu)勢明顯的競爭力。

      關(guān)鍵詞:飯店業(yè)

      數(shù)據(jù)挖掘

      決策樹

      數(shù)據(jù)挖掘概述

      數(shù)據(jù)挖掘是指從大量的、不完全的、有噪聲的、模糊的、隨機的實際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。從商業(yè)角度,數(shù)據(jù)挖掘是一種新的商業(yè)信息處理技術(shù),其主要特點是對商業(yè)數(shù)據(jù)庫中的大量業(yè)務(wù)數(shù)據(jù)進行抽取、轉(zhuǎn)換、分析和其他模型化處理,從中提取輔助商業(yè)決策的關(guān)鍵性數(shù)據(jù)。

      據(jù)統(tǒng)計,數(shù)據(jù)開掘技術(shù)能夠發(fā)現(xiàn)和跟蹤數(shù)據(jù)集合中潛在的模式,因此,有人認為,在數(shù)據(jù)庫中,處理隱藏的知識、不可意料的模式和新規(guī)那么的發(fā)現(xiàn)的所有方法中,數(shù)據(jù)挖掘是最有效的。如果沒有數(shù)據(jù)挖掘技術(shù),許多數(shù)據(jù)就很可能停留在未使用的階段。正是數(shù)據(jù)挖掘為飯店管理者提供了全面、深入地分析和了解顧客及其行為特征的重要助臂;也正是由于其創(chuàng)造客戶價值的能力,數(shù)據(jù)挖掘技術(shù)已經(jīng)被國外一些飯店作為一個重要的競爭工具使用。比方:Hilton

      Corporation在它的Beverly

      Hills總部使用了E.piphany

      E.4軟件,Starwood

      Corporation也引進了Unica

      Corp的Affmium軟件。

      數(shù)據(jù)挖掘的研究方法和步驟

      飯店生存與否的關(guān)鍵,是它是否有能力為顧客提供令其滿意的效勞和設(shè)施,比方飯店的清潔狀況、登記入住和結(jié)賬是否方便快捷、飯店效勞員是否有禮貌、價格是否合理等等。

      但是要把這些對顧客偏好的了解轉(zhuǎn)化為有效的競爭力,飯店就需要挖掘有效的客戶特征信息。而飯店是否能制定并執(zhí)行切實可行的市場戰(zhàn)略正是取決于飯店對客戶偏好和行為特征的了解是否正確和全面。因此,我們首先需要利用數(shù)據(jù)挖掘技術(shù)開掘出詳細有效的客戶特征信息。

      定義目標(biāo)

      開發(fā)任何數(shù)據(jù)挖掘模型,都應(yīng)該遵守目標(biāo)同樣的規(guī)那么:明確的目標(biāo),恰當(dāng)?shù)臄?shù)據(jù)準(zhǔn)備,適宜的工具和技術(shù),嚴(yán)格的處理和全面的驗證。常常被忽略也最值得強調(diào)的是,數(shù)據(jù)挖掘模型之間最主要的區(qū)別是目標(biāo)的區(qū)別。其處理步驟往往是相同的。所以,我們在具體實施中,不僅要從建模的角度強調(diào)定義目標(biāo)的重要性,還需要從商業(yè)的角度強調(diào)清晰定義目標(biāo)的重要性。

      數(shù)據(jù)準(zhǔn)備

      數(shù)據(jù)準(zhǔn)備是數(shù)據(jù)挖掘模型開發(fā)過程的第一個步驟,也是最重要的步驟之一。雖然數(shù)據(jù)挖掘的工具也很重要,但是數(shù)據(jù)是框架〔信息庫〕,模型的質(zhì)量與底層的數(shù)據(jù)密切相關(guān)。數(shù)據(jù)準(zhǔn)備階段包括這幾個局部的工作——數(shù)據(jù)收集、數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)歸約。

      首先我們必須收集支持模型的有關(guān)數(shù)據(jù)。只有對目標(biāo)主體和市場有非常透徹的理解,才可能為目標(biāo)模型選擇出最正確的數(shù)據(jù)。在有了建模所需的完整數(shù)據(jù)集以后,下一步需要對數(shù)據(jù)進行清理,即檢查數(shù)據(jù),找出錯誤、異常值和缺失值。數(shù)據(jù)清理是數(shù)據(jù)準(zhǔn)備過程中最花費時間、最乏味,但也是最重要的步驟,因為后面挖掘工作的質(zhì)量依賴于數(shù)據(jù)的精確性和正確性。為了使后面的挖掘工作易于進行,我們還需要進行數(shù)據(jù)集成,即將來自不同數(shù)據(jù)源的數(shù)據(jù)整合成一致的數(shù)據(jù)存儲。在擁有明確的目標(biāo)和干凈、準(zhǔn)確的數(shù)據(jù)之后,還需要進行數(shù)據(jù)轉(zhuǎn)換〔將數(shù)據(jù)轉(zhuǎn)換為適于挖掘的形式〕和數(shù)據(jù)歸約,使數(shù)據(jù)能夠發(fā)揮最正確效果。

      選擇數(shù)據(jù)挖掘工具和技術(shù)

      數(shù)據(jù)挖掘工具有很多,比方:規(guī)那么歸納、聚類、決策樹、遺傳算法、神經(jīng)網(wǎng)絡(luò)等。每個工具都有它的優(yōu)點和缺點,不能簡單的說哪種工具好,哪種不好。我們需要針對具體的情況和飯店方案的目標(biāo)來選擇最適合的工具。

      這個步驟包括定義模型結(jié)構(gòu)〔是樹、神經(jīng)網(wǎng)絡(luò)、還是規(guī)那么歸納?〕、搜索〔選擇具體的算法〕和驗證〔什么時候算法能夠得到正確的模型并停止計算?〕。

      處理、驗證和實現(xiàn)模型

      模型開發(fā)的一個重要準(zhǔn)那么是:用模型開發(fā)過程中未使用過的數(shù)據(jù)來驗證模型。這個準(zhǔn)那么可以檢驗?zāi)P偷慕研浴K?,在?zhǔn)備好數(shù)據(jù)、選擇好適宜的數(shù)據(jù)挖掘工具后,需要進行的是模型處理之前最后一個步驟——將數(shù)據(jù)文件分割成建模數(shù)據(jù)集和驗證數(shù)據(jù)集兩個局部。然后,我們就可以用準(zhǔn)備好的數(shù)據(jù)和數(shù)據(jù)挖掘工具處理模型了。而建立的模型是否健壯,就需要在驗證數(shù)據(jù)集上檢驗?zāi)P汀H绻P万炞C的結(jié)果不佳,可能是由于數(shù)據(jù)有問題、變量匹配差或建模使用的數(shù)據(jù)挖掘技術(shù)不合理等因素造成的,就需要使用適宜的驗證技術(shù)使模型更加嚴(yán)格、有效。在成功地挖掘出有用的信息后,就可以利用這些信息來制定適宜的市場戰(zhàn)略。通過這種方式,我們可以把數(shù)據(jù)挖掘技術(shù)挖掘出來的信息轉(zhuǎn)化成為有效的企業(yè)競爭力。

      數(shù)據(jù)挖掘技術(shù)在飯店業(yè)的應(yīng)用

      這里引用了一個基于韓國豪華飯店的實例研究,旨在說明數(shù)據(jù)挖掘技術(shù)在飯店業(yè)的有效性和實用性,并借此案例進一步說明在飯店業(yè)使用數(shù)據(jù)挖掘技術(shù)的具體實施過程。這個研究的目標(biāo)是幫助飯店決策者建立飯店顧客的行為模式,并以此作為飯店制定可行市場戰(zhàn)略的重要根底。

      為了最大化地獲取并反映飯店顧客的行為模式,研究者選擇了韓國漢城在經(jīng)營價格、地理位置等方面都相似的11家飯店,并在光臨這11家飯店的顧客中精挑細選出281位顧客,對其進行了問卷調(diào)查。為了獲得顧客情況的數(shù)據(jù)資料,研究者在問卷調(diào)查中通過設(shè)定的14個問題,主要考察了與之相關(guān)聯(lián)的十多項數(shù)據(jù)。這十多項數(shù)據(jù)來自以下三個方面:顧客的人口統(tǒng)計學(xué)數(shù)據(jù)〔年齡、性別、國籍、職業(yè)〕;顧客的行為數(shù)據(jù)〔旅行的目的、過去光臨飯店的頻率、選擇的飯店、樓層類型、房間類型、支付方式……〕;顧客的心理或態(tài)度數(shù)據(jù)〔對飯店效勞員的禮貌、快速/平滑處理顧客投訴、預(yù)訂的便利性、前臺效勞等方面的滿意程度……〕。值得強調(diào)的是,研究者為模型選擇的數(shù)據(jù)是基于對飯店業(yè)本身以及顧客、市場情況等方面透徹理解之上的,比方研究者所考察的顧客對于飯店提供的某些效勞的滿意度數(shù)據(jù),是從已經(jīng)被證實與飯店效勞質(zhì)量緊密相關(guān)的屬性中挑選出來的。同時應(yīng)指出,由于顧客滿意度數(shù)據(jù)等是無法從飯店數(shù)據(jù)庫得到的,所以研究者使用了問卷調(diào)查這一方式對建模數(shù)據(jù)進行了完善。

      在獲得了建模所需的數(shù)據(jù)之后,研究者首先對收集的數(shù)據(jù)進行了清理,即填寫缺失值,平滑噪聲數(shù)據(jù),識別、刪除孤立點,并糾正數(shù)據(jù)的不一致性。但僅僅有準(zhǔn)確的數(shù)據(jù)是不夠的,還需要對一些數(shù)據(jù)進行處理。在這個研究實例中,研究者主要是把對一些顧客屬性數(shù)據(jù)〔包括飯店名稱;顧客的性別、國籍、職業(yè)、支付方式、旅行目的、選擇的房間和樓層類型;顧客對飯店預(yù)訂房間的便利性、效勞員的禮貌情況、效勞質(zhì)量、處理顧客投訴情況等方面的滿意程度〕轉(zhuǎn)化為了簡單的、便于處理的數(shù)字。比方:把研究中的11家飯店名稱用數(shù)字1-11表示;飯店把性別屬性轉(zhuǎn)化為0=男性,1=女性;把國籍屬性轉(zhuǎn)化為:1=美國,2=歐洲,3=日本,4=韓國,5=除了日韓的亞洲;把顧客對各項指標(biāo)的滿意度屬性都轉(zhuǎn)化為:5=非常滿意,4=比擬滿意,3=一般,2=比擬不滿意,1=完全不滿意;把顧客支付方式轉(zhuǎn)化為1=旅行支票,2=現(xiàn)金,3=信用卡;把顧客旅游目的轉(zhuǎn)化為1=商務(wù)旅行,2=旅游。然后,研究者把所有的數(shù)據(jù)都安排到一個Excel文件中,并將其轉(zhuǎn)化為SPSS格式,使后面的工作便于展開。

      針對這個研究的目標(biāo)——預(yù)測顧客在飯店選擇、房間類型選擇、支付方式等問題上的顧客行為模式,我們需要挖掘顧客行為模式與其人口統(tǒng)計學(xué)資料〔年齡、性別、國籍、職業(yè)〕、對飯店各項效勞或設(shè)施的滿意度情況之間的相互關(guān)系。而挖掘出的信息的商業(yè)價值在于為飯店經(jīng)理人提供決策依據(jù)。所以,挖掘出的信息必須是飯店經(jīng)理人容易理解的。這樣,信息最終才能轉(zhuǎn)化為飯店的優(yōu)勢競爭力。

      正是由于上述各種原因,研究者在諸多數(shù)據(jù)挖掘技術(shù)中選擇了結(jié)構(gòu)和生成規(guī)那么易于理解的決策樹。而在CART、C5.0、CHAID等多種建立決策樹的算法中,研究者選擇了C5.0,是由于其速度快、內(nèi)存占用小、修剪能力和交互驗證的特征能夠使預(yù)測更精確。

      為了能在具體實施中僅僅提煉出對飯店管理者設(shè)計有關(guān)戰(zhàn)略有用的信息,而不是產(chǎn)生大量的規(guī)那么集,研究者對訓(xùn)練數(shù)據(jù)集設(shè)置了一個精確度為50%的閥值,而且只選擇了預(yù)測精確性超過80%的規(guī)那么。研究者最終使用SPSS的數(shù)據(jù)挖掘應(yīng)用工具Clementine還是挖掘出了50多條有關(guān)規(guī)那么。這50多條規(guī)那么從顧客的年齡、國籍、職業(yè)、性別、旅行目的、選擇飯店、支付方式、光臨頻率、在飯店的停留時間等各個方面具體剖析了顧客的行為模式,揭示了導(dǎo)致或影響這些顧客行為的各種因素,其中一些能夠為飯店管理者提供決策上的支持。

      挖掘出的這50多條規(guī)那么中,有一些規(guī)那么是比擬明顯的,是有經(jīng)驗的飯店管理者在管理工作中已經(jīng)發(fā)現(xiàn)或是可以發(fā)覺的規(guī)那么;而另一些規(guī)那么卻是潛在的、是飯店管理者不易發(fā)覺或無法發(fā)覺的。同時,挖掘出來的這50多條規(guī)那么并不一定都是有用的或是有意義的,在管理者具體把這些規(guī)那么用于管理實踐中時,不同的戰(zhàn)略目標(biāo)往往需要不同的規(guī)那么作為根底。

      比方,研究者挖掘出了如下有關(guān)顧客光臨情況的規(guī)那么:假設(shè)顧客為30多歲的男性或30歲至40多歲的女性,并已經(jīng)光臨過某個飯店四次,那么這位顧客很有可能再光臨這家飯店或與之類似的飯店;而40多歲的男性顧客已經(jīng)光臨過某家飯店四次,那么不太可能再次光臨這家飯店或與之類似的飯店;光臨過某家飯店多于五次的女性顧客很可能再光臨這家飯店或與之類似的飯店十次以上;如果顧客已經(jīng)光臨過某家飯店兩次,而且他住在飯店的標(biāo)準(zhǔn)層,又是直接在飯店預(yù)訂房間的,同時他對于飯店房間的大小比擬滿意,那么這位顧客很可能再光臨這家飯店或與之類似的飯店五到九次。

      上述有關(guān)顧客光臨情況說明:這家飯店的管理者在對有價值顧客進行定位時,可以首先排除已經(jīng)光臨過本飯店四次的40多歲的男性顧客,并把已經(jīng)光臨過本飯店五次以上的女性顧客定位為最有價值顧客,同時把已經(jīng)光臨過本飯店四次的30多歲的男性和30至40多歲的女性定位為比擬有價值顧客。這樣,管理者就可以通過諸如僅針對有價值顧客進行??酮剟罘桨?,以保存核心顧客,培養(yǎng)其忠誠度;同時飯店還可以注意顧客預(yù)訂房間的方式和選擇的房間類型,并使飯店房間的布置更顯寬敞來提高顧客滿意度,著重對直接預(yù)訂標(biāo)準(zhǔn)層房間,且已經(jīng)光臨過飯店兩次的顧客進行顧客有效的保存措施。

      當(dāng)然,上面所提到的定位有價值顧客和顧客保存只是數(shù)據(jù)挖掘運用到飯店管理中的兩個例子;在實際中,這些挖掘出來的規(guī)那么還可以運用于飯店市場拓展、市場細分、顧客需求分析、創(chuàng)立個性化效勞等很多方面。有效的運用數(shù)據(jù)挖掘工具,并將其轉(zhuǎn)化為切實可行的措施,能夠給我們的飯店帶來極具競爭力的優(yōu)勢。特別是在數(shù)據(jù)挖掘技術(shù)在飯店業(yè)的應(yīng)用還處于初始階段的今天,早期有效采用數(shù)據(jù)挖掘技術(shù)能使其在飯店業(yè)中提升地位,更具競爭力。

      參考資料:

      1.劉靜艷、顏亮,酒店??酮剟罘桨冈谖覈膽?yīng)用[J],旅游科學(xué),2002

      2.吳東曉,基于顧客的飯店品牌價值影響因素的實證研究[J],南開管理評論,2003

      第三篇:C02 利用Python實現(xiàn)大數(shù)據(jù)分析與數(shù)據(jù)挖掘技術(shù)培訓(xùn)(5天)

      Python實現(xiàn)大數(shù)據(jù)挖掘技術(shù)培訓(xùn)

      【課程目標(biāo)】

      Python已經(jīng)成為數(shù)據(jù)分析和數(shù)據(jù)挖掘的首選語言,作為除了Java、C/C++/C#外最受歡迎的語言。

      本課程基于Python工具來實現(xiàn)大數(shù)據(jù)的數(shù)據(jù)分析和數(shù)據(jù)挖掘項目?;跇I(yè)務(wù)問題,在數(shù)據(jù)挖掘標(biāo)準(zhǔn)過程指導(dǎo)下,采用Python分析工具,實現(xiàn)數(shù)據(jù)挖掘項目的每一步操作,從數(shù)據(jù)預(yù)處理、數(shù)據(jù)建模、數(shù)據(jù)可視化,到最終數(shù)據(jù)挖掘結(jié)束,幫助學(xué)員掌握Python用于數(shù)據(jù)挖掘,提升學(xué)員的數(shù)據(jù)化運營及數(shù)據(jù)挖掘的能力。

      通過本課程的學(xué)習(xí),達到如下目的:

      1、全面掌握Python語言以及其編程思想。

      2、掌握常用擴展庫的使用,特別是數(shù)據(jù)挖掘相關(guān)庫的使用。

      3、學(xué)會使用Python完成數(shù)據(jù)挖掘項目整個過程。

      4、掌握利用Python實現(xiàn)可視化呈現(xiàn)。

      5、掌握數(shù)據(jù)挖掘常見算法在Python中的實現(xiàn)。【授課時間】

      5天時間

      (全部模塊講完需要5天時間,可以根據(jù)時間需求拆分內(nèi)容模塊)?!臼谡n對象】

      業(yè)務(wù)支持部、IT系統(tǒng)部、大數(shù)據(jù)系統(tǒng)開發(fā)部、大數(shù)據(jù)分析中心、網(wǎng)絡(luò)運維部等相關(guān)技術(shù)人員?!緦W(xué)員要求】

      課程為實戰(zhàn)課程,要求:

      1、每個學(xué)員自備一臺便攜機(必須)。

      2、便攜機中事先安裝好Excel 2010版本及以上。

      3、便攜機中事先安裝好Python 3.6版本及以上。

      注:講師現(xiàn)場提供開源的安裝程序、擴展庫,以及現(xiàn)場分析的數(shù)據(jù)源。

      【授課方式】

      語言基礎(chǔ) +挖掘模型 +案例演練+開發(fā)實踐+可視化呈現(xiàn)

      采用互動式教學(xué),圍繞業(yè)務(wù)問題,展開數(shù)據(jù)分析過程,全過程演練操作,讓學(xué)員在分析、分享、講授、總結(jié)、自我實踐過程中獲得能力提升?!菊n程大綱】

      第一部分:Python語言基礎(chǔ)

      目的:掌握基本的Python編程思想與編程語句,熟悉常用數(shù)據(jù)結(jié)構(gòu)的操作

      1、Python簡介

      2、開發(fā)環(huán)境搭建 ? Python的安裝 ? 擴展庫的安裝

      3、掌握Python的簡單數(shù)據(jù)類型 ?

      字符串的使用及操作 ? 整數(shù)、浮點數(shù)

      4、掌握基本語句:

      ? if、while、for、print等 ? 基本運算:

      ? 函數(shù)定義、參數(shù)傳遞、返回值

      5、掌握復(fù)雜的數(shù)據(jù)類型:列表/元組

      ? 列表操作:訪問、添加、修改、刪除、排序 ? 列表切片、復(fù)制等 ? 列表相關(guān)的函數(shù)、方法 ? 元組的應(yīng)用

      6、復(fù)雜數(shù)據(jù)類型:字典 ? 創(chuàng)建、訪問、修改、刪除、遍歷 ? 字典函數(shù)和方法

      7、復(fù)雜數(shù)據(jù)類型:集合

      8、掌握面向?qū)ο缶幊趟枷?? 創(chuàng)建類、繼承類 ? 模塊

      9、函數(shù)定義、參數(shù)傳遞、返回值10、11、標(biāo)準(zhǔn)庫與擴展庫的導(dǎo)入 異常處理:try-except塊

      演練:基本的Python編程語句

      第二部分:Python語言與數(shù)據(jù)挖掘庫

      目的:掌握數(shù)據(jù)集結(jié)構(gòu)及基本處理方法,進一步鞏固Python語言

      1、數(shù)據(jù)挖掘常用擴展庫介紹 ? Numpy數(shù)組處理支持 ? Scipy矩陣計算模塊

      ? Matplotlib數(shù)據(jù)可視化工具庫 ? Pandas數(shù)據(jù)分析和探索工具 ? StatsModels統(tǒng)計建模庫 ? Scikit-Learn機器學(xué)習(xí)庫 ? Keras深度學(xué)習(xí)(神經(jīng)網(wǎng)絡(luò))庫 ? Gensim文本挖掘庫

      2、數(shù)據(jù)集讀取與操作:讀取、寫入 ? 讀寫文本文件 ? 讀寫CSV文件 ? 讀寫Excel文件 ? 從數(shù)據(jù)庫獲取數(shù)據(jù)集

      3、數(shù)據(jù)集的核心數(shù)據(jù)結(jié)構(gòu)(Pandas數(shù)據(jù)結(jié)構(gòu))? DataFrame對象及處理方法 ? Series對象及處理方法

      演練:用Python實現(xiàn)數(shù)據(jù)的基本統(tǒng)計分析功能

      第三部分:數(shù)據(jù)可視化處理

      目的:掌握作圖擴展庫,實現(xiàn)數(shù)據(jù)可視化

      1、常用的Python作圖庫 ? Matplotlib庫 ? Pygal庫

      2、實現(xiàn)分類匯總

      演練:按性別統(tǒng)計用戶人數(shù)

      演練:按產(chǎn)品+日期統(tǒng)計各產(chǎn)品銷售金額

      3、各種圖形的畫法 ? 直方圖 ? 餅圖 ? 折線圖 ? 散點圖

      4、繪圖的美化技巧

      演練:用Python庫作圖來實現(xiàn)產(chǎn)品銷量分析,并可視化

      第四部分:數(shù)據(jù)挖掘基礎(chǔ) 目的:掌握數(shù)據(jù)挖掘標(biāo)準(zhǔn)流程

      1、數(shù)據(jù)挖掘概述

      2、數(shù)據(jù)挖掘的標(biāo)準(zhǔn)流程(CRISP-DM)? 商業(yè)理解 ? 數(shù)據(jù)準(zhǔn)備 ? 數(shù)據(jù)理解 ? 模型建立 ? 模型評估 ? 模型應(yīng)用

      3、數(shù)據(jù)挖掘常用任務(wù)與算法

      案例:用大數(shù)據(jù)實現(xiàn)精準(zhǔn)營銷的項目過程

      第五部分:數(shù)據(jù)理解和數(shù)據(jù)準(zhǔn)備

      目的:掌握數(shù)據(jù)預(yù)處理的基本環(huán)節(jié),以及Python的實現(xiàn)

      1、數(shù)據(jù)預(yù)處理

      ? 異常值處理:3σ準(zhǔn)則,IQR準(zhǔn)則 ? 缺失值插補:均值、拉格朗日插補 ? 數(shù)據(jù)篩選/抽樣 ? 數(shù)據(jù)的離散化處理 ? 變量變換、變量派生

      2、數(shù)據(jù)的基本分析

      ? 相關(guān)分析:原理、公式、應(yīng)用 ? 方差分析:原理、公式、應(yīng)用 ? 卡方分析:原理、公式、應(yīng)用 ? 主成分分析:降維

      案例:用Python實現(xiàn)數(shù)據(jù)預(yù)處理及數(shù)據(jù)準(zhǔn)備

      第四部分:分類預(yù)測模型實戰(zhàn)

      1、常見分類預(yù)測的模型與算法

      2、如何評估分類預(yù)測模型的質(zhì)量 ? 查準(zhǔn)率 ? 查全率 ? ROC曲線

      3、邏輯回歸分析模型 ? 邏輯回歸的原理 ? 邏輯回歸建模的步驟 ? 邏輯回歸結(jié)果解讀

      案例:用sklearn庫實現(xiàn)銀行貸款違約預(yù)測

      4、決策樹模型

      ? 決策樹分類的原理 ? 決策樹的三個關(guān)鍵問題 ? 決策樹算法與實現(xiàn) 案例:電力竊漏用戶自動識別

      5、人工神經(jīng)網(wǎng)絡(luò)模型(ANN)? 神經(jīng)網(wǎng)絡(luò)概述 ? 神經(jīng)元工作原理

      ? 常見神經(jīng)網(wǎng)絡(luò)算法(BP、LM、RBF、FNN等)案例:神經(jīng)網(wǎng)絡(luò)預(yù)測產(chǎn)品銷量

      6、支持向量機(SVM)? SVM基本原理 ? 維災(zāi)難與核心函數(shù)

      案例:基于水質(zhì)圖像的水質(zhì)評價

      7、貝葉斯分析 ? 條件概率 ? 常見貝葉斯網(wǎng)絡(luò)

      第五部分:數(shù)值預(yù)測模型實戰(zhàn)

      1、常用數(shù)值預(yù)測的模型 ? 通用預(yù)測模型:回歸模型

      ? 季節(jié)性預(yù)測模型:相加、相乘模型 ? 新產(chǎn)品預(yù)測模型:珀爾曲線與龔鉑茲曲線

      2、回歸分析概念

      3、常見回歸分析類別

      第六部分:聚類分析(客戶細分)實戰(zhàn)

      1、客戶細分常用方法

      2、聚類分析(Clustering)? 聚類方法原理介紹及適用場景 ? 常用聚類分析算法 ? 聚類算法的評價

      案例:使用SKLearn實現(xiàn)K均值聚類 案例:使用TSNE實現(xiàn)聚類可視化

      3、RFM模型分析

      ? RFM模型,更深入了解你的客戶價值 ? RFM模型與市場策略 案例:航空公司客戶價值分析

      第七部分:關(guān)聯(lián)規(guī)則分析實戰(zhàn)

      1、關(guān)聯(lián)規(guī)則概述

      2、常用關(guān)聯(lián)規(guī)則算法

      3、時間序列分析

      案例:使用apriori庫實現(xiàn)關(guān)聯(lián)分析 案例:中醫(yī)證型關(guān)聯(lián)規(guī)則挖掘

      第八部分:案例實戰(zhàn)(學(xué)員主導(dǎo),老師現(xiàn)場指導(dǎo))

      1、電商用戶行為分析及服務(wù)推薦

      2、基于基站定位數(shù)據(jù)的商圈分析

      結(jié)束:課程總結(jié)與問題答疑。

      第四篇:數(shù)據(jù)挖掘技術(shù)在信用卡業(yè)務(wù)中的應(yīng)用案例分享

      數(shù)據(jù)挖掘技術(shù)在信用卡業(yè)務(wù)中的應(yīng)用案例分享

      信用卡業(yè)務(wù)具有透支筆數(shù)巨大、單筆金額小的特點,這使得數(shù)據(jù)挖掘技術(shù)在信用卡業(yè)務(wù)中的應(yīng)用成為必然。國外信用卡發(fā)卡機構(gòu)已經(jīng)廣泛應(yīng)用數(shù)據(jù)挖掘技術(shù)促進信用卡業(yè)務(wù)的發(fā)展,實現(xiàn)全面的績效管理。我國自1985年發(fā)行第一張信用卡以來,信用卡業(yè)務(wù)得到了長足的發(fā)展,積累了巨量的數(shù)據(jù),數(shù)據(jù)挖掘在信用卡業(yè)務(wù)中的重要性日益顯現(xiàn)。

      一、數(shù)據(jù)挖掘技術(shù)在信用卡業(yè)務(wù)中的應(yīng)用

      數(shù)據(jù)挖掘技術(shù)在信用卡業(yè)務(wù)中的應(yīng)用主要有分析型客戶關(guān)系管理、風(fēng)險管理和運營管理。

      1.分析型CRM

      分析型CRM應(yīng)用包括市場細分、客戶獲取、交叉銷售和客戶流失。信用卡分析人員搜集和處理大量數(shù)據(jù),對這些數(shù)據(jù)進行分析,發(fā)現(xiàn)其數(shù)據(jù)模式及特征,分析某個客戶群體的特性、消費習(xí)慣、消費傾向和消費需求,進而推斷出相應(yīng)消費群體下一步的消費行為,然后以此為

      基礎(chǔ),對所識別出來的消費群體進行特定產(chǎn)品的主動營銷。這與傳統(tǒng)的不區(qū)分消費者對象特征的大規(guī)模營銷手段相比,大大節(jié)省了營銷成本,提高了營銷效果,從而能為銀行帶來更多的利潤。對客戶采用何種營銷方式是根據(jù)響應(yīng)模型預(yù)測得出的客戶購買概率做出的,對響應(yīng)概率高的客戶采用更為主動、人性化的營銷方式,如電話營銷、上門營銷;對響應(yīng)概率較低的客戶可選用成本較低的電子郵件和信件營銷方式。除獲取新客戶外,維護已有優(yōu)質(zhì)客戶的忠誠度也很重要,因為留住一個原有客戶的成本要遠遠低于開發(fā)一個新客戶的成本。在客戶關(guān)系管理中,通過數(shù)據(jù)挖掘技術(shù),找到流失客戶的特征,并發(fā)現(xiàn)其流失規(guī)律,就可以在那些具有相似特征的持卡人還未流失之前,對其進行有針對性的彌補,使得優(yōu)質(zhì)客戶能為銀行持續(xù)創(chuàng)造價值。

      2.風(fēng)險管理

      數(shù)據(jù)挖掘在信用卡業(yè)務(wù)中的另一個重要應(yīng)用就是風(fēng)險管理。在風(fēng)險管理中運用數(shù)據(jù)挖掘技術(shù)可建立各類信用評分模型。模型類型主要有三種:申請信用卡評分卡、行為信用評分卡和催收信用評分卡,分別為信用卡業(yè)務(wù)提供事前、事中、和事后的信用風(fēng)險控制。

      申請評分模型專門用于對新申請客戶的信用評估,它應(yīng)用于信用卡征信審核階段,通過申請人填寫的有關(guān)個人信息,即可有效、快速地辨別和劃分客戶質(zhì)量,決定是否審批通過并對審批通過的申請人核定初始信用額度,幫助發(fā)卡行從源頭上控制風(fēng)險。申請評分模型不依賴于人們的主觀判斷或經(jīng)驗,有利于發(fā)卡行推行統(tǒng)一規(guī)范的授信政策。行為評分模型是針對已有持卡人,通過對持卡客戶的行為進行監(jiān)控和預(yù)測,從而評估持卡客戶的信用風(fēng)險,并根據(jù)模型結(jié)果,智能化地決定是否調(diào)整客戶信用額度,在授權(quán)時決定是否授權(quán)通過,到期換卡時是

      否進行續(xù)卡操作,對可能出現(xiàn)的使其提前進行預(yù)警。催收評分模型是申請評分模型和行為評分模型的補充,是在持卡人產(chǎn)生了逾期或壞賬的情況下建立的。催收評分卡被用于預(yù)測和評估對某一筆壞賬所采取措施的有效性,諸如客戶對警告信件反應(yīng)的可能性。這樣,發(fā)卡行就可以根據(jù)模型的預(yù)測,對不同程度的逾期客戶采取相應(yīng)措施進行處理。以上三種評分模型在建立時,所利用的數(shù)據(jù)主要是人口統(tǒng)計學(xué)數(shù)據(jù)和行為數(shù)據(jù)。人口統(tǒng)計學(xué)數(shù)據(jù)包括年齡、性別、婚姻狀況、教育背景、家庭成員特點、住房情況、職業(yè)、職稱、收入狀況等。行為數(shù)據(jù)包括持卡人在過去使用信用卡的表現(xiàn)信息,如使用頻率、金額、還款情況等。由此可見,數(shù)據(jù)挖掘技術(shù)的使用,可以使銀行有效地建立起事前、事中到事后的信用風(fēng)險控制體系。

      3.運營管理

      雖然數(shù)據(jù)挖掘在信用卡運營管理領(lǐng)域的應(yīng)用不是最重要的,但它已為國外多家發(fā)卡公司在提高生產(chǎn)效率、優(yōu)化流程、預(yù)測資金和服務(wù)需求、提供服務(wù)次序等問題的分析上取得了較大成績。

      二、常用的數(shù)據(jù)挖掘方法

      上述數(shù)據(jù)挖掘技術(shù)在信用卡領(lǐng)域的應(yīng)用中,有很多工具可用于開發(fā)預(yù)測和描述模型。有些用統(tǒng)計方法,如線性回歸和邏輯回歸;有些有非統(tǒng)計或混合方法,如神經(jīng)網(wǎng)絡(luò)、遺傳算法、決策樹及回歸樹。這里僅討論幾種常見的典型方法。

      1.線性回歸

      簡單線性回歸分析是量化兩個連續(xù)變量之間關(guān)系的一種統(tǒng)計技術(shù)。這兩個變量分別是因變量(預(yù)測變量)。使用這一方法,可以發(fā)現(xiàn)一條穿過數(shù)據(jù)的線,線上的點使對應(yīng)數(shù)據(jù)點的方差最小。為市場營銷、風(fēng)險和客戶關(guān)系管理建立模型時,通常有多個自變量,用多個獨立自變量來預(yù)測一個連續(xù)變量稱為多元線性回歸,用線性回歸方法建立的模型通常具有魯棒性。

      2.邏輯回歸

      邏輯回歸是使用最廣泛的建模技術(shù),與線性回歸很相似。兩者的主要區(qū)別在于邏輯回歸的因變量(想預(yù)測變量)不是連續(xù)的,而是離散的或者類型變量。如申請評分模型可運用邏輯回歸方法,選取關(guān)鍵變量確定回歸系數(shù)。以申請者的關(guān)鍵變量x1,x2,…xm為自變量,以y=[1 申請者是壞客戶;0 申請者是好客戶,為因變量,則對于二分類因變量,一般假設(shè)客戶變壞的概率為 p(y=1)=eβ0+β1×1+…+βmxm/1+eβ0+β1×1+…+βmxm式中,β0,β1…,βm是常數(shù),即1n(p/1-p)=β0+β1×1+…+βmxm

      3.神經(jīng)網(wǎng)絡(luò)

      神經(jīng)網(wǎng)絡(luò)處理和回歸處理大不相同,它不依照任何概率分布,而是模仿人腦功能,可以認為它是從每一次經(jīng)驗中提取并學(xué)習(xí)信息。神經(jīng)網(wǎng)絡(luò)系統(tǒng)由一系列類似于人腦神經(jīng)元一樣的節(jié)點組成,這些節(jié)點通過網(wǎng)絡(luò)彼此互連。如果有數(shù)據(jù)輸入,它們便可以進行確定數(shù)據(jù)模式的工作。神經(jīng)網(wǎng)絡(luò)由相互連接的輸入層、中間層(或隱藏層)、輸出層組成。中間層由多個節(jié)點組成,完成大部分網(wǎng)絡(luò)工作。輸出層輸出數(shù)據(jù)分析的執(zhí)行結(jié)果。

      4.遺傳算法

      與神經(jīng)元網(wǎng)絡(luò)類似,遺傳算法也不遵循任何概率分布,是源自“適者生存”的進化過程。它首先將問題的可能解按某種形式進行編碼,編碼后的解稱為染色體。隨機選取n個染色體作為初始種群,再根據(jù)預(yù)定的評價函數(shù)對每個染色體計算適應(yīng)值,性能較好的染色體有較高的適應(yīng)值。選擇適應(yīng)值較高的染色體進行復(fù)制,并通過遺傳算子產(chǎn)生一群新的更適應(yīng)環(huán)境的染色體,形成新的種群,直至最后收斂到一個最適應(yīng)環(huán)境的個體,得到問題的最優(yōu)化解。

      5.決策樹

      決策樹的目標(biāo)是逐步將數(shù)據(jù)分類到不同的組或分支中,在因變量的值上建立最強劃分。由于分類規(guī)則比較直觀,所以易于理解。圖1為客戶響應(yīng)的決策樹,從中很容易識別出響應(yīng)率最高的組。

      三、實例分析

      以下以邏輯回歸方法建立信用卡申請評分模型為例,說明數(shù)據(jù)挖掘技術(shù)在信用卡業(yè)務(wù)中的應(yīng)用。申請評分模型設(shè)計可分為7個基本步驟。

      1.定義好客戶和壞客戶的標(biāo)準(zhǔn)

      好客戶和壞客戶的標(biāo)準(zhǔn)根據(jù)適合管理的需要定義。按照國外的經(jīng)驗,建立一個預(yù)測客戶好壞的風(fēng)險模型所需的好、壞樣本至少各要有1000個左右。為了規(guī)避風(fēng)險,同時考慮到信用卡市場初期,銀行的效益來源主要是銷售商的傭金、信用卡利息、手續(xù)費收入和資金的運作利差。因此,一般銀行把降低客戶的逾期率作為一個主要的管理目標(biāo)。比如,將壞客戶定義為出現(xiàn)過逾期60天以上的客戶;將壞客戶定義為出現(xiàn)過逾期60天以上的客戶;將好客戶定義為沒有30天以上逾期且當(dāng)前沒有逾期的客戶。

      一般來講,在同一樣本空間內(nèi),好客戶的數(shù)量要遠遠大于壞客戶的數(shù)量。為了保證模型具有較高的識別壞客戶的能力,取好、壞客戶樣本數(shù)比率為1:1。

      2.確定樣本空間

      樣本空間的確定要考慮樣本是否具有代表性。一個客戶是好客戶,表明持卡人在一段觀察期內(nèi)用卡表現(xiàn)良好;而一個客戶只要出現(xiàn)過“壞”的記錄,就把他認定為壞客戶。所以,一般好客戶的觀察期要比壞客戶長一些、好、壞客戶可以選擇在不同的時間段,即不同的樣本空間內(nèi)。比如,好客戶的樣本空間為2003年11月-2003年12月的申請人,壞客戶的樣本空間為2003年11月-2004年5月的申請人,這樣既能保證好客戶的表現(xiàn)期較長,又能保證有足夠數(shù)量的壞客戶樣本。當(dāng)然,抽樣的好、壞客戶都應(yīng)具有代表性。

      3.數(shù)據(jù)來源

      在美國,有統(tǒng)一的信用局對個人信用進行評分,通常被稱為“FICO評分”。美國的銀行、信用卡公司和金融機構(gòu)在對客戶進行信用風(fēng)險分析時,可以利用信用局對個人的數(shù)據(jù)報告。在我國,由于征信系統(tǒng)還不完善,建模數(shù)據(jù)主要來自申請表。隨著我國全國性征信系統(tǒng)的逐步完善,未來建模的一部分數(shù)據(jù)可以從征信機構(gòu)收集到。

      4.數(shù)據(jù)整理

      大量取樣的數(shù)據(jù)要真正最后進入模型,必須經(jīng)過數(shù)據(jù)整理。在數(shù)據(jù)處理時應(yīng)注意檢查數(shù)據(jù)的邏輯性、區(qū)分“數(shù)據(jù)缺失”和“0”、根據(jù)邏輯推斷某些值、尋找反常數(shù)據(jù)、評估是否真實??梢酝ㄟ^求最小值、最大值和平均值的方法,初步驗證抽樣數(shù)據(jù)是否隨機、是否具有代表性。

      5.變量選擇

      變量選擇要同時具有數(shù)學(xué)統(tǒng)計的正確性和信用卡實際業(yè)務(wù)的解釋力。Logistic回歸方法是盡可能準(zhǔn)確找到能夠預(yù)測因變量的自變量,并給予各自變量一定權(quán)重。若自變量數(shù)量太少,擬合的效果不好,不能很好地預(yù)測因變量的情況;若自變量太多,會形成過分擬合,預(yù)測因變量的效果同樣不好。所以應(yīng)減少一些自變量,如用虛擬變量表示不能量化的變量、用單變量和決策樹分析篩選變量。與因變量相關(guān)性差不多的自變量可以歸為一類,如地區(qū)對客戶變壞概率的影響,假設(shè)廣東和福建兩省對壞客戶的相關(guān)性分別為-0.381和-0.380,可將這兩個地區(qū)歸為一類,另外,可以根據(jù)申請表上的信息構(gòu)造一些自變量,比如結(jié)合申請表上“婚姻狀況”和“撫養(yǎng)子女”,根據(jù)經(jīng)驗和常識結(jié)合這兩個字段,構(gòu)造新變量“已婚有子女”,進入模型分析這個變量是不真正具有統(tǒng)計預(yù)測性。

      6.模型建立

      借助SAS9軟件,用逐步回歸法對變量進行篩選。這里設(shè)計了一種算法,分為6個步驟。

      ? 步驟1:求得多變量相關(guān)矩陣(若是虛擬變量,則>0.5屬于比較相關(guān);若是一般變量,則>0.7-0.8屬于比較相關(guān))。

      ? 步驟2:旋轉(zhuǎn)主成分分析(一般變量要求>0.8屬于比較相關(guān);虛擬變量要求>0.6-0.7屬于比較相關(guān))。

      ? ? 步驟3:在第一主成分和第二主成分分別找出15個變量,共30個變量。步驟4:計算所有30個變量對好/壞的相關(guān)性,找出相關(guān)性大的變量加入步驟3得出的變量。

      ? 步驟5:計算VIF。若VIF數(shù)值比較大,查看步驟1中的相關(guān)矩陣,并分別分析這兩個變量對模型的作用,剔除相關(guān)性較小的一個。

      ? 步驟6:循環(huán)步驟4和步驟5,直到找到所有變量,且達到多變量相關(guān)矩陣相關(guān)性很而單個變量對模型貢獻作用大。7.模型驗證

      在收集數(shù)據(jù)時,把所有整理好的數(shù)據(jù)分為用于建立模型的建模樣本和用于模型驗證的對照樣本。對照樣本用于對模型總體預(yù)測性、穩(wěn)定性進行驗證。申請評分模型的模型檢驗指標(biāo)包括K-S值、ROC、AR等指標(biāo)。雖然受到數(shù)據(jù)不干凈等客觀因素的影響,本例申請評分模型的K-S值已經(jīng)超過0.4,達到了可以使用的水平。

      四、數(shù)據(jù)挖掘在國內(nèi)信用卡市場的發(fā)展前景

      在國外,信用卡業(yè)務(wù)信息化程度較高,數(shù)據(jù)庫中保留了大量的數(shù)量資源,運用數(shù)據(jù)技術(shù)建立的各類模型在信用卡業(yè)務(wù)中的實施非常成功。目前國內(nèi)信用卡發(fā)卡銀行首先利用數(shù)據(jù)挖掘建立申請評分模型,作為在信用卡業(yè)務(wù)中應(yīng)用的第一步,不少發(fā)卡銀行已經(jīng)用自己的歷史數(shù)據(jù)建立了客戶化的申請評分模型??傮w而言,數(shù)據(jù)挖掘在我國信用卡業(yè)務(wù)中的應(yīng)用處于數(shù)據(jù)質(zhì)量問題,難于構(gòu)建業(yè)務(wù)模型。

      隨著國內(nèi)各家發(fā)卡銀行已經(jīng)建立或著手建立數(shù)據(jù)倉庫,將不同操作源的數(shù)據(jù)存放到一個集中的環(huán)境中,并且進行適當(dāng)?shù)那逑春娃D(zhuǎn)換。這為數(shù)據(jù)挖掘提供了一個很好的操作平臺,將給數(shù)據(jù)挖掘帶來各種便利和功能。人民銀行的個人征信系統(tǒng)也已上線,在全國范圍內(nèi)形成了個人信用數(shù)據(jù)的集中。在內(nèi)部環(huán)境和外部環(huán)境不斷改善的基礎(chǔ)上,數(shù)據(jù)挖掘技術(shù)在信用卡業(yè)務(wù)中將具有越來越廣闊的應(yīng)用前景。

      下載案例7-2 天津聯(lián)通利用SAS數(shù)據(jù)挖掘技術(shù)實現(xiàn)精細營銷word格式文檔
      下載案例7-2 天津聯(lián)通利用SAS數(shù)據(jù)挖掘技術(shù)實現(xiàn)精細營銷.doc
      將本文檔下載到自己電腦,方便修改和收藏,請勿使用迅雷等下載。
      點此處下載文檔

      文檔為doc格式


      聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻自行上傳,本網(wǎng)站不擁有所有權(quán),未作人工編輯處理,也不承擔(dān)相關(guān)法律責(zé)任。如果您發(fā)現(xiàn)有涉嫌版權(quán)的內(nèi)容,歡迎發(fā)送郵件至:645879355@qq.com 進行舉報,并提供相關(guān)證據(jù),工作人員會在5個工作日內(nèi)聯(lián)系你,一經(jīng)查實,本站將立刻刪除涉嫌侵權(quán)內(nèi)容。

      相關(guān)范文推薦