第一篇:數(shù)據(jù)分析與建模,實驗報告,實驗二,,數(shù)據(jù)分析工具初步使用
學生學號
實驗課成績
學 學 生 實 驗 報 告 書
實驗課程名稱 數(shù)據(jù)分析與建模 開 開 課 學 院 管理學院 指導教師姓名 鄢 丹 學 學 生 姓 名
學生專業(yè)班級 信管 16 班
2018 —2019 學年
第1
學期實驗報告填寫說明
1. 綜合性、設計性實驗必須填寫實驗報告,驗證、演示性實驗可不寫實驗報告。
2. 實驗報告書 必須按統(tǒng)一格式制作(實驗中心網(wǎng)站有下載)。
3. 老師在指導學生實驗時,必須按實驗大綱的要求,逐項完成各項實驗;實驗報告書中的實驗課程名稱和實驗項目 必須與實驗指導書一致。
4. 每項實驗依據(jù)其實驗內容的多少,可安排在一個或多個時間段內完成,但每項實驗只須填寫一份實驗報告。
5. 每份實驗報告教師都應該有簽名、評分表及實驗報告成績。
6. 教師應及時評閱學生的實驗報告并給出各實驗項目成績,完整保存實驗報告。在完成所有實驗項目后,教師應按學生姓名將批改好的各實驗項目實驗報告裝訂成冊,構成該實驗課程總報告,按班級交到實驗中心,每個班級實驗報告袋中附帶一份實驗指導書及班級實驗課程成績表。
7. 實驗報告封面信息需填寫完整,并給出實驗環(huán)節(jié)的成績,實驗環(huán)節(jié)成績按其類型采取百分制或優(yōu)、良、中、及格和不及格五級評定(與課程總成績一致),并記入課程總成績中。
實驗課程名稱:_ 數(shù)據(jù)分析與建模__
實驗項目名稱 實驗二
數(shù)據(jù)分析工具的初步使用 實驗 成績
實 實 驗 者
專業(yè)班級
組 組
別 無 無 同 同 組 者 無 無 實驗日期 2018 年 年 10 月 月 10 日 一部分:實驗預習報告(包括實驗目的、意義,實驗基本原理與方法,主要儀器設備及耗材,實驗方案與技術路線等)
一、實驗目的、意義 本實驗旨在通過資料查閱和上機實驗,熟悉和掌握數(shù)據(jù)分析工具 Mathematica。
二、實驗 基本原理 與方法
數(shù)據(jù)分析工具 Mathematica 的使用方法,以及幫助指南文檔等。
三、實驗內容及要求 應用 Mathematica 完成下列題目的運算求解或繪圖。
(1)分別計算 2+4,3 2-2 3,的值。
(2)對 的值,分別取有效數(shù)字位數(shù) 6 位,20 位,30 位。
(3)給變量 a 賦值為 2,并計算 a 2-6,3a+b 的值。
(4)定義函數(shù) f(x)=xsinx+x 2 +2x,分別求 f(x)在 x=1,π/2 時的值,再求 f(x 2)。
(5)設函數(shù),求 的值。
(6)作函數(shù) f(x)=x 2 的圖形。
(7)將 f(x)=x 2 與 g(x)=x-1 畫在一個坐標系內。
(8)在同一坐標系中繪制
與 的圖形。
(9)繪制函數(shù) 在區(qū)間[0,2π]上的圖形。
(10)繪制由坐標(-1,2),(0,2.5),(1,3),(2,4),(3,4.5),(4,5.5)構成的散點圖。
(11)繪制函數(shù) sin(x+y)cos(x+y)的 3D 立體圖。
(12)繪制函數(shù) 在-2≤x≤2,-2≤y≤2 上的圖形。
(13)繪制函數(shù) 在-2≤x≤2,-2≤y≤2 上的圖形,去掉坐標系,邊框,網(wǎng)格線。
(14)繪制螺旋線
在 0≤t≤4π 上的圖形。
(15)利用參數(shù)方程繪制 z=x 2 + y 2 在 0≤z≤8 上的圖形。
四、實驗方案或技術路線(只針對綜合型和設計型實驗)
按照實驗任務要求,理論結合實際的實驗方案,鞏固課程內容,溫故知新,查遺補漏,夯實理論基礎,提升實驗動手能力。
技術路線是,從整體規(guī)劃,分步驟實施,實驗全面總結。
第二部分:實驗過程記錄(可加頁)(包括實驗原始數(shù)據(jù)記錄,實驗現(xiàn)象記錄,實驗過程發(fā)現(xiàn)的問題等)
(1)分別計算 2+4,3 2-2 3,的值。
步驟:以 2+4 的計算過程為例。首先輸入“In”后的式子,如“2+4”;然后同時按下鍵盤上的“shift”和“enter”鍵,就可得到“Out”后面的計算結果,如“2+4”的結果為“6”。其他式子也是按照此方法計算。其中,運算符“+”、“-”、“*”、“/”、“^”(乘方)均可以在鍵盤上找到,而根號的輸入如下:
鼠標先在導航欄上找到【面板】并點擊,再選擇【特殊字符】,再選擇【符號】,便可找到根號。當光標停留在該符號上時,會顯示“sqrt”,即開根號的意思。根號的具體位置如下圖所示:
按照上述方法得到的運行結果如下圖所示:
(2)對 的值,分別取有效數(shù)字位數(shù) 6 位,20 位,30 位。
取有效數(shù)字需要用到近似運算符,語法如下:N[表達式,有效數(shù)字位數(shù)]。系統(tǒng)默認是至少16 位,但標準輸出只顯示前 6 位有效數(shù)字。
%表示上一次的輸出結果;%% 表示上上一次的輸出結果??以此類推。
% a(a 為常數(shù))表示第 a 次的輸出結果。
結合本題來看, 具體分析如下:
N[%]表示輸出上一次的輸出結果,并取 6 位有效數(shù)字; N[%4, 20]表示輸出第 4 次的輸出結果 Out[4],并取 20 位有效數(shù)字 N[%4, 30]表示輸出第 4 次的輸出結果 Out[4],并取 30 位有效數(shù)字 運行結果如下圖所示:
(3)給變量 a 賦值為 2,并計算 a 2-6,3a+b 的值。
變量的賦值、表示與運算:變量名必須以小寫字母開頭,不能含有空格或標點符號;變量賦值用“=”表示;變量一旦被賦值,會一直保留,直到它被清除或被重新賦值??捎妹睢癈lear [變量]”清除原來的賦值。
具體輸入及運行結果如下:
(4)定義函數(shù) f(x)=xsinx+x 2 +2x,分別求 f(x)在 x=1,π/2 時的值,再求 f(x 2)。
多元函數(shù)的自定義命令:自定義函數(shù) [ 變量 1_, 變量 2_, ?] := 表達式 求函數(shù)在某一點的值時,直接將自變量的值代入再輸出即可。
注意:此處 Sin 函數(shù)的首字母 S 需要大寫,否則軟件不會將其視為正弦函數(shù),而是視為一個變量。如果用 Pi 表示 π 時,首字母也需要大寫,否則軟件會將其視作一個變量名。
(5)設函數(shù),求 的值。
定義分段函數(shù),只需要分段定義自定義函數(shù)即可,并在后面添加范圍限制,格式為:
/ ;范圍限制(其中“邏輯與”用“&&”表示,“邏輯或”用“||”表示)
(6)作函數(shù) f(x)=x 2 的圖形。
一元函數(shù)作圖的命令:Plot[函數(shù), 作圖范圍, 可選項] 故本題為:
f[x_] := x^2 Plot[f[x], {x,-1, 1}]
(7)將 f(x)=x 2 與 g(x)=x-1 畫在一個坐標系內。
當兩圖畫在一個坐標系時,一元函數(shù)作圖的命令為:
Plot[{函數(shù) 1, 函數(shù) 2, ?}, 作圖范圍, 可選項] 故本題為:Plot[{x^2, x-1}, {x,-1, 1}]
(8)在同一坐標系中繪制
與 的圖形。
參數(shù)方程作圖的命令:ParametricPlot[參數(shù)方程, 參數(shù)范圍, 可選項] 若以參數(shù)方程組取代參數(shù)方程 , 可在同一坐標系中繪制多個參數(shù)方程所確定的函數(shù)的圖形。AspectRatio->Automatic 為可選項,表示按坐標系刻度的實際比例 1:1 作圖,默認情況下是 0.618:1。
故本題為:ParametricPlot[{{Sin[t], Cos[t]}, {Sin[t], 2*Cos[t]}}, {t, 0, 2*Pi}]
(9)繪制函數(shù) 在區(qū)間[0,2π]上的圖形。
極坐標式函數(shù)作圖的命令:PolarPlot[極坐標函數(shù), 變量范圍, 可選項] 故本題為:PolarPlot[1?Cos[
第二篇:數(shù)據(jù)分析工具
數(shù)據(jù)分析工具
概述 數(shù)據(jù)分析是指用適當?shù)慕y(tǒng)計方法對收集來的大量第一手資料和第二手資料進行分析,以求最大化地開發(fā)數(shù)據(jù)資料的功能,發(fā)揮數(shù)據(jù)的作用。是為了提取有用信息和形成結論而對數(shù)據(jù)加以詳細研究和概括總結的過程。數(shù)據(jù)也稱觀測值,是實驗、測量、觀察、調查等的結果,常以數(shù)量的形式給出。
數(shù)據(jù)是事實,也稱觀測值,是實驗、測量、觀察、調查等的結果,常以數(shù)量的形式給出。數(shù)據(jù)分析的目的是把隱沒在一大批看來雜亂無章的數(shù)據(jù)中的信息集中、萃取和提煉出來,以找出所研究對象的內在規(guī)律。在實用中,數(shù)據(jù)分析可幫助人們作出判斷,以便采取適當行動。數(shù)據(jù)分析是組織有目的地收集數(shù)據(jù)、分析數(shù)據(jù),使之成為信息的過程。這一過程是質量管理體系的支持過程。
分析工具 excel作為常用的分析工具,可以實現(xiàn)基本的分析工作,在商業(yè)智能領域Cognos、Microstrategy、Brio、BO和Oracle以及國內產品如北京永洪科技的Yonghong Z-Suite BI套件,奧威智動的Power BI也比較常用。
自商業(yè)智能這一領域被開拓以來,國內外BI工具層出不窮。IBM cognos、SAP BO、oracle BIEE、Microsoft BI、MicroStrategy、思邁特 BI、奧威智動 Power-BI等都是傳統(tǒng)的BI軟件,而Qliktech QlikView、tableau、永洪科技 Yonghong Z-Suite等是下一代BI的代表。
傳統(tǒng)BI工具基于數(shù)據(jù)驅動,以瀑布開發(fā)模式建設BI系統(tǒng)。傳統(tǒng)BI工具需要預先形成CUBE,交付時間在半年左右,如果需求發(fā)生變化,相關模塊調整周期按月計算。通常傳統(tǒng)BI工具模塊較多,操作復雜,無法形成自服務BI。
新一代BI軟件區(qū)別于傳統(tǒng)BI軟件,基于業(yè)務驅動,無需預生成Cube,交付周期按周、月計算,能夠形成自服務BI系統(tǒng)。對于需求變化,交付周期按天、周計算,相關模塊調整不大。Yonghong Z-Suite、tableau、QlikView等新一代BI工具帶有數(shù)據(jù)集市,可以處理海量數(shù)據(jù)。以Yonghong Z-Suite為例,其主要有以下特點:
驅動模式:業(yè)務驅動。
開發(fā)模式:以敏捷開發(fā)模式建設BI系統(tǒng)。
交付周期:交付周期偏短,項目失敗率低;樂意在客戶現(xiàn)場做POC(Proof of Concept)。需求變化:可以應對變化,新需求交付周期很短;相關模塊調整不大,交付周期在一兩天之內。
成本:一站式平臺提供數(shù)據(jù)集市和BI軟件,無需購買MPP數(shù)據(jù)倉庫,費用低。自服務BI:能夠形成自服務BI。
分析:展現(xiàn)只是起點,分析功能強大。
海量數(shù)據(jù):X86通用平臺,以Scale-out擴展模式處理海量數(shù)據(jù)?;贑PU收費,具有較高性價。
數(shù)據(jù)集市:Yonghong Z-Data Mart專業(yè)數(shù)據(jù)集市處理大數(shù)據(jù)。
第三篇:網(wǎng)店的數(shù)據(jù)分析工具使用
實訓八 網(wǎng)店的數(shù)據(jù)分析工具使用
姓名: 學號:
量子恒道功能詳述并舉例
量子恒道統(tǒng)計(淘寶官方出品)基礎服務提供基于店鋪的流量數(shù)據(jù),包括流量分析、推廣效果、客戶分析等相關數(shù)據(jù)分析,同時還為賣家提供“過濾掌柜ID”等工具類產品-百寶箱。
一、流量分析
1、流量概況(包含 淘寶店鋪數(shù)據(jù) 和 手機淘寶店鋪數(shù)據(jù) 兩部分)
2、實時客戶訪問
3、按小時流量分析
4、按天流量分析
5、寶貝被訪排行
6、分類頁被訪排行
7、店內搜索關鍵詞
二、推廣效果
1、流量來源構成
2、淘寶搜索關鍵詞
三、客戶分析
1、訪客地區(qū)分析
四、百寶箱
1、個性化統(tǒng)計圖標
2、過濾掌柜ID
3、量子排行榜
五、量子積分禮盒
六、量子超市
流量分析
流量概況
流量分析中展現(xiàn)了店鋪的一些基本流量數(shù)據(jù),通過查看該頁面,您能夠大致了解店鋪的流量狀況。包括以下5個方面: a.流量概況:該頁面展示店鋪的流量概況,包括兩部分數(shù)據(jù):淘寶店鋪數(shù)據(jù)和手機淘寶店鋪數(shù)據(jù)。兩部分數(shù)據(jù)相對獨立地包括通過電腦訪問店鋪的瀏覽量和訪客數(shù)和通過手機端訪問店鋪的瀏覽量和訪客數(shù)。系統(tǒng)會每分鐘對數(shù)據(jù)進行更新。您可以選擇 “按天”和“按小時”這兩種方式查看數(shù)據(jù)。同時,通過圖表下方的時間軸可以調整查看的時間。拖動時間軸上選中區(qū)域可以查看不同時間段,拖動選中區(qū)域邊界可以調整時間段的大小。b.最近七天被訪問寶貝TOP10 c.最近7天訪客來源TOP10 d.最近7天訪客地區(qū)TOP10 e.店鋪基本信息
手機淘寶店鋪流量概況(按天查看)
手機淘寶店鋪流量概況(按小時查看)
手機淘寶店鋪流量概況(其他數(shù)據(jù)指標)
實時客戶訪問
顯示店鋪當前的被訪問情況。系統(tǒng)每分鐘更新客戶的訪問數(shù)據(jù),包括訪問時間、入店來源、被訪頁面、訪客位置、是否回頭客,讓您時刻了解店內客戶訪問情況。
同時可以使用“顧客跟蹤”功能,詳細了解客戶的訪問軌跡、訪客地區(qū)、進店時間、停留時間、入店來源,探索客戶的關注范圍和行為規(guī)律。
按小時流量分析
您可以查詢店鋪內某一天的流量情況,24小時分時段的數(shù)據(jù)報表。各時段用戶瀏覽量和訪客數(shù)一目了然,為您安排店內人手和寶貝上線時間提供參考:
“流量對比”功能,可以讓您同時對比任意兩天的瀏覽量和訪客數(shù)信息:
按天流量分析
您可以自定義查看不同日期的統(tǒng)計數(shù)據(jù),也可以快速查看當月、最近3個月、最近6個月和最近12個月的統(tǒng)計數(shù)據(jù),幫助您最簡單、直接的了解店鋪一定時期內顧客的瀏覽量和訪客數(shù)。當鼠標放置在圖表區(qū)域以外時,還可以顯示您選擇時段內瀏覽量和訪客數(shù)的最高值與最低值。
另外,“流量對比”功能,可以對兩個不同月份各天的店鋪瀏覽量和訪客數(shù)進行對比。
寶貝被訪排行 您可以自定義查看不同時間段的統(tǒng)計數(shù)據(jù),也可以快速查看最近30天、本周、本月等不同時段的統(tǒng)計數(shù)據(jù):
在寶貝較多時,您還可以通過按分類或按寶貝進行相應的寶貝查詢,快速了解寶貝的情況:
“寶貝被訪詳情”提供排名TOP10的寶貝被訪詳情信息,包括關注度、瀏覽量、訪客數(shù)、平均訪問時間、入店和出店次 數(shù)等,并清晰地顯示出查詢日期內寶貝每天的瀏覽量和訪客數(shù)。在頁面的上方您可以選擇不同的時段查看數(shù)據(jù),寶貝圖片右側的下拉菜單可用來選擇查看TOP10 中其他寶貝的詳情,在頁面的下方是寶貝被訪趨勢圖以及寶貝訪問來源和訪問地區(qū),幫助您多角度了解寶貝信息:
分類頁被訪排行
提供所有分類頁當天、最近7天及最近30天的詳細被訪信息,包括瀏覽量、訪客數(shù)、入店人次、出店人次等。排行默認按瀏覽量降序排列,您也可選擇按訪客數(shù)、入店人次、出店人次等其他指標進行排序。
另外,您也可以直接輸入某個分類名稱,點擊“查詢”,即可查看所查詢的分類頁信息。同時,為了方便您在本地進行數(shù)據(jù)分析以及對統(tǒng)計報表進行操作,您可以點擊“下載”或“打印”按鈕進行相應操作。
店內搜索關鍵詞 提供訪客在店內查找寶貝時所使用的全部關鍵詞的統(tǒng)計信息,如搜索次數(shù)、跳失率等,您可以自由選擇時間段,系統(tǒng)會自動根據(jù)您選擇的時段,顯示店內搜索排名前十位的關鍵詞以及每個關鍵詞所占的搜索比例:
另外,可以用“趨勢查看”功能查看隨著時間的變化,每個關鍵詞的到達頁瀏覽量、搜索次數(shù)及跳失率的變化趨勢,為您及時優(yōu)化寶貝的名稱以便能夠被高效地搜索到提供參考:
推廣效果
流量來源構成
來源構成中總結了店內所有瀏覽的來源情況,比如某來源的到達頁瀏覽量及其所占的百分比:
淘寶搜索關鍵詞
淘寶搜索關鍵詞反映的是買家通過哪些詞的搜索到達店鋪寶貝的數(shù)據(jù)。淘寶搜索關鍵詞提供TOP10搜索關鍵詞的圖表展示,并提供所有關鍵詞的統(tǒng)計信息,如到達頁瀏覽量、平均每次訪問頁面數(shù)、跳失率等。
另外,可以用“趨勢查看”功能查看隨著時間的變化,每個關鍵詞的到達頁瀏覽量、搜索次數(shù)及跳失率的變化趨勢,為您及時優(yōu)化寶貝的名稱以便能夠被高效地搜索到提供參考。
客戶分析
訪客地區(qū)分析 “訪客地區(qū)分析功能”支持國際和中國各省、自治區(qū)、直轄市、特別行政區(qū)內城市瀏覽量及訪問人數(shù)的查詢,以地圖的形式展示地區(qū)分布。當您的鼠標放置在地圖當中某一區(qū)域內時,會相應顯示該區(qū)域的瀏覽量和訪客數(shù)。系統(tǒng)每小時對該數(shù)據(jù)進行更新,您可以選擇不同時間段查詢數(shù)據(jù)。
另外,點擊某一地區(qū)對應的訪問趨勢“查看”按鈕,可以查看本周、一月、一個季度等不同時間段內各地區(qū)瀏覽量、訪客數(shù)的變化趨勢,為您針對不同地區(qū)做推廣提供決策。
百寶箱
過濾掌柜ID 過濾掌柜ID可過濾掉掌柜進出店鋪的瀏覽記錄,讓統(tǒng)計數(shù)據(jù)更加精確。
a.即日起,凡激活淘寶量子店鋪統(tǒng)計的用戶即默認開啟過濾掌柜ID功能,若您未作任何更改,掌柜進出店鋪的瀏覽記錄將不再被記錄。
b.為保證正常使用此功能,請確保您瀏覽器開啟cookie功能,避免反復清除cookie。c.此功能支持多客戶端,使用不同電腦時,只需登錄,瀏覽記錄就會被屏蔽。d.建議設置此功能后退出并重新登錄到量子店鋪統(tǒng)計,以使該功能生效。e.若您不能正常使用過濾功能,請訪問以下鏈接http://bangpai.taobao.com/group/thread/868167-15038974.htm,嘗試重新調整相關設置。
個性化統(tǒng)計圖標
“個性化統(tǒng)計圖標”提供兩種圖標顯示方式:
a.在統(tǒng)計圖標上顯示店鋪的統(tǒng)計數(shù)據(jù):可以在店鋪首頁以生動的圖片形式進行顯示,圖標上的數(shù)據(jù)分別是今天,昨天以及店鋪使用量子統(tǒng)計以來的瀏覽量,能夠為訪問店鋪的客人帶來一種直觀的印象,也可以讓您不需登錄店鋪管理后臺就能了解店鋪的瀏覽量。b.在統(tǒng)計圖標上不顯示店鋪的統(tǒng)計數(shù)據(jù)。
量子排行榜
量子排行榜是量子店鋪統(tǒng)計通過收集分析用戶數(shù)據(jù)并加以整理,以量子排行(寶貝人均關注度TOP榜)的形式體現(xiàn)出來。在這個排行榜中我們按淘寶主要類目/賣 家地區(qū)/賣家級別等維度來體現(xiàn)寶貝的關注度。賣家通過這個,可以簡單清晰的了解自己行業(yè)類目最新動態(tài)。第一時間把握商機、優(yōu)化商品,達到最終促進成交的效果。
量子積分禮盒
量子統(tǒng)計(淘寶官方版)為回饋廣大賣家用戶,正式推出“量子積分禮盒”。您可憑多種方式獲取積分,換取多種量子優(yōu)惠禮品,享受量子特權,搶先體驗量子更多新功能。a.禮品兌換中心
通過“禮品兌換中心”可換取量子基礎服務和特色功能免費使用時間、也可以搶先體驗新功能。
b.獲取量子積分
用戶可憑多種方式輕松獲取量子積分。
1)發(fā)送鏈接邀請好友使用量子統(tǒng)計(淘寶官方版)2)每日登錄量子統(tǒng)計 3)參與量子活動
c.積分記錄
可查詢增加積分及積分兌換的歷史記錄。
d.積分小貼士
記錄用戶積分獲取及積分使用過程中的常見問題,具體包括以下七個問題: 1)什么是量子積分禮盒;
2)量子積分用戶有什么特權;
3)如何獲得量子積分;
4)如何使用積分兌換禮品;
5)量子積分可以兌換哪些服務;
6)如何查看我的積分;
7)使用量子積分有什么注意事項;
量子超市
在量子超市這一模塊中,您可以對不同功能模塊進行了解,并根據(jù)自己的實際情況,進行訂購、續(xù)訂或積分兌換及試用等操作。
數(shù)據(jù)魔方的功能及應用
一、增添某些維度的數(shù)據(jù),讓數(shù)據(jù)查詢更全面
1、添加“什么品牌好賣”,展現(xiàn)賣家所在行業(yè)的熱賣品牌排行,通過排行榜明確自己品牌所處的位置。在時間維度上,可以選擇最近7天和最近30天。還可以點擊查看具體關注的某個品牌詳情,包括它的成交金額、關注人數(shù)和收藏人數(shù)。
2、添加“什么產品好賣”,展示該行業(yè)下近期的熱賣產品,無論賣家是用來分析競爭對手還是作為店鋪日后的選品參考,都是很有價值的。
二、整理歸類報表,展現(xiàn)更有邏輯,方便操作和查詢
三、增加幫助中心,幫助您找到數(shù)據(jù)指標含義,學習更多數(shù)據(jù)分析干貨
這一點對于新手賣家來說尤其重要。也許你剛接觸電商,不了解很多數(shù)據(jù)指標,沒有關系,通過幫助中心的解釋,可以很清楚地了解每個指標對應的含義。同時在《魔方學堂》里面有很多學習課程,讓你在使用魔方的同時,可以了解更多干貨課程,有更多學習和交流的機會。
應用:
第一步,進入淘寶網(wǎng)首頁(004km.cn),登錄賬號,同時選擇“我的淘寶”,點擊進入 如圖所示:
第二步,點擊“我是賣家”,選擇“軟件服務訂購” 如圖所示:
第三步,選擇“數(shù)據(jù)分析”,點擊“數(shù)據(jù)魔方專業(yè)版”的“立即訂購”,進入下一個頁面 如圖所示:
第四步,點擊選擇自己所需類目,確認無誤后,點擊“下一步”,進入支付寶付賬頁面 如圖所示:
第五步,進入支付寶付賬界面,賣家可按照支付寶流程進行數(shù)據(jù)魔方的購買
二、從哪里可以找到數(shù)據(jù)魔方專業(yè)版的入口?
入口一:進入淘寶網(wǎng)首頁(004km.cn),登錄賬號,選擇“我的淘寶”,點擊進入;進入以后選擇“我是賣家”界面,找到“數(shù)據(jù)魔方專業(yè)版”的入口,點擊進入
如圖所示:
入口二:進入淘寶商家數(shù)據(jù)平臺(http://shuju.taobao.com/),選擇“數(shù)據(jù)魔方專業(yè)版”入口,點擊進入 如圖所示:
三、怎樣使用數(shù)據(jù)魔方專業(yè)版? 以女裝類目下的“襯衫”為例
第一步,進入淘寶商家數(shù)據(jù)平臺(http://shuju.taobao.com/)頁面,選擇“數(shù)據(jù)魔方專業(yè)版”入口,點擊進入 如圖所示:
第二步,登錄賬號 如圖所示:
進入頁面的展示: 圖一: 圖二:
第三步,選擇“行業(yè)”類目下的“女裝”類目,再次選擇“女裝”類目下的“襯衫”,點擊確定 如圖所示:
襯衫類目的頁面展示:
第四步,選擇自己想要看的區(qū)塊,進行選擇,如選擇“成交趨勢分析”,會在“數(shù)據(jù)區(qū)”出現(xiàn)相應的數(shù)據(jù)
你可以點擊時間標記,進行自定義選擇時間,選擇所需的時間段 如圖所示:
您在查看數(shù)據(jù)時,可以在搜索區(qū)鍵入相應的關鍵詞,進行搜索 如圖所示:
數(shù)據(jù)魔方專業(yè)版還有很多其他功能和區(qū)塊未被展示出來,賣家朋友們可以購買魔方專業(yè)版,自己來體驗一下數(shù)據(jù)的神奇之處吧!
簡析量子恒道與數(shù)據(jù)魔方的功能側重
數(shù)據(jù)魔方主要是針對品牌企業(yè)和中小賣家的,而小艾分析、量子統(tǒng)計主要針對是中小賣家的.而且數(shù)據(jù)魔方還可以分析競爭對手的數(shù)據(jù)分析.相對來講, 小艾分析、量子統(tǒng)計主要是分析精細東西.對于店鋪前期比較好.后期隨著店鋪的不斷成長.需要功能更強大的軟件去分析店鋪的詳細數(shù)據(jù).網(wǎng)店實訓3的心得體會與課程建議
本次實訓為熟悉一個第三方活動工具軟件的使用和策劃一次店內促銷活動,包含活動宗旨、活動類型、具體內容及推廣方案。通過此次學習,我了解了第三方活動工具VIP購優(yōu)匯的功能及應用使用,有助于后期應用推廣。
第二項策劃一次店內促銷活動,通過這個方式,增進了小組成員的合作,也加強我們個人的團隊合作意識,學會合作,互相學習促進。并且,從本次的任務中,將策劃實踐于操作,有利于將課堂知識轉化為現(xiàn)實中的應用。
建議:下次希望可以換個機房。
第四篇:數(shù)據(jù)分析軟件和工具
以下是我在近三年做各類計量和統(tǒng)計分析過程中感受最深的東西,或能對大家有所幫助。當然,它不是ABC的教程,也不是細致的數(shù)據(jù)分析方法介紹,它只 是“總結”和“體會”。由于我所學所做均甚雜,我也不是學統(tǒng)計、數(shù)學出身的,故本文沒有主線,只有碎片,且文中內容僅為個人觀點,許多論斷沒有數(shù)學證明,望統(tǒng)計、計量大牛輕拍。
于我個人而言,所用的數(shù)據(jù)分析軟件包括EXCEL、SPSS、STATA、EVIEWS。在分析前期可以使用EXCEL進行數(shù)據(jù)清洗、數(shù)據(jù)結構調 整、復雜的新變量計算(包括邏輯計算);在后期呈現(xiàn)美觀的圖表時,它的制圖制表功能更是無可取代的利器;但需要說明的是,EXCEL畢竟只是辦公軟件,它 的作用大多局限在對數(shù)據(jù)本身進行的操作,而非復雜的統(tǒng)計和計量分析,而且,當樣本量達到“萬”以上級別時,EXCEL的運行速度有時會讓人抓狂。
SPSS是擅長于處理截面數(shù)據(jù)的傻瓜統(tǒng)計軟件。首先,它是專業(yè)的統(tǒng)計軟件,對“萬”甚至“十萬”樣本量級別的數(shù)據(jù)集都能應付自如;其次,它是統(tǒng)計軟 件而非專業(yè)的計量軟件,因此它的強項在于數(shù)據(jù)清洗、描述統(tǒng)計、假設檢驗(T、F、卡方、方差齊性、正態(tài)性、信效度等檢驗)、多元統(tǒng)計分析(因子、聚類、判 別、偏相關等)和一些常用的計量分析(初、中級計量教科書里提到的計量分析基本都能實現(xiàn)),對于復雜的、前沿的計量分析無能為力;第三,SPSS主要用于 分析截面數(shù)據(jù),在時序和面板數(shù)據(jù)處理方面功能了了;最后,SPSS兼容菜單化和編程化操作,是名副其實的傻瓜軟件。
STATA與EVIEWS都是我偏好的計量軟件。前者完全編程化操作,后者兼容菜單化和編程化操作;雖然兩款軟件都能做簡單的描述統(tǒng)計,但是較之 SPSS差了許多;STATA與EVIEWS都是計量軟件,高級的計量分析能夠在這兩個軟件里得到實現(xiàn);STATA的擴展性較好,我們可以上網(wǎng)找自己需要 的命令文件(.ado文件),不斷擴展其應用,但EVIEWS就只能等著軟件升級了;另外,對于時序數(shù)據(jù)的處理,EVIEWS較強。
綜上,各款軟件有自己的強項和弱項,用什么軟件取決于數(shù)據(jù)本身的屬性及分析方法。EXCEL適用于處理小樣本數(shù)據(jù),SPSS、STATA、EVIEWS可以處理較大的樣本;EXCEL、SPSS適合做數(shù)據(jù)清洗、新變量計算等分析前準備性工作,而STATA、EVIEWS在這方面 較差;制圖制表用EXCEL;對截面數(shù)據(jù)進行統(tǒng)計分析用SPSS,簡單的計量分析SPSS、STATA、EVIEWS可以實現(xiàn),高級的計量分析用 STATA、EVIEWS,時序分析用EVIEWS。關于因果性
做統(tǒng)計或計量,我認為最難也最頭疼的就是進行因果性判斷。假如你有A、B兩個變量的數(shù)據(jù),你怎么知道哪個變量是因(自變量),哪個變量是果(因變量)?
早期,人們通過觀察原因和結果之間的表面聯(lián)系進行因果推論,比如恒常會合、時間順序。但是,人們漸漸認識到多次的共同出現(xiàn)和共同缺失可能是因果關 系,也可能是由共同的原因或其他因素造成的。從歸納法的角度來說,如果在有A的情形下出現(xiàn)B,沒有A的情形下就沒有B,那么A很可能是B的原因,但也可能 是其他未能預料到的因素在起作用,所以,在進行因果判斷時應對大量的事例進行比較,以便提高判斷的可靠性。
有兩種解決因果問題的方案:統(tǒng)計的解決方案和科學的解決方案。統(tǒng)計的解決方案主要指運用統(tǒng)計和計量回歸的方法對微觀數(shù)據(jù)進行分析,比較受干預樣本與 未接受干預樣本在效果指標(因變量)上的差異。需要強調的是,利用截面數(shù)據(jù)進行統(tǒng)計分析,不論是進行均值比較、頻數(shù)分析,還是方差分析、相關分析,其結果 只是干預與影響效果之間因果關系成立的必要條件而非充分條件。類似的,利用截面數(shù)據(jù)進行計量回歸,所能得到的最多也只是變量間的數(shù)量關系;計量模型中哪個 變量為因變量哪個變量為自變量,完全出于分析者根據(jù)其他考慮進行的預設,與計量分析結果沒有關系。總之,回歸并不意味著因果關系的成立,因果關系的判定或 推斷必須依據(jù)經過實踐檢驗的相關理論。雖然利用截面數(shù)據(jù)進行因果判斷顯得勉強,但如果研究者掌握了時間序列數(shù)據(jù),因果判斷仍有可為,其中最經典的方法就是 進行“格蘭杰因果關系檢驗”。但格蘭杰因果關系檢驗的結論也只是統(tǒng)計意義上的因果性,而不一定是真正的因果關系,況且格蘭杰因果關系檢驗對數(shù)據(jù)的要求較高(多期時序數(shù)據(jù)),因此該方法對截面數(shù)據(jù)無能為力。綜上所述,統(tǒng)計、計量分析的結果可以作為真正的因果關系的一種支持,但不能作為肯定或否定因果關系的最 終根據(jù)??茖W的解決方案主要指實驗法,包括隨機分組實驗和準實驗。以實驗的方法對干預的效果進行評估,可以對除干預外的其他影響因素加以控制,從而將干預實施后的效果歸因為干預本身,這就解決了因果性的確認問題。關于實驗
在隨機實驗中,樣本被隨機分成兩組,一組經歷處理條件(進入干預組),另一組接受控制條件(進入對照組),然后比較兩組樣本的效果指標均值是否有差 異。隨機分組使得兩組樣本“同質”,即“分組”、“干預”與樣本的所有自身屬性相互獨立,從而可以通過干預結束時兩個群體在效果指標上的差異來考察實驗處 理的凈效應。隨機實驗設計方法能夠在最大程度上保證干預組與對照組的相似性,得出的研究結論更具可靠性,更具說服力。但是這種方法也是備受爭議的,一是因 為它實施難度較大、成本較高;二是因為在干預的影響評估中,接受干預與否通常并不是隨機發(fā)生的;第三,在社會科學研究領域,完全隨機分配實驗對象的做法會 涉及到研究倫理和道德問題。鑒于上述原因,利用非隨機數(shù)據(jù)進行的準實驗設計是一個可供選擇的替代方法。準實驗與隨機實驗區(qū)分的標準是前者沒有隨機分配樣本。
通過準實驗對干預的影響效果進行評估,由于樣本接受干預與否并不是隨機發(fā)生的,而是人為選擇的,因此對于非隨機數(shù)據(jù),不能簡單的認為效果指標的差異 來源于干預。在剔除干預因素后,干預組和對照組的本身還可能存在著一些影響效果指標的因素,這些因素對效果指標的作用有可能同干預對效果指標的作用相混淆。為了解決這個問題,可以運用統(tǒng)計或計量的方法對除干預因素外的其他可能的影響因素進行控制,或運用匹配的方法調整樣本屬性的不平衡性——在對照組中尋 找一個除了干預因素不同之外,其他因素與干預組樣本相同的對照樣本與之配對——這可以保證這些影響因素和分組安排獨立。
隨機實驗需要至少兩期的面板數(shù)據(jù),并且要求樣本在干預組和對照組隨機分布,分析方法就是DID(倍差法,或曰雙重差分法);準實驗分析用截面數(shù)據(jù)就 能做,不要求樣本在干預組和對照組隨機分布,分析方法包括DID(需兩期的面板數(shù)據(jù))、PSM(傾向性得分匹配法,需一期的截面數(shù)據(jù))和PSM-DID(需兩期的面板數(shù)據(jù))。從準確度角度來說,隨機實驗的準確度高于準實驗和非實驗分析。
關于分析工具的選擇
如果根據(jù)理論或邏輯已經預設了變量間的因果關系,那么就無需使用實驗方法。我對非實驗數(shù)據(jù)分析工具的選擇原則如下。
? ? ? ? ? ? ? ? 因變量為連續(xù)變量,自變量至少有一個連續(xù)變量,進行多元線性回歸; 因變量為連續(xù)變量,自變量全部為分類變量,進行方差分析;
因變量為分類變量,自變量至少有一個連續(xù)變量,使用Logit模型或Probit模型; 因變量為分類變量,自變量全部為分類變量,進行交叉表分析和卡方檢驗;
因變量在某個閉區(qū)間內分布,并且有較多樣本落在閉區(qū)間的邊界上,使用Tobit模型;
因變量不唯一,如多產出問題,進行數(shù)據(jù)包絡分析(DEA);
因變量為整數(shù)、數(shù)值小、取零個數(shù)較多,使用計數(shù)(Count)模型; 數(shù)據(jù)具有層次結構(嵌套結構),使用多層線性模型(HLM)。
隨著統(tǒng)計和計量經濟學的發(fā)展,各種前沿分析工具層出不窮,但我認為最靠譜的分析工具不外乎以下四種:DID(針對隨機實驗),多元線性回歸,固定效 應變截距模型(FE,針對面板數(shù)據(jù)),Logit模型或Probit模型(針對分類因變量數(shù)據(jù))。其他方法或適用條件苛刻,或分析過程折騰,或方法本身不 可靠(尤其是聚類分析、判別分析,超級不靠譜),因此能用以上四種方法分析問題時,不必為“炫方法”而瞎折騰。關于擬合優(yōu)度、變量選擇原則及估計值絕對大小的意義
在人人的“數(shù)據(jù)分析”小站中,某同學提出這樣一個問題:“多元回歸分析中,怎么選擇自變量和因變量,可以使R方達到80%以上?”
很顯然,問這個問題的同學要么沒學好計量,要么就是犯了功利主義的錯誤,或者二者皆有。擬合優(yōu)度的大小很大程度上取決于數(shù)據(jù)本身的性質。如果數(shù)據(jù)是 時序數(shù)據(jù),只要拿有點相關關系的變量進行回歸就能使擬合優(yōu)度達到80%以上,但這樣的高R方根本說明不了什么,很可能使分析者陷入偽回歸的陷阱,嚴謹?shù)淖?法當然是做平穩(wěn)性檢驗和協(xié)整檢驗;如果是截面數(shù)據(jù),根本沒必要追求R方到80%的程度,一般來說,有個20%、30%就非常大了。
如果一定要增大R方,那么最應該做的的確是對納入模型的變量進行選擇。選擇納入模型的原則我認為有三條。第一,從理論和邏輯出發(fā),將可能影響因變量 的變量作為自變量納入模型,即理論上或邏輯上能影響因變量的自變量必須納入模型,即使該自變量的回歸系數(shù)不顯著。第二,奧姆剃刀原則——如無必要,勿增實體,即理論上或邏輯上不能影響因變量的自變量不能納入模型,即使該自變量的回歸系數(shù)顯著。第三,防止納入具有多重共線性的自變量。
前面說了,對截面數(shù)據(jù)進行計量分析,R方能達到20%、30%是非常了不起的事情。但是,如果擬合優(yōu)度(或類似擬合優(yōu)度的指標)在20%、30%或 更低時,回歸系數(shù)只具有定性或定序上的意義,強調其絕對數(shù)值的大小沒什么意義。譬如lnY=alnA+blnB+?+zlnZ+c回歸的R方為20%,a 為0.375,b為0.224,且二者的T檢驗顯著,那么我們可以說,A、B對Y有影響,也可以說一百分點的A變化對Y的影響大于一百分點的B變化對Y的影響(控制其他因素的情況下),但說一百分點的A變化對Y的影響較一百分點的B變化對Y的影響大0.151%,就沒什么意義了。
第五篇:數(shù)據(jù)分析實驗報告冊
《數(shù)據(jù)分析》
實驗報告冊
15-20 16 學年
目錄
實驗一 網(wǎng)上書店的數(shù)據(jù)庫創(chuàng)建及其查詢
實驗 1-1 “響當當”網(wǎng)上書店的數(shù)據(jù)庫創(chuàng)建
實驗1-2 “響當當”網(wǎng)上書店庫存、圖書和會員信息查詢
實驗1-3 “響當當”網(wǎng)上書店會員分布和圖書銷售查詢
實驗二 企業(yè)銷售數(shù)據(jù)的分類匯總分析
實驗2-1 Northwind公司客戶特征分析
實驗2-2 “北風”貿易公司銷售業(yè)績觀測板
實驗三 餐飲公司經營數(shù)據(jù)時間序列預測
實驗3-1 “美食佳”公司半成品年銷售量預測
實驗3-2 “美食佳”公司月管理費預測
實驗3-3 “美食佳”華東分公司銷售額趨勢預測
實驗3-4 “美食佳”公司會員卡發(fā)行量趨勢預測
實驗3-5 “美食佳”火鍋連鎖店原料采購成本預測
實驗四 住房建筑許可證數(shù)量的回歸分析
實驗4-1 “家家有房”公司建筑許可證一元線性回歸分析
實驗4-2 “家家有房”公司建筑許可證一元非線性回歸分析
實驗4-3 “家家有房”公司建筑許可證多元線性回歸分析
實驗4-4 “家家有房”公司建筑許可證多元非線性回歸分析
實驗五 手機用戶消費習慣聚類分析
實驗六 新產品價格敏感度測試模型分析
實驗一 網(wǎng)上書店的數(shù)據(jù)庫創(chuàng)建及其查詢
實驗 1-1 “響當當”網(wǎng)上書店的數(shù)據(jù)庫創(chuàng)建
實驗類型:驗證性
實驗學時:2 實驗目的:
? 理解數(shù)據(jù)庫的概念;
? 理解關系(二維表)的概念以及關系數(shù)據(jù)庫中數(shù)據(jù)的組織方式; ? 了解數(shù)據(jù)庫創(chuàng)建方法。
實驗步驟:
這個實驗我們沒有直接做,只是了解了一下數(shù)據(jù)庫的概念。
實驗1-2 “響當當”網(wǎng)上書店庫存、圖書和會員信息查詢
實驗目的
? 理解odbc的概念;
? 掌握利用microsoft query進行數(shù)據(jù)查詢的方法。
實驗步驟:
1..建立odbc數(shù)據(jù)源:啟動microsoft office query應用程序,在microsoft office query應用程序窗口中,執(zhí)行“文件/新建”命令,出現(xiàn) “選擇數(shù)據(jù)源”對話框,單擊“確定”按鈕,出現(xiàn)“創(chuàng)建新數(shù)據(jù)源”對話框,按照要求做相應的操作。
選擇數(shù)據(jù)源對話框
創(chuàng)建新數(shù)據(jù)源窗口
做圖上所示的選擇
odbc microsoft access安裝對話框
選擇數(shù)據(jù)庫對話框
選擇數(shù)據(jù)源對話框
2.查詢設計1—低庫存量圖書信息查詢:選擇“bookstore”數(shù)據(jù)源,點擊“確定”,進入“添加表”窗口,添加書表后,在“查詢設計”窗口的“表”窗格中,分別雙擊“書”表中需要查詢的“書名”、“isbn”、“庫存量”等字段,執(zhí)行“視圖/條件”命令,在“條件”窗格的“條件字段”行的 實驗小結:
因為我們沒有嘗試建立數(shù)據(jù)庫,直接開始數(shù)據(jù)查詢,所以實驗時遇到了很多問題。比如我們在選擇數(shù)據(jù)源時就遇到了麻煩,弄了半天才開始查詢設計,而且不是很熟練,一直做了四五個查詢設計才慢慢熟練起來。
實驗思考:
1、在數(shù)據(jù)查詢過程中,如果所選的某個表與其他表之間沒有聯(lián)系的話,會 產生什么問題?
答:所選的查詢數(shù)據(jù)將會全部顯示在查詢窗口,與其它表的數(shù)據(jù)沒有直接聯(lián)系。這樣就不能表現(xiàn)出表與表數(shù)據(jù)之間的關聯(lián)性,數(shù)據(jù)也就失去賦予的意義。
2、若“響當當個”網(wǎng)上書店的某個會員了解自己最近2年的圖書訂購情況,請為他設計一個查詢。
答:分別添加“書”、“會員”、“訂單明細”和“訂單”表,雙擊“書”表的“書名”、“會員”表的“姓名”和“訂單明細”表的“訂購數(shù)量”以及“訂單”表的“訂購日期”字段,在向查詢條件窗口中輸入某一會員姓名以及相應的訂購日期.實驗1-3 “響當當”網(wǎng)上書店會員分布和圖書銷售查詢
實驗目的
?掌握復雜的數(shù)據(jù)查詢方法:多表查詢、計算字段和匯總查詢
實驗步驟: 1.查詢設計1—會員分布信息查詢:添加“會員”表到查詢設計窗口,在“查詢設計”窗口的“表”窗格中,雙擊“會員”表的“城市”和“會員號”字段。然后雙擊“會員號”字段的列標,在“編輯列”對話框中輸入列標“會員人數(shù)”,并選擇匯總方式:“計數(shù)”,單擊“確定”按鈕后即可看到查詢結果,其中顯示了各城市的會員人數(shù),再設置相應的條件,進行相應的查詢。
選擇匯總方式
查詢結果
2.查詢設計2—圖書總訂購量和總銷售金額查詢:添加“訂單”、“訂單明細”和“書”表。在“查詢設計”窗口的“表”窗格中,雙擊“訂單”表的“訂購日期”、“訂單明細”表的“訂購數(shù)量”字段。另外還要構造一個計算字段“銷售金額”,方法是直接在某空白列的列標中輸入公式;在上面的字段中,“訂購數(shù)量”和“銷售金額”是匯總字段,分類字段是“訂購年份”,雙擊“訂購日期”列的列標,在編輯列對話框的字段項中輸入公式“year(訂購日期)”,在其中的列標項中輸入“訂購年份”然后分別雙擊“訂購數(shù)量”和“訂購數(shù)量*單價”字段的列標,在編輯列對話框的列標項中分別輸入“總訂購數(shù)量”和“總銷售金額”字樣,并在總計項中選擇“求和”。
在“條件”窗格的“條件字段”行的
5.查詢設計5—被訂購圖書的作者和出版社信息查詢:添加“會員”、“訂單”、“訂單明細”、“書”、“作者”和“出版社”表。在表之間建立合適的聯(lián)系。在“查詢設計”窗口的“表”窗格中,雙擊“書”表的“書名”、“作者”表的“姓名”和“出版社”表的“出版社名稱”字段。在條件窗格中添加關于訂購日期和會員姓名的條件??梢圆榭吹浇Y果為會員“劉丹”在2007年共訂購了7本圖書。
實驗小結:
實驗1-3的實驗比較難,但是經過前面的練習還是比之前快一點,不過還是遇到一些困難,比如查看到結果為會員“劉丹”在2007年共訂購了幾本書的查詢設計就在輸入指令時卡住了,經過幾個同學討論還是做出來了。一直到晚上天黑了才把一共十個實驗做完。
實驗思考:
1、在進行匯總查詢的過程中,如果被選擇的字段除了分類字段以外還包含了其他字段。
查詢結果是否正確?為什么?請舉例說明。
答:不正確,如果被選擇的字段除了分類字段以外還包含了其他字段,那么query將把多余的字段自動作為分類字段。
2、“響當當”網(wǎng)上書店的管理人員想了解最近2年中那位作者的書是最暢銷,請你設計一個查詢找到相關作者。
答:查詢近兩年的總訂購量。
實驗二 企業(yè)銷售數(shù)據(jù)的分類匯總分析
實驗2-1 North wind公司客戶特征分析
實驗類型:驗證性
實驗學時:2 實驗目的:
? 理解數(shù)據(jù)分類匯總在企業(yè)中的作用與意義; ? 掌握數(shù)據(jù)透視表工具的基本分類匯總功能;
? 掌握建立分類匯總數(shù)據(jù)排行榜、生成時間序列、繪制praetor曲線圖、計算各地區(qū)客戶分布、統(tǒng)計各地區(qū)客戶的平均銷售額和大宗銷售時間序列的方法和步驟。
實驗步驟:
一、匯總客戶銷售額排行榜 為了匯總客戶銷售額的排行榜,首先要獲得客戶每筆銷售的銷售額、所購買產品的類別以及銷售發(fā)生的時間,然后再利用數(shù)據(jù)透視表工具將銷售額按照客戶名稱、產品類別和銷售時間加以匯總。
步驟1:獲取各客戶每筆銷售的銷售額、銷售產品的類別和時間。
在一張空白的工作表中,選擇菜單“數(shù)據(jù)”→“數(shù)據(jù)透視表和數(shù)據(jù)透視圖” →“外部數(shù)據(jù)源”,單擊“獲取數(shù)據(jù)按鈕”,隨后啟動了Microsoft Query,選擇所建立的連接到Northwind.mdb數(shù)據(jù)庫的ODBC數(shù)據(jù)源——“NW”,并選擇“確定”,選擇“客戶”表中的的“公司名稱”、“訂單”表中的“訂購日期”、以及“類別”表中“類別名稱”,隨后Query彈出窗口“?查詢向導?無法繼續(xù),因為該表格無法鏈接到您的查詢中。您必須在Microsoft Query 中的表格之間拖動字段,人工鏈接?!边@是因為類別表無法同訂單表建立聯(lián)系。單擊“確定”。
要查詢銷售額,需要在Query中首先增加“訂單明細”表,利用其中的“單價”、“數(shù)量”與“折扣”字段中的數(shù)據(jù),才能計算銷售額。在數(shù)據(jù)窗格中,在一個空白字段的名稱處輸入公式:“訂單明細.單價*數(shù)量*(1-折扣)”。鍵入回車后就可以計算出銷售額。見圖2-7。
隨后,將“產品”表也添加到查詢中,雖然查詢結果中并不包括任何“產品”表中的字段,但是該表的能夠建立“類別”表與“訂單明細”表之間的聯(lián)系(“訂單明細”表指明所訂購產品的ID,“產品”表指明該產品屬于哪一個類別)。此時,查詢中的表都建立了正確的聯(lián)系,并在查詢結果中包括了匯總所需要的數(shù)據(jù)。如圖2-7。
圖2-7 查詢各客戶每筆銷售的銷售額、銷售產品的類別和時間
將計算銷售額的字段的列標命名為“銷售額”。選擇Query菜單中的“文件”→“將數(shù)據(jù)返回Microsoft Office Excel”,此時Query已經關閉,我們的操作對象回到了Excel,單擊“下一步”,指定位置在“現(xiàn)有工作表”,單元格A3,單擊完成。
步驟2:匯總客戶銷售額排行榜,并排序。
此時,在工作表的區(qū)域A1:G16的位置,出現(xiàn)了數(shù)據(jù)透視表的框架,數(shù)據(jù)透視表的浮動工具欄和數(shù)據(jù)透視表的字段列表。
為了能對銷售的時間——“訂購日期”進行組合以獲得各年的銷售額,首先將“訂購日期”拖至行域,將“銷售額”拖至數(shù)據(jù)域,“類別名稱”拖至列域,得到如圖2-8所示的數(shù)據(jù)透視表。
圖2-8 按訂購日期與類別匯總銷售額
為了能將銷售額按照匯總,將光標停留在“訂購日期”下方的任何單元格,右擊鼠標,選擇“組合及顯示明細數(shù)據(jù)”→“組合”,選擇組合的步長為年。
然后將單元格A4當中的字段名稱“訂購日期”改為“訂購年”,將它推至頁域,將字段列表中的“公司名稱”拖到行域,讓透視表按照列總計,從大到小排列,就得到了如圖2-9所示的數(shù)據(jù)透視表。它能夠反映了三年或者各,各個客戶的銷售額的大小,以及排列名詞的先后,還能夠觀察到各客戶訂購的產品類別和該類別的銷售額。
圖2-9 按照訂購年、客戶公司名稱、類別名稱匯總的銷售額排行榜
二、匯總前三大客戶各月銷售額,并繪制圖形
在前一部分實驗的基礎上,選擇前三個最重要的客戶,進一步觀察購買情況,他們購買情況的變化將對公司整體銷售業(yè)績產生很大影響。所以,將前三大客戶的銷售數(shù)據(jù)加以展開,按月顯示其銷售的變化。
步驟1:將實驗要求1所匯總的數(shù)據(jù)透視表復制到新的工作表。步驟2:利用數(shù)據(jù)透視表,匯總前三大客戶的銷售額時間序列。
按照實驗要求1匯總的數(shù)據(jù)透視表,反映出“高上補習班、正人資源、大鈺貿易”是公司的前三大客戶。點開“公司名稱”字段,選中這三個公司名稱,并拖到列域。
將列域的字段“類別名稱”拖出數(shù)據(jù)透視表。將頁域的字段“訂購年”旋轉到行域,將其重新組合。選擇組合的步長為“月”和“年”,把字段名稱修改為“訂購年”與“訂購月”。光標停留在數(shù)據(jù)表中任何單元格,右擊鼠標,選擇“表格選項”,將“對于空數(shù)據(jù)項顯示”設置為“0”,即當該單元格匯總出的數(shù)據(jù)值為空時,在數(shù)據(jù)透視表中將其顯示為0。此時得到的前三大客戶銷售額時間序列見圖2-10。
圖2-10 Northwind公司前三大客戶銷售額時間序列
步驟3:繪制前三大客戶銷售額時間序列圖。
光標停留在數(shù)據(jù)透視表中,選擇菜單“插入”→“圖表”,在當前工作簿自動插入一張圖表。選擇菜單“圖表”→“位置”,將該圖表調整到與數(shù)據(jù)透視表位于同一張工作表。選擇菜單“圖表”→“圖表類型”,選擇“折線圖”→“數(shù)據(jù)點折線圖”。隨后,再對該圖的大小、外觀以及數(shù)據(jù)系列的格式加以調整,就能得到Northwind公司前三大客戶銷售額時間序列圖,如圖2-1所示。
三、繪制按照客戶匯總的客戶數(shù)與銷售額帕累托曲線
步驟1:查詢“訂購日期”、客戶的“公司名稱”與“銷售額”等數(shù)據(jù)。
在Excel的空白工作表中,選擇菜單“數(shù)據(jù)”→“數(shù)據(jù)透視表與數(shù)據(jù)透視圖” →“外部數(shù)據(jù)源”→“獲取數(shù)據(jù)”,利用Microsoft Query,從“訂單”表、“訂單明細”表與“客戶”表中查詢 “訂購日期”、客戶的“公司名稱”與“銷售額”(銷售額=訂單明細.單價*數(shù)量*(1-折扣))等字段,將所查詢數(shù)據(jù)返回Excel。
步驟2:利用查詢的數(shù)據(jù),制作數(shù)據(jù)透視表。
從數(shù)據(jù)透視表的字段列表中,選擇“訂購日期”,拖至行域,將“銷售額”拖至數(shù)據(jù)域。將“訂購日期”字段按年組合,然后拖至頁域,將“公司名稱”拖至行域,按照銷售額從大到小的順序排列,得到按照和客戶公司名稱匯總的數(shù)據(jù)透視表,如圖2-11。
圖2-11 Northwind公司按照匯總的各客戶銷售額
步驟3:利用數(shù)據(jù)透視表的數(shù)據(jù),計算客戶數(shù)累計百分比與客戶銷售額累計百分比,繪制帕累托曲線。
在區(qū)域D4:G4依次輸入說明文字,“公司名稱”、“ 客戶百分比”、“ 客戶數(shù)累計百分比 ”、“銷售額累積百分比”。按照圖2-12輸入公式,得到如圖2-13所示的匯總數(shù)據(jù)。
圖2-12 Northwind公司按照匯總客戶數(shù)累計百分比和銷售額累計百分比公式
圖2-13 Northwind公司按照匯總客戶數(shù)累計百分比和銷售額累計百分比
區(qū)域F5:F93匯總累計的客戶數(shù),即到該客戶為止,已有客戶數(shù)占到總客戶數(shù)的百分比。區(qū)域G5:G93匯總了到該客戶為止,已有客戶實現(xiàn)的銷售額占總銷售額的百分比。
選中區(qū)域F4:G93的數(shù)據(jù),繪制無數(shù)據(jù)點散點圖,得到如圖2-14所示圖形。
圖2-14 客戶數(shù)與銷售額的帕累托初步曲線
步驟4:在曲線上添加代表20%客戶數(shù)的垂直參考線。在I5:I7單元格輸入“20%”,在J5與J7單元格輸入“0”和“120%”,在J6單元格輸入公式:“=INDEX(G5:G93,MATCH(I5,F5:F93,1),1)”,即從客戶數(shù)累計百分比中,查找到20%的客戶數(shù)在
圖2-15 Northwind公司客戶數(shù)與銷售額帕累托曲線垂直參考線數(shù)據(jù)
最后公司客戶銷售額與客戶數(shù)parato曲線呈現(xiàn)如圖所示:
圖2-2 公司客戶銷售額與客戶數(shù)parato曲線
四、繪制按照訂單匯總的銷售額與銷售次數(shù)帕累托曲線 步驟1:查詢“訂購日期”、“訂單ID”與“銷售額”等數(shù)據(jù)。
在Excel的空白工作表中,選擇菜單“數(shù)據(jù)”→“數(shù)據(jù)透視表與數(shù)據(jù)透視圖” →“外部數(shù)據(jù)源”→“獲取數(shù)據(jù)”,利用Microsoft Query,從“訂單”表和“訂單明細”表中查詢 “訂購日期”、“訂單ID”與“銷售額”(銷售額=訂單明細.單價*數(shù)量*(1-折扣))等字段,將查詢數(shù)據(jù)返回Excel。
步驟2:利用查詢的數(shù)據(jù),制作數(shù)據(jù)透視表。
從數(shù)據(jù)透視表的字段列表中,選擇“訂購日期”,拖至行域,將“銷售額”拖至數(shù)據(jù)域。將“訂購日期”字段按年組合,拖至頁域,將“訂單ID”拖至行域,按照銷售額從大到小的順序排列,得到按照和訂單ID匯總的數(shù)據(jù)透視表,如圖2-16。
圖2-16 Northwind公司按照匯總各訂單銷售額
步驟3:利用數(shù)據(jù)透視表的數(shù)據(jù),計算客戶數(shù)累計百分比與銷售額累計百分比,繪制帕累托曲線。
在區(qū)域D4:G4依次輸入說明文字,“銷售次數(shù)百分比”、“ 銷售次數(shù)累計百分比”、“ 銷售額累計百分比 ”。按照圖2-17輸入公式,得到如圖2-18所示的匯總數(shù)據(jù)。
圖2-17 Northwind公司按照匯總客戶數(shù)累計百分比和銷售額累計百分比公式
圖2-18 Northwind公司按照匯總客戶數(shù)累計百分比和銷售額累計百分比
區(qū)域E5:E834計算單次銷售占總銷售次數(shù)(即訂單數(shù))的百分比,區(qū)域F5:F834匯總累計銷售次數(shù)占總銷售次數(shù)的百分比,即到該訂單為止,已有訂單數(shù)占到總訂單數(shù)的百分比。區(qū)域G5:G834匯總到該訂單為止,已有訂單實現(xiàn)的銷售額占總銷售額的百分比。
選中區(qū)域F4:G834的數(shù)據(jù),繪制無數(shù)據(jù)點散點圖,得到如圖2-19圖形。
圖2-19 銷售次數(shù)與銷售額的帕累托初步曲線
步驟4:在曲線上添加代表20%客戶數(shù)的垂直參考線。
在I5:I7單元格輸入“20%”,在J5與J7單元格輸入“0”和“120%”,在J6單元格輸入公式:“=INDEX(G5:G834,MATCH(I5,F5:F G834,1),1)”,即從銷售次數(shù)累計百分比中,查找20%的銷售次數(shù)在
圖2-3 norwthwind公司銷售次數(shù)與銷售額parato曲線
五、匯總各地區(qū)客戶分布
步驟1:查詢“公司名稱”與“地區(qū)”字段等數(shù)據(jù)。
將Excel一張空白工作表命名為“5.各地區(qū)客戶分布”。選擇菜單“數(shù)據(jù)”→“數(shù)據(jù)透視表與數(shù)據(jù)透視圖” →“外部數(shù)據(jù)源”→“獲取數(shù)據(jù)”,利用Microsoft Query,從“客戶”表中查詢 “公司名稱”與“地區(qū)”字段,然后將所查詢的數(shù)據(jù)返回Excel。
步驟2:利用查詢的數(shù)據(jù),制作數(shù)據(jù)透視表。
從數(shù)據(jù)透視表的字段列表中,選擇“地區(qū)”,拖至行域,選擇“公司名稱”,拖至數(shù)據(jù)域,得到按照地區(qū)匯總的客戶數(shù)的數(shù)據(jù)透視表,如圖2-20。
圖2-20 按照地區(qū)匯總客戶數(shù)的數(shù)據(jù)透視表
步驟3:利用數(shù)據(jù)透視表的數(shù)據(jù),制作數(shù)據(jù)透視圖。光標停留在數(shù)據(jù)透視表中,選擇菜單“插入”→“圖表”,在新建工作表中建立數(shù)據(jù)透視圖,改變該圖表位置,將其調整到“5.各地區(qū)客戶分布”工作表中,得到了如圖2-4所示的圖形。
圖2-4 公司各地區(qū)客戶的分布
六、繪制各地區(qū)平均銷售額及銷售額占總銷售額百分比 步驟1:查詢“地區(qū)”與“銷售額”等數(shù)據(jù)。
在Excel的空白工作表中,選擇菜單“數(shù)據(jù)”→“數(shù)據(jù)透視表與數(shù)據(jù)透視圖” →“外部數(shù)據(jù)源”→“獲取數(shù)據(jù)”,利用Microsoft Query,選擇數(shù)據(jù)源,從“客戶”、和“訂單明細”表中,查詢客戶的“地區(qū)”與“銷售額”(銷售額=訂單明細.單價*數(shù)量*(1-折扣))等字段,將查詢數(shù)據(jù)返回Excel。查詢時應包括“訂單”表,該表能建立 “客戶”表和“訂單明細”表之間的聯(lián)系。
步驟2:利用查詢的數(shù)據(jù),制作數(shù)據(jù)透視表。
從數(shù)據(jù)透視表的字段列表中,選擇“地區(qū)”,拖至行域,將“銷售額”拖至數(shù)據(jù)域,得到按照地區(qū)匯總的銷售額的數(shù)據(jù)透視表,如圖2-21。
圖2-21 Northwind公司按照地區(qū)匯總的銷售額
步驟3:利用數(shù)據(jù)透視表的數(shù)據(jù),計算各地區(qū)平均銷售額與銷售額占總銷售額的百分比。在區(qū)域D4:G4依次輸入說明文字:“地區(qū)”、“ 客戶數(shù) ”、“平均銷售額”與“ 銷售額占總額百分比”。按照圖2-22輸入公式,得到如圖2-23所示的匯總數(shù)據(jù)。
圖2-22 Northwind公司按照地區(qū)匯總平均銷售額、銷售額占總銷售額百分比公式
圖2-23 Northwind公司按照地區(qū)匯總平均銷售額、銷售額占總銷售額百分比
區(qū)域E5:E10存放各地區(qū)的客戶數(shù),區(qū)域F5:F10計算各地區(qū)平均銷售額,區(qū)域G5:G10計算各地區(qū)銷售額占總銷售額的百分比。利用區(qū)域D5:D10與區(qū)域F5:G10中的數(shù)據(jù),繪制柱型圖。由于一個數(shù)據(jù)系列是平均銷售額,一個數(shù)據(jù)系列是百分比,兩個系列數(shù)值相差懸殊,所以在圖2-24中,只能觀察到一個數(shù)據(jù)系列的柱型,另一個系列的柱型貼近“0”,無法觀察到。選中代表百分比的系列(選中平均銷售額的系列,移動上下箭頭,直到選中代表百分比的系列),選擇菜單“格式”→“數(shù)據(jù)系列格式” →“坐標軸”→“次坐標軸”,將代表百分比的系列對應到次坐標軸。
圖2-24 Northwind公司按照地區(qū)匯總平均銷售額、銷售額占總銷售額百分比圖
觀察該圖形,可以發(fā)現(xiàn) “華東”與“西南”地區(qū),客戶的平均銷售額比其他地區(qū)高,說明這兩個地區(qū)大客戶的銷售情況比較好。華北地區(qū)雖然銷售額占總銷售額的百分比最高,是Northwind公司最重要的市場,但該地區(qū)大客戶的銷售情況并不理想,平均銷售額并不高。今后該地區(qū)應更注重改善大客戶銷售情況。
七、繪制大宗銷售的銷售額時間序列。
步驟1:查詢“公司名稱 ”、“訂單ID”、“ 訂購日期”與“ 銷售額”等數(shù)據(jù)。
將Excel的空白工作表命名為“7.大宗銷售數(shù)據(jù)”,選擇菜單“數(shù)據(jù)”→“獲取外部數(shù)據(jù)” →“外部數(shù)據(jù)源”→“獲取數(shù)據(jù)”,利用Microsoft Query,從“客戶”表、“訂單”表和“訂單明細”表中,查詢“公司名稱 ”、“訂單ID”、“ 訂購日期”與“ 銷售額”(銷售額=訂單明細.單價*數(shù)量*(1-折扣))等字段,將查詢數(shù)據(jù)返回Excel,存放在區(qū)域A1:D831。
步驟2:挑選出銷售額超過2000元的訂單。
在區(qū)域F1:F2,按照圖2-25,輸入篩選的條件。利用Excel高級篩選功能,挑選出滿足條件的記錄,存放在區(qū)域H1:K186中。
圖2-25 Northwind公司2000元以上銷售額的訂單的銷售情況
步驟3:利用挑選出的訂單,制作數(shù)據(jù)透視表。利用區(qū)域H1:K186中的數(shù)據(jù),制作數(shù)據(jù)透視表。從數(shù)據(jù)透視表的字段列表中,選擇“訂購日期”,拖至行域,將“銷售額”拖至數(shù)據(jù)域,將“訂購日期”字段按年組合,然后拖至頁域,將“公司名稱”拖至頁域,規(guī)定行域字段必須“顯示空數(shù)據(jù)項”,得到如圖2-26所示的數(shù)據(jù)透視表。
圖2-26 Northwind公司大宗銷售的時間序列數(shù)據(jù)透視表
步驟4:繪制大宗銷售的時間序列圖形。
為了讓圖形能夠正確反映銷售情況,去掉沒有發(fā)生銷售的時間點,如96年1月到96年6月,我們在數(shù)據(jù)透視表外面,另準備作圖數(shù)據(jù)。按照圖2-27,在區(qū)域E12:E33輸入從96年7月到98年4月的時間(98年5月數(shù)據(jù)不完整,故不包括在時間序列內),在單元格F12輸入公式:“=C12”,并復制到區(qū)域F13:F33。
圖2-27 Northwind公司大宗銷售的時間序列作圖數(shù)據(jù)
利用區(qū)域E11:F33中的數(shù)據(jù),制作折線圖,將圖表X軸的類型改為分類軸?!肮久Q”選擇“全部”,在圖形上嘗試添加恰當?shù)内厔菥€,顯示趨勢線的方程與R2,并前推兩個周期,得到的時間序列圖形如圖2-28。從該圖形上,可以大致了解大宗銷售的變化趨勢,對未來的情況做初步估計。
圖2-28 Northwind公司大宗銷售的時間序列圖
實驗小結:
數(shù)據(jù)透視表分類匯總的兩種方法:
1、先將數(shù)據(jù)導入Excel成為數(shù)據(jù)清單,利用數(shù)據(jù)透視表匯總對數(shù)據(jù)清單進行匯總
2、利用數(shù)據(jù)透視表直接從數(shù)據(jù)庫中查詢、并匯總數(shù)據(jù)。數(shù)據(jù)透視表功能,使用最方便,可以把匯總表“旋轉”,從不同的“角度”查看數(shù)據(jù),還可以篩選數(shù)據(jù)、合并數(shù)據(jù)、展開詳細數(shù)據(jù)、或者選擇部分數(shù)據(jù)加以查看。
實驗思考:
1、你還能從哪些方面對客戶的銷售數(shù)據(jù)進行分析,幫助該公司促進銷售或者為客戶提供更好的服務?
答:使用Northwind公司的銷售數(shù)據(jù),生成凈銷售額時間序列,創(chuàng)建可以調節(jié)的產品列表框,并繪制特定產品銷售金額時間序列的圖形。觀測每種產品在不同年份不同月份的銷售情況,對下階段的銷售做出預測。
2、帕累托曲線可以幫助分析投入與產出之間的關系,它還能幫助該公司進哪些方面的分析?
答:①帶來80%利潤的20%的顧客在哪里,并且留住他們。②銷售量達80%的20%產品是哪些,找出來好好包裝開發(fā)。③銷售量達80%的20%城市在哪里,并且維護好。
實驗三 餐飲公司經營數(shù)據(jù)時間序列預測
實驗3-1 “美食佳”公司半成品年銷售量預測
實驗類型:驗證性
實驗學時:2 實驗目的: ? 理解數(shù)平滑預測法的概念;
? 掌握在excel中建立指數(shù)平滑預測模型的方法; ? 掌握尋找最優(yōu)平滑常數(shù)的各種方法。
實驗步驟:
一、運用“數(shù)據(jù)分析”工具進行指數(shù)平滑預測 步驟1:確定時間序列的類型。
如圖3-1所示在單元格a1:b21中布置好公司從1987-2006年的銷售量數(shù)據(jù)。然后,繪制公司從1987年至2006年共20年的銷售量折線圖,結果如圖3-2所示,既沒有趨勢成分也沒有季節(jié)成分,呈現(xiàn)出的是圍繞一個水平上下波動的時間序列,說明適合用指數(shù)平滑法或移動平均法進行預測。本實驗的數(shù)據(jù)是數(shù)據(jù),建議采用指數(shù)平滑預測法。
圖3-1 公司從1987-2006年的銷售量數(shù)據(jù)
圖3-2 公司從1987-2006年的銷售量折線圖
步驟2:利用“數(shù)據(jù)分析”工具中的指數(shù)平滑功能進行預測。
在“工具”菜單中選擇“加載宏”,在隨后彈出的“加載宏”對話框中選擇“分析工具庫”,然后單擊“確定”按鈕,將會在“工具”菜單下出現(xiàn)“數(shù)據(jù)分析”選項。在“工具”菜單中選擇“數(shù)據(jù)分析”,在出現(xiàn)的“數(shù)據(jù)分析”對話框中選擇“指數(shù)平滑”,出現(xiàn)如圖3-3所示的對話框。
圖3-3 指數(shù)平滑分析的參數(shù)設置
在“指數(shù)平滑”對話框中,在“輸入?yún)^(qū)域”輸入“b2:b21”單元格,“阻尼系數(shù)”輸入“0.75”(注:阻尼系數(shù)=1-平滑常數(shù)),在“輸出區(qū)域”輸入“c2”單元格,單擊“確定”按鈕,將會看到如圖3-4中單元格c2:c21的輸出結果。
將單元格c21往下復制,便得到2007年的指數(shù)平滑預測值7.96。
圖3-4 指數(shù)平滑預測結果
二、運用指數(shù)平滑公式進行預測 步驟1:利用公式
計算指數(shù)平滑預測值。
如圖3-5,在單元格f1中輸入平滑常數(shù)0.25,在單元格c2中輸入公式:“=b2”,作為
三、尋找最優(yōu)的平滑常數(shù) 步驟1:計算均方誤差。
如圖3-5在單元格f2中輸入公式:“=average((b2:b21-c2:c21)^2)”,作為數(shù)組運算,需要同時按Ctrl+Shift+Enter三個鍵作為輸入結束,計算均方誤差MSE。步驟2:利用模擬運算表及查找引用函數(shù)功能,尋找最優(yōu)平滑常數(shù)。
如圖3-7在單元格e7:e24中給出不同的平滑常數(shù)(大于0小于1),在單元格f6中輸入公式:“=f2”,選定單元格e6:f24,在“數(shù)據(jù)”菜單中選擇“模擬運算表”,在彈出的對話框中做如圖3-8所示的參數(shù)設置,利用一維模擬運算表功能計算不同平滑常數(shù)下的mse值,見圖3-7結果。
圖3-7 模擬運算表輔助查找最優(yōu)平滑常數(shù)
圖3-8 模擬運算表對話框參數(shù)設置
在單元格f4中輸入公式:“=index(e7:e24,match(min(f7:f24),f7:f24,0))”,找到最優(yōu)平滑常數(shù)為0.35。然后,根據(jù)最優(yōu)平滑常數(shù)0.35(將此值代入單元格f1中),2007年的預測值為7.94。
步驟3:利用規(guī)劃求解功能,尋找最優(yōu)平滑常數(shù)。規(guī)劃求解工具是一個從函數(shù)值所要達到的目標出發(fā),反過來確定為達到這個目標,各自變量應取什么值的工具。
在“工具”菜單中選擇“規(guī)劃求解”,在彈出的對話框中做如圖3-9所示的參數(shù)設置,然后單擊“求解”按鈕,得到如圖3-10所示的規(guī)劃求解結果,其中可變單元格f2中顯示最優(yōu)平滑常數(shù)為0.37。根據(jù)最優(yōu)平滑常數(shù)0.37,2007年的預測值為7.93。
圖3-9 規(guī)劃求解參數(shù)設置
圖3-10 規(guī)劃求解的結果
以上兩種方法所尋找到的平滑常數(shù)都是基于實際銷售量與預測銷售量的均方誤差極小,從理論上證明了所獲得的平滑常數(shù)是最優(yōu)的。
實驗思考:
1.為什么用模擬運算表加查找引用函數(shù)功能,得到的最優(yōu)平滑常數(shù)(0.35),與用規(guī)劃求解功能得到的結果(0.37)不一樣?
答:用模擬運算表加查找引用函數(shù)功能得到的最優(yōu)平滑常數(shù)(0.35)是根據(jù)設定的間隔求解,結果不是很準確。而規(guī)劃求解功能得到的結果(0.37)是精確結果。
2.可否調整模擬運算表的輸入數(shù)據(jù)間隔,再試一試,結果會如何?
答:在實驗3-1中,調整模擬運算表的輸入數(shù)據(jù)間隔,其結果不變。因為模擬運算表只是將數(shù)據(jù)代入變量中來求得對應的值,所得到的值與數(shù)據(jù)的間隔無關。
實驗3-2 “美食佳”公司月管理費預測
實驗目的:
? 理解移動平均預測法的概念;
? 掌握在excel中建立移動平均模型的方法; ? 掌握尋找最優(yōu)移動平均跨度的各種方法。
實驗步驟:
一、運用“數(shù)據(jù)分析”工具進行移動平均預測 步驟1:確定時間序列的類型。
如圖3-11所示在單元格a1:c19中布置好公司從2006年1月至2007年6月的數(shù)據(jù)。
繪制公司從2006年1月至2007年6月共18個月的管理費用折線圖,結果如圖3-12所示,既沒有趨勢成分也沒有季節(jié)成分,呈現(xiàn)出的是圍繞一個水平上下波動的時間序列,說明適合用指數(shù)平滑法或移動平均法進行預測。本實驗的數(shù)據(jù)是月度數(shù)據(jù),建議采用移動平均預測法。
圖3-11 公司從2006年1月至2007年6月的管理費數(shù)據(jù)
圖3-12 公司從2006年1月至2007年6月的管理費用折線圖
步驟2:利用“數(shù)據(jù)分析”工具的移動平均功能進行預測。在“工具”菜單中選擇“數(shù)據(jù)分析”,在出現(xiàn)的“數(shù)據(jù)分析”對話框中選擇“移動平均”,出現(xiàn)如圖3-13所示的對話框。
在“移動平均”對話框中,在“輸入?yún)^(qū)域”輸入“c2:c19”單元格,“間隔”輸入“3”(注:移動平均跨度為3),在“輸出區(qū)域”輸入“d3”單元格,單擊“確定”按鈕,將會看到如圖3-14中單元格d5:d20的輸出結果。
如單元格d20所示,2007年7月公司管理費用的移動平均預測值為20.3萬元。
圖3-13 移動平均對話框參數(shù)設置
圖3-14 移動平均預測結果
二、運用移動平均公式進行預測
步驟1:利用average()函數(shù)計算移動平均預測值。
如圖3-15,在單元格g1中輸入移動平均跨度3,在單元格d5中輸入移動平均模型預測公式:“=average(c2:c4)”。
將單元格d5往下復制,便得到2007年7月的移動平均預測值20.3。
圖3-15平均值函數(shù)的計算結果
步驟2:繪制移動平均預測圖。
利用單元格c2:d20中的數(shù)據(jù)繪制如圖3-16所示的公司18個月的管理費用及移動平均預測圖。
圖3-16 公司18個月的管理費用及移動平均預測圖
通過以上實驗能夠檢驗,運用“數(shù)據(jù)分析”工具和移動平均公式進行移動平均預測的預測結果是一致的?!懊朗臣选惫?007年7月的管理費移動平均預測值為20.3,此預測結果是基于移動平均跨度為3個月所獲得的。對沒有先期經驗的人來說,怎樣選擇移動平均跨度呢?又怎么判斷所選的移動平均跨度是最優(yōu)的呢?下面的實驗步驟將指導我們掌握尋找最優(yōu)移動平均跨度的不同方法。
三、尋找最優(yōu)的移動平均跨度 步驟1:計算均方誤差。
此處用到兩個函數(shù):sumxmy2()函數(shù)和count()函數(shù)。sumxmy2()函數(shù)的功能是返回兩數(shù)組中對應數(shù)值之差的平方和,它需要兩個參數(shù),一個參數(shù)是 圖3-18結果。
圖3-18模擬運算表輔助查找最優(yōu)移動平均跨度
圖3-19 模擬運算表參數(shù)設置
在單元格g4中輸入公式:“=index(f7:f15,match(min(g7:g15),g7:g15,0))”,找到最優(yōu)移動平均跨度為5。根據(jù)最優(yōu)移動平均跨度5(將此值代入單元格g1中),2007年7月的預測值為20.2。
實驗思考
1.可否利用規(guī)劃求解功能,尋找最優(yōu)的移動平均跨度?
答:在實驗3-2中,無法利用規(guī)劃求解功能尋找最優(yōu)的移動平均刻度。因為求MSE所用的公式為“=SUMXMY2(C2:C19,D2:D19)/COUNT(D2:D19)”與移動平均刻度值所在的G1單元格無直接聯(lián)系。
2.excel提供的移動平均趨勢線功能也可進行移動平均預測,但趨勢線方法與本實驗所介紹的方法有何不同?
答:Excel提供的移動平均趨勢線方法與本實驗所介紹的方法與本實驗所介紹方法的區(qū)別在于趨勢線的作用是對已知的一堆數(shù)據(jù)作回歸分析,以找到一個可以直接計算的方程式并對其他任意未經測量的數(shù)值進行計算。趨勢線方法考慮了大量可能的結果。
實驗3-3 “美食佳”華東分公司銷售額趨勢預測 實驗類型:驗證性
實驗學時:2 實驗目的:
? 理解趨勢預測法的概念;
? 掌握在excel中建立線性趨勢預測模型的方法; ? 掌握尋找線性趨勢模型參數(shù)的各種方法; ? 掌握線性趨勢值預測的不同方法。
實驗步驟:
步驟1:確定時間序列的類型。
如圖3-20所示在單元格a1:c12中布置好華東分公司從1996年至2006年的銷售額數(shù)據(jù)。繪制華東分公司從1996年至2006年共11年的銷售額折線圖,結果如圖3-21所示,具有較明顯的線性趨勢成分,呈上升趨勢,說明適合用線性趨勢法進行預測。
圖3-20 華東分公司從1996年至2006年的銷售額數(shù)據(jù)
圖3-21 華東分公司從1996年至2006年的銷售額折線圖
步驟2:添加線性趨勢線。
如圖3-22所示,在圖中選中數(shù)據(jù)系列,右鍵菜單中選擇“添加趨勢線”,出現(xiàn)“添加趨勢線”對話框。
如圖3-23所示,在“添加趨勢線”對話框的“類型”中選擇“線性”。
如圖3-24所示,在“添加趨勢線”對話框的“選項”中選擇“顯示公式”和“顯示r平方值”,得到如圖3-25的結果。
圖3-22 選用添加趨勢線功能
圖3-23 添加趨勢線對話框
圖3-24 添加趨勢線的選項對話框
圖3-25 華東分公司銷售額與和線性趨勢線
步驟3:用趨勢線前推法大致預測線性趨勢值。
選定線性趨勢線,右鍵菜單中選擇“趨勢線格式”,出現(xiàn)如圖3-26的“趨勢線格式”對話框。
如圖3-26所示,在“趨勢線格式”對話框中選定“選項”,將趨勢預測前推1周期,得到如圖3-27所示的大致預測結果。
由圖3-27中的趨勢線可見,公司2007年的銷售額預測值約為1000萬元。
圖3-26 趨勢預測前推1周期設置
圖3-27 趨勢預測前推1周期的大致預測結果
步驟4:用方程或函數(shù)準確預測線性趨勢值。
根據(jù)得到的線性趨勢方程公式y(tǒng)=11.473x+861.98,如圖3-28所示,在單元格c13中輸入公式:“=11.473*a13+861.98”,即將x=12(2007年為
圖3-29 帶預測點的銷售額線性趨勢預測圖
實驗思考
1.本實驗的幾張圖中,x軸是“分類”還是“自動”? 答:本實驗(實驗3-3)中,X軸是自動。
2.預測點數(shù)據(jù)如果作為新數(shù)據(jù)系列添加到圖形中,結果與圖3-29有何不同?
答:實驗3-3中,預測點數(shù)據(jù)如果作為新數(shù)據(jù)系列添加到圖形中,結果與圖3-29相比,預測部分的值將是一條直線。
3.為什么預測值一定在趨勢線的延伸線上?
答:預測值一定在趨勢線上的原因是預測值是依據(jù)趨勢線作出來的。4.若要預測公司2008年的全國銷售額,可以怎么做?若要預測公司2009年、2010年、甚至更遠年份的銷售額,會有什么問題?
答:若要預測2008年的全國銷售額,可依據(jù)2007年的預測值來作。但若要預測更遠年份的銷售額,則不能以之為基礎由趨勢線函數(shù)進行預測,因為彼時銷售額呈線性增長,與客觀事實不符。
5.除了本實驗中介紹的添加趨勢線方法可以找到線性趨勢預測模型的參數(shù)外,還可以用哪些方法找到線性趨勢預測模型y=a+bx中的參數(shù) a和b。
答:還可用回歸方法找到Y=a+bX中參數(shù)a,b的值。
實驗3-4 “美食佳”公司會員卡發(fā)行量趨勢預測
實驗類型:驗證性
實驗學時:2 實驗目的:
? 理解非線性趨勢預測法的概念;
? 掌握在excel中建立非線性趨勢預測模型的方法; ? 掌握非線性趨勢值預測的方法。
預測公司2007年7月會員卡的發(fā)行量。
實驗步驟:
步驟1:確定時間序列的類型。
如圖3-30所示在單元格a1:c15中布置好公司從2006年5月至2007年6月的會員卡發(fā)行數(shù)據(jù)。
繪制公司從2006年5月至2007年6月共14個月的會員卡發(fā)行量的折線圖,結果如圖3-31所示,具有較明顯的非線性趨勢成分,說明適合用非線性趨勢法進行預測。從曲線的形狀看,它先上升較快后上升較慢,符合對數(shù)曲線的特征,因此我們可以選用對數(shù)趨勢模型進行預測。
圖3-30 2006年5月至2007年6月會員卡發(fā)行量數(shù)據(jù)
圖3-31 2006年5月至2007年6月會員卡發(fā)行量的折線圖
步驟2:添加非線性趨勢線。
如圖3-32所示,在圖中選中數(shù)據(jù)系列,右鍵菜單中選擇“添加趨勢線”,出現(xiàn)“添加趨勢線”對話框。
如圖3-33所示,在“添加趨勢線”對話框的“類型”中選擇“對數(shù)”。
如圖3-34所示,在“添加趨勢線”對話框的“選項”中選中“顯示公式”和“顯示r平方值”,得到如圖3-35的結果。
圖3-32 選擇添加趨勢線功能
圖3-33 添加趨勢線對話框
圖3-34 添加趨勢線選項對話框
圖3-35 2006年5月至2007年6月會員卡發(fā)行量和對數(shù)趨勢線
步驟3:趨勢線前推法大致預測非線性趨勢值。
選定對數(shù)趨勢線,右鍵菜單中選擇“趨勢線格式”,出現(xiàn)如圖3-36的“趨勢線格式”對話框。
如圖3-36所示,在“趨勢線格式”對話框中選定“選項”,將趨勢預測前推1周期,得到如圖3-37所示的大致預測結果。
由圖3-37中的趨勢線可見,公司2007年7月的會員卡發(fā)行量預測值約為25萬張。
圖3-36 趨勢預測前推1周期設置
圖3-37 趨勢預測前推1周期的大致預測結果
步驟4:用方程或函數(shù)準確預測非線性趨勢值。根據(jù)得到的方程公式y(tǒng)=7.7785ln(x)+3.7651,如圖3-38所示,在單元格c16中輸入公式:“=7.7785*ln(a16)+3.7651”,即將x=15(2007年7月為 規(guī)劃求解法找到對數(shù)趨勢預測模型y=a+bln(x)中的參數(shù)a和b?
答:還可用回歸方法找到Y=a+bX中參數(shù)a,b的值。
實驗3-5 “美食佳”火鍋連鎖店原料采購成本預測 實驗目的:
? 理解季節(jié)指數(shù)的概念; ? 掌握季節(jié)指數(shù)預測方法。
實驗步驟:
步驟1:確定時間序列的類型。
如圖3-40所示在單元格a1:c17中布置好公司從2003年
圖3-42 4年同期的原材料采購成本折線圖
步驟2:計算季節(jié)指數(shù)。
一年有4個季度,所以以4為移動平均跨度,計算移動平均數(shù),其結果應該對應放在每4個季度的中間位置。但當移動平均跨度為4時,沒有中間季度位置可放,因此只能放在
圖3-44 中心化后的原材料采購成本移動平均數(shù)
平均季節(jié)指數(shù)應等于1,因此4個季度的季節(jié)指數(shù)總和必須等于4。如果不滿足這一點,則應對季節(jié)指數(shù)進行調整。方法是用每一個季節(jié)指數(shù)除以未調整的季節(jié)指數(shù)之
和再乘以季度指數(shù)總和4。如圖3-43中單元格i6所示,未調整前的季節(jié)指數(shù)之和為3.9852,所以需要調整。在單元格j2中輸入公式:“=i2/$i$6*4”,往下復制到j3:j5,得到調整后的季節(jié)指數(shù)。
步驟3: 消除季節(jié)影響。
如圖3-45所示,將調整后的季節(jié)指數(shù)復制到E列,分別對應2003-2007年的4個季度。
圖3-45 消除季節(jié)影響后的原材料采購成本
在單元格F2中輸入公式:“=D2/E2”,將公式復制到單元格F3:F17中,得到消除季節(jié)影響后的結果。
利用單元格F2:F17中的數(shù)據(jù)繪制公司從2003年 圖3-46 消除季節(jié)影響后的原材料采購成本及趨勢線
步驟4:計算預測值。
如圖3-47中G列所示,利用FORECAST()函數(shù)計算線性趨勢預測值。
圖3-47 趨勢預測值和季節(jié)預測值的計算
在單元格H2中輸入公式:“=G2*E2”,將公式復制到單元格H3:H21中,即在線性趨勢預測值的基礎上乘以調整后的季節(jié)指數(shù)得到最終的季節(jié)預測值。公司2007年1至4季度的采購成本預測值分別為73.0、20.9、13.8、154.9。
根據(jù)D列的原始采購成本數(shù)據(jù)和H列的季度預測值數(shù)據(jù),作折線圖,結果如圖3-48所示。
圖3-48 2003-2004年原材料采購成本及2007年4個季度的原材料采購成本預測值
實驗思考
1.圖3-47中的“序號”一列有什么用?
答:圖3-47中“序號”一列的作用是為趨勢線公式的獲得提供依據(jù)(作為自變量X)。2.計算趨勢預測值時,若不用forcast()函數(shù),還可以有什么方法?請至少用兩種方法試試看。
答:計算趨勢預測值還可用移動平均預測法、指數(shù)平滑預測法、一元線性回歸分析模型等。
3.季節(jié)指數(shù)模型是否只能用于季節(jié)數(shù)據(jù)的預測?若是、月度、甚至周數(shù)據(jù),可以用季節(jié)指數(shù)模型嗎?
答:季節(jié)指數(shù)模型不是只能用于季節(jié)數(shù)據(jù)的預測,、月度、周數(shù)據(jù)等在某些情況下均能用季節(jié)指數(shù)模型。
實驗總結: 此次實驗中學習了指數(shù)平滑預測法、移動平均預測法、趨勢預測法、非線性趨勢預測法、季節(jié)指數(shù)的概念,計算趨勢預測值還可用移動平均預測法、指數(shù)平滑預測法、一元線性回歸分析模型等。實驗不難,關鍵要會分析和辨別使用何種分析方法。
實驗四 住房建筑許可證數(shù)量的回歸分析
實驗4-1 “家家有房”公司建筑許可證一元線性回歸分析
實驗目的
? 理解一元線性回歸分析的概念;
? 針對不同的問題,能夠建立適當?shù)囊辉€性回歸模型; ? 掌握內建函數(shù)slope()、intercept()與linest()的用法;
? 掌握用規(guī)劃求解法、添加線性趨勢線法、回歸分析報告法確定線性回歸方程的系數(shù); ? 給定自變量的情況下,根據(jù)線性回歸模型預測因變量的值。
實驗步驟:
步驟1:確定因變量與自變量并輸入觀測值。
根據(jù)實驗要求,我們確定因變量為建筑許可證的頒發(fā)數(shù)量,自變量為人口密度,并將數(shù)據(jù)合理的布置在excel工作表的單元格a1:b19中,以備建模使用。
步驟2:繪制因變量與自變量關系散點圖。
利用工作表的數(shù)據(jù),以每平方公里的人口密度為x值,建筑許可證的頒發(fā)數(shù)量為y值,繪制xy散點圖,如圖4-1所示。從這個散點圖可以看出每平方公里的人口密度與建筑許可證的頒發(fā)數(shù)量之間存在著大體上的線性依賴關系。
圖4-1建筑許可證的頒發(fā)數(shù)量與每平方公里的人口密度散點圖
步驟3:求出回歸系數(shù)a、b的取值,計算判定系數(shù)R2,并進行預測。
excel提供了幾種不同的工具,包括規(guī)劃求解工具,intercept()、slope()與linest()等內建函數(shù),在散點圖中添加趨勢線和趨勢線方程以及生成回歸分析報告等方法來確定回歸系數(shù)a和b。我們這里介紹利用規(guī)劃求解的方法來求解回歸系數(shù)。
步驟4:假定回歸系數(shù)的值,建立線性回歸模型。
假定回歸系數(shù)的值為a=1,b=1并將之放在單元格f2:f3中。用回歸直線方程y=a+bx以及每平方公里的人口密度來計算建筑許可證的頒發(fā)數(shù)量預測值,放在單元格c2中,即在單元c2中輸入公式“=$f$2+$f$3*a2”,并將此公式復制到c3:c19中,得到建筑許可證的頒發(fā)
數(shù)量預測值。在單元格f5中計算建筑許可證的頒發(fā)數(shù)量觀測值與預測值的均方誤差mse,即在單元格f5中輸入公式“{=average((c2:c19-b2:b19)^2)}”(注:其中的花括號不是直接輸入,是將所有內容輸入完后按住ctrl+shift鍵后再按回車鍵生成的)。如圖4-2所示:
圖4-2 回歸參數(shù)求解前的模型
步驟5:啟動規(guī)劃求解工具,確定模型最優(yōu)參數(shù)。
在如圖4-3的“規(guī)劃求解參數(shù)”對話框中將目標單元格設為$f$5,使其等于最小值,將可變單元格設為$f$2:$f$3,無須設置任何約束條件即可直接求解,保存規(guī)劃求解結果。注意規(guī)劃求解受到迭代次數(shù)和精度的限制,本例需啟用8次規(guī)劃求解工具進行重復運算才能得到滿意的精度,即
圖4-4 回歸參數(shù)求解后的模型
根據(jù)上述回歸方程,如果任意給定人口密度(7000),即可預測出建筑許可證的頒發(fā)數(shù)量(14655.287),如圖4-5所示。
實驗思考
1.除了用規(guī)劃求解的方法外,還可以哪些其它方法求出建筑許可證數(shù)量與每平方里人口密度之間關系的回歸方程y=a+bx的系數(shù),請用其它方法求得系數(shù),并檢驗與實驗4-1所獲得的系數(shù)是否一致。
答:除用規(guī)劃求解額方法外,還可以利用添加趨勢線的方法獲得回歸方程Y=a+bX的系數(shù)。用規(guī)劃求解方法獲得的回歸方程Y=a+bX的系數(shù)中a的值為-23900.10788,b的值為5.500026742;而用添加趨勢線的方法獲得的a的值為-23901,,b的值為5.5001,在誤差允許的范圍內,可認為他們的系數(shù)一致。
2.如果每平方公里的人口密度與建筑許可證數(shù)量之間是非線性關系,該如何選擇非線性模型,并針對任意給定每平方公里的人口密度,預測建筑許可證的頒發(fā)數(shù)量。
答:若每平方公里的人口密度與建筑許可證數(shù)量之間是非線性關系,可利用添加趨勢線的方法來進行檢驗,找出每一種可能的非線性模型的均方誤差MSE,選擇其中最小的一項作為最佳的非線性模型。然后根據(jù)非線性模型的公式,帶入相應參數(shù)后即可預測建筑許可證的頒發(fā)數(shù)量。
3.根據(jù)擬合優(yōu)度,進一步分析是否有其他非線性回歸模型,更適合人口密度與建筑許可證數(shù)量的相關關系。
答:根據(jù)擬合優(yōu)度對其他非線性回歸模型進行分析,暫未找到更適合人口密度與建筑許可證數(shù)量的相關關系。
實驗4-2 “家家有房”公司建筑許可證一元非線性回歸分析
實驗目的
? 理解一元非線性回歸分析的概念;
? 針對不同的問題,能夠建立適當?shù)囊辉蔷€性回歸模型;
? 掌握用規(guī)劃求解法、添加非線性趨勢線法、變換法確定非線性回歸方程的系數(shù); ? 在給定自變量的情況下,根據(jù)非線性回歸模型預測因變量的值。
實驗步驟:
步驟1:確定因變量與自變量。
根據(jù)實驗要求,我們確定因變量為建筑許可證的頒發(fā)數(shù)量,自變量為自由房屋的均值。并將數(shù)據(jù)合理的布置在excel工作表的單元格a1:b19中,以備建模使用。
步驟2:選擇合適的回歸方程。
利用步驟1中準備的數(shù)據(jù)畫出散點圖,如圖4-5所示,通過散點圖選擇合適的擬合函數(shù),建立含未知參數(shù)的方程。
圖4-5 建筑許可證的頒發(fā)數(shù)量與自由房屋的均值散點圖
仔細觀察散點圖,發(fā)現(xiàn)建筑許可證的頒發(fā)數(shù)量隨著自由房屋的均值增大而增大,且隨著自由房屋均值的增加建筑許可證的頒發(fā)數(shù)量增加的速度而放緩,這是對數(shù)曲線的特征,因此可以采用對數(shù)函數(shù)來進行擬合。即將建筑許可證的頒發(fā)數(shù)量(y)與自由房屋的均值(x)之間的關系表述為:
y= a + blnx 其中的參數(shù)a與b的值待定。
步驟3:假定回歸系數(shù)的值,建立非線性回歸模型。
假定回歸系數(shù)的值為a=1,b=1并將之放在單元格f2:f3中。用回歸對數(shù)方程y=a+blnx以及自由房屋均值來計算建筑許可證的頒發(fā)數(shù)量預測值,放在單元格c2中,即在單元c2中輸入公式“=$f$2+$f$3*ln(a2)”,并將此公式復制到c3:c19中,得到建筑許可證的頒發(fā)數(shù)量預測值。在單元格f5中計算建筑許可證的頒發(fā)數(shù)量觀測值與預測值的均方誤差mse,即在單元格f5中輸入公式“{=average((c2:c19-b2:b19)^2)}”(用ctrl+shift+enter組合鍵添加花括號)。如圖4-6所示:
圖4-6 回歸參數(shù)求解前的模型 步驟4:確定參數(shù)a與b的值。
對于本例的問題,我們采用規(guī)劃求解的方法來確定參數(shù)a與b的值,利用規(guī)劃求解工具計算出使mse極小的參數(shù)a與b,規(guī)劃求解對話框的設置如圖4-7所示。
圖4-7 規(guī)劃求解對話框
然后點擊“求解”按鈕,可得如圖4-8所示的結果。
圖4-8 規(guī)劃求解后的模型結果
步驟5:添加趨勢線,顯示R2值。
在圖4-7的散點圖中通過添加對數(shù)趨勢線,并在添加趨勢線對話框中的“選項”中選擇“顯示R2”與“顯示公式”,如圖4-9所示。我們發(fā)現(xiàn)R2達到0.9441,表明選擇對數(shù)回歸模型預測是可行的。同時我們也檢驗了趨勢線方法與規(guī)劃求解法所得到的回歸方程系數(shù)是一樣的。
圖4-9 添加了對數(shù)趨勢線
步驟6:進行預測。
根據(jù)對數(shù)回歸方程,如果任意給定 自由房屋的均值,即可預測出建筑許可證的頒發(fā)數(shù)量。將x=300,預測出頒發(fā)的建筑許可證數(shù)量為-78874.08+16877.319*ln(300)=17390.4708,如圖 4-8所示。
實驗思考:
1、請將此問題轉換為線性回歸模型,求解模型的參數(shù)和R2值,并與規(guī)劃求解法的結果進行比較。
答:若將此模型轉換為線性回歸模型,得到的模型為y=16877.34701Ln(X)-
79003.9859, MSE=2023817.464,與原模型中y=16878Ln(X)-78877,R2=0.9441,MSE=2006982.816相比,基本無差別。
實驗4-3 “家家有房”公司建筑許可證多元線性回歸分析 實驗目的
? 理解多元線性回歸分析的概念;
? 針對不同的問題,能夠建立適當?shù)亩嘣€性回歸模型; ? 掌握運用向前增選法確定回歸自變量;
? 在給定自變量的情況下,根據(jù)多元線性回歸模型預測因變量的值。
實驗步驟:
步驟1:輸入原始數(shù)據(jù)。
首先分析案例中的自變量和因變量,并將數(shù)據(jù)合理的布置在excel工作表的a1:d19中,如圖4-10所示,以備建模使用。
根據(jù)實驗要求,我們確定因變量為建筑許可證的頒發(fā)數(shù)量(y),自變量為每平方公里的人口密度(x1)、自由房屋的均值(x2)與平均家庭收入(x3),假設多元線性模型為:y=a+b1*x1+b2*x2+b3*x3。
圖4-10 人口密度、自由房屋均值、平均家庭收入與建筑許可證數(shù)量數(shù)據(jù) 步驟2:分別繪制三個候選自變量與因變量之間的關系圖。
圖4-11 建筑許可證數(shù)量與每平方公里人口密度的散點圖
這個問題涉及到三個候選自變量,每平方公里的人口密度(x1)、自由房屋的均值(x2)與平均家庭收入(x3)。首先分別對每個候選自變量繪制與因變量建筑許可證的頒發(fā)數(shù)量關系的散點圖,見圖4-11—圖4-13。
圖4-12 建筑許可證數(shù)量與自由房屋的均值的散點圖
圖4-13建筑許可證數(shù)量與平均家庭收入的散點圖
步驟3:針對每一個候選變量生成回歸分析報告。
分別對這三個候選變量做回歸分析報告,根據(jù)值,找出最優(yōu)的變量。這里我們采用向前增選法,先給出建筑許可證的頒發(fā)數(shù)量與三個候選變量之間的回歸分析報告,分別見圖4-14和4-16。
圖4-14 許可證數(shù)量與人口密度的回歸分析報告
圖4-15 許可證數(shù)量與自由房屋均值的回歸分析報告
圖4-16 許可證數(shù)量與平均家庭收入的回歸分析報告
圖4-17 建筑許可證數(shù)量與人口密度及平均家庭收入的回歸分析報告
圖4-18 建筑許可證數(shù)量與自由房屋均值及平均家庭收入回歸分析報告
實驗思考
1.在用回歸分析報告求解參數(shù)時,自變量與因變量之間應該滿足什么關系? 答:在用回歸分析報告求解參數(shù)時,自變量與因變量之間應滿足一個或多個自變量值對應一個應變量。
2.為什么實驗結果只選用兩元線性回歸模型而不用三元線性回歸模型進行建筑許可證數(shù)量的預測?
答:實驗結果只選用兩元線性回歸模型二不用三元線性回歸模型既高興建筑許可證數(shù)量預測的原因是三元回歸分析報告中自有房屋的均值X2的調整后的R2的值并未超過一元回歸分析報告中對自有房屋的均值X2的調整后的R2的值,說明自有房屋的均值X2與建筑許可證數(shù)量的線性相關性不強,若它參與回歸預測,將會影響預測結果。
3.在用多元線性回歸時,如何確定候選變量,確定的依據(jù)是什么?
答:用多元線性回歸時,可依據(jù)對某一自變量在組合前得到的調整后的R2的值與組合后得到的調整后的R2的值之間的大大小進行候選變量的確定。若組合后得到的調整后的R2的值超過組合前得到的調整后的R2的值,則確定其為候選變量
4.從實驗4-2我們了解自有房屋的均值(x2)與建筑許可證數(shù)量是對數(shù)相關,如果我們用回歸方程y=a+b1*x1+b2*lnx2+b3*x3來進行預測是否更精確?那么我們又怎樣確定此方程的各項系數(shù)呢?
答:若用回歸方程Y=a+b1*X1+b2*lnX2+b3*X3來進行預測,結果不一定會更精確。因為Y是受3個自變量的共同影響??捎枚嘣蔷€性回歸確定次方程的各項系數(shù),因為線性回歸是特殊的非線性回歸。
實驗4-4 “家家有房”公司建筑許可證多元非線性回歸分析
實驗目的
? 理解多元非線性回歸分析的概念;
? 針對不同的問題,能夠建立適當?shù)亩嘣蔷€性回歸模型;
? 掌握用規(guī)劃求解法、變換技術加回歸分析報告法確定多元非線性回歸方程的系數(shù); ? 在給定自變量的情況下,根據(jù)多元非線性回歸模型預測因變量的值。
實驗步驟:
步驟1:確定因變量與自變量。
根據(jù)實驗要求,我們確定因變量為建筑許可證的頒發(fā)數(shù)量(y),因變量為平均家庭收入(x1)與人均交納稅收(x2),并將數(shù)據(jù)合理的布置在excel工作表中。
步驟2:確定模型并對模型初始化。
因為是非線性模型,而且是多元的,所以我們這里假設模型為y=a+b1*x1^2+b2*x2^2。在單元格h2:h4中分別放入?yún)?shù)a,b1,b2初值1,并在單元格d2中輸入公式“=$h$2+ $h$3 *a2^2+$h$4*b2^2”,并將其復制到公式d3:d19中,在單元格h5中輸入公式“=sumxmy2(d2:d19,c2:c19)/count(d2:d19)”。
步驟3:啟用規(guī)劃求解工具。
在“工具”菜單中選擇“規(guī)劃求解”,打開“規(guī)劃求解”對話框,并在該對話框中做如
圖4-19中設置,然后點擊“求解”按鈕,并將結果保存在圖4-20中。
圖4-19規(guī)劃求解參數(shù)的設置
圖4-20 規(guī)劃求解后的模型結果
步驟4:根據(jù)獲得的參數(shù)進行預測。
利用規(guī)劃求解的結果,將參數(shù)a,b1,b2的值及平均家庭收入為80千元,人均交納的稅收為7千元代入模型y=a+b1*x1^2+b2*x2^2,可得建筑許可證的頒發(fā)數(shù)量預測值為11464.4。
步驟5:將非線性模型與線性模型結果比較。
將模型假設為線性模型y=a+b1*x1+b2*x2,并將參數(shù)放置在單元格h8:h11中,重復步驟2與步驟3,可以看到在線性模型求得的mse為1500179.183,比在非線性模型下求得的mse的值1158258.3大,因此在該實驗中,用二元非線性模型要比用線性模型求解的結果要好些。
實驗思考
1.如果要用回歸分析報告求解多元非線性模型的參數(shù),首先要做的工作是什么?怎么做?
答:若要用回歸分析報告求解多元非線性模型的參數(shù),首先要做的是確定因變量與自變量。并將數(shù)據(jù)合理地布置在Excel表中。
2.現(xiàn)王經理經過深入調查研究發(fā)現(xiàn):建筑許可證的頒發(fā)數(shù)量既與每平方公里的人口密度有著密切的關系,也與自由房屋的均值有著密切的關系,此外還與平均家庭收入、人口增長百分比、失業(yè)率、人均交納的稅收等有著相關關系,并給出相關數(shù)據(jù)如表4-5,根據(jù)表4-5中所給的數(shù)據(jù),想想用什么方法能夠較快的找出合適的自變量建立多元回歸分析模型,并以此預測建筑許可證的頒發(fā)數(shù)量。
答:可分別求出每一因素調整前的R2的值與調整后的R2作比較,再確定其是否影響顯著,以此進行選擇細分。
實驗總結:
本次實驗主要目的是理解數(shù)平滑預測法、移動平均預測法、趨勢預測法、非線性趨勢預測法、季節(jié)指數(shù)的概念;掌握在excel中建立指數(shù)平滑預測模型、移動平均模型、線性趨勢預測模型、非線性趨勢預測模型、季節(jié)指數(shù)預測的方法,掌握尋找最優(yōu)平滑常數(shù)、最優(yōu)移動平均跨度、線性趨勢模型參數(shù)、線性趨勢值預測的各種方法。
實驗五 手機用戶消費習慣聚類分析
實驗目的
? 理解聚類分析的概念; ? 理解聚類分析的原理;
? 掌握在SPSS中進行聚類分析的方法。
實驗步驟: 為研究移動用戶的手機消費習慣,現(xiàn)收集了反映移動用戶手機使用情況的數(shù)據(jù),該數(shù)據(jù)中包含7個變量:客戶編號(Customer_ID)、工作日上班時期電話時長(Peak_mins)、工作日下班時期電話時長(OffPeak_mins)、周末電話時長(Weekend_mins)、國際電話時長(International_mins)、總通話時長(Total_mins)和平均每次通話時長(average_mins)。請用SPSS軟件按除客戶編號外的6個變量維度對移動用戶進行細分。部分數(shù)據(jù)如圖所示。
移動電話用戶手機使用情況部分數(shù)據(jù)
本次實驗采用迭代聚類方法進行數(shù)據(jù)分析。
1.數(shù)據(jù)的初步分析
選擇菜單 打開SPSS文件 telco.sav→分析(Analyze)→描述統(tǒng)計(Descriptive Statistics)→描述(Descriptives…)選入變量 將除“Customer_ID”外的其余6個變量選入變量框(Variables)中
設置選項 打開Options按鈕,勾選均值(Mean)、標準差(Std.deviation)、最小值(Minimum)、最大值(Maximum)四項
結果輸出見下圖。
上圖顯示6個變量數(shù)值差異較大,其中均值最大值為1064.3,最小值為4.1267,標準差的取值也從最小的3.804變化到最大的560.801。這種差異會影響聚類分析的結果。而要消除這種影響,需在聚類前對數(shù)據(jù)進行標準化處理。
2.標準化處理
在上一步彈出的“Descriptive”對話框中選擇“Save standardized values as variables”,即將標準化值另存為變量,輸出如下圖。
標準化的目的是消除量綱和變異的影響。消除量綱影響,要扣減平均值;消除變異影響,要除以標準差。因此標準化數(shù)據(jù)等于某變量的觀察值減去該變量的平均數(shù),然后除以該變量的標準差。標準化后各變量的平均數(shù)為0,標準差為1,消除了量綱和變異的影響。如ID為K1000050的用戶工作日上班時間通話時長(Peak_mins)標準化后的值,Peak_mins標準化=(觀察值-均值)/標準差=(40.61-708.347)/515.258=-1.296。
3.聚類分析
選擇菜單 打開SPSS文件 telco.sav→分析(Analyze)→分類(Classify)→K均值聚類(K-Means Cluster…)選擇變量 選入上圖中紅框內的6個標準化數(shù)據(jù)變量
設置選項 主窗口設置選項如下圖中的