第一篇:回歸分析方法總結(jié)全面
一、什么是回歸分析
回歸分析(Regression Analysis)是研究變量之間作用關(guān)系的一種統(tǒng)計(jì)分析方法,其基本組成是一個(或一組)自變量與一個(或一組)因變量?;貧w分析研究的目的是通過收集到的樣本數(shù)據(jù)用一定的統(tǒng)計(jì)方法探討自變量對因變量的影響關(guān)系,即原因?qū)Y(jié)果的影響程度。回歸分析是指對具有高度相關(guān)關(guān)系的現(xiàn)象,根據(jù)其相關(guān)的形態(tài),建立一個適當(dāng)?shù)臄?shù)學(xué)模型(函數(shù)式),來近似地反映變量之間關(guān)系的統(tǒng)計(jì)分析方法。利用這種方法建立的數(shù)學(xué)模型稱為回歸方程,它實(shí)際上是相關(guān)現(xiàn)象之間不確定、不規(guī)則的數(shù)量關(guān)系的一般化。
二、回歸分析的種類 1.按涉及自變量的多少,可分為一元回歸分析和多元回歸分析一元回歸分析是對一個因變量和一個自變量建立回歸方程。多元回歸分析是對一個因變量和兩個或兩個以上的自變量建立回歸方程。
2.按回歸方程的表現(xiàn)形式不同,可分為線性回歸分析和非線性回歸分析
若變量之間是線性相關(guān)關(guān)系,可通過建立直線方程來反映,這種分析叫線性回歸分析。若變量之間是非線性相關(guān)關(guān)系,可通過建立非線性回歸方程來反映,這種分析叫非線性回歸分析。
三、回歸分析的主要內(nèi)容
1.建立相關(guān)關(guān)系的數(shù)學(xué)表達(dá)式。依據(jù)現(xiàn)象之間的相關(guān)形態(tài),建立適當(dāng)?shù)臄?shù)學(xué)模型,通過數(shù)學(xué)模型來反映現(xiàn)象之間的相關(guān)關(guān)系,從數(shù)量上近似地反映變量之間變動的一般規(guī)律。
2.依據(jù)回歸方程進(jìn)行回歸預(yù)測。由于回歸方程反映了變量之間的一般性關(guān)系,因此當(dāng)自變量發(fā)生變化時,可依據(jù)回歸方程估計(jì)出因變量可能發(fā)生相應(yīng)變化的數(shù)值。因變量的回歸估計(jì)值,雖然不是一個必然的對應(yīng)值(他可能和系統(tǒng)真值存在比較大的差距),但至少可以從一般性角度或平均意義角度反映因變量可能發(fā)生的數(shù)量變化。
3.計(jì)算估計(jì)標(biāo)準(zhǔn)誤差。通過估計(jì)標(biāo)準(zhǔn)誤差這一指標(biāo),可以分析回歸估計(jì)值與實(shí)際值之間的差異程度以及估計(jì)值的準(zhǔn)確性和代表性,還可利用估計(jì)標(biāo)準(zhǔn)誤差對因變量估計(jì)值進(jìn)行在一定把握程度條件下的區(qū)間估計(jì)。四、一元線性回歸分析
1.一元線性回歸分析的特點(diǎn)
1)兩個變量不是對等關(guān)系,必須明確自變量和因變量。
2)如果x和 y兩個變量無明顯因果關(guān)系,則存在著兩個回歸方程:一個是以x為自變量,y為因變量建立的回歸方程;另一個是以y為自變量,x為因變量建立的回歸方程。若繪出圖形,則是兩條斜率不同的回歸直線。
3)直線回歸方程中,回歸系數(shù)b可以是正值,也可以是負(fù)值。若 0 b >,表示直線上升,說明兩個變量同方向變動;若 0 b <,表示直線下降,說明兩個變量是反方向變動。2.建立一元線性回歸方程的條件
任何一種數(shù)學(xué)模型的運(yùn)用都是有前提條件的,配合一元線性回歸方程應(yīng)具備以下兩個條件: 1)兩個變量之間必須存在高度相關(guān)的關(guān)系。
兩個變量之間只有存在著高度相關(guān)的關(guān)系,回歸方程才有實(shí)際意義。2)兩個變量之間確實(shí)呈現(xiàn)直線相關(guān)關(guān)系。
兩個變量之間只有存在直線相關(guān)關(guān)系,才能配合直線回歸方程。3.建立一元線性回歸方程的方法
一元線性回歸方程是用于分析兩個變量(一個因變量和一個自變量)線性關(guān)系的數(shù)學(xué)表達(dá)式,一般形式為:yc=a+bx 式中:x代表自變量;
yc代表因變量y的估計(jì)值(又稱理論值); ab為回歸方程參數(shù)。其中,a是直線在y軸上的截距,它表示當(dāng)自變量x等于 0 時,因變量所達(dá)到的數(shù)值;b是直線的斜率,在回歸方程中亦稱為回歸系數(shù),它表示當(dāng)自變量x每變動一個單位時,因變量y平均變動的數(shù)值。
一元線性回歸方程應(yīng)根據(jù)最小二乘法原理建立,因?yàn)橹挥杏米钚《朔ㄔ斫⒌幕貧w方程才可以同時滿足兩個條件:
1)因變量的實(shí)際值與回歸估計(jì)值的離差之和為零;
2)因變量的實(shí)際值與回歸估計(jì)值的離差平方和為最小值。
只有滿足這兩個條件,建立的直線方程的誤差才能最小,其代表性才能最強(qiáng)。
現(xiàn)在令要建立的一元線性回歸方程的標(biāo)準(zhǔn)形式為yc=a+bx,依據(jù)最小二乘法原理,因變量實(shí)際值y與估計(jì)值yc的離差平方和為最小值,即Q=∑(y-yc)2取得最小值。為使Q=∑(y-yc)2=最小值
根據(jù)微積分中求極值的原理,需分別對a,b求偏導(dǎo)數(shù),并令其為0,經(jīng)過整理,可得到如下方程組: ∑y=an+b∑x ∑xy=a∑x+b∑x2
解此方程組,可求得a,b兩個參數(shù)
4.計(jì)算估計(jì)標(biāo)準(zhǔn)誤差
回歸方程只反映變量x和y之間大致的、平均的變化關(guān)系。因此,對每一個給定的x值,回歸方程的估計(jì)值yc與因變量的實(shí)際觀察值y之間總會有一定的離差,即估計(jì)標(biāo)準(zhǔn)誤差。估計(jì)標(biāo)準(zhǔn)誤差是因變量實(shí)際觀察值 y與估計(jì)值yc離差平方和的平均數(shù)的平方根,它反映因變量實(shí)際值y與回歸直線上各相應(yīng)理論值yc之間離散程度的統(tǒng)計(jì)分析指標(biāo)。估計(jì)標(biāo)準(zhǔn)誤差:
式中:sy——估計(jì)標(biāo)準(zhǔn)誤差;y——因變量實(shí)際觀察值;yc——因變量估計(jì)值;n-2——自由度 如何描述兩個變量之間線性相關(guān)關(guān)系的強(qiáng)弱? 利用相關(guān)系數(shù)r來衡量
當(dāng)r>0時,表示x與y為正相關(guān);當(dāng)r<0時,表示x與y為負(fù)相關(guān)。5.殘差分析與殘差圖:
殘差是指觀測值與預(yù)測值(擬合值)之間的差,即是實(shí)際觀察值與回歸估計(jì)值的差
在研究兩個變量間的關(guān)系時,a)要根據(jù)散點(diǎn)圖來粗略判斷它們是否線性相關(guān);
b)判斷是否可以用回歸模型來擬合數(shù)據(jù);
c)可以通過殘差來判斷模型擬合的效果,判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù),這方面的分析工作就稱為殘差分析。6.殘差圖的制作及作用。
坐標(biāo)縱軸為殘差變量,橫軸可以有不同的選擇;若模型選擇的正確,殘差圖中的點(diǎn)應(yīng)該分布 在以橫軸為心的帶狀區(qū)域,帶狀區(qū)域的寬度越窄精度越高。對于遠(yuǎn)離橫軸的點(diǎn),要特別注意。
7.幾點(diǎn)注解:
第一個樣本點(diǎn)和第 6 個樣本點(diǎn)的殘差比較大,需要確認(rèn)在采集過程中是否有人為的錯誤。如果數(shù)據(jù)采集有錯誤,就應(yīng)該予以糾正,然后再重新利用線性回歸模型擬合數(shù)據(jù);如果數(shù)據(jù)采集沒有錯誤,則需要尋找其他的原因。
另外,殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型計(jì)較合適,這樣的帶狀區(qū)域的寬度越窄,說明模型擬合精度越高,回歸方程的預(yù)報(bào)精度越高。還可以用判定系數(shù)r2來刻畫回歸的效果,該指標(biāo)測度了回歸直線對觀測數(shù)據(jù)的擬合程度,其計(jì)算公式是:
其中:SSR-回歸平方和;
SSE-殘差平方和;
Sst=ssr+sse總離差平方和。
由公式知,R(相關(guān)指數(shù))的值越大,說明殘差平方和越小,也就是說模型擬合效果越好。在含有一個解釋變量的線性模型中r2恰好等于相關(guān)系數(shù)r的平方,即R2=r2
在線性回歸模型中,R2表示解釋變量對預(yù)報(bào)變量變化的貢獻(xiàn)率。R2越接近1,表示回歸的效果越好(因?yàn)镽2越接近1,表示解釋變量和預(yù)報(bào)變量的線性相關(guān)性越強(qiáng))。
如果某組數(shù)據(jù)可能采取幾種不同回歸方程進(jìn)行回歸分析,則可以通過比較R2的值來做出選擇,即選取R2較大的模型作為這組數(shù)據(jù)的模型。
總的來說:相關(guān)指數(shù)R2是度量模型擬合效果的一種指標(biāo)。在線性模型中,它代表自變量刻畫預(yù)報(bào)變量的能力。
五、多元線性回歸分析
在一元線性回歸分析中,因變量y只受某一個因素的影響,即只由一個自變量x來估計(jì)。但對于復(fù)雜的自然界中的問題,影響因素往往很多,在這種情況下,因變量y要用多個自變量同時進(jìn)行估計(jì)。例如,某種產(chǎn)品的總成本不僅受原材料價(jià)格的影響,而且也與產(chǎn)品產(chǎn)量、管理水平等因素有關(guān);農(nóng)作物產(chǎn)量的髙低受品種、氣候、施肥量等多個因素的影響。描述因變量與兩個或兩個以上自變量之間的數(shù)量關(guān)系的回歸分析方法稱為多元線性回歸分析。它是一元線性回歸分析的推廣,其分析過程相對復(fù)雜一些,但基本原理與一元線性回歸分析類似。多元線性回歸方程的一般表達(dá)式為: 為便于分析,當(dāng)自變量較多時可選用兩個主要的自變量x1和x2。其線性回歸方程標(biāo)準(zhǔn)式為:
其中:yc為二元回歸估計(jì)值;a為常數(shù)項(xiàng);b1和b2分別為y對x1和x2的回歸系數(shù),b1表示當(dāng)自變量x2為一定時,由于自變量x1變化一個單位而使y平均變動的數(shù)值,b2表示當(dāng)自變量x1為一定時,由于自變量x2變化一個單位而使y平均變動的數(shù)值,因此,b1和b2稱為偏回歸系數(shù)。
要建立二元回歸方程,關(guān)鍵問題是求出參數(shù)a,b1和b2的值,求解方法仍用最小二乘法,即分別對a,b1和b2求偏導(dǎo)數(shù),并令函數(shù)的一階導(dǎo)數(shù)等于零,可得如下方程組:
(二)在回歸分析中,通常稱自變量為回歸因子,一般用一般用表示。預(yù)測公式:
表示,而稱因變量為指標(biāo),稱之為回歸方程?;貧w
模型,按照各種原則可以分為各種模型:
1.當(dāng)n =1 時,稱為一元(單因子)回歸;當(dāng)n ≥ 2時,稱為多元(多因子)回歸。
2.當(dāng) f 為線性函數(shù)時,稱為線性回歸;當(dāng) f 為非線性函數(shù)時,稱為非線性(曲線)回歸。最小二乘準(zhǔn)則:
假設(shè)待定的擬合函數(shù)為,另據(jù)m個數(shù)據(jù)點(diǎn),相當(dāng)于求解以下規(guī)劃問題:
即使得總離差平方和最小。具體在線性擬合的過程中,假設(shè)擬合函數(shù)為y=a+bx,a與b為待定系數(shù),已知有m個數(shù)據(jù)點(diǎn),分別為使:,應(yīng)用最小二乘法,就是要
達(dá)到最小值。
把S 看成自變量為a和b的連續(xù)函數(shù),則根據(jù)連續(xù)函數(shù)達(dá)到及致電的必要條 件,于是得到:
因此,當(dāng)S 取得最小值時,有:
可得方程組為:
稱這個方程組為正規(guī)方程組,解這個二元一次方程組,得到:
如果把已有數(shù)據(jù)描繪成散點(diǎn)圖,而且從散點(diǎn)圖中可以看出,各個數(shù)據(jù)點(diǎn)大致分布在一條直線附近,不妨設(shè)他們滿足線性方程:
其中,x為自變量,y為因變量,a與b為待定系數(shù);ε成為誤差項(xiàng)或者擾動項(xiàng)。
這里要對數(shù)據(jù)點(diǎn)做線性回歸分析,從而a和b就是待定的回歸系數(shù),ε為隨機(jī)誤差。不妨設(shè)得到的線性擬合曲線為:
這就是要分析的線性回歸方程。一般情況下,得到這個方程以后,主要是描繪出
回歸曲線,并且觀測擬合效果和計(jì)算一些誤差分析指標(biāo),例如最大點(diǎn)誤差、總方差和標(biāo)準(zhǔn)差等。
這里最缺乏的就是一個統(tǒng)一的評價(jià)系統(tǒng),以下說明從概率角度確立的關(guān)于線性回歸的一套評價(jià)系統(tǒng)。
在實(shí)際的線性回歸分析中,除了估計(jì)出線性回歸系數(shù)a和b,還要計(jì)算y和x的相關(guān)程度,即相關(guān)性檢驗(yàn)。相關(guān)性檢驗(yàn)主要通過計(jì)算相關(guān)系數(shù)來分析,相關(guān)系數(shù)的計(jì)算公式為:
其中n為數(shù)據(jù)點(diǎn)的個數(shù),為原始數(shù)據(jù)點(diǎn),r的值能夠很好地反映出線性相關(guān)程度的高低,一般來說,存在以下一些標(biāo)準(zhǔn):
1.當(dāng) r →1 或者 r →? 1時,表示 y與x高度線性相關(guān),于是由原始數(shù)據(jù)描繪出的散點(diǎn)圖中所有數(shù)據(jù)點(diǎn)都分布在一條直線的附近,分別稱為正相關(guān)和負(fù)相關(guān);
2.當(dāng) r →0 時,表示 y與x不相關(guān),由原始數(shù)據(jù)描繪出的散點(diǎn)圖的數(shù)據(jù)點(diǎn)一般呈無規(guī)律的特點(diǎn)四散分布; 3.當(dāng)?1 4.如果r → 1,則y與x線性相關(guān)程度越高;反之,如果r →0,則y與x線性相關(guān)程度越低。 實(shí)際計(jì)算r值的過程中,長列表計(jì)算,即: 在實(shí)際問題中,一般要保證回歸方程有最低程度的線性相關(guān)。因?yàn)樵S多實(shí)際問題中,兩個變量之間并非線性的相關(guān)關(guān)系,或者說線性相關(guān)程度不高,此時硬給他建立線性回歸方程,顯然沒有太大意義,也沒有什么實(shí)用價(jià)值。一般來說,把這個最低限度的值記為臨界值出r的值,并且滿足,稱之為相關(guān)性檢驗(yàn)標(biāo)準(zhǔn)。因此,如果計(jì)算,則符合相關(guān)性要求,線性回歸方程作用顯著。反之,如果,則線性回歸方程作用不顯著,就盡量不要采用線性回歸方程。臨界值的數(shù)值表如下: 其中,自由度可以由原始數(shù)據(jù)點(diǎn)的個數(shù)減去相應(yīng)的回歸方程的變量個數(shù),例如線性回歸方程中有兩個變量,而數(shù)據(jù)點(diǎn)的個數(shù)為n個,則自由度為n ? 2.自由度一般記為 f,但不要與一般的函數(shù)發(fā)生混淆。顯著性水平一般取為 0.01,0.02,0.05等,利用它可以計(jì)算y與x之間相關(guān)關(guān)系的可信程度或者稱為置信水平,計(jì)算公式為: (這里取顯著性水平為α =0.05) 現(xiàn)在介紹置信區(qū)間的問題,由于實(shí)際誤差的存在,由線性擬合得到的計(jì)算值跟實(shí)際值之間必然存在一定的差距,其差值就是計(jì)算誤差。假設(shè)原始數(shù)據(jù)點(diǎn)為為,計(jì)算得到的數(shù)據(jù)點(diǎn),再給定附近的一個區(qū)間: 則實(shí)際值yi可能落在這個區(qū)間內(nèi),也可能落在這個區(qū)間外。如果所有的這些區(qū)間(以為中心,長度為)包含實(shí)際值的個數(shù)占總數(shù)的比例達(dá)到95%或者以上,則稱這些區(qū)間的置信水平不少于95% 根據(jù)以上的分析,可以知道置信區(qū)間的概念,如果確定了置信水平為95%,從而可以找到相應(yīng)的最小的Δt值,使得 95%以上的實(shí)際值落在區(qū)間 內(nèi),則稱為預(yù)測值滿足置信水平95%的置信區(qū)間。一般情況下,如果不做特別說明,置信區(qū)間的相應(yīng)置信水平默認(rèn)為95%,置信區(qū)間反映了回歸方程的適用范圍和精確度,特別的,當(dāng)所有離散數(shù)據(jù)分布在回歸曲線的附件,大致呈現(xiàn)為正態(tài)分布時,置信區(qū)間為:中S 為該回歸模型的標(biāo)準(zhǔn)差,計(jì)算公式為: 其或者為: 那么,如果回歸方程為 y=a+bx,則有兩條控制直線分別為,他們代表了置信區(qū)間的上限和下限,如下圖所示: 和 那么,可以預(yù)料實(shí)際的數(shù)據(jù)點(diǎn)幾乎全部(至少95%)落在上圖兩條虛線所夾的區(qū)域內(nèi)。這里對回歸方程的應(yīng)用做一個總結(jié): 1.估計(jì)、預(yù)測指標(biāo)值。對于因子x的一個給定值 x0,代入回歸預(yù)測方程即可求出相應(yīng)的指標(biāo)值,稱為指標(biāo)y0的點(diǎn)估計(jì),相應(yīng)預(yù)測誤差為 但是,真實(shí)指標(biāo)y0 的值一般無法確知,預(yù)測精度只能根據(jù)回歸誤差來做估計(jì)。在回歸預(yù)測中,預(yù)測的精度可以用均方差和標(biāo)準(zhǔn)差的比值來估計(jì); 2.估計(jì)指標(biāo)值范圍。估計(jì)指標(biāo)值的范圍,就是求給定x0,相應(yīng)于某個給定的置信水平的置信區(qū)間。具體的求法,要應(yīng)用到t分布; 3.控制因子取值。在某些實(shí)際問題中,特別當(dāng)因子值可以人為的控制、調(diào)解時,也可以根據(jù)所要達(dá)到的指標(biāo)值,反過來推出因子的取值,這就是因子值的控制。 1、穩(wěn)健回歸 其主要思路是將對異常值十分敏感的經(jīng)典最小二乘回歸中的目標(biāo)函數(shù)進(jìn)行修改。經(jīng)典最小二乘回歸以使誤差平方和達(dá)到最小為其目標(biāo)函數(shù)。因?yàn)榉讲顬橐徊环€(wěn)健統(tǒng)計(jì)量,故最小二乘回歸是一種不穩(wěn)健的方法。為減少異常點(diǎn)的作用,對不同的點(diǎn)施加不同的權(quán)重,殘差小的點(diǎn)權(quán)重大,殘差大的店權(quán)重小。 2、變系數(shù)回歸 地理位置加權(quán) 3、偏最小二乘回歸 長期以來,模型式的方法和認(rèn)識性的方法之間的界限分得十分清楚。而偏最小二乘法則把它們有機(jī)的結(jié)合起來了,在一個算法下,可以同時實(shí)現(xiàn)回歸建模(多元線性回歸)、數(shù)據(jù)結(jié)構(gòu)簡化(主成分分析)以及兩組變量之間的相關(guān)性分析(典型相關(guān)分析)。偏最小二乘法在統(tǒng)計(jì)應(yīng)用中的重要性體現(xiàn)在以下幾個方面:偏最小二乘法是一種多因變量對多自變量的回歸建模方法。偏最小二乘法可以較好的解決許多以往用普通多元回歸無法解決的問題。偏最小二乘法之所以被稱為第二代回歸方法,還由于它可以實(shí)現(xiàn)多種數(shù)據(jù)分析方法的綜合應(yīng)用。能夠消除自變量選取時可能存在的多重共線性問題。普通最小二乘回歸方法在自變量間存在嚴(yán)重的多重共線性時會失效。自變量的樣本數(shù)與自變量個數(shù)相比過少時仍可進(jìn)行預(yù)測。 4、支持向量回歸 能較好地解決小樣本、非線性、高維數(shù)和局部極小點(diǎn)等實(shí)際問題。 傳統(tǒng)的化學(xué)計(jì)量學(xué)算法處理回歸建模問題在擬合訓(xùn)練樣本時,要求“殘差平方和”最小,這樣將有限樣本數(shù)據(jù)中的誤差也擬合進(jìn)了數(shù)學(xué)模型,易產(chǎn)生“過擬合”問題,針對傳統(tǒng)方法這一不足之處,SVR采用“ε不敏感函數(shù)”來解決“過擬合”問題,即f(x)用擬合目標(biāo)值yk時,取:f(x)=∑SVs(αi-α*i)K(xi,x) 上式中αi和α*i為支持向量對應(yīng)的拉格朗日待定系數(shù),K(xi,x)是采用的核函數(shù)[18],x為未知樣本的特征矢量,xi為支持向量(擬合函數(shù)周圍的ε“管壁”上的特征矢量),SVs 為支持向量的數(shù)目.目標(biāo)值yk擬合在yk-∑SVs(αi-α*i)K(xi,xk)≤ε時,即認(rèn)為進(jìn)一步擬合是無意義的。 5、核回歸 核函數(shù)回歸的最初始想法是用非參數(shù)方法來估計(jì)離散觀測情況下的概率密度函數(shù)(pdf)。為了避免高維空間中的內(nèi)積運(yùn)算 由Mercer條件,存在映射函數(shù)a和核函數(shù)K(?,?),使得:=K(xi ,x) 采用不同的函數(shù)作為SVM的核函數(shù)K(x i,x),可以實(shí)現(xiàn)多種從輸入空間到特征空間的非線性映射形式 6、嶺回歸 嶺回歸分析是一種專用于共線性數(shù)據(jù)分析的有偏估計(jì)回歸方法,實(shí)質(zhì)上是一種改良的最小二乘估計(jì)法,通過放棄最小二乘法的無偏性,以損失部分信息、降低精度為代價(jià)獲得回歸系數(shù)更為符合實(shí)際、更可靠的回歸方法,對病態(tài)數(shù)據(jù)的耐受性遠(yuǎn)遠(yuǎn)強(qiáng)于最小二乘法。 7、半?yún)?shù)回歸 模型既含有參數(shù)分量又含有非參數(shù)分量,其參數(shù)部分用來解釋函數(shù)關(guān)系已知的部分,它是觀測值中的主要成分,而其非參數(shù)部分則描述函數(shù)關(guān)系未知,無法表達(dá)為待定參數(shù)的函數(shù)部分。 8、自回歸 例1.Yt = α+β0Xt +β1Xt-1 +……+βsXt-s + ut,例2.Yt = f(Yt-1, Yt-2, … , X2t, X3t, …),滯后的因變量(內(nèi)生變量)作為解釋變量出現(xiàn)在方程的右端。這種包含了內(nèi)生變量滯后項(xiàng)的模型稱為自回歸模型。 9、正交回歸 因素水平值在區(qū)間[Zj1, Zj2]內(nèi)變化,經(jīng)編碼之后,編碼值xi在區(qū)間[-1,+1]間變化,將響應(yīng)值y原來對Z1, Z2……Zm的回歸問題,轉(zhuǎn)化為y對x1,x2……xm的回歸問題。它的主要優(yōu)點(diǎn)是可以把實(shí)驗(yàn)或計(jì)算的安排、數(shù)據(jù)的處理和回歸方程的精度統(tǒng)一起來加以考慮,根據(jù)實(shí)驗(yàn)?zāi)康暮蛿?shù)據(jù)分析來選擇實(shí)驗(yàn)或計(jì)算點(diǎn),不僅使得在每個實(shí)驗(yàn)或計(jì)算點(diǎn)上獲得的數(shù)據(jù)含有最大的信息,從而減少實(shí)驗(yàn)或計(jì)算次數(shù),而且使數(shù)據(jù)的統(tǒng)計(jì)分析具有一些較好的性質(zhì),以較少的實(shí)驗(yàn)或計(jì)算建立精度較高的回歸方程。 10、逐步回歸 實(shí)際問題中影響因變量的因素可能很多,我們希望從中挑選出影響顯著的自變量來建立回歸模型,這就涉及到變量選擇的問題,逐步回歸是一種從眾多變量中有效地選擇重要變量的方法。基本思路為,先確定一初始子集,然后每次從子集外影響顯著的變量中引入一個對y 影響最大的,再對原來子集中的變量進(jìn)行檢驗(yàn),從變得不顯著的變量中剔除一個影響最小的,直到不能引入和剔除為止。 11、主成分回歸 在統(tǒng)計(jì)學(xué)中,主成分分析是一種簡化數(shù)據(jù)集的技術(shù)。它是一個線性變換。這個變換把數(shù)據(jù)變換到一個新的坐標(biāo)系統(tǒng)中,使得任何數(shù)據(jù)投影的第一大方差在第一個坐標(biāo)(稱為第一主成分)上,第二大方差在第二個坐標(biāo)(第二主成分)上,依次類推。 首先對X陣進(jìn)行主成份分析,T陣的維數(shù)可以與X陣相同,如果使用整個T陣參加回歸,這樣得到的結(jié)果與多元線性回歸沒有多大的差別。因?yàn)橹鞒煞郑ㄐ伦兞浚┦窃兞康木€性組合。前面的k個主成份包含了X矩陣的絕大部分有用信息,而后面的主成份則往往與噪聲和干擾因素有關(guān)。因此參與回歸的是少數(shù)主成分組成的矩陣。在維數(shù)上遠(yuǎn)小于X。主成分回歸通過對參與回歸的主成份的合理選擇,可以去掉噪音。主成份間相互正交,解決了多元線性回歸中的共線性問題。主成分回歸能夠充分利用數(shù)據(jù)信息,有效地提高模型的抗干擾能力。 一、分析 第一步:解:設(shè)居住面積為 X1,房屋稅為X2,是否配有游泳池為X3.模型為: 第二步:估計(jì)參數(shù)建立模型 bVariables Entered/Removed???0??1X1??2X2??3X3y(Analyze Regression Linear)Model1VariablesEntered游泳池, 房屋稅, a居住面積VariablesRemoved.MethodEntera.All requested variables entered.b.Dependent Variable: 銷售價(jià)格 Model SummaryModel1RR Square.885a.783AdjustedR Square.691Std.Error ofthe Estimate25.15902 a.Predictors:(Constant), 游泳池, 房屋稅, 居住面積bANOVAModel1Sum ofSquaresRegression16028.801Residual4430.836Total20459.636df3710Mean Square5342.934632.977F8.441Sig..010aa.Predictors:(Constant), 游泳池, 房屋稅, 居住面積b.Dependent Variable: 銷售價(jià)格 aCoefficientsModel1(Constant)居住面積房屋稅游泳池UnstandardizedCoefficientsBStd.Error12.69831.5073.5291.29833.85111.6179.77017.697StandardizedCoefficientsBeta.532.555.101t.4032.7192.914.552Sig..699.030.023.598a.Dependent Variable: 銷售價(jià)格 通過SPSS線性回歸分析: ? 取顯著性水平α=0.05,sig必須小于0.05才能t值檢驗(yàn)合格,?(1)、擬合優(yōu)度檢驗(yàn):由可決系數(shù)R2=0.885,大于0.7,說明模型對數(shù)據(jù)的擬合程度一般。 ?(2)、F檢驗(yàn): 由F=8.441,檢驗(yàn)P=0.010<0.05,即可認(rèn)為回歸系數(shù)具有顯著意義。這說明原先的線性模型假設(shè)是對的。?(3)、t檢驗(yàn):對于t檢驗(yàn),先檢驗(yàn)X1,因?yàn)閄1的t統(tǒng)計(jì)量為2.719,檢驗(yàn)P=0.030<0.05,自變量X1的t檢驗(yàn)通過;再檢驗(yàn)X2,因?yàn)閄2的t統(tǒng)計(jì)量為2.914,檢驗(yàn)P=0.0230<0.05,自變量X2的t檢驗(yàn)通過;最后檢驗(yàn)X3,因?yàn)閄3的t統(tǒng)計(jì)量為0.552,檢驗(yàn)P=0.598>0.05,自變量X3的t檢驗(yàn)沒有通過,y與x3之間不存在線性關(guān)系,剔除后重新估計(jì)方程。再次進(jìn)行統(tǒng)計(jì)檢驗(yàn): bVariables Entered/RemovedModel1VariablesEntered房屋稅, a居住面積VariablesRemoved.MethodEntera.All requested variables entered.b.Dependent Variable: 銷售價(jià)格 bANOVA Sum ofModelSquares1Regression15835.868Residual4623.769Total20459.636b.Dependent Variable: 銷售價(jià)格dfMean Square27917.9348577.97110F13.700Sig..003aa.Predictors:(Constant), 房屋稅, 居住面積 aCoefficientsModel1(Constant)居住面積房屋稅UnstandardizedCoefficientsBStd.Error19.35427.8153.3611.20633.56911.090StandardizedCoefficientsBeta.507.551t.6962.7873.027Sig..506.024.016 a.Dependent Variable: 銷售價(jià)格 aResiduals StatisticsPredicted ValueStd.Predicted ValueStandard Error of7.64921.863Predicted ValueAdjusted Predicted Value115.4975225.9239Residual-28.2165736.51500Std.Residual-1.1741.519Stud.Residual-1.2562.418Deleted Residual-32.31361110.05458Stud.Deleted Residual-1.3114.359Mahal.Distance.1037.361Cook's Distance.0025.037Centered Leverage Value.010.736a.Dependent Variable: 銷售價(jià)格Minimum120.1281-.997Maximum234.29681.872MeanStd.Deviation159.818239.79431.0001.00011.636152.2998.00000.000.1087.51842.3021.818.497.1824.94532.4261821.50295.8941.14840.689931.6282.5431.507.254N***111111111 ? 再次進(jìn)行R擬合度檢驗(yàn)、F檢驗(yàn)、t檢驗(yàn) ? 1)擬合度檢驗(yàn):從上圖表一可以看出:相關(guān)系數(shù)為R=0.880,可決系數(shù)R2=0.774>0.7,說明模型對數(shù)據(jù)的擬合程度可行。 ? 2)F檢驗(yàn):從ANOVA方差分析表可以看出,F(xiàn)=13.7,P=0.03<0.05,可以認(rèn)為變量y與X1,X2之間的線性關(guān)系顯著。? 3)t檢驗(yàn):從Coefficients系數(shù)分析表可以看出,X1的t統(tǒng)計(jì)量為2.787,P=0.024<0.05,通過t檢驗(yàn);X2的統(tǒng)計(jì)量為3.027,P=0.016<0.05,通過t檢驗(yàn),所以可以認(rèn)為因變量y與X1,X2之間存在線性回歸關(guān)系。通過統(tǒng)計(jì)檢驗(yàn)可以得出一元線性回歸方程: y?19.354?3.361x1?33.569x2綜上所述,當(dāng)X1=18百平方尺,X2=1.5百元時,售價(jià)的點(diǎn)估計(jì)值為(pre_1)為130.20714千元,也就是說該夫婦所擁有的房子的售價(jià)的預(yù)測區(qū)間為7.02163萬~19.019798萬美金之間,而這對夫婦所提出的抵押額是預(yù)測區(qū)間的上限,為了安全慎重起見,銀行會拒絕這對夫婦的申請。 傳統(tǒng)文化回歸課堂分析 近60年來,一次次的教學(xué)改革,更變了教育模式、教育技術(shù)、教育制度、科學(xué)知識和教育觀念,但是仍然缺少一種深厚的底蘊(yùn)和大智慧的觀照??v觀當(dāng)下的語文教學(xué),仍籠罩著應(yīng)試教育的陰影。建立在工具化、符號化和理性化知識觀基礎(chǔ)上的語文被成一塊塊,演化成做不完的習(xí)題,就像荒蕪的沙漠,無情無趣、缺乏美感?,F(xiàn)有的語文 教材雖是完整而系統(tǒng)的,卻同時也暴露出其封閉性?!拔幕钡氖洌瑤韮和硇陌l(fā)展的片面與異化,教出來的孩子可能有知識但沒靈魂,有技藝但沒情懷。如此看來,語文的工具性和人文性并沒有得到很好的統(tǒng)一。語文課程改革還沒有從根本上解決文化的缺失問題。 在我看來,教學(xué)方式和教學(xué)手段的改變都不能給教學(xué)帶來奇跡,只有當(dāng)教學(xué)方式和教學(xué)內(nèi)容同時改進(jìn)時,語文教育才有希望。語文教育拿什么來培育兒童呢?我以為,文化的品質(zhì)和素養(yǎng)是一個可以讓人終身受益的東西,能讓語文教育回到其本真狀態(tài)和原先意義上去。為了突出語文教學(xué)中文化的特性、靈魂和精神,真正把“語文”教學(xué)當(dāng)做“文化”的載體來實(shí)踐,我和我的海門市東洲小學(xué)的老師們提出了“文化語文”的主張?!拔幕Z文”中的“文化”,是一種精神、一種積淀、一種濡染,一種智慧,引導(dǎo)兒童探尋意義、沐浴傳統(tǒng)、豐富涵養(yǎng)、提升悟性。這幾年來,我和我的團(tuán)隊(duì)伴隨“文化語文”一路走來,得到了許多大學(xué)和教科研院所專家學(xué)者的指導(dǎo),吸收了“李吉林情境教育”等諸多理論流派的寶貴經(jīng)驗(yàn),幫助我們糾正了許多偏差。我們一步步從課堂中走出來,進(jìn)入一個更為廣闊的教育文化領(lǐng)域,這也正驗(yàn)證了一線教師在職業(yè)生涯中的生活經(jīng)歷就是一個實(shí)驗(yàn)的命題。 我認(rèn)為,建設(shè)“文化語文”課程,是一種讓語文教育“回家”的深入思考和把握。兩千多年前,孔子帶著學(xué)生“游春”,意味非常濃。孔子的教育既有書齋里的瑯瑯書聲,也有“浴乎沂,風(fēng)乎舞雩,詠而歸”的愜意快樂,這就是中國式的教育。 首先回歸語文和兒童的關(guān)系上?!罢軐W(xué)原就是懷著一種鄉(xiāng)愁的沖動到處去尋找家園”的,“尋找家園”的沖動就是“精神還鄉(xiāng)”。語文教育要使語言成為兒童的精神家園,這個家園中有自己民族的文化信念乃至文化信仰。我以為,語文的工具性和人文性是有機(jī)統(tǒng)一的。從中**語的特點(diǎn)來講,母語的工具性就是它的人文性。沒有工具性的支撐,人文性就成了無影之水,沒有人文性的支撐,工具性的目標(biāo)也根本實(shí)現(xiàn)不了。兒童通過扎實(shí)的母語學(xué)習(xí),才有可能感悟詩歌的悲情美,小說的歡樂美,戲曲的團(tuán)圓與浪漫。唯有吮吸到母語甜美的“乳汁”,才會長成有中華民族文化修養(yǎng)的人。 其次回歸中華民族的優(yōu)秀文化傳統(tǒng)。阿諾德說,“文化是對完美的追求”,“文化語文”就是要在中國的土壤里尋找中國教育的鑰匙,讓兒童守護(hù)母語的家園,培養(yǎng)有民族根基的全面發(fā)展的人。正如作家馮驥才所說:“文化是民族的一根神經(jīng)。如果沒有了民族文化,那這個民族就成了植物人?!蓖瑯樱褡逦幕彩钦Z文的一根神經(jīng),抽去這根神經(jīng),語文就是一個植物人似的語文。 再次回歸課程?!盎貧w課程”就是用最有價(jià)值的知識,用道德的方式,來傳承和發(fā)展文化。以民族文化為核心,多元文化和兒童文化為語境,基于兒童的生態(tài)教學(xué),回歸民族的古典情結(jié),追求語文的情調(diào)性靈,強(qiáng)調(diào)兒童的精神關(guān)懷和智慧生長,使課程實(shí)施走進(jìn)生活的灌木林?!盎丶摇钡倪^程其實(shí)會有許多新的感覺和想象,也會開始一種新的創(chuàng)造。 基于這樣的認(rèn)識,“文化語文”在實(shí)踐中重點(diǎn)解決以下問題1)開發(fā)課程資源。進(jìn)行大主題閱讀研究和“微型主題文化課程”。大主題閱讀是依托現(xiàn)有語文教材,根據(jù)大主題進(jìn)行閱讀拓展,同時綜合藝術(shù)、科學(xué)、歷史乃至兒童哲學(xué)等內(nèi)容,開展文化語文活動,并要求兒童寫出自己的感悟。微型主題文化課,是在現(xiàn)有的語文教材之外,選擇中國文學(xué)中具有母體色彩的意象,比如《推開窗兒》《蝴蝶翩翩》《牧童短笛》等,精心遴選充滿詩情畫意的詩文、民歌、對聯(lián)、成語、農(nóng)諺、童謠等重組教材。文化語文吸納一切優(yōu)秀的現(xiàn)代文明。(2)構(gòu)建教學(xué)模式。以文化為中心,力求五個帶入:藝術(shù)帶入、生活帶入、活動帶入,情感帶入、智慧帶入。嘗試 語言與文學(xué)分家實(shí)驗(yàn),部分語文教材作為語言文字訓(xùn)練材料,增設(shè)文學(xué)名著導(dǎo)讀課、精讀欣賞課、大聲朗讀課、作品推薦課等。把文學(xué)作品作為豐富的精神養(yǎng)料,讓每一段文字都成為有血有肉的一段段情感。(3)培養(yǎng)文化語文教師是實(shí)現(xiàn)文化語文最重要的支撐。我們通過文化閱讀、文化沙龍、文化講壇、文化欣賞、文化創(chuàng)造,培養(yǎng)老師對于美的敏銳感受,對于善的由衷同情,對于他人的理解和尊重,對于自然的熱愛與敬畏,對于自己精神與性靈的涵養(yǎng)與守護(hù)。 房地產(chǎn)市場可以分為居住物業(yè)市場和非居住物業(yè)市場。非居住物業(yè)市場是廣義上的商業(yè)房地產(chǎn)市場;商業(yè)房地產(chǎn)市場狹義上指購物中心。由于廣義的商業(yè)房地產(chǎn)市場包含了:寫字樓市場、工業(yè)物業(yè)市場、購物中心等,這幾個子市場差異較大,分析方法也不同,所以本文主要討論狹義的商業(yè)房地產(chǎn)市場——購物中心的市場機(jī)會研究方法。 在發(fā)達(dá)國家購物中心可分為以下幾個大類: 區(qū)域購物中心(regional mall):封閉式的建筑,擁有綜合性的百貨超市。以總租售面積(GLA)可以將區(qū)域中心劃分為一般區(qū)域中心和超區(qū)域中心(4.7——18萬㎡),車位指數(shù)(PI)一般為5.5個/100㎡。業(yè)態(tài)上濃縮了中央商務(wù)區(qū)的功能,為顧客提供各種檔次的商品;主導(dǎo)商主要為大型百貨超市,此外還有各種附屬商為顧客提供各種個性化服務(wù)。一般區(qū)域中心要求服務(wù)區(qū)內(nèi)人口規(guī)模在15萬以上,超區(qū)域中心在35萬以上。 社區(qū)購物中心(community shopping center):采用開放式的建筑設(shè)計(jì),GLA一般在1——4萬㎡,車位指數(shù)一般為:5個/100㎡,業(yè)態(tài)上沒有大型綜合性百貨超市,有初級百貨超市,日用品超市,平價(jià)超市,專賣店等,市場服務(wù)區(qū)人口規(guī)模4——15萬。 鄰里購物中心(neighborhood shopping center):GLA一般在0.3——5萬㎡之間,車位指數(shù)為:5個/100㎡,業(yè)態(tài):包括食品、藥品、日用雜貨等日常生活相關(guān)的商品,銀行、干洗店等;服務(wù)區(qū)要求的人口規(guī)模一般在2000——4萬之間。 此外還有:特色專賣中心(specialty center),直銷中心(outlet center),平價(jià)中心(off-price center),休閑購物中心(urban entertainment center),時尚中心(fashion center),假日中心(festival center),混合式商務(wù)中心(retail uses in mixed-use development)等 在商業(yè)房地產(chǎn)市場分析過程中,購物中心類型的選擇會對整個分析過程產(chǎn)生較大影響。 一、經(jīng)典市場研究方法 商業(yè)房地產(chǎn)市場分析的主要內(nèi)容有:需求分析、供給分析。在進(jìn)行這兩項(xiàng)分析之前必須進(jìn)行購物中心市場服務(wù)區(qū)(商圈)分析,界定購物中心未來可能覆蓋的地理范圍。市場服務(wù)區(qū)(trade area)指一個商業(yè)房地產(chǎn)所提供的商業(yè)服務(wù)(商品服務(wù))的范圍,如一個商場商品的主要銷售范圍。市場服務(wù)區(qū)的界定方法主要有:同心圓法、行車時間法、路線調(diào)查法。購物中心的市場服務(wù)區(qū)由該中心的類型、規(guī)模、業(yè)態(tài)、周圍競對手狀況、人口密度、交通狀況等因素所決定,它的邊界不一定規(guī)則,理想狀況是同心圓,實(shí)際上則不一定,許多自然地物、道路等都可能成為其邊界。界定范圍之后需要收集不同服務(wù)圈層里的人口規(guī)模、居民戶數(shù)、平均家庭收入、人均收入等數(shù)據(jù),這些數(shù)據(jù)是進(jìn)行市場分析的基礎(chǔ)。 1、市場需求分析主要方法 市場需求分析需要在市場服務(wù)區(qū)的界定完成的基礎(chǔ)上進(jìn)行,其主要方法有: 比率——人口相乘法:在一個城市區(qū)域內(nèi)商品零售面積的人均需求量的經(jīng)驗(yàn)值乘以服務(wù)區(qū)的總?cè)丝?,從而得出市場需求總量。市場需求潛?+ 調(diào)查區(qū)現(xiàn)有零售面積 = 總需求量。 如果需求潛力大于零,即存在開發(fā)空間,開發(fā)可行。 單位零售房地產(chǎn)面積商品零售額比率比較法:首先統(tǒng)計(jì)商品服務(wù)區(qū)內(nèi)的商品零售總額和零售房產(chǎn)總面積;然后對商品進(jìn)行分類,統(tǒng)計(jì)不同類型商品(家電、汽車等)零售額、零售面積;最后將商品分類統(tǒng)計(jì)數(shù)據(jù)與商品零售總額和零售房產(chǎn)總面積進(jìn)行比較,可以發(fā)現(xiàn)某類商品單位零售面積零售額是否存在不足現(xiàn)象,從而判斷市場是否處于飽和狀態(tài)。 馬利茲亞城市商業(yè)房產(chǎn)需求預(yù)測法:該方法以“長期預(yù)測和短期預(yù)測都受就業(yè)增長直接影響,就業(yè)增長快預(yù)示商業(yè)房產(chǎn)有開發(fā)潛力”這一理論假設(shè)為前提。馬利茲亞模型將眾多市場的影響因素分為:經(jīng)濟(jì)增長因素(在短期預(yù)測中可促進(jìn)經(jīng)濟(jì)增長的因素如:區(qū)位優(yōu)勢、就業(yè)人口比率等)和經(jīng)濟(jì)發(fā)展因素(能帶動城市區(qū)域長遠(yuǎn)發(fā)展的因素如:教育水平、產(chǎn)業(yè)多樣性等),通過對以上因素的綜合分析可以較為宏觀的判斷一個城市商業(yè)房產(chǎn)的開發(fā)前景。 房地產(chǎn)開發(fā)度指數(shù)(power ratio)法:一個大城市區(qū)域可以看成一個統(tǒng)一的市場可以進(jìn)一步劃分成若干個二級市場,二級市場間存在著投資競爭,通過對競爭的分析可以找出各個二級市場的商業(yè)房地產(chǎn)市場投資飽和狀況,該狀況決定了某個二級市場取是否有商業(yè)房產(chǎn)開發(fā)潛力。房地產(chǎn)開發(fā)度指數(shù)法通過對城市市場區(qū)零售房產(chǎn)總面積、單元區(qū)零售房產(chǎn)總面積、城市平均家庭收入、單元區(qū)平均家庭收入等數(shù)據(jù)的分析可以具體得出某一單元區(qū)的商業(yè)房產(chǎn)需求量。 2、經(jīng)典研究方法的分析步驟 1)確定購物中心類型 2)研究購物中心商品服務(wù)范圍(街道、城市、地區(qū)) 3)調(diào)查在服務(wù)區(qū)范圍內(nèi)現(xiàn)有該種類型購物中心的商業(yè)樓面,包括已經(jīng)出租的樓面、控制樓面的總量;調(diào)查服務(wù)區(qū)范圍內(nèi)的人口統(tǒng)計(jì),居民收入和消費(fèi)狀況及單位樓面的租(售)價(jià)格 4)研究人口統(tǒng)計(jì)數(shù)據(jù)和經(jīng)濟(jì)狀況,分析商品服務(wù)區(qū)內(nèi)可以支撐的總的商業(yè)樓面面積 5)比較服務(wù)區(qū)現(xiàn)有的商業(yè)樓面與該商品服務(wù)區(qū)可支撐的總的商業(yè)樓面之間的差異,從而發(fā)現(xiàn)商業(yè)房產(chǎn)的開發(fā)潛力 6)根據(jù)商品服務(wù)區(qū)外具體情況的研究對上述開發(fā)潛力作進(jìn)一步修正 發(fā)達(dá)國家成熟的房地產(chǎn)市場信息較為全面,城市區(qū)域經(jīng)濟(jì)數(shù)據(jù)獲得相對較容易,因此商業(yè)房地產(chǎn)市場分析的經(jīng)典方法可以得到較好的運(yùn)用。但是在界定購物中心的類型等環(huán)節(jié)時,市場研究人員的商業(yè)經(jīng)驗(yàn)仍然有重要作用,在市場分析過程中市場分析人員的主觀判斷仍是不可缺少的。特別是在休閑娛樂中心的定位上市場分析過程更多的表現(xiàn)為一種藝術(shù),而不是一種技術(shù)。此外在國內(nèi)現(xiàn)階段房地產(chǎn)市場不健全,宏觀經(jīng)濟(jì)數(shù)據(jù)不準(zhǔn)確、針對性不強(qiáng),微觀區(qū)域經(jīng)濟(jì)數(shù)據(jù)缺乏的情況下,我們必須結(jié)合現(xiàn)實(shí)條件創(chuàng)造性的應(yīng)用商業(yè)房地產(chǎn)經(jīng)典市場分析方法。第二篇:各種回歸方法總結(jié)
第三篇:統(tǒng)計(jì)回歸分析報(bào)告
第四篇:傳統(tǒng)文化回歸課堂分析
第五篇:商業(yè)地產(chǎn)分析方法總結(jié)