第一篇:實(shí)習(xí)九 數(shù)值變量資料的統(tǒng)計分析
(二)應(yīng)用題
1.某市100名7歲男童的坐高
(2)計算均數(shù)=66.65(cm)
(3)計算標(biāo)準(zhǔn)差=2.06(cm)
2.用玫瑰花結(jié)形成試驗(yàn)檢查13名流行性出血熱患者的抗體滴度,結(jié)果如下,求平均滴度。G=lg-1(lg20+lg20+...+lg40)13
=lg-11.95=89.00
第二篇:兩個多重相關(guān)變量組的統(tǒng)計分析
兩個多重相關(guān)變量組的統(tǒng)計分析
摘 要
本文介紹兩組相關(guān)變量問的典型相關(guān)與典型冗余分析的統(tǒng)計分析方法,以及在SAS軟件包中如何實(shí)現(xiàn),文中給出了一個典型的例子。關(guān)鍵詞:統(tǒng)計分析;典型相關(guān);典型冗余分析
在實(shí)際問題中,經(jīng)常遇到需要研究兩組變量間的相關(guān)關(guān)系,而且每組變量中間常常存在多重相關(guān)性。比如工廠生產(chǎn)的產(chǎn)品質(zhì)量指標(biāo)與原材料、工藝指標(biāo)間的相關(guān)關(guān)系;體育科研中運(yùn)動員的體力測試指標(biāo)與運(yùn)動能力指標(biāo)間的相關(guān)關(guān)系;經(jīng)濟(jì)領(lǐng)域中投資性變量與國民收入變量間的相關(guān)關(guān)系;教育學(xué)中學(xué)生高考各科成績與高二年級各主科成績間的相關(guān)關(guān)系;醫(yī)學(xué)研究中患某種疾病病人的各種癥狀程度與用科學(xué)方法檢查的一些指標(biāo)間的相關(guān)關(guān)系等等。
研究兩個變量組之間相關(guān)關(guān)系的常用方法是多元統(tǒng)計中的典型相關(guān)分析(參考[2]和 [3])。如果進(jìn)一步研究這兩組多重相關(guān)變量間的相互依賴關(guān)系,即考慮多對多的回歸建模問題,除了最小二乘準(zhǔn)則下的多對多回歸分析、雙重篩選逐步回歸分析,以及提取自變量成分的主成分回歸等方法外,還有近年發(fā)展起來的偏最小二乘(PLS)回歸方法。關(guān)于多對多回歸建模問題,我們將另文介紹。本文介紹典型相關(guān)與典型冗余分析,它是偏最小二乘回歸的理論基礎(chǔ)。
一 典型相關(guān)分析的基本思想與解法
第一組變量記為X=(X1?Xp)?,第二組變量記為Y=(Y1?Yq)?(不妨設(shè)p≤q)。典型相關(guān)分析借助于主成分分析提取成分的思想,從第一組變量X提取典型成分V(V是X1,?,Xp的線性組合);再從第二組變量Y提取典型成分W(W是Y1,?,Yq的線性組合),并要求V和W 的相關(guān)程度達(dá)到最大。這時V和W 的相關(guān)程度可以大致反映兩組變量X和Y的相關(guān)關(guān)系。
?X???11 ?12????記p+q維隨機(jī)向量Z=??的協(xié)差陣∑=?其中∑11一是X的協(xié)差陣,??,?21 ?22Y????∑22:是Y的協(xié)差陣,∑l2=∑21是X,Y的協(xié)差陣。我們用X和Y的線性組合 V=a?X和W=b?Y之問的相關(guān)來研究X和Y之間的相關(guān)。我們希望找到a和b,使ρ(V,W)最大。由相關(guān)系數(shù)的定義,ρ(V,W)=
Cov(V,W)Var(v)Var(w)
分析上式將發(fā)現(xiàn):在使得V,W的相關(guān)達(dá)最大的同時,V和W的方差將達(dá)最小,這說明按此準(zhǔn)則得到的典型成分V和W,對原變量組X和Y的代表性最差,它們無法更多地反映原變量組的變異信息。另方面因V,W任意線性組合的相關(guān)系數(shù)與 V,W 的相關(guān)系數(shù)相等,即使得相關(guān)系數(shù)最大的V=a?X和W=b?X并不唯一。故在典型相關(guān)分析解法中附加了約束條件:
Var(U)= a?∑11a = 1 Var(V)= b?∑22b = 1。
問題化為在約束條件Var(U)=1,Var(V)=1下,求a和b,使得ρ(U,V)= a?∑l2b達(dá)最大。
?X?定義l 設(shè)X=(X1?Xp)?,Y=(Y1?Yq)?,p+q維隨機(jī)向量??Y??的均值向量為
??O,協(xié)差陣∑>O(不妨設(shè)p≤q)。如果存在a1 =(al1,?,alp)和b1 =(b1l,?,b1q)使得
ρ1=ρ(a?1X,b? lY)=
Var(,X)?1,Var(,Y)?1max????(??X,??Y)
則稱a?X ,b? Y是X,Y的第一對典型相關(guān)變量,它們之間的相關(guān)系數(shù)稱為第一個典型相關(guān)系數(shù)。
如果存在ak?(ak1,?akp)?和bk?(bk1,?akq)?使得
①a?kX , b? kY和前面 k-1對典型變量都不關(guān);
②Var(a?kX)= l,Var(b? kY)= 1;
③a?kX與b? kY的相關(guān)系數(shù) ?k最大,則稱a?kX , b? kY是X,Y的第k對典型相關(guān)變量,它們之間的相關(guān)系數(shù)?k稱為第k個典型相關(guān)系數(shù)(k?2,?,p)。
已知p+q維總體Z的n次中心化觀測數(shù)據(jù)陣為:
?x11x12?x1p?x21x22?x2p??Z????n(p?q)??xn1xn2?xnpy11?yn1y12??yn2y21y22y1q??y2q??????X???n?p??ynq???Y? n?q?若假定Z~Np?q(0,?),則協(xié)差陣∑的最大似然估計為
11?X?XS?Z?Z??nn??Y?XX?Y???S11S12????? ????YY??S21S22?下面我們將從樣本協(xié)差陣S出發(fā),來討論兩組變量問的相關(guān)關(guān)系。
令T?S11?1/2SS12?1/222為p×q陣,則p×q陣和q×q陣T?T?的非零特征根相同,且非零特征根均為正的。若rk(T)=rk(S12)=r≤p(因p≤q),非零特征根依次為 ?1≥?2≥?≥?T >O(且λi>O,i=1,?,r)。記r階對角陣D=diag(λi,?,λr)。利用p×q陣T的奇異值分解定理(參考[4])有 222T?(a,?,a)D(?,?,?)
1r12p?qr?r其中口ai(i=l,?,r)為TT?對應(yīng)于?i2的單位正交特征向量;?i(i=1,?,r)為TT?對應(yīng)于?i2的單位正交特征向量,且ai與?i滿足關(guān)系式:?i???ai??1/2??S11?i?,容易驗(yàn)證與滿足:biai(i?1,?r)??1/2?S22?i??bi???1?iT??i。令
1?1/2??ai???bi??S11?1/2?i(i?1,?r)
i1iS22?i則Vi?ai?X,Wi?bi?Y為X,Y的第i對樣本典型相關(guān)變量,?i為第i個樣本典型相關(guān)系數(shù)。
二 典型相關(guān)系數(shù)的顯著性檢驗(yàn)
總體z的兩組變量X=(X1?Xp)?和Y=(Y1?Yq)?如果不相關(guān),即Cov(X,Y)= ∑12=0,以上有關(guān)兩組變量典型相關(guān)的討論就毫無意義.故在討論兩組變量間的相關(guān)關(guān)系之前,應(yīng)首先對假設(shè)H0:∑l2=0作統(tǒng)計檢驗(yàn),它等價于檢驗(yàn)H0:ρl=0。
設(shè)總體Z~Np?q(0,?),用似然比方法可導(dǎo)出檢驗(yàn)H0:∑l2=0的似然比統(tǒng)計量Λ,利用矩陣行列式及其分塊行列式的關(guān)系,可得出
??SS11||S222?Ip?S11S12S22S21??(1??1)
i?1?1?1p其中p+q階方陣s是∑的最大似然估計量,Sy分別是∑ij(i,j=1,2)的最大似然估計?i2(i?1,?,p)是T?T?的特征值。
統(tǒng)計量Λ的精確分布已由Hotelting(1936年)等人給出,但表達(dá)式很復(fù)雜。由Λ統(tǒng)計量 出發(fā)可導(dǎo)出檢驗(yàn)H0的近似檢驗(yàn)方法,如 Willksλ統(tǒng)計量,Pillai的跡,Hotettintg-Lawley跡和Roy的極大根等(參閱[2])。
當(dāng)否定H0時,表明X,Y相關(guān),進(jìn)而可得出至少第一個典型相關(guān)系數(shù)ρ1≠0。相應(yīng)的第一 對典型相關(guān)變量V1,W1可能已經(jīng)提取了兩組變量相關(guān)關(guān)系的絕大部分信息。兩組變量余下的部分可認(rèn)為不相關(guān),這時ρ1≈(i=2,?,p)。故在否定H0后,有必要檢驗(yàn)H0:?i?(i?2,?,p)即第i個及以后的所有典型相關(guān)系數(shù)均為0。利用似然比方法可導(dǎo)出檢驗(yàn)H0的似然比統(tǒng)計量,并給出該統(tǒng)計量的近似分布。從i=2開始逐個檢驗(yàn),直到某個i0,使H0相容時為止。這時說明第i0個及以后的所有典型相關(guān)系數(shù)均為0。假定經(jīng)檢驗(yàn),前m個典型相關(guān)系數(shù)顯著地不等于0(m≤p)。
(t)(t)(t)三 典型結(jié)構(gòu)與典型冗余分析
1.典型結(jié)構(gòu)
求出典型變量后,進(jìn)一步可以來計算原始變量與典型變量之問的相關(guān)系數(shù)陣——典型結(jié) 構(gòu)。
記A=(al,a2,?,ar)為P×r矩陣,B=(bl,b2,?,br)為q×r矩陣,典型隨機(jī)向量V?(V1,?,Vr)?(a?1X,?a?rX)??A?X;W?(W1,?Wr)??(b?1y,?b?rY)??B?Y;隨機(jī)向量Z的??11 ?12??S11S12??S?協(xié)差陣為∑=?>0,隨機(jī)向量的協(xié)差陣為?S21S22?是∑的最大似然??21 ?22?????然估計。則
Cov(X,V)=Cov(X,A?X)=∑11A,Cov(X,W)=Cov(X,B?Y)=∑12B,Cov(Y,V)=Gov(Y,A?X)= ∑12A,Cov(Y,W)=Coy(X,B?Y)=∑22B。
用Sij代替以上公式中的∑ij(i,j=1,2),即可計算出原始變量與典型變量之間的協(xié)差陣。由協(xié)差陣還可以計算原始變量與典型變量之間的相關(guān)系數(shù)陣。若假定原始變量均為標(biāo)準(zhǔn)化變量,則以上計算得到的原始變量與典型變量的協(xié)方差陣就是相關(guān)系數(shù)陣。
若計算這四個相關(guān)系數(shù)陣中各列(或各行)相關(guān)系數(shù)的平方和,還將得出下面一些有關(guān)的概念。2.幾個概念 類似于主成分分析,把Vk看成是由第一組標(biāo)準(zhǔn)化變量X提取的成分,Wk看成是由第二組標(biāo)準(zhǔn)化變量Y提取的成分,由相關(guān)陣R(X,V)=S11A=[r(Xj,Vk)](p,r)和R(Y,W)=S11B=[r(Xj,Vk)](q,r)分別計算第k列的平方和。記
1p21p2Rd(X,Vk)??r(Xj,Vk),Rd(Y,Wk)??r(Yj,Vk)(k?1,?,r)
pj?1qj?1并稱Rd(X,Vk))(或Rd(Y,Wk))為第k個典型變量 Vk(或Wk)解釋本組變量X(或Y)總變差的百分比。記
1mp21mq2Rd(X;V1,?,Vm)???r(Xj,Vk),Rd(Y;W1,?,Wm)???r(Xj,Vk)
pk?1j?1qk?1j?1并稱Rd(X;V1,?,Vm)(或Rd(Y;W1,?,Wm))為前m(m≤r)個典型變量V1,?,Vm(W1,?,Wm)解釋本組變量X(或Y)總變差的累計百分比。
在典型相關(guān)分析中,從兩組變量分別提取的兩個典型成分首先要求相關(guān)程度最大,同時也希望每個典型成分解釋各組變差的百分比也盡可能的大。百分比的多少反映由每組變量提取的用于典型相關(guān)分析的變差的多少。
類似于主成分分析,還可以引入前m個典型變量對本組第j個變量Xi(或Yj,)的貢獻(xiàn)等概念(參考[1])。3.典型冗余分析
我們進(jìn)一步來討論典型變量解釋另一組變量總變差百分比的問題。在典型相關(guān)分析中,因所提取的每對典型成分保證其相關(guān)程度達(dá)最大,故每個典型成分不僅解釋了本組變量韻信息,還解釋了另一組變量的信息。典型相關(guān)系數(shù)越大,典型成分解釋對方變量組變差的信息也將越多。
類似可以定義Rd(X;Vk))(或Rd(Y;Wk))為Wk(或Vk)解釋另一組總變差的百分比。以下給出利用典型變量解釋本組變差的百分比來計算解釋另一組變差百分比的公式:
Rd(X;Vk)?1p?rj?1p2(Xj,Vk)??2,?,r)kRd(X;Vk)(k?12,Rd(Y;Vk)?1q?rj?1p(Xj,Vk)??2,?,r)kRd(Y;Wk)(k?1事實(shí)上,由典型變量的系數(shù)ak與bk之間的關(guān)系: ak?1?kS11S12bk??kak?S11S12bk??kS11ak?S11S11S12bk?S12bk以及典型?1?1?1變量與原始變量(假定已標(biāo)準(zhǔn)化)的相關(guān)陣即得:r(Xj,Wk)= λk(Xj;Vk),故有Rd(X;Wk)=?2kRd(X;Vk),類似可證明另一式。
Rd(X;Wk)表示第一組中典型變量解釋的變差被第二組中典型變量重復(fù)解釋的百分比,簡稱為第一組典型變量的冗余測度;Rd(X;Vk)表示第二組中典型變量解釋的變差被第一組中典型變量重復(fù)解釋的百分比,簡稱為第二組典型變量的冗余測度。
冗余測度的大小表示這對典型變量能夠?qū)α硪唤M變差相互解釋的程度大小。它將為進(jìn)一步討論多對多建模提供一些有用信息。
四 應(yīng)用例子一康復(fù)俱樂20名成員測試數(shù)據(jù)的典型相關(guān)分析
康復(fù)俱樂部對20名中年人測量了三個生理指標(biāo):WEIGHT(體重),WAIST(腰圍),PULSE(脈膊)和三個訓(xùn)練指標(biāo):CHINS(拉單杠次數(shù)),SITUPS(仰臥起坐次數(shù)),JUMPS(跳高)(數(shù)據(jù)見以下數(shù)據(jù)行)。試分析生理指標(biāo)和訓(xùn)練指標(biāo)這二組變量間的相關(guān)性。
解 使用SAS/STAT軟件中的CANCORR過程來完成典型相關(guān)分析。首先把測試數(shù)據(jù)生成SAS數(shù)據(jù)集,SAS程序如下:
data da20x6;input weight waist pulse chins situps jumps@@;label wight =’體重’ waist=’腰圍’ pulse=’脈搏’ chins=’單杠’
situps=’仰臥起坐’ jumps=’跳高’;
cards;191 36 50 5 162 60 189 37 52 2 110 60 193 38 58 12 101 101 162 35 62 12 105 37 189 35 46 13 155 58 182 36 56 4 101 42 211 38 56 8 101 38 167 34 60 6 125 40 176 31 74 15 200 40 154 33 56 17 251 250 169 34 50 17 120 38 166 33 52 13 210 115 154 34 64 14 215 105 247 46 50 1 50 50 193 36 46 6 70 31 202 37 62 12 210 120 156 33 54 15 225 73 138 33 68 2 110 43;run;proc cancorr data=da20x6 all vname=’生理指標(biāo)’wname=’訓(xùn)練指標(biāo)’;var weight waist pulse;with chins situps jumps;run;DATA步創(chuàng)建康復(fù)俱樂部測試數(shù)據(jù)的SAS數(shù)據(jù)集(名為DA20X6),它有20個觀測,6個變量。
CANCORR過程用于對輸入數(shù)據(jù)集DA20X6做典型相關(guān)分析。選項(xiàng)ALL要求輸出所有可選擇的計算結(jié)果;VNAIVIE=給出VAR語句中變量組的標(biāo)簽為生理指標(biāo) ;WNAIVIE=對WITH語句給出的第二組變量規(guī)定標(biāo)簽為訓(xùn)練指標(biāo)。VAR語句列出第一組變量的名字,WITH列出第二組變量的名字。部分計算結(jié)果見輸出1至輸出5。
輸出1 均值、標(biāo)準(zhǔn)差和兩組變量問的相關(guān)系數(shù)
— 輸出1列出6個變量的均值和標(biāo)準(zhǔn)差及生理指標(biāo)和訓(xùn)練指標(biāo)之間的相數(shù)。理指標(biāo)和訓(xùn)練指標(biāo)之間的相關(guān)性是中等的,其中WAIST和SITUPS 相關(guān)系數(shù)最大為-0.6456。
輸出2 典型相關(guān)分析系數(shù)及顯著性檢驗(yàn)
— 輸出2給出典型相關(guān)分析的一般結(jié)果。第一典型相關(guān)系數(shù)為07956,它比生理指標(biāo)和訓(xùn)練指標(biāo)兩組間的任一個相關(guān)系數(shù)都大 檢驗(yàn)總體中所有典型相關(guān)均為O的零假設(shè)時顯著性概率為0.0635(即Pr>F的值),故在α=0.10的顯著水平下,否定所有典型相關(guān)為0的假設(shè)。也就是至少有一個典型相關(guān)是顯著的。從后面的檢驗(yàn)結(jié)果可知,只有第一典型相關(guān)系數(shù)是顯著不等于0的。因此,兩組變量相關(guān)性的研究可轉(zhuǎn)化為研究第一對典型相關(guān)變量的相關(guān)性。
輸出3 標(biāo)準(zhǔn)化后典型變量的系數(shù)
— 輸出結(jié)果中還給出原始變量和標(biāo)準(zhǔn)化變量的典型相關(guān)變量的系數(shù)。因六個變量沒有用相同單位測量,我們來分析標(biāo)準(zhǔn)化后的系數(shù)(見輸出3)。來自生理指標(biāo)的第一典型變量V1為(右上角帶“*”的變量表示標(biāo)準(zhǔn)化變量): V1=-0.7754WEIGHT* + 1.5793WAIST*1054SITUPS* + O.7164JUMPS*
它在SITUPS*上的系數(shù)最大 這一對典型變量主要是反映腰圍(WAIST*)和仰臥起坐(SITUPS)的負(fù)相關(guān)關(guān)系。
輸出4 典型結(jié)構(gòu)—原始變量和典型變量的相關(guān)系數(shù)陣
—由輸出4可看出來自生理指標(biāo)的第一典型變量v1與腰圍(WAIST)的相關(guān)系數(shù)為0.92,V與體重(WEIGHT)的相關(guān)為0.6206,它們都是正的。但典型變量V1在體重上的系數(shù)為負(fù)的(-0.7754),即體重在V1的系數(shù)和它與V1的相關(guān)反號。來自訓(xùn)練指標(biāo)的第一典型變量Wl與三個訓(xùn)練指標(biāo)的相關(guān)都是負(fù)值,其中跳高(JUMPS)在W1的系數(shù)(0.7164)和它與Wl的相關(guān)(-0.1622)也是反號。因此,體重和跳高在這兩組變量中是一個校正(或抑制)變量。
一個變量同典型變量的相關(guān)與在典型變量上的系數(shù)符號相反似乎是矛盾的。下面以體重為例來說明這一現(xiàn)象,我們知道肥胖性同腰圍和體重之間的關(guān)系很密切的。一般說來,有理由認(rèn)為胖的人比瘦的人仰臥起坐的次數(shù)少。假定這組樣本中沒有身高非常高的人,因此體重和腰圍之間的相關(guān)(0.8702)是很強(qiáng)的?!?腰圍大的人傾向于比腰圍小的人胖。因此腰圍與仰臥起坐為負(fù)相關(guān)(-0.6456)。· 體重大的人傾向于比體重小的人胖。于是體重與仰臥起坐為負(fù)相關(guān)(-0.4931)。
考慮用多元回歸方法由WAIST*(腰圍)和WEIGHT*(體重)來預(yù)測SITUPS*(仰臥起坐),得到的回歸式為:SITUPS* =0.2833 WEIGHT* – 0.8921 WAIST*,回歸式中WEIGHT* 系數(shù)的符號為正似乎不合理,關(guān)于系數(shù)的符號可解釋如下:
· 若固定體重的值,腰圍大的人傾向于較強(qiáng)壯和較胖,故而仰臥起坐次數(shù)少,于是腰圍的多元回歸系數(shù)(-0.8921)應(yīng)是負(fù)的。
· 若固定腰圍的值,體重大的人傾向于比較高和比較瘦,故而仰臥起坐次數(shù)多;因此體重的多元回歸系數(shù)(0.2833)應(yīng)為正的。這里體重與仰臥起坐的相關(guān)同體重的回歸系數(shù)符號相反。
因此,第一典型相關(guān)一般解釋為以體重(WEIGHT)和跳高(JUMPS)作為校正(或抑制)變量來強(qiáng)化腰圍(WAIST)和抑臥起坐(SITUPS)之間的負(fù)相關(guān)關(guān)系。
輸出5 CANCORR過程產(chǎn)生的典型冗余分析結(jié)果
—輸出5給出典型冗余分析的結(jié)果。我們來分析標(biāo)準(zhǔn)化的方差,第一典型變量vl可以解釋45.08%組內(nèi)變差,并解釋25.84%的另一組(訓(xùn)練指標(biāo))的變差;而典型變量wl可以解釋40.81%組內(nèi)變差,并解釋28.54%的另一組(生理指標(biāo))的變差。可見第一對典型變量V1和Wl都不能很好地全面地預(yù)測另一組變量。第二和第三對典型變量實(shí)際上都沒有給出什么信息,三個典型變量解釋另一組總變差的累計百分比分別為0.2969和0.2767。
輸出5中第4張表格給出訓(xùn)練指標(biāo)組中各個變量被生理指標(biāo)變量組提取的前M個(M=1,2,3)典型變量V1,?,VM解釋變差的累計百分比(即多重相關(guān)的平方和:?r2(Y1,Vk)),可以看出只有CHINS(O.3351)和SITUPS(0.4233)可被對k?1M方變量組的第一典型變量Vl預(yù)測,Vl對JUMPS(O.0167)幾乎沒有預(yù)測能力。從第3張表格類似可得出,而來自訓(xùn)練指標(biāo)的第一典型變量Wl對WAIST(O.5421)有相當(dāng)好的預(yù)測能力,對WEIGHT(0.2438)較差,而對PULSE(0.0701)幾乎沒有預(yù)測能力。
[參考文獻(xiàn)]
[ 1]王惠文.偏最小二乘回歸方法及其應(yīng)用[M].北京:國肪工業(yè)出版社,2000. [2]高惠璇等.SAs系統(tǒng)SAS/STAT軟件使用手冊[M].北京:中國統(tǒng)計出版社,1998.[3] 高惠璇.實(shí)用統(tǒng)計方法與SAS系統(tǒng)[M]北京:北京大學(xué)出版社,2001. [4] 高惠璇.統(tǒng)計計算[M]北京:北京大學(xué)出版社,1995. [5]王學(xué)民.應(yīng)用多元分析[M]上海:上海財經(jīng)大學(xué)出版社,1999
第三篇:數(shù)值分析模擬試卷(九)
數(shù)值分析模擬試卷(九)班級 學(xué)號 姓名 一、填空題(每空3分,共30分)1. 設(shè),則差商 __________ ;
2.在用松弛法(SOR)解線性方程組時,若松弛因子滿足,則迭代法______ ;
3.要使求的Newton迭代法至少三階收斂,需要滿足______ ;
4.設(shè),用Newton迭代法求具有二階收斂的迭代格式為_______________ ;
求具有二階收斂的迭代格式為__________________;
5.已知,則________,_____;
6.若,改變計算式=__________________,使計算結(jié)果更為精確;
7.過節(jié)點(diǎn)的插值多項(xiàng)式為____________ ;
8.利用拋物(Simpson)公式求= . 二、(14分)已知方陣,(1)證明:
A不能被分解成一個單位下三角陣L和一個上三角陣U的乘積;
(2)給出A的選主元的Doolittle分解,并求出排列陣;
(3)用上述分解求解方程組,其中. 三、(12分)設(shè)函數(shù)在區(qū)間[0,1]上具有四階連續(xù)導(dǎo)數(shù),確定一個次數(shù)不超過3的多項(xiàng)式,滿足,并寫出插值余項(xiàng). 四、(10分)證明對任意的初值,迭代格式均收斂于方程的根,且具有線性收斂速度. 五、(12分)試確定常數(shù)A,B,C和a,使得數(shù)值積分公式 有盡可能高的代數(shù)精度.所得的數(shù)值積分公式代數(shù)精度是多少?是否為Gauss型的? 六、(12分)(1)試導(dǎo)出切比雪夫(Chebyshev)正交多項(xiàng)式 的三項(xiàng)遞推關(guān)系式:
(2)用高斯—切比雪夫求積公式計算積分,問當(dāng)節(jié)點(diǎn)數(shù)取何值時,能得到 積分的精確值? 七、(10分)、推導(dǎo)常微分方程的初值問題的數(shù)值解公式:
.
第四篇:單變量統(tǒng)計分析方法總結(jié)(寫寫幫推薦)
單變量統(tǒng)計分析方法總結(jié)
一、計量資料
1.兩組獨(dú)立樣本比較
1.1資料符合正態(tài)分布,且兩組方差齊性,及獨(dú)立性,可直接采用t檢驗(yàn)。1.2資料不符合正態(tài)分布
(1)數(shù)據(jù)轉(zhuǎn)換(如對數(shù)轉(zhuǎn)換等)→使之服從正態(tài)分布→轉(zhuǎn)換后的數(shù)據(jù)采用t檢驗(yàn);(2)直接采用非參數(shù)檢驗(yàn)(如Wilcoxon檢驗(yàn))。1.3資料方差不齊
(1)t’檢驗(yàn)(前提是資料滿足正態(tài)性);(2)采用非參數(shù)檢驗(yàn)(如Wilcoxon檢驗(yàn))。2.兩組配對樣本的比較
2.1 兩組差值服從正態(tài)分布,采用配對t檢驗(yàn)。
2.2 兩組差值不服從正態(tài)分布,采用wilcoxon的符號配對秩和檢驗(yàn)。3.多組完全隨機(jī)樣本比較
3.1資料符合正態(tài)分布,且各組方差齊性,直接采用完全隨機(jī)的方差分析。
如檢驗(yàn)結(jié)果為有統(tǒng)計學(xué)意義,則進(jìn)一步作兩兩比較,兩兩比較的方法有LSD檢驗(yàn),SNK法,Bonferroni法,tukey法,Scheffe法等。3.2資料不符合正態(tài)分布,或各組方差不齊
(1)數(shù)據(jù)轉(zhuǎn)換(如對數(shù)轉(zhuǎn)換等)→使之服從正態(tài)分布或方差齊性→轉(zhuǎn)換后數(shù)據(jù)采用F檢驗(yàn);(2)直接采用非參數(shù)檢驗(yàn)(如Kruscal-Wallis法)。
如果檢驗(yàn)結(jié)果為有統(tǒng)計學(xué)意義,則進(jìn)一步作兩兩比較,一般采用Bonferroni法校正P值,然 后用兩組的Wilcoxon檢驗(yàn),或秩變換方法。4.多組隨機(jī)區(qū)組樣本比較
4.1資料符合正態(tài)分布,且各組方差齊性,直接采用隨機(jī)區(qū)組的方差分析。
如果檢驗(yàn)結(jié)果為有統(tǒng)計學(xué)意義,則進(jìn)一步作兩兩比較,兩兩比較的方法有LSD檢驗(yàn),Bonferroni法,tukey法,Scheffe法,SNK法等。
4.2資料不符合正態(tài)分布,或各組方差不齊,則采用非參數(shù)檢驗(yàn)的Fridman檢驗(yàn)法。如果檢驗(yàn)結(jié)果為有統(tǒng)計學(xué)意義,則進(jìn)一步作兩兩比較,一般采用Bonferroni法校正P值,然 后用符號配對的Wilcoxon檢驗(yàn)?!镄枰⒁獾膯栴}:
(1)一般來說,如果是大樣本,比如各組例數(shù)大于50,可以不作正態(tài)性檢驗(yàn),直接采用t檢驗(yàn)或方差分析。因?yàn)榻y(tǒng)計學(xué)上有中心極限定理,假定大樣本是服從正態(tài)分布的。
(2)當(dāng)進(jìn)行多組比較時,最容易犯的錯誤是僅比較其中的兩組,而不顧其他組,這樣作容易增大α。正確的做法應(yīng)該是,先作總的各組間的比較,如果總的來說差別有統(tǒng)計學(xué)意義,然后才能作其中任意兩組的比較,這些兩兩比較有特定的統(tǒng)計方法,如上面提到的LSD檢驗(yàn),Bonferroni法,tukey法,Scheffe法,SNK法等。**絕不能對其中的兩組直接采用t檢驗(yàn),這樣即使得出結(jié)果也未必正確**
二、分類資料
1.四格表資料
?2檢驗(yàn)。
1.2 n≥40,且至少一個理論數(shù)1≤T<5,則用校正的?2檢驗(yàn)。1.1 n≥40,且所有理論數(shù)T>5,則用普通的Pearson 1.3 n<40,或有理論數(shù)T<1,則用Fisher’s確切概率法檢驗(yàn)。2.R×C表資料的統(tǒng)計分析
2.1 列變量和行變量均為無序分類變量,則(1)n≥40,且理論數(shù)1≤T<5的格子數(shù)目占總格子數(shù)目<20%,則用普通的Pearson
?2檢驗(yàn)。
(2)超過理論數(shù)1≤T<5的格子數(shù)目占總格子數(shù)目20%,可采用似然比卡方檢驗(yàn)或Fisher’s確切概率法檢驗(yàn)(總例數(shù)不應(yīng)太大,因?yàn)檫@種算法計算機(jī)也要算半天才能出結(jié)果)。2.2 需要統(tǒng)計分析變量為等級資料變量,另一變量為分組變量,采用非參數(shù)檢驗(yàn)。兩組的Wilcoxon秩和檢驗(yàn),或多組的 Kruskal-Wallis檢驗(yàn)。如果總的來說有差別,還可進(jìn) 一步作兩兩比較,以說明是否任意兩組之間的差別都有統(tǒng)計學(xué)意義。
2.3 列變量和行變量均為等級資料變量,如果要做兩變量之間的相關(guān)性,可采用Spearson 相關(guān)分析。
3.配對分類資料的統(tǒng)計分析 則用McNemar配對?檢驗(yàn)。
第五篇:實(shí)習(xí)一 計量資料的統(tǒng)計分析(教師參考.doc
首次實(shí)驗(yàn)提示:
1.實(shí)驗(yàn)室規(guī)則
2.預(yù)習(xí)與作業(yè):作業(yè)分?jǐn)?shù)作為平時成績的主要依據(jù)。
3.請假制度
4.衛(wèi)生值日
實(shí)習(xí)一計量資料的統(tǒng)計分析
一. 目的要求:
1.2.3.4.掌握描述計量資料集中趨勢和離散趨勢常用指標(biāo)的意義、計算方法與適用范圍; 掌握醫(yī)學(xué)參考值范圍與總體均數(shù)可信區(qū)間; 掌握t檢驗(yàn)與u檢驗(yàn)(用途、應(yīng)用條件、檢驗(yàn)統(tǒng)計量的計算及檢驗(yàn)步驟)掌握計算器統(tǒng)計模型的使用。
二. 重點(diǎn)與難點(diǎn):
1、集中趨勢——常用的平均數(shù)及其比較:
2、離散趨勢:意義——指標(biāo)數(shù)值越小,說明觀察值的變異度越小,平均數(shù)的代表性越好。
全距、四分位數(shù)間距、方差和標(biāo)準(zhǔn)差、變異系數(shù)的適用范圍與計算。
3、醫(yī)學(xué)參考值范圍與總體均數(shù)可信區(qū)間的概念與計算(注意課本中t分布法估計總體均數(shù)可信區(qū)間的條件不正確)
4、t檢驗(yàn)與u檢驗(yàn)的用途、應(yīng)用條件、檢驗(yàn)統(tǒng)計量的計算及檢驗(yàn)步驟
注意:(1)課本中t檢驗(yàn)的條件不正確;
(2)確定概率時,應(yīng)盡可能得出確切的概率范圍;
(3)單側(cè)檢驗(yàn)與雙側(cè)檢驗(yàn)的選擇
5、計算器統(tǒng)計模型運(yùn)用:
根據(jù)學(xué)生手中的計算器類型介紹統(tǒng)計模型的使用,包括直接法與頻數(shù)表法。要求在后續(xù)作業(yè)計算中使用計算器。
三. 練習(xí)題:
上交作業(yè):9-4,9-5,9-9
課外練習(xí)(不上交):9-1,9-2,9-3,9-8