第一篇:醫(yī)學(xué)統(tǒng)計(jì)學(xué)總結(jié)
1、同一資料的標(biāo)準(zhǔn)差是否一定小于均數(shù)?
答:均數(shù)是描述定量資料集中趨勢的指標(biāo),而標(biāo)準(zhǔn)差是描述定量資料離散程度的指標(biāo),二者反映的是資料分布特征的兩個(gè)不同方面。
2、極差、四分位間距、標(biāo)準(zhǔn)差、變異系數(shù)的適用范圍有何異同?
答:這四個(gè)指標(biāo)的相同點(diǎn)在于均用于描述計(jì)量資料的離散程度。不同點(diǎn)為:極差可用于各種分布的資料,一般常用于描述單峰對(duì)稱分布小樣本資料的變異程度,或用于初步了解資料的變異程度。若樣本含量相差較大,則不宜用極差來比較資料的離散程度。四分位間距:適用于描述偏態(tài)分布資料、兩端無確切值或分布不明確資料的離散程度。標(biāo)準(zhǔn)差常用于描述對(duì)稱分布,特別是正態(tài)分布或近似分布資料的離散程度。變異系數(shù)適用于比較計(jì)量單位不同或均數(shù)相差懸殊的幾組資料的離散程度。
3、x2檢驗(yàn)用于什么?
答:x檢驗(yàn)用于:推斷兩個(gè)及兩個(gè)以上總體率或構(gòu)成比是否有差別,兩個(gè)分類變量間有無相關(guān)關(guān)系,多個(gè)率的趨勢檢驗(yàn),以及兩個(gè)率的等效檢驗(yàn)等。此外,也用于頻數(shù)分布的擬合優(yōu)度檢驗(yàn)。
4、四格表的U檢驗(yàn)和x2檢驗(yàn)有何聯(lián)系?
答:(1)相同點(diǎn):四格表的u檢驗(yàn)的根據(jù)是正態(tài)近似原理(n足夠大,∏和1-∏均不太?。?。能用四格表的u檢驗(yàn)進(jìn)行兩個(gè)率比較檢驗(yàn)的資料,都可以用x檢驗(yàn)。四格表的雙側(cè)u檢驗(yàn)與x檢驗(yàn)是完全等價(jià)的,兩個(gè)統(tǒng)計(jì)量的關(guān)系為u= x,u20.05/2= u20.05/1.u檢驗(yàn)和卡方檢驗(yàn)都存在連續(xù)性矯正問題(2)不同點(diǎn):①正態(tài)分布可以確定單、雙側(cè)檢驗(yàn)界值,滿足正態(tài)近似條件時(shí),可以使用四格表的單側(cè)u檢驗(yàn)。②滿足四格表u檢驗(yàn)的資料,計(jì)算兩率之間的95%可信區(qū)間,尚可分析兩率之差有無實(shí)際意義。③x2檢驗(yàn)還可以用于配對(duì)設(shè)計(jì)四格表,但這時(shí)推斷∏1,∏2是否有差別的x2公式不同。5.參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)的區(qū)別何在?各有何優(yōu)缺點(diǎn)? 答:區(qū)別:參數(shù)檢驗(yàn),其應(yīng)用條件是已知總體的分布類型,對(duì)總體參數(shù)進(jìn)行估計(jì)或檢驗(yàn)。非參數(shù)檢驗(yàn),不依賴總體分布的具體形式,目的在于檢驗(yàn)總體分布是否不同。(2)參數(shù)檢驗(yàn)優(yōu)點(diǎn)是符合應(yīng)用條件時(shí),檢驗(yàn)效能較高。缺點(diǎn)是對(duì)資料要求嚴(yán)格,不能用于等級(jí)數(shù)據(jù)、一端或兩端有不確切數(shù)據(jù),此外,還要求資料的分布類型已知和總體方差齊等條件。非參數(shù)檢驗(yàn)優(yōu)點(diǎn)是應(yīng)用范圍廣,計(jì)算簡便,對(duì)資料的要求不高;缺點(diǎn)是若對(duì)符合參數(shù)檢驗(yàn)條件的資料用非參數(shù)檢驗(yàn),則會(huì)降低檢驗(yàn)效能。如需檢驗(yàn)出同樣大小的差異,非參數(shù)檢驗(yàn)往往需要更大的樣本含量。
6.對(duì)同一資料,又出自同一研究目的,用參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)所得不一致時(shí),宜以何者為準(zhǔn)?答:兩者各有使用條件,究竟取哪種結(jié)論,要根據(jù)資料是否滿足該種檢驗(yàn)方法的應(yīng)用條件進(jìn)行選擇。在符合參數(shù)檢驗(yàn)的條件時(shí),可接受參數(shù)檢驗(yàn)的結(jié)論,而資料不符合參數(shù)檢驗(yàn)的條件時(shí),應(yīng)以非參數(shù)檢驗(yàn)的結(jié)論為佳。如總體分布為極度偏態(tài)或其他非正態(tài)分布,或者兩總體方差不齊時(shí),此時(shí)宜采用秩和檢驗(yàn)的結(jié)果。7.非參數(shù)檢驗(yàn)適用于哪些情況?
答:①等級(jí)資料②偏態(tài)資料。當(dāng)觀察資料成偏態(tài)或極度偏態(tài)而又未經(jīng)任何變量變換,或雖經(jīng)變量變換但仍未達(dá)到正態(tài)或近似正態(tài)分布時(shí)③總體分布類型未知的資料④要比較的各組資料方差不齊⑤一端或兩端有不確定數(shù)據(jù)。
8.兩樣本比較的秩和檢驗(yàn),當(dāng)n1>n2>10時(shí)采用u檢驗(yàn),這時(shí)檢驗(yàn)是屬于參數(shù)檢驗(yàn)還是非參數(shù)檢驗(yàn)?為什么?答:兩組比較的秩和檢驗(yàn),當(dāng)n很大時(shí),可利用秩和T的分布隨n增大漸進(jìn)正態(tài)分布的性質(zhì),進(jìn)行u檢驗(yàn),此時(shí)利用的并非原始數(shù)據(jù),而是經(jīng)秩變換后的數(shù)據(jù),故仍屬非參數(shù)檢驗(yàn)。9.直線回歸分析中應(yīng)注意哪些問題?
答:做回歸分析一定要有專業(yè)意義,不能將毫無聯(lián)系的兩個(gè)變量作直線回歸分析;回歸分析之前首先應(yīng)繪制散點(diǎn)圖,考查x與y之間有無直線趨勢以及是否存在異常點(diǎn);考慮是否滿足建立線性回歸模型的基本假定;直線回歸方程的應(yīng)用與圖示一般以自變量x的取值范圍為限;兩變量的直線關(guān)系不一定是因果關(guān)系,也可能是伴隨關(guān)系。
10.簡述直線回歸與直線相關(guān)的區(qū)別與聯(lián)系。
答:區(qū)別:①資料要求不同:直線回歸中因變量y是來自正態(tài)總體的隨機(jī)變量,而r既可以是來自正態(tài)總體中的隨機(jī)變量,也可以是嚴(yán)密控制、精確測量的變量;相關(guān)分析則要求x,y是來自雙變量正態(tài)分布總體的隨機(jī)變量,②分析目的不同:直線回歸用于說明兩變量間依存變化的數(shù)量關(guān)系;直線相關(guān)用于說明變量間的直線相關(guān)關(guān)系。聯(lián)系:①方向一致:對(duì)一組數(shù)據(jù)計(jì)算,r與b,它們的正負(fù)號(hào)是一致的。②假設(shè)檢驗(yàn)等價(jià):對(duì)同一樣本r和b的假設(shè)檢驗(yàn)得到的t值相等。③用回歸解釋相關(guān):由r2=SS回/SS總可知,若回歸平方和越接近總平方和,則r越接近于1。
11.簡述直線相關(guān)、秩相關(guān)的區(qū)別與聯(lián)系。
答:區(qū)別:①資料要求不同:直線相關(guān)要求x、y是來自雙變量正態(tài)總體的隨機(jī)變量;秩相關(guān)適用于不服從雙變量正態(tài)分布或總體分布類型未知以及用等級(jí)表示的原始數(shù)據(jù)。②相關(guān)意義不同:直線相關(guān)表示兩變量的直線相關(guān)關(guān)系存在,秩相關(guān)表示兩變量的相關(guān)關(guān)系。聯(lián)系:相關(guān)系數(shù)的取值范圍相同;秩相關(guān)是將原始數(shù)據(jù)進(jìn)行秩變換,以秩次計(jì)算直線相關(guān)系數(shù)。
12.均數(shù)的可信區(qū)間和參考值范圍有何不同?
222
22答:均數(shù)的可信區(qū)間:按一定的概率100(1-α)%(即可信度)估計(jì)總體均數(shù)所在的范圍,得到的范圍亦稱可信區(qū)間。參考值范圍:醫(yī)學(xué)參考值范圍指包括絕大多數(shù)正常人的人體形態(tài)、功能和代謝產(chǎn)物等各種生理及生化指標(biāo)常數(shù),也稱正常值。由于存在著個(gè)體差異,生物醫(yī)學(xué)數(shù)據(jù)并非常數(shù),而是一定范圍內(nèi)波動(dòng),故采用醫(yī)學(xué)參考值范圍作為判定正常和異常的參考標(biāo)準(zhǔn)。
13秩和檢驗(yàn)的優(yōu)缺點(diǎn)是什么? 答:①不受總體分布限制,適用面廣②適用于等級(jí)資料及兩端無確定值的資料③易于理解,易于計(jì)算。缺點(diǎn):是對(duì)分布類型的廣泛適應(yīng)性,使其很難充分利用資料提供的信息,有時(shí)會(huì)導(dǎo)致檢驗(yàn)效能降低。14在t檢驗(yàn)和u檢驗(yàn)時(shí),何種情況下采用單側(cè)檢驗(yàn)?
答:單側(cè)檢驗(yàn)的備擇假設(shè)帶有方向性,如:m>m0,實(shí)際中只可能出現(xiàn)一種情況。雙側(cè)檢驗(yàn)的備擇假設(shè)中包含不等號(hào)(如:m≠m0),實(shí)際上包括兩種情況:m>m0或m<m0,無方向性。15.均數(shù)、幾何均數(shù)和中位數(shù)的適用范圍是什么?
答:均數(shù)適用于描述單峰對(duì)稱分布,特別是正態(tài)分布或近似正態(tài)分布資料的集中趨勢。(由于均數(shù)易受到極端值的影響,故不適用于描述偏態(tài)分布資料的集中趨勢,只是需采用幾何均數(shù)或中位數(shù)。)幾何均數(shù)對(duì)于原始觀察值呈偏態(tài)分布,但經(jīng)過對(duì)數(shù)變換后呈正態(tài)分布或近似正態(tài)分布的資料,易用幾何均數(shù)描述其集中趨勢。常用于等比級(jí)資料或?qū)?shù)正態(tài)分布資料。中位數(shù)可用于各種分布的資料。對(duì)于正態(tài)分布資料,中位數(shù)等于均數(shù);對(duì)于對(duì)數(shù)正態(tài)分布資料,中位數(shù)等于幾何均數(shù)。由于中位數(shù)不受極端值的影響,主要用于偏態(tài)分布資料,兩端無確切值或分布不明確的資料。16.標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)誤有何區(qū)別與聯(lián)系,他們的用途是什么?
答:標(biāo)準(zhǔn)差:是描述對(duì)稱分布,特別是正態(tài)分布或近似正態(tài)分布資料離散趨勢(變異程度)的常用指標(biāo)??傮w標(biāo)準(zhǔn)差用δ表示,樣本標(biāo)準(zhǔn)差用s表示。標(biāo)準(zhǔn)誤:樣本均數(shù)的標(biāo)準(zhǔn)差稱為標(biāo)準(zhǔn)誤。樣本均數(shù)⊙的總體均數(shù)為H,各⊙圍繞H的離散程度,可以用樣本均數(shù)的標(biāo)準(zhǔn)差來描述。用途:標(biāo)準(zhǔn)差用途:①表示變量分布的離散程度②結(jié)合均數(shù)計(jì)算變異系數(shù)③結(jié)合樣本含量計(jì)算標(biāo)準(zhǔn)誤④結(jié)合均數(shù)描述分布特征。標(biāo)準(zhǔn)誤用途:表示每個(gè)樣本均數(shù)間的變異程度,描述樣本均數(shù)的抽樣誤差,即樣本均數(shù)與總體均數(shù)的接近程度,也可稱為樣本均數(shù)的標(biāo)準(zhǔn)差。17.統(tǒng)計(jì)圖制作的一般原則?
答:首先,根據(jù)資料性質(zhì)和分析目的正確選用適當(dāng)?shù)慕y(tǒng)計(jì)圖。其次,除圓圖外,一般用直角坐標(biāo)系的第一象限的位置表示。最后,繪制圖形應(yīng)注意準(zhǔn)確、美觀,給人以清晰的印象。18.各種統(tǒng)計(jì)圖適合于何種資料? 答:描述某連續(xù)變量的頻數(shù)分布宜選用直方圖;分析、比較獨(dú)立的或不連續(xù)的多個(gè)組或多個(gè)類別的統(tǒng)計(jì)量宜選用條圖,分析某指標(biāo)隨時(shí)間或其它連續(xù)變量變化而變化的趨勢宜選用線圖,描述或比較不同事物內(nèi)部構(gòu)成時(shí)用圓圖或百分比條圖等。
19.為什么要做r和b的假設(shè)檢驗(yàn)?
答:b:即使從總體回歸系數(shù)β等于零的總體中作隨機(jī)抽樣,由于抽樣誤差的存在,其樣本回歸系數(shù)b也不一定全為零。因此,求得一個(gè)樣本回歸系數(shù)時(shí),首先,需考慮線性方程是否成立?并進(jìn)行回歸系數(shù)β是否為零的檢驗(yàn)。以推斷自變量x與應(yīng)變量y見是否有直線關(guān)系存在。
r:假定從總體相關(guān)系數(shù)t=0的總體中隨機(jī)抽樣,由于存在抽樣誤差,所得樣本相關(guān)系數(shù)r不一定全為零。故此,求得一個(gè)樣本相關(guān)系數(shù)r值后,仍需進(jìn)行總體相關(guān)系數(shù)t是否為零的假設(shè)檢驗(yàn)。
20.服從二項(xiàng)分布的條件是什么?
答:凡具有貝努力試驗(yàn)序列3個(gè)特點(diǎn)的變量,一般可認(rèn)為服從二項(xiàng)分布①每次試驗(yàn)的結(jié)果只能是兩種互斥的結(jié)果中的一種(A或者非A)②各次試驗(yàn)的結(jié)果互不影響,即各次試驗(yàn)獨(dú)立③在相同試驗(yàn)條件下,各次試驗(yàn)中出現(xiàn)某一結(jié)果A具有相同的概率∏(非A的概率1-∏)。
21.相關(guān)系數(shù)和回歸系數(shù)有什么區(qū)別和聯(lián)系?
答:直線的斜率稱為回歸系數(shù),直線相關(guān)系數(shù)也稱積距相關(guān)系數(shù),說明具有直線關(guān)系的兩變量間的相關(guān)方向與密切程度。它們的聯(lián)系——方向一致即r與b正負(fù)一致,假設(shè)檢驗(yàn)等價(jià)。區(qū)別:資料要求不同,回歸系數(shù)方程要求服從正態(tài)分布,x精確測量嚴(yán)格控制Ⅰ型回歸,相關(guān)方程要求x,y雙重復(fù)正態(tài)Ⅱ型回歸。22多個(gè)樣本均數(shù)間的比較為什么不能用t檢驗(yàn)?
答:多個(gè)樣本均數(shù)的兩兩比較又稱多重比較,其目的是推斷究竟哪些總體均數(shù)之間存在差別,由于涉及的對(duì)比組數(shù)大于2,若仍用前述的t檢驗(yàn)對(duì)兩個(gè)對(duì)比組做比較,會(huì)使犯第Ⅰ類錯(cuò)誤的概率增大,即可能吧本來無差別的兩個(gè)總體均數(shù)判為有差別,因此,多重比較不宜用t檢驗(yàn)分別作兩兩比較。
23對(duì)同一資料,有出自同一研究目的,用參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)所得結(jié)果不一致時(shí),宜以何者為準(zhǔn)?答:參數(shù)檢驗(yàn)要求其總體分布為正態(tài)分布,總體方差齊性,非參數(shù)檢驗(yàn)常用解決那些總體分布未知的統(tǒng)計(jì)問題,對(duì)于同一資料,又出自同一研究目的,采用參數(shù)研究還是非參數(shù)檢驗(yàn)取決于資料的類型。24.為什么要進(jìn)行抽樣研究?抽樣時(shí)為什么會(huì)產(chǎn)生抽樣誤差?
答:計(jì)量資料的總體中所含的樣本數(shù)量巨大,要獲取資料的總體均數(shù)、標(biāo)準(zhǔn)差等數(shù)據(jù)十分困難,因此醫(yī)學(xué)科學(xué)研究中通常采用的抽樣研究方法,是指從總體中隨機(jī)抽取一個(gè)樣本,用樣本信息推斷總體特征,這種分析方法稱為統(tǒng)計(jì)推斷。但通常情況下,樣本均數(shù)(x拔)不可能與總體均數(shù)μ正好相等,這種由個(gè)體變異產(chǎn)生的,隨機(jī)抽樣引起的樣本統(tǒng)計(jì)量與總體參數(shù)間的差異稱為抽樣誤差。25.相關(guān)系數(shù)的意義?
答:相關(guān)系數(shù)r沒有單位,取值范圍為-1≤r≤1。兩變量相關(guān)的方向用r的正負(fù)號(hào)表示,即r>0表示正相關(guān);r<0表示負(fù)相關(guān)。相關(guān)系數(shù)r的大小表示密切程度,r絕對(duì)值越接近1,表示兩變量間相關(guān)關(guān)系密切程度越高。∣r∣=1表示完全相關(guān),∣r∣=0表示無直線相關(guān)。26.方差分析的應(yīng)用條件?
答:①各樣本是相互獨(dú)立的隨機(jī)樣本②各樣本來自正態(tài)分布③各樣本方差相等,即方差齊。
27.χ2檢驗(yàn)要注意的問題(注意事項(xiàng))?
答:① 計(jì)算χ2 值時(shí)必須用絕對(duì)數(shù)。而不能用相對(duì)數(shù),因?yàn)棣? 值的大小與頻數(shù)大小有關(guān)。②χ2 檢驗(yàn)要求理論頻數(shù)不宜太小,一般認(rèn)為不宜有1/5以上格子理論頻數(shù)小于5,或一個(gè)格子的理論頻數(shù)小于1。對(duì)理論頻數(shù)太小有三種處理方法:A 增大樣本例數(shù) B 刪除理論數(shù)太小的行或列 C 合并③當(dāng)多個(gè)樣本率(或構(gòu)成比)比較的χ2 檢驗(yàn)結(jié)論為拒絕檢驗(yàn)假設(shè),只能認(rèn)為各總體率(或總體構(gòu)成比)之間總的說來有差別,但不能說它們彼此間都有差別?;蚰硟烧唛g有差別。
28.非參數(shù)檢驗(yàn)適用哪些情況?
答:①等級(jí)順序資料。②偏態(tài)資料。當(dāng)觀察資料成偏態(tài)或極度偏態(tài)分布而又未經(jīng)變量變換未達(dá)到正態(tài)或近似正態(tài)分布時(shí),宜用非參數(shù)檢驗(yàn)。③未知分布類型資料④要比較的各組資料變異度相差較大,方差不齊,且不能變換達(dá)到齊性。⑤初步分析。有些醫(yī)學(xué)資料由于統(tǒng)計(jì)工作量過大,可采用非參數(shù)統(tǒng)計(jì)方法進(jìn)行初步分析,挑選其中有意義者再進(jìn)一步分析⑥對(duì)于一些特殊情況,如從幾個(gè)總體所獲得的數(shù)據(jù),往往難以對(duì)其原有總體分布作出估計(jì),在這種情況下可用非參數(shù)統(tǒng)計(jì)方法。
29.為什么秩和檢驗(yàn)的編秩在不同對(duì)比組間出現(xiàn)相同數(shù)據(jù)要給予“平均秩次”,而同一組的相同數(shù)據(jù)不必計(jì)算“平均秩次”?
答:因?yàn)樵诓煌瑢?duì)比組,不取平均秩次會(huì)加大或減小某一組的秩和;而在同一組內(nèi),出現(xiàn)相同數(shù)據(jù)不編平均秩次,該組秩和不受影響。
30.怎樣正確使用單側(cè)檢驗(yàn)和雙側(cè)檢驗(yàn)?
答:根據(jù)專業(yè)知識(shí)推斷兩個(gè)總體是否有差別時(shí),是甲高于乙,還是以高于甲,當(dāng)兩種可能都存在時(shí),一般選雙側(cè);若根據(jù)專業(yè)知識(shí),如果甲不會(huì)低于乙,或研究者僅關(guān)心其中一種可能時(shí),可選用單側(cè)。一般來講,雙側(cè)檢驗(yàn)較穩(wěn)妥故較多用,在預(yù)實(shí)驗(yàn)有探索性質(zhì)時(shí),對(duì)結(jié)果的考慮以思路較寬為好,也用雙側(cè)檢驗(yàn)。單側(cè)檢驗(yàn),應(yīng)以專業(yè)知識(shí)為依據(jù),他充分利用了另一側(cè)的不可能性,故檢出效率高,但應(yīng)慎用。
31.回歸系數(shù):直線的斜率b,也稱回歸系數(shù)。統(tǒng)計(jì)學(xué)意義是自變量x改變一個(gè)單位時(shí),應(yīng)變量y平均變化b個(gè)單位。32.相關(guān)系數(shù):也稱pearson積距相關(guān)系數(shù),說明具有直線相關(guān)的兩變量間相關(guān)方向與密切程度。33.直線回歸分析中應(yīng)注意的問題?
答:①做直線回歸一定要有實(shí)際意義②回歸分析之前首先應(yīng)繪制散點(diǎn)圖。③考慮建立線性模型的基本假定④取值范圍,避免外延。⑤兩變量間有直線關(guān)系不一定是因果關(guān)系。34.相關(guān)分析應(yīng)用中應(yīng)注意的問題?
答:①資料要求x、y都應(yīng)來自雙變量正態(tài)總體的隨機(jī)變量。②進(jìn)行相關(guān)分析前,應(yīng)先繪制散點(diǎn)圖,有線性趨勢時(shí),才可進(jìn)行相關(guān)分析。③滿足應(yīng)用條件的同一份雙變量資料,回歸系數(shù)b與相關(guān)系數(shù)r的正負(fù)號(hào)一致,假設(shè)檢驗(yàn)等價(jià)。④相關(guān)分析時(shí),小樣本資料經(jīng)t檢驗(yàn)只能推斷兩變量間有無直線關(guān)系,而不能推斷其相關(guān)的密切程度。要推斷兩樣本間相關(guān)的程度,樣本含量必須足夠大,當(dāng)r有統(tǒng)計(jì)學(xué)意義時(shí),但r2較小時(shí),下結(jié)論要慎重。35.方差分析的應(yīng)用條件? 答:①各樣本是相互獨(dú)立的隨機(jī)樣本②各樣本來自正態(tài)分布③各樣本方差相等,即方差齊。
36.二項(xiàng)分布:貝努力試驗(yàn)序列中結(jié)果A出現(xiàn)次數(shù)的概率分布就是~。
37.率的標(biāo)準(zhǔn)化法:為解決因內(nèi)部構(gòu)成不同而導(dǎo)致分組率比較的結(jié)果與和紀(jì)律比較結(jié)果的矛盾,選定一個(gè)共同的標(biāo)準(zhǔn)人口或標(biāo)準(zhǔn)人口構(gòu)成,分別計(jì)算兩組的標(biāo)準(zhǔn)化率,這種方法稱~。
38.抽樣誤差:由個(gè)體變異產(chǎn)生的,隨機(jī)抽樣引起的樣本統(tǒng)計(jì)量與總體參考數(shù)間的差異稱~
第二篇:醫(yī)學(xué)統(tǒng)計(jì)學(xué)總結(jié)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)總結(jié)
一、兩組或多組計(jì)量資料的比較1.兩組資料: 1)大樣本資料或服從正態(tài)分布的小樣本資料(1)若方差齊性,則作成組t檢驗(yàn)(2)若方差不齊,則作t’檢驗(yàn)或用成組的Wilcoxon秩和檢驗(yàn) 2)小樣本偏態(tài)分布資料,則用成組的Wilcoxon秩和檢驗(yàn) 2.多組資料: 1)若大樣本資料或服從正態(tài)分布,并且方差齊性,則作完全隨機(jī)的方差分析。如果方差分析的統(tǒng)計(jì)檢驗(yàn)為有統(tǒng)計(jì)學(xué)意義,則進(jìn)一步作統(tǒng)計(jì)分析:選擇合適的方法(如:LSD檢驗(yàn),Bonferroni檢驗(yàn)等)進(jìn)行兩兩比較。2)如果小樣本的偏態(tài)分布資料或方差不齊,則作Kruskal Wallis的統(tǒng)計(jì)檢驗(yàn)。如果Kruskal Wallis的統(tǒng)計(jì)檢驗(yàn)為有統(tǒng)計(jì)學(xué)意義,則進(jìn)一步作統(tǒng)計(jì)分析:選擇合適的方法(如:用成組的Wilcoxon秩和檢驗(yàn),但用Bonferroni方法校正P值等)進(jìn)行兩兩比較。
二、分類資料的統(tǒng)計(jì)分析1.單樣本資料與總體比較 1)二分類資料:(1)小樣本時(shí):用二項(xiàng)分布進(jìn)行確切概率法檢驗(yàn);(2)大樣本時(shí):用U檢驗(yàn)。2)多分類資料:用Pearson c2檢驗(yàn)(又稱擬合優(yōu)度檢驗(yàn))。2.四格表資料 1)n>40并且所以理論數(shù)大于5,則用Pearson c2 2)n>40并且所以理論數(shù)大于1并且至少存在一個(gè)理論數(shù)<5,則用校正c2或用Fisher’s 確切概率法檢驗(yàn) 3)n£40或存在理論數(shù)<1,則用Fisher’s 檢驗(yàn) 3.2×C表資料的統(tǒng)計(jì)分析 1)列變量為效應(yīng)指標(biāo),并且為有序多分類變量,行變量為分組變量,則行評(píng)分的CMH c2或成組的Wilcoxon秩和檢驗(yàn) 2)列變量為效應(yīng)指標(biāo)并且為二分類,列變量為有序多分類變量,則用趨勢c2檢驗(yàn) 3)行變量和列變量均為無序分類變量(1)n>40并且理論數(shù)小于5的格子數(shù)<行列表中格子總數(shù)的25%,則用Pearson c2(2)n£40或理論數(shù)小于5的格子數(shù)>行列表中格子總數(shù)的25%,則用Fisher’s 確切概率法檢驗(yàn) 4.R×C表資料的統(tǒng)計(jì)分析 1)列變量為效應(yīng)指標(biāo),并且為有序多分類變量,行變量為分組變量,則CMH c2或Kruskal Wallis的秩和檢驗(yàn) 2)列變量為效應(yīng)指標(biāo),并且為無序多分類變量,行變
量為有序多分類變量,作none zero correlation analysis的CMH c
23)列變量和行變量均為有序多分類變量,可以作Spearman相關(guān)分析 4)列變量和行變量均為無序多分類變量,(1)n>40并且理論數(shù)小于5的格子數(shù)<行列表中格子總數(shù)的25%,則用Pearson c2(2)n£40或理論數(shù)小于5的格子數(shù)>行列表中格子總數(shù)的25%,則用Fisher’s 確切概率法檢驗(yàn)
三、Poisson分布資料1.單樣本資料與總體比較: 1)觀察值較小時(shí):用確切概率法進(jìn)行檢驗(yàn)。2)觀察值較大時(shí):用正態(tài)近似的U檢驗(yàn)。2.兩個(gè)樣本比較:用正態(tài)近似的U檢驗(yàn)。配對(duì)設(shè)計(jì)或隨機(jī)區(qū)組設(shè)計(jì)
四、兩組或多組計(jì)量資料的比較 1.兩組資料: 1)大樣本資料或配對(duì)差值服從正態(tài)分布的小樣本資料,作配對(duì)t檢驗(yàn) 2)小樣本并且差值呈偏態(tài)分布資料,則用Wilcoxon的符號(hào)配對(duì)秩檢驗(yàn) 2.多組資料: 1)若大樣本資料或殘差服從正態(tài)分布,并且方差齊性,則作隨機(jī)區(qū)組的方差分析。如果方差分析的統(tǒng)計(jì)檢驗(yàn)為有統(tǒng)計(jì)學(xué)意義,則進(jìn)一步作統(tǒng)計(jì)分析:選擇合適的方法(如:LSD檢驗(yàn),Bonferroni檢驗(yàn)等)進(jìn)行兩兩比較。2)如果小樣本時(shí),差值呈偏態(tài)分布資料或方差不齊,則作Fredman的統(tǒng)計(jì)檢驗(yàn)。如果Fredman的統(tǒng)計(jì)檢驗(yàn)為有統(tǒng)計(jì)學(xué)意義,則進(jìn)一步作統(tǒng)計(jì)分析:選擇合適的方法(如:用Wilcoxon的符號(hào)配對(duì)秩檢驗(yàn),但用Bonferroni方法校正P值等)進(jìn)行兩兩比較。
五、分類資料的統(tǒng)計(jì)分析1.四格表資料 1)b+c>40,則用McNemar配對(duì)c2檢驗(yàn)或配對(duì)邊際c2檢驗(yàn) 2)b+c<40,則用二項(xiàng)分布確切概率法檢驗(yàn) 2.C×C表資料: 1)配對(duì)比較:用McNemar配對(duì)c2檢驗(yàn)或配對(duì)邊際c2檢驗(yàn) 2)一致性問題(Agreement):用Kap檢驗(yàn) 變量之間的關(guān)聯(lián)性分析
六、兩個(gè)變量之間的關(guān)聯(lián)性分析 1.兩個(gè)變量均為連續(xù)型變量 1)小樣本并且兩個(gè)變量服從雙正態(tài)分布,則用Pearson相關(guān)系數(shù)做統(tǒng)計(jì)分析 2)大樣本或兩個(gè)變量不服
第三篇:醫(yī)學(xué)統(tǒng)計(jì)學(xué)知識(shí)點(diǎn)總結(jié)
知識(shí)點(diǎn)
1.統(tǒng)計(jì)學(xué)是應(yīng)用概率論和數(shù)理統(tǒng)計(jì)的基本原理和方法,研究數(shù)據(jù)的搜集、整理、分析、表達(dá)和解釋的一門學(xué)科。
2.醫(yī)學(xué)統(tǒng)計(jì)學(xué)是應(yīng)用統(tǒng)計(jì)學(xué)的基本原理和方法,研究醫(yī)學(xué)及其有關(guān)領(lǐng)域數(shù)據(jù)信息的搜集、整理、分析、表達(dá)和解釋的一門學(xué)科。
3.統(tǒng)計(jì)軟件包是對(duì)資料進(jìn)行各種統(tǒng)計(jì)處理分析的一系列程序的組合。4.統(tǒng)計(jì)工作的基本步驟:研究設(shè)計(jì)、搜集資料、整理資料和分析資料。
5.科研結(jié)果的好壞取決于研究設(shè)計(jì)的好壞,研究設(shè)計(jì)是統(tǒng)計(jì)工作中的基礎(chǔ)和關(guān)鍵,決定著整個(gè)統(tǒng)計(jì)工作的成敗。
6.統(tǒng)計(jì)分析包括統(tǒng)計(jì)描述和統(tǒng)計(jì)推斷。統(tǒng)計(jì)描述是對(duì)已知的樣本(或總體)的分布情況或特征值進(jìn)行分析表述;統(tǒng)計(jì)推斷是根據(jù)已知的樣本信息來推斷未知的總體。7.醫(yī)學(xué)原始資料的類型有:計(jì)量資料、計(jì)數(shù)資料、等級(jí)資料。
8.計(jì)量資料是用定量的方法對(duì)每一個(gè)觀察單位的某項(xiàng)指標(biāo)進(jìn)行測定所得的資料。
9.計(jì)數(shù)資料是把觀察單位按某種屬性(性質(zhì))或類別進(jìn)行分組,清點(diǎn)各組觀察單位數(shù)所得資料。
10.等級(jí)資料是把觀察單位按屬性程度或等級(jí)順序分組,清點(diǎn)各組觀察單位數(shù)所得資料。各屬性之間有程度的差別。等級(jí)資料的等級(jí)順序不能任意顛倒。11.同質(zhì):是指所研究的觀察對(duì)象具有某些相同的性質(zhì)或特征。
12.變異:是同質(zhì)個(gè)體的某項(xiàng)指標(biāo)之間的差異,即個(gè)體變異或個(gè)體差異性。13.總體是根據(jù)研究目的確定的同質(zhì)研究對(duì)象的總體。樣本是總體中具有代表性的一部分個(gè)體。
14.抽樣研究是通過從總體中隨機(jī)抽取樣本,對(duì)樣本信息進(jìn)行分析,從而推斷總體的研究方法。抽樣誤差是由隨機(jī)抽樣造成的樣本指標(biāo)與總體指標(biāo)之間、樣本指標(biāo)與樣本指標(biāo)之間的差異,其根源在于總體中的個(gè)體存在變異性,只要是抽樣研究,就一定存在抽樣誤差,不能用樣本的指標(biāo)直接下結(jié)論。
15.統(tǒng)計(jì)學(xué)的主要任務(wù)是進(jìn)行統(tǒng)計(jì)推斷,包括參數(shù)估計(jì)和假設(shè)檢驗(yàn)。16.概率是某隨機(jī)事件發(fā)生可能性大?。ɑ驒C(jī)會(huì)大?。┑臄?shù)值度量。概率的取值為0≤P≤1。小概率事件是指P≤0.05的隨機(jī)事件。
17.頻數(shù)表和頻數(shù)分布圖的用途:(1)揭示計(jì)量資料的分布類型。(2)揭示計(jì)量資料分布的重要特征—集中趨勢與離散趨勢。(3)便于發(fā)現(xiàn)特大或特小的可疑值。(4)作為陳述資料的形式。例數(shù)大時(shí),可以頻率估計(jì)概率。(5)便于資料的進(jìn)一步統(tǒng)計(jì)分析。18.均數(shù)應(yīng)用于計(jì)量資料的正態(tài)分布或近似正態(tài)分布資料。19.當(dāng)資料呈正態(tài)分布時(shí),均數(shù)位于分布的中心。
20.每個(gè)觀察值都加一個(gè)常數(shù)a,則均數(shù)為原均數(shù)加常數(shù)a;每個(gè)觀察值都乘以一個(gè)常數(shù)b,則均數(shù)為原均數(shù)的b倍。
21.幾何均數(shù)應(yīng)用于對(duì)數(shù)正態(tài)分布或近似正態(tài)分布資料,也可用于呈倍數(shù)關(guān)系的等比資料。在醫(yī)院中主要用于抗原(體)滴度資料。
22.計(jì)算幾何均數(shù)的資料一般不能有觀察值為0,也不能同時(shí)包含正負(fù)觀察值。
23.中位數(shù)可用于描述任何分布類型計(jì)量資料的集中趨勢,但對(duì)于正態(tài)分布或近似正態(tài)分布的資料,中位數(shù)不利于進(jìn)一步的統(tǒng)計(jì)分析,故對(duì)正態(tài)分布或近似正態(tài)分布資料應(yīng)首選均數(shù)描述其集中趨勢。
24.中位數(shù)適用于描述偏態(tài)分布資料、一端或兩端無確定數(shù)據(jù)的資料和分布不明資料的集中趨勢。
25.極差與四分位數(shù)間距可用于描述計(jì)量資料的離散程度,但都比較粗略,而四分位數(shù)間距較極差穩(wěn)定,他們用于描述偏態(tài)分布資料。
26.中位數(shù)M是一個(gè)特殊的百分位數(shù),即第50百分位數(shù)P50,。百分位數(shù)是一種位置指標(biāo),樣本的第X百分位數(shù)記為Px,它表示將全部觀測值X1、X2,?,Xn由小到大依次排列后位于第X百分位置的數(shù)值。
27.方差和標(biāo)準(zhǔn)差用于描述正態(tài)分布計(jì)量資料的離散程度。
28.均數(shù)與標(biāo)準(zhǔn)差結(jié)合用于全面描述正態(tài)分布計(jì)量資料的集中趨勢與離散趨勢。
29.變異系數(shù)描述的是相對(duì)離散程度,無度量衡單位。用于單位不同,或雖單位相同,但均數(shù)相差較大的資料間變異程度的比較。
30.正態(tài)分布是橫軸上方以均數(shù)處最高的單峰對(duì)稱分布,以均數(shù)為中心,左右兩側(cè)對(duì)稱。正態(tài)分布N(μ,σ2)中有兩個(gè)參數(shù):總體均數(shù)μ和總體標(biāo)準(zhǔn)差σ。μ是位置參數(shù),σ是變異度參數(shù)。
31.正態(tài)分布曲線下的面積是1,其分布有一定的規(guī)律,x±1.64s內(nèi)的面積為90%,x±1.96s內(nèi)的面積為95%,x±2.58s內(nèi)的面積為99%。32.常用相對(duì)數(shù)有:率、構(gòu)成比、相對(duì)比。
33.率是說明某現(xiàn)象發(fā)生的頻率或強(qiáng)度。某一分率的改變不影響其他分率變化。
34.構(gòu)成比是表示某事物內(nèi)部各組成部分所占的比重或分布。某一部分構(gòu)成比的改變將影響其他構(gòu)成比的變化。
35.相對(duì)比表示兩個(gè)有關(guān)事物指標(biāo),用以說明一個(gè)指標(biāo)是另一個(gè)指標(biāo)的幾倍或幾分之幾。兩個(gè)指標(biāo)可以是絕對(duì)比、相對(duì)數(shù)或平均數(shù)。
36.應(yīng)用相對(duì)數(shù)注意事項(xiàng):(1)計(jì)算相對(duì)數(shù)時(shí)分母應(yīng)該有足夠數(shù)量即例數(shù)不能太小。(2)計(jì)算合計(jì)率或平均率時(shí),不能把n個(gè)率相加后除以n,應(yīng)該絕對(duì)數(shù)相加后再計(jì)算相對(duì)數(shù)。(3)正確區(qū)分構(gòu)成比與率,分析時(shí)不能以構(gòu)成比代替率。(4)相對(duì)數(shù)的比較應(yīng)注意其可比性。對(duì)比組之間除了被研究的因素不同以外,其他相對(duì)數(shù)造成影響的因素應(yīng)可能在構(gòu)成比代替率。(5)樣本率或樣本構(gòu)成比在比較時(shí)應(yīng)做假設(shè)檢驗(yàn)。
37.常用的標(biāo)準(zhǔn)化方法有直接標(biāo)準(zhǔn)化法、間接標(biāo)準(zhǔn)化法和反推標(biāo)準(zhǔn)法,簡稱直接法、間接法和反推法。
38.一般選擇“標(biāo)準(zhǔn)”的方法有兩種:(1)選擇具有代表性的,較穩(wěn)定的、數(shù)量較大的人群作為“標(biāo)準(zhǔn)”;(2)互相比較資料中任選一組數(shù)據(jù)作“標(biāo)準(zhǔn)”。
39.標(biāo)準(zhǔn)化死亡比(SMR)是被標(biāo)化組的實(shí)際死亡數(shù)與預(yù)期死亡數(shù)之比,若SMR>1,表示被標(biāo)化組死亡率高于標(biāo)準(zhǔn)組;若SMR<1,表示被標(biāo)化組死亡率低于標(biāo)準(zhǔn)組; 40.計(jì)算標(biāo)準(zhǔn)化率的步驟:⑴根據(jù)資料所具備的條件選用直接法或間接法;⑵選定標(biāo)準(zhǔn)構(gòu)成;⑶選擇公式計(jì)算標(biāo)準(zhǔn)化率。
41.應(yīng)用標(biāo)準(zhǔn)化法的注意事項(xiàng):(1)標(biāo)準(zhǔn)化法只適用于內(nèi)部構(gòu)成不同影響到總率比較的情況;
(2)由于選擇的標(biāo)準(zhǔn)不同,算出的標(biāo)準(zhǔn)化率也不同,但比較的結(jié)論一致;(3)標(biāo)準(zhǔn)化后的標(biāo)準(zhǔn)化率,已經(jīng)不再反映當(dāng)時(shí)當(dāng)?shù)氐膶?shí)際水平,它只表示相互比較的資料間的相對(duì)水平;(4)樣本標(biāo)準(zhǔn)化率也存在抽樣誤差,也需要進(jìn)行假設(shè)檢驗(yàn)。
42.發(fā)病率是計(jì)算一定期間內(nèi)某人群中的新發(fā)病例數(shù),而患病率是計(jì)算調(diào)查時(shí)點(diǎn)被調(diào)查人群中的現(xiàn)患病例數(shù)。
43.在一定期間內(nèi)某人可能發(fā)病一次以上而成為多個(gè)病例,所以發(fā)病率可能會(huì)大于100%;;而患病率不會(huì)出現(xiàn)大于100%的情況。
44.發(fā)病率高的疾病稱為多發(fā)??;患病率高的疾病稱為常見病。患病率高,發(fā)病率也高的疾病稱為常見多發(fā)病。
45.統(tǒng)計(jì)表一般由標(biāo)題、標(biāo)目、線條、數(shù)字和備注等部分組成。統(tǒng)計(jì)表的編制應(yīng):⑴重點(diǎn)突出,簡單明了,一張統(tǒng)計(jì)表至應(yīng)包括一個(gè)中心內(nèi)容;⑵主謂分明,層次清楚;⑶結(jié)構(gòu)完整,有自明性。
46.常用的統(tǒng)計(jì)圖有條圖、圓圖、百分條圖、直方圖、線圖、半對(duì)數(shù)線圖、散點(diǎn)圖、箱式圖和統(tǒng)計(jì)地圖等。
47.單個(gè)構(gòu)成比的描述,可選用圓圖或百分條圖;多個(gè)構(gòu)成比的描述和比較,宜選用百分條圖。
48.普通線圖適用于描述某項(xiàng)指標(biāo)隨某個(gè)連續(xù)型數(shù)值變量變化而變化的幅度(絕對(duì)變化趨勢);半對(duì)數(shù)線圖適用于描述某項(xiàng)指標(biāo)隨某個(gè)連續(xù)型數(shù)值變量變化而變化的速度(相對(duì)變化趨勢)。
49.箱式圖通常選用5個(gè)描述統(tǒng)計(jì)量來繪制,即最小值、下四分位數(shù)(P25)、中位數(shù)(M)、上四分位數(shù)(P75)、最大值;可用于描述某個(gè)連續(xù)型數(shù)值變量的分布特征,也可用于比較不同類別之間某個(gè)連續(xù)型數(shù)值變量分布特征的差異。
50.均數(shù)抽樣誤差是抽樣產(chǎn)生的由于個(gè)體差異所導(dǎo)致的樣本均數(shù)與樣本均數(shù)之間、樣本均數(shù)與總體均數(shù)之間的差異。
51.標(biāo)準(zhǔn)誤是樣本均數(shù)的標(biāo)準(zhǔn)差,是描述均數(shù)抽樣誤差大小的指標(biāo)。增加樣本含量可減小樣本均數(shù)的標(biāo)準(zhǔn)誤,從而降低抽樣誤差。
52.參數(shù)估計(jì)是指用樣本指標(biāo)(統(tǒng)計(jì)量)來推斷總體指標(biāo)(參數(shù))。估計(jì)方法有點(diǎn)估計(jì)和區(qū)間估計(jì),區(qū)間估計(jì)是按預(yù)先給定的概率1-α,由樣本指標(biāo)確定的包含總體參數(shù)的一個(gè)范圍。
53.可信區(qū)間是指總體均數(shù)可能所在的范圍。用于推斷總體參數(shù)所在的范圍??傮w均數(shù)95%可信區(qū)間的意義為:總體均數(shù)在x±t0.05,νSx或x±1.96Sx范圍內(nèi)的可能性為95%。
54.在抽樣研究中,由于有抽樣誤差存在,不能直接通過比較樣本均數(shù)與樣本均數(shù)之間、樣本均數(shù)與總體均數(shù)之間的大小得出結(jié)論,要進(jìn)行假設(shè)檢驗(yàn)。55.假設(shè)檢驗(yàn)的基本思想包括小概率思想和反證法思想。56.假設(shè)檢驗(yàn)是先對(duì)總體作出某種假定(檢驗(yàn)假設(shè)),然后根據(jù)樣本信息來推斷其是否成立的一類統(tǒng)計(jì)方法的總稱。用于推斷總體參數(shù)是否相等。
57.假設(shè)檢驗(yàn)的基本步驟:⑴建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn);⑵計(jì)算檢驗(yàn)統(tǒng)計(jì)量;⑶確定P值,作出統(tǒng)計(jì)判斷。
58.單樣本t檢驗(yàn)的目的是推斷樣本均數(shù)所代表的總體均數(shù)與已知總體均數(shù)是否相同,它要求樣本取自正態(tài)總體。
59.配對(duì)設(shè)計(jì)包括:⑴兩個(gè)受試對(duì)象按某特征相同或相近配成對(duì)子,分別給予不同的處理;⑵同一受試對(duì)象給予不同處理或處理前后比較。它可以降低抽樣誤差,提高統(tǒng)計(jì)效率。60.配對(duì)t檢驗(yàn)適用于配對(duì)設(shè)計(jì)的計(jì)量資料的比較,且要求差值服從正態(tài)分布。
61.完全隨機(jī)設(shè)計(jì)可以將一批同質(zhì)受試對(duì)象隨機(jī)分配到各組,也可以是隨機(jī)抽取幾組不同的受試對(duì)象,觀察其實(shí)驗(yàn)效應(yīng)。
62.完全隨機(jī)設(shè)計(jì)兩樣本均數(shù)比較的t檢驗(yàn)是推斷計(jì)量資料的兩個(gè)總體均數(shù)之間有無差別的假設(shè)檢驗(yàn)方法,要求樣本來自正態(tài)總體,且兩總體方差相等(方差齊)。
63.方差齊性檢驗(yàn)的適用條件是兩樣本均來自正態(tài)分布的總體,方差齊性檢驗(yàn)中的檢驗(yàn)統(tǒng)計(jì)量F服從F分布,有兩個(gè)自由度,分子的自由度(較大方差)和分母的自由度(較小方差)。F值越大,P值越小。
64.兩個(gè)樣本均數(shù)比較,方差不齊時(shí)刻選擇:⑴近似t′檢驗(yàn);⑵通過一定的變量變換以達(dá)到方差齊;⑶選用非參數(shù)統(tǒng)計(jì),如秩和檢驗(yàn)等。65.Z檢驗(yàn)適用于大樣本資料的假設(shè)檢驗(yàn)。
66.第Ⅰ類錯(cuò)誤:檢驗(yàn)假設(shè)H0本來是成立的,經(jīng)過檢驗(yàn)后被拒絕了,即“棄真”。其發(fā)生的的概率為α,為已知。
67.第Ⅱ類錯(cuò)誤:檢驗(yàn)假設(shè)H0本來是不成立的,經(jīng)過檢驗(yàn)后被接受了,即“存?zhèn)巍?。其發(fā)生的概率為β,屬未知數(shù)。68.假設(shè)檢驗(yàn)的注意事項(xiàng):⑴要有嚴(yán)密的研究設(shè)計(jì);⑵選用的假設(shè)檢驗(yàn)方法應(yīng)符合應(yīng)用條件;⑶有統(tǒng)計(jì)學(xué)意義不等于有實(shí)際意義;⑷結(jié)論不能絕對(duì)化;⑸正確理解P值與差別有無統(tǒng)計(jì)意義;⑹平衡Ⅰ類錯(cuò)誤和Ⅱ類錯(cuò)誤。69.方差分析是一種以分析數(shù)據(jù)的變異為基礎(chǔ),以F值為檢驗(yàn)統(tǒng)計(jì)量的計(jì)量資料的假設(shè)檢驗(yàn)方法,主要用于推斷計(jì)量資料單因素k水平(k≧3)或多因素不同水平總體均數(shù)間的差異性,其前提條件為資料服從正態(tài)分布,各組方差齊。
70.隨機(jī)區(qū)組設(shè)計(jì)資料的總變異被分解為3個(gè)部分,即處理組間變異、區(qū)組間變異和誤差。區(qū)組變異和誤差兩部分相當(dāng)于單因素方差分析的組內(nèi)變異。
71.兩兩比較的方法很多,常用q檢驗(yàn)、LSD—t檢驗(yàn)等;q檢驗(yàn)適用于探索性研究,對(duì)每兩個(gè)樣本均數(shù)都進(jìn)行檢驗(yàn);LSD—t檢驗(yàn)適用于事先有明確假設(shè)的證實(shí)性研究。72.常用數(shù)據(jù)變換的方法有對(duì)數(shù)變換、平方根變換、平方根反正弦變換、倒數(shù)變換。
273.X檢驗(yàn)是一種以Χ2分布為基礎(chǔ),以Χ2值為檢驗(yàn)統(tǒng)計(jì)量的計(jì)數(shù)資料的假設(shè)檢驗(yàn)方法。
274.X值反映實(shí)際頻數(shù)(A)和理論頻數(shù)(T)的符合程度。
275.X檢驗(yàn)的主要用途:⑴推斷兩個(gè)或兩個(gè)以上總體率(或構(gòu)成比)之間有無差別;⑵兩變量間有無相關(guān)關(guān)系;⑶檢驗(yàn)頻數(shù)分布的擬合優(yōu)度。
2276.四格表X檢驗(yàn)的注意事項(xiàng):(1)當(dāng)n≥40,T≥5時(shí),用四格表x檢驗(yàn)的基本公式或?qū)S?2公式計(jì)算X 值;(2)當(dāng)n≥40,1≤T<5時(shí),需要用校正公式計(jì)算X 值;(3)當(dāng)n<40或2T 2277.行×列表資料X檢驗(yàn)的注意事項(xiàng):(1)行×列表X檢驗(yàn)允許有1/5的基本格子的理論頻數(shù)小于5大于1,但不能有理論頻數(shù)小于1。⑵如果有1/5以上格子的理論頻數(shù)小于5大于1,或有一個(gè)格子的理論頻數(shù)小于1,可采用以下處理方法:①增加樣本含量:可以增大理論頻數(shù);②將理論頻數(shù)太小的行或列與性質(zhì)相近的鄰行或鄰列中的實(shí)際頻數(shù)合并;③刪去理論頻數(shù)太小的格子所對(duì)應(yīng)的行或例。 78.依次增減四格表中某個(gè)格子(一般選用行合計(jì)與列合計(jì)均為最小的那個(gè)格子)的數(shù)據(jù),可列出周邊合計(jì)不變條件下各種組合的四格表(一般可列出最小周邊合計(jì)數(shù)加1個(gè)四格表)。 79.非參數(shù)檢驗(yàn)是一類不依賴于總體分布類型的檢驗(yàn),即在應(yīng)用中可以不考慮被研究對(duì)象為何種分布以及分布是否已知,檢驗(yàn)假設(shè)中沒有包括總體參數(shù)的一類統(tǒng)計(jì)方法。80.秩和檢驗(yàn)的適用范圍:⑴未加精確測量的資料(包括等級(jí)資料);⑵偏態(tài)分布且無法轉(zhuǎn)化為正態(tài)分布的資料;⑶分布不清的資料。 81.配對(duì)資料的秩和檢驗(yàn)用于配對(duì)設(shè)計(jì)計(jì)量資料差值的比較和單一樣本與總體中位數(shù)的比較。 82.直線相關(guān)是分析服從正態(tài)分布的兩個(gè)隨機(jī)變量x和y有無線性相關(guān)關(guān)系的一種統(tǒng)計(jì)分析方法。 83.相關(guān)系數(shù)是描述兩個(gè)變量間線性相關(guān)關(guān)系的密切程度與方向的統(tǒng)計(jì)指標(biāo)。相關(guān)系數(shù)的符號(hào)表示兩變量的線性相關(guān)的方向。其特點(diǎn)為:⑴相關(guān)系數(shù)r沒有單位;⑵取值范圍在﹣1和1之間;⑶r為正表示正相關(guān),r為1表示完全正相關(guān);r值為負(fù)表示負(fù)相關(guān),r為﹣1表示完全負(fù)相關(guān);⑷r絕對(duì)值越接近1,表示兩個(gè)變量間相關(guān)關(guān)系密切程度越高;越接近0,則相關(guān)關(guān)系越不密切。 84.相關(guān)分析的前提條件:兩個(gè)隨機(jī)變量;散點(diǎn)圖呈線性相關(guān);服從雙變量正態(tài)分布。85.在有相關(guān)關(guān)系時(shí),根據(jù)r值判斷兩變量相關(guān)的密切程度:⑴|r|≥0.7,兩變量有高度相關(guān)關(guān)系;⑵0.7>|r|≥0.4,兩變量有中度相關(guān)關(guān)系;⑶|r|<0.4,兩變量有低度相關(guān)關(guān)系。 86.直線回歸分析的前提條件:⑴線性:兩個(gè)變量間存在線性關(guān)系;⑵獨(dú)立性:任意兩個(gè)觀察值互相獨(dú)立;⑶正態(tài)性:應(yīng)變量y是服從正態(tài)分布的隨機(jī)變量;⑷方差齊:給定x后,應(yīng)變量y的方差相等。 87.等級(jí)相關(guān)應(yīng)用范圍:⑴不服從雙變量正態(tài)分布或偏態(tài)分布;⑵總體分布類型未知;⑶原始數(shù)據(jù)是等級(jí)變量。 88.對(duì)同一資料,相關(guān)系數(shù)t檢驗(yàn)與回歸系數(shù)t 檢驗(yàn)效果相同。 89.決定系數(shù)r2決定回歸效果的好壞,r2越接近1,回歸的效果越好。 90.直線回歸方程:y=a+bx其中a為回歸直線在Y軸上的截距:⑴a>0表示直線與縱軸的交點(diǎn)在原點(diǎn)的上方;⑵a<0則交點(diǎn)在原點(diǎn)的下方;⑶a=0則回歸直線通過原點(diǎn);b為回歸系數(shù),即直線的斜率:⑴b>0表示直線從左下方走向右上方,即 y隨 x的增大而增大;⑵b<0表示直線從左上方走向右下方,即 y隨 x的增大而減??;⑶b=0表示直線與 x軸平行,即x與 y無直線關(guān)系;⑷b的統(tǒng)計(jì)學(xué)意義是x每增(減)一個(gè)單位,y平均改變b個(gè)單位。 91.實(shí)驗(yàn)設(shè)計(jì)的特點(diǎn):⑴研究者能人為設(shè)置處理因素;⑵受試對(duì)象接受何種處理因素或水平是由隨機(jī)分配而定的。 92.醫(yī)學(xué)實(shí)驗(yàn)設(shè)計(jì)包括處理因素或研究因素,受試對(duì)象和實(shí)驗(yàn)效應(yīng)三個(gè)基本要素。 93.常用對(duì)照的形式為空白對(duì)照、安慰劑對(duì)照、實(shí)驗(yàn)對(duì)照、標(biāo)準(zhǔn)對(duì)照、自身對(duì)照、相互對(duì)照及歷史對(duì)照等。 94.隨機(jī)化包括隨機(jī)抽樣和隨機(jī)分組,隨機(jī)抽樣指保證總體中的每一個(gè)個(gè)體都有同等的機(jī)會(huì)被抽出來作為樣本;隨機(jī)分組指保證樣本中的每一個(gè)個(gè)體都有同等的機(jī)會(huì)被分配到實(shí)驗(yàn)組或?qū)φ战M。 95.實(shí)驗(yàn)設(shè)計(jì)的基本原則:對(duì)照、隨機(jī)、重復(fù)、均衡。 96.重復(fù)是指研究樣本要有一定的數(shù)量,即在保證研究結(jié)果具有一定可靠性的條件下,確定最少的樣本例數(shù)。 97.均衡原則又稱齊同對(duì)比原則,指實(shí)驗(yàn)組和對(duì)照組或各實(shí)驗(yàn)組之間,除了處理因素以外,其他一切條件應(yīng)盡可能相同或一致。 98.完全隨機(jī)設(shè)計(jì)又稱隨機(jī)對(duì)照試驗(yàn),屬于單因素研究設(shè)計(jì)。 99.樣本含量估計(jì)需要確定四個(gè)基本因素:α、1-β、σ、δ。α、δ與樣本含量成反比,σ(或s)、1-β與樣本含量成正比。 100.劑量反應(yīng)是實(shí)驗(yàn)物質(zhì)引起實(shí)驗(yàn)動(dòng)物總體中產(chǎn)生某種反應(yīng)的劑量。 簡述標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤的聯(lián)系與區(qū)別? 標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)誤都是變異指標(biāo),但它們之間有區(qū)別,也有聯(lián)系。區(qū)別: ①概念不同;標(biāo)準(zhǔn)差是描述觀察值(個(gè)體值)之間的變異程度;標(biāo)準(zhǔn)誤是描述樣本均數(shù)的抽樣誤差;②用途不同;標(biāo)準(zhǔn)差常用于表示變量值對(duì)均數(shù)波動(dòng)的大小,與均數(shù)結(jié)合估計(jì)參考值范圍,計(jì)算變異系數(shù),計(jì)算標(biāo)準(zhǔn)誤等。標(biāo)準(zhǔn)誤常用于表示樣本統(tǒng)計(jì)量(樣本均數(shù),樣本率)對(duì)總體參數(shù)(總體均數(shù),總體率)的波動(dòng)情況,用于估計(jì)參數(shù)的可信區(qū)間,進(jìn)行假設(shè)檢驗(yàn)等。③它們與樣本含量的關(guān)系不同: 當(dāng)樣本含量 n 足夠大時(shí),標(biāo)準(zhǔn)差趨向穩(wěn)定;而標(biāo)準(zhǔn)誤隨n的增大而減小,甚至趨于0。聯(lián)系: 標(biāo)準(zhǔn)差,標(biāo)準(zhǔn)誤均為變異指標(biāo),如果把樣本均數(shù)看作一個(gè)變量值,則樣本均數(shù)的標(biāo)準(zhǔn)誤可稱為樣本均數(shù)的標(biāo)準(zhǔn)差;當(dāng)樣本含量不變時(shí),標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差成正比;兩者均可與均數(shù)結(jié)合運(yùn)用,但描述的內(nèi)容各不相同。 試述正態(tài)分布的特征? 服從正態(tài)分布的變量的頻數(shù)分布由υ、σ 完全決定。 (1)υ 是正態(tài)分布的位置參數(shù),描述正態(tài)分布的集中趨勢位置。正態(tài)分布以 x =υ為對(duì) 稱軸,左右完全對(duì)稱。正態(tài)分布的均數(shù)、中位數(shù)、眾數(shù)相同,均等于υ。 (2)σ描述正態(tài)分布資料數(shù)據(jù)分布的離散程度,σ越大,數(shù)據(jù)分布越分散,σ越小,數(shù) 據(jù)分布越集中。σ也稱為是正態(tài)分布的形狀參數(shù),σ越大,曲線越扁平,反之,σ越小,曲 線越瘦高。 簡述直線相關(guān)與直線回歸的聯(lián)系與區(qū)別? 答: 1、區(qū)別: ①在資料要求上,回歸要求因變量y 服從正態(tài)分布,自變量x是可以精確測量和嚴(yán)格控制的變量,一般稱為Ⅰ型回歸;相關(guān)要求兩個(gè)變量x、y服從雙變量正態(tài)分布。這種資料若進(jìn)行回歸分析稱為Ⅱ型回歸。②在應(yīng)用上,說明兩變量間依存變化的數(shù)量關(guān)系用回歸,說明變量間的相關(guān)關(guān)系用相關(guān)。 2、聯(lián)系: ①對(duì)一組數(shù)據(jù)若同時(shí)計(jì)算r與b,則它們的正負(fù)號(hào)是一致的;②r與b的假設(shè)檢驗(yàn)是等價(jià)的,即對(duì)同一樣本,二者的t值相等。③可用回歸解釋相關(guān)。 .簡述假設(shè)檢驗(yàn)的基本步驟及其兩類錯(cuò)誤 ① 建立假設(shè):包括: H0,稱無效假設(shè);H1: 稱備擇假設(shè);② 確定檢驗(yàn)水準(zhǔn):檢驗(yàn)水準(zhǔn)用α表示,α一般取0.05;③ 計(jì)算檢驗(yàn)統(tǒng)計(jì)量:根據(jù)不同的檢驗(yàn)方法,使用特定的公式計(jì)算;④確定P值:通過統(tǒng)計(jì)量及相應(yīng)的界值表來確定P值;⑤推斷結(jié)論:如P>α,則接受H0,差別無統(tǒng)計(jì)學(xué)意義;如P≤α,則拒絕H0,差別有統(tǒng)計(jì)學(xué)意義。Ⅰ型錯(cuò)誤又稱第一類錯(cuò)誤(type Ⅰ error):拒絕了實(shí)際上成立的的錯(cuò)誤,其概率通常用,為“棄真”,表示。Ⅱ型錯(cuò)誤又稱第二類錯(cuò)誤(type Ⅱ error):不拒絕實(shí)際上不成立的表示。為“存?zhèn)巍钡腻e(cuò)誤,其概率通常用 3.簡述標(biāo)準(zhǔn)差的意義和用途? 標(biāo)準(zhǔn)差是描述變量值離散程度常用的指標(biāo),主要用途如下: ①描述變量值的離散程度。兩組同類資料(總體或樣本)均數(shù)相近,標(biāo)準(zhǔn)差大,說明變量值的變異度較大,即各變量值較分散,因而均數(shù)代表性較差;反之,標(biāo)準(zhǔn)差較小,說明變量異度較小,各變量值較集中在均數(shù)周圍,因而均數(shù)的代表性較好。②結(jié)合均數(shù)描述正態(tài)分布特征;③結(jié)合均數(shù)計(jì)算變異系數(shù)CV;④結(jié)合樣本含量計(jì)算標(biāo)準(zhǔn)誤。 抽樣誤差:由于總體中存在個(gè)體變異,隨機(jī)抽樣所得樣本僅僅是總體的一部分,從而造成樣本統(tǒng)計(jì)量與總體參數(shù)之間的差異,稱抽樣誤差。 第一類錯(cuò)誤:拒絕了實(shí)際上是成立的H0所產(chǎn)生的錯(cuò)誤,即“棄真”,其概率大小為α。 第二類錯(cuò)誤:接受了實(shí)際上不成立的H0所產(chǎn)生的錯(cuò)誤,即“存?zhèn)巍?,其概率大小用β表示,一般β是未知的,其大小與α有關(guān)。 構(gòu)成比: 又稱構(gòu)成指標(biāo)。它說明一事物內(nèi)部各組成部分所占的比重或分布。 構(gòu)成比=(某一組成部分的觀察單位數(shù)/同一事物各組成的觀察單位總數(shù))×100%。 率:又稱頻率指標(biāo)。它說明某現(xiàn)象發(fā)生的頻率或強(qiáng)度。 率=(發(fā)生某現(xiàn)象的觀察單位數(shù)/可能發(fā)生該現(xiàn)象的觀察單位總數(shù))×K。 率的標(biāo)準(zhǔn)化法: 采用一個(gè)共同的內(nèi)部構(gòu)成標(biāo)準(zhǔn),把兩個(gè)或多個(gè)樣本的不同內(nèi)部構(gòu)成調(diào)整為共同的內(nèi)部構(gòu)成標(biāo)準(zhǔn), 以消除因內(nèi)部構(gòu)成不同對(duì)總率產(chǎn)生的影響,使算得的標(biāo)準(zhǔn)化率具有可比性 計(jì)量資料: 用定量方法對(duì)每個(gè)觀察對(duì)象測定某項(xiàng)指標(biāo)量的大小,所得的資料稱為計(jì)量資料。 計(jì)數(shù)資料: 先將觀察單位按某種屬性或類別分組,然后清點(diǎn)各組的觀察單位數(shù)所得資料,稱為計(jì)數(shù)資料。等級(jí)資料: 將觀察單位按某種屬性的不同程度分組,所得各組的觀察單位數(shù),稱為等級(jí)資料。 小概率事件:我們把概率很接近于0(即在大量重復(fù)試驗(yàn)中出現(xiàn)的頻率非常低)的事件稱為小概率事件。P值:P 值即概率,反映某一事件發(fā)生的可能性大小。統(tǒng)計(jì)學(xué)根據(jù)顯著性檢驗(yàn)方法所得到的P 值反應(yīng)結(jié)果真實(shí)程度,一般以P ≤ 0.05 認(rèn)為有統(tǒng)計(jì)學(xué)意義,P ≤0.01 認(rèn)為有高度統(tǒng)計(jì)學(xué)意義,其含義是樣本間的差異由抽樣誤差所致的概率等于或小于0.05 或0.01。 描述數(shù)據(jù)分布集中趨勢的指標(biāo) 算術(shù)均數(shù)、幾何均數(shù)、中位數(shù)。 描述數(shù)據(jù)分布離散程度的指標(biāo) 極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差、變異系數(shù)。 同質(zhì):影響研究指標(biāo)的主要因素易控制的因素基本上相同。 可信區(qū)間:在參數(shù)估計(jì)時(shí),按一定可信度估計(jì)所得的總體參數(shù)所在的范圍。 率:又稱頻率指標(biāo)。它說明某現(xiàn)象發(fā)生的頻率或強(qiáng)度。 非參數(shù)檢驗(yàn):在統(tǒng)計(jì)推斷中,不依賴于總體的分布形式, 直接對(duì)總體分布位置是否相同進(jìn)行檢驗(yàn)的方法相關(guān)系數(shù): 說明兩變量間相關(guān)關(guān)系的密切程度與相關(guān)方向的指標(biāo),用r表示。 回歸系數(shù)b: 即回歸直線的斜率,它表示當(dāng)X變動(dòng)一個(gè)單位時(shí),Y平均改變b個(gè)單位。 偏回歸系數(shù)bi: 在其它自變量保持恒定時(shí),Xi每增(減)一個(gè)單位時(shí)y平均改變bi個(gè)單位。 決定系數(shù): 相關(guān)系數(shù)或復(fù)相關(guān)系數(shù)的平方,即r或R。它表明由于引入有顯著性相關(guān)的自變量,使總平方和減少的部分,r或R越接近1, 說明引入相關(guān)變量的效果越好 醫(yī)學(xué)參考值范圍:指絕大多數(shù)正常人的解剖、生理、生化、免疫及組織代謝產(chǎn)物的含量等各種波動(dòng)范圍。2222 醫(yī)學(xué)統(tǒng)計(jì)學(xué) 簡答題 1.隨機(jī)區(qū)組方差分析的填表(需要自己畫表)。 2.兩樣本均數(shù)比較時(shí),為何要做統(tǒng)計(jì)檢驗(yàn)。 3.什么是率的標(biāo)準(zhǔn)化?如何選取標(biāo)準(zhǔn)構(gòu)成比? 4.在比較樣本均數(shù)與總體均數(shù),兩樣本均數(shù)比較時(shí),可信區(qū)間與t檢驗(yàn)的區(qū)別關(guān)系。 5.什么是兩類錯(cuò)誤?請(qǐng)說明其含義和如何控制錯(cuò)誤。 6.兩個(gè)樣本率為什么要做統(tǒng)計(jì)檢驗(yàn)。 7.列方差分析表。 8.醫(yī)學(xué)參考值有哪些方法?及需滿足什么條件? 9.以t檢驗(yàn)和秩和檢驗(yàn)說明參數(shù)檢驗(yàn)與非參數(shù)檢驗(yàn)的優(yōu)缺點(diǎn)。 10..線性相關(guān)與回歸的區(qū)別與聯(lián)系。第四篇:醫(yī)學(xué)統(tǒng)計(jì)學(xué)重點(diǎn)總結(jié)
第五篇:醫(yī)學(xué)統(tǒng)計(jì)學(xué)大題總結(jié)