第一篇:醫(yī)學統(tǒng)計學重點總結(jié)
簡述標準差與標準誤的聯(lián)系與區(qū)別?
標準差和標準誤都是變異指標,但它們之間有區(qū)別,也有聯(lián)系。區(qū)別: ①概念不同;標準差是描述觀察值(個體值)之間的變異程度;標準誤是描述樣本均數(shù)的抽樣誤差;②用途不同;標準差常用于表示變量值對均數(shù)波動的大小,與均數(shù)結(jié)合估計參考值范圍,計算變異系數(shù),計算標準誤等。標準誤常用于表示樣本統(tǒng)計量(樣本均數(shù),樣本率)對總體參數(shù)(總體均數(shù),總體率)的波動情況,用于估計參數(shù)的可信區(qū)間,進行假設(shè)檢驗等。③它們與樣本含量的關(guān)系不同: 當樣本含量 n 足夠大時,標準差趨向穩(wěn)定;而標準誤隨n的增大而減小,甚至趨于0。聯(lián)系: 標準差,標準誤均為變異指標,如果把樣本均數(shù)看作一個變量值,則樣本均數(shù)的標準誤可稱為樣本均數(shù)的標準差;當樣本含量不變時,標準誤與標準差成正比;兩者均可與均數(shù)結(jié)合運用,但描述的內(nèi)容各不相同。
試述正態(tài)分布的特征?
服從正態(tài)分布的變量的頻數(shù)分布由υ、σ 完全決定。
(1)υ 是正態(tài)分布的位置參數(shù),描述正態(tài)分布的集中趨勢位置。正態(tài)分布以 x =υ為對
稱軸,左右完全對稱。正態(tài)分布的均數(shù)、中位數(shù)、眾數(shù)相同,均等于υ。
(2)σ描述正態(tài)分布資料數(shù)據(jù)分布的離散程度,σ越大,數(shù)據(jù)分布越分散,σ越小,數(shù)
據(jù)分布越集中。σ也稱為是正態(tài)分布的形狀參數(shù),σ越大,曲線越扁平,反之,σ越小,曲
線越瘦高。
簡述直線相關(guān)與直線回歸的聯(lián)系與區(qū)別?
答:
1、區(qū)別: ①在資料要求上,回歸要求因變量y 服從正態(tài)分布,自變量x是可以精確測量和嚴格控制的變量,一般稱為Ⅰ型回歸;相關(guān)要求兩個變量x、y服從雙變量正態(tài)分布。這種資料若進行回歸分析稱為Ⅱ型回歸。②在應用上,說明兩變量間依存變化的數(shù)量關(guān)系用回歸,說明變量間的相關(guān)關(guān)系用相關(guān)。
2、聯(lián)系: ①對一組數(shù)據(jù)若同時計算r與b,則它們的正負號是一致的;②r與b的假設(shè)檢驗是等價的,即對同一樣本,二者的t值相等。③可用回歸解釋相關(guān)。
.簡述假設(shè)檢驗的基本步驟及其兩類錯誤
① 建立假設(shè):包括: H0,稱無效假設(shè);H1: 稱備擇假設(shè);② 確定檢驗水準:檢驗水準用α表示,α一般取0.05;③ 計算檢驗統(tǒng)計量:根據(jù)不同的檢驗方法,使用特定的公式計算;④確定P值:通過統(tǒng)計量及相應的界值表來確定P值;⑤推斷結(jié)論:如P>α,則接受H0,差別無統(tǒng)計學意義;如P≤α,則拒絕H0,差別有統(tǒng)計學意義。Ⅰ型錯誤又稱第一類錯誤(type Ⅰ error):拒絕了實際上成立的的錯誤,其概率通常用,為“棄真”,表示。Ⅱ型錯誤又稱第二類錯誤(type Ⅱ error):不拒絕實際上不成立的表示。為“存?zhèn)巍钡腻e誤,其概率通常用
3.簡述標準差的意義和用途?
標準差是描述變量值離散程度常用的指標,主要用途如下: ①描述變量值的離散程度。兩組同類資料(總體或樣本)均數(shù)相近,標準差大,說明變量值的變異度較大,即各變量值較分散,因而均數(shù)代表性較差;反之,標準差較小,說明變量異度較小,各變量值較集中在均數(shù)周圍,因而均數(shù)的代表性較好。②結(jié)合均數(shù)描述正態(tài)分布特征;③結(jié)合均數(shù)計算變異系數(shù)CV;④結(jié)合樣本含量計算標準誤。
抽樣誤差:由于總體中存在個體變異,隨機抽樣所得樣本僅僅是總體的一部分,從而造成樣本統(tǒng)計量與總體參數(shù)之間的差異,稱抽樣誤差。
第一類錯誤:拒絕了實際上是成立的H0所產(chǎn)生的錯誤,即“棄真”,其概率大小為α。
第二類錯誤:接受了實際上不成立的H0所產(chǎn)生的錯誤,即“存?zhèn)巍?,其概率大小用β表示,一般β是未知的,其大小與α有關(guān)。
構(gòu)成比: 又稱構(gòu)成指標。它說明一事物內(nèi)部各組成部分所占的比重或分布。
構(gòu)成比=(某一組成部分的觀察單位數(shù)/同一事物各組成的觀察單位總數(shù))×100%。
率:又稱頻率指標。它說明某現(xiàn)象發(fā)生的頻率或強度。
率=(發(fā)生某現(xiàn)象的觀察單位數(shù)/可能發(fā)生該現(xiàn)象的觀察單位總數(shù))×K。
率的標準化法: 采用一個共同的內(nèi)部構(gòu)成標準,把兩個或多個樣本的不同內(nèi)部構(gòu)成調(diào)整為共同的內(nèi)部構(gòu)成標準, 以消除因內(nèi)部構(gòu)成不同對總率產(chǎn)生的影響,使算得的標準化率具有可比性
計量資料: 用定量方法對每個觀察對象測定某項指標量的大小,所得的資料稱為計量資料。
計數(shù)資料: 先將觀察單位按某種屬性或類別分組,然后清點各組的觀察單位數(shù)所得資料,稱為計數(shù)資料。等級資料: 將觀察單位按某種屬性的不同程度分組,所得各組的觀察單位數(shù),稱為等級資料。
小概率事件:我們把概率很接近于0(即在大量重復試驗中出現(xiàn)的頻率非常低)的事件稱為小概率事件。P值:P 值即概率,反映某一事件發(fā)生的可能性大小。統(tǒng)計學根據(jù)顯著性檢驗方法所得到的P 值反應結(jié)果真實程度,一般以P ≤ 0.05 認為有統(tǒng)計學意義,P ≤0.01 認為有高度統(tǒng)計學意義,其含義是樣本間的差異由抽樣誤差所致的概率等于或小于0.05 或0.01。
描述數(shù)據(jù)分布集中趨勢的指標 算術(shù)均數(shù)、幾何均數(shù)、中位數(shù)。
描述數(shù)據(jù)分布離散程度的指標 極差、四分位數(shù)間距、方差、標準差、變異系數(shù)。
同質(zhì):影響研究指標的主要因素易控制的因素基本上相同。
可信區(qū)間:在參數(shù)估計時,按一定可信度估計所得的總體參數(shù)所在的范圍。
率:又稱頻率指標。它說明某現(xiàn)象發(fā)生的頻率或強度。
非參數(shù)檢驗:在統(tǒng)計推斷中,不依賴于總體的分布形式, 直接對總體分布位置是否相同進行檢驗的方法相關(guān)系數(shù): 說明兩變量間相關(guān)關(guān)系的密切程度與相關(guān)方向的指標,用r表示。
回歸系數(shù)b: 即回歸直線的斜率,它表示當X變動一個單位時,Y平均改變b個單位。
偏回歸系數(shù)bi: 在其它自變量保持恒定時,Xi每增(減)一個單位時y平均改變bi個單位。
決定系數(shù): 相關(guān)系數(shù)或復相關(guān)系數(shù)的平方,即r或R。它表明由于引入有顯著性相關(guān)的自變量,使總平方和減少的部分,r或R越接近1, 說明引入相關(guān)變量的效果越好
醫(yī)學參考值范圍:指絕大多數(shù)正常人的解剖、生理、生化、免疫及組織代謝產(chǎn)物的含量等各種波動范圍。2222
第二篇:醫(yī)學統(tǒng)計學_總結(jié)_重點_筆記_復習資料
第一章
2選1 總體:總體(population)是根據(jù)研究目的確定的同質(zhì)觀察單位(研究對象)的全體,實際上是某一變量值的集合??煞譃橛邢蘅傮w和無限總體。總體中的所有單位都能夠標識者為有限總體,反之為無限總體。
總體population根據(jù)研究目的而確定的同質(zhì)觀察單位的全體。
樣本:從總體中隨機抽取部分觀察單位,其測量結(jié)果的集合稱為樣本(sample)。樣本應具有代表性。所謂有代表性的樣本,是指用隨機抽樣方法獲得的樣本。
樣本sample從總體中隨機抽得的部分觀察單位,其實測值的集合。
3選1 小概率事件:我們把概率很接近于0(即在大量重復試驗中出現(xiàn)的頻率非常低)的事件稱為小概率事件。
P值:P 值即概率,反映某一事件發(fā)生的可能性大小。統(tǒng)計學根據(jù)顯著性檢驗方法所得到的P 值反應結(jié)果真實程度,一般以P ≤ 0.05 認為有統(tǒng)計學意義,P ≤0.01 認為有高度統(tǒng)計學意義,其含義是樣本間的差異由抽樣誤差所致的概率等于或小于0.05 或0.01。P值是:
1)一種概率,一種在原假設(shè)為真的前提下出現(xiàn)觀察樣本以及更極端情況的概率。2)拒絕原假設(shè)的最小顯著性水平。3)觀察到的(實例的)顯著性水平。
4)表示對原假設(shè)的支持程度,是用于確定是否應該拒絕原假設(shè)的另一種方法。
小概率原理:一個事件如果發(fā)生的概率很小的話,那么可認為它在一次實際實驗中是不會發(fā)生的,數(shù)學上稱之小概率原理,也稱為小概率的實際不可能性原理。統(tǒng)計學中,一般認為等于或小于0.05或0.01的概率為小概率。
資料的類型(3選1)
(1)計量資料:對每個觀察單位用定量的方法測定某項指標量的大小,所得的資料稱為計量資料(measurement data)。計量資料亦稱定量資料、測量資料。.其變量值是定量的,表現(xiàn)為數(shù)值大小,一般有度量衡單位。如某一患者的身高(cm)、體重(kg)、紅細胞計數(shù)(10/L)、脈搏(次/分)、血壓(KPa)等。
計量資料measurement data定量資料quantitative data數(shù)值變量資料numerical variable 為觀測每個觀察單位某項指標的大小,而獲得的資料。
(2)計數(shù)資料:將觀察單位按某種屬性或類別分組,所得的觀察單位數(shù)稱為計數(shù)資料(count data)。計數(shù)資料亦稱定性資料或分類資料。其觀察值是定性的,表現(xiàn)為互不相容的類別或?qū)傩?。如調(diào)查某地某時的男、女性人口數(shù);治療一批患者,其治療效果為有效、無效的人數(shù);調(diào)查一批少數(shù)民族居民的A、B、AB、O 四種血型的人數(shù)等。
計量資料enumeration data定性資料qualitative data無序分類變量資料unordered categorical variable 名義變量資料nominal variable 為將觀察單位按某種屬性或類別分組計數(shù),分組匯總各組觀察單位數(shù)后而得到的資料。
(3)等級資料:將觀察單位按測量結(jié)果的某種屬性的不同程度分組,所得各組的觀察單位數(shù),稱為等級資料(ordinal data)。等級資料又稱有序變量。如患者的治療結(jié)果可分為治愈、好轉(zhuǎn)、有效、無效或死亡,各種結(jié)果既是分類結(jié)果,又有順序和等級差別,但這種差別卻不能準確測量;一批腎病患者尿蛋白含量的測定結(jié)果分為 +、++、+++等。12等級資料ranked data半定量資料semi-quantitative data有序分類變量ordinal categorical variable資料
為將觀察單位按某種屬性的不同程度分成等級后分組計數(shù),分類匯總各組觀察單位后而得到的資料。
等級資料與計數(shù)資料不同:屬性分組有程度差別,各組按大小順序排列。
等級資料與計量資料不同:每個觀察單位未確切定量,故亦稱為半計量資料。兩種誤差(2選1)
抽樣誤差(sampling error)由于抽樣而引起的總體指標(參數(shù))與樣本指標(統(tǒng)計數(shù))之間的差異。抽樣誤差是由個體變異或其它隨機因素造成的,是不可避免的,但誤差分布有規(guī)律可循,可進行估計和分析。
系統(tǒng)誤差(systematic error):由于測量儀器結(jié)構(gòu)本身的問題、刻度不準確或測量環(huán)境改變等原因,在多次測量時所產(chǎn)生的,總是偏大或總是偏小的誤差,稱為系統(tǒng)誤差。它帶有規(guī)律性,經(jīng)過校正和處理,通??梢詼p少或消除。
統(tǒng)計的步驟(考填空題,四個空)
統(tǒng)計工作的步驟
1.設(shè)計:設(shè)計內(nèi)容包括資料收集、整理和分析全過程總的設(shè)想和安排。設(shè)計是整個研究中最關(guān)鍵的一環(huán),是今后工作應遵循的依據(jù)。
2.收集資料:應采取措施使能取得準確可靠的原始數(shù)據(jù)。
3.整理資料:簡化數(shù)據(jù),使其系統(tǒng)化、條理化,便于進一步分析計算。
4.分析資料:計算有關(guān)指標,反映事物的綜合特征,闡明事物的內(nèi)在聯(lián)系和規(guī)律。分析資料包括統(tǒng)計描述和統(tǒng)計推斷。
實驗設(shè)計的基本原則(考填空題,三個空)隨機化原則、對照的原則、重復的原則。2選1 參數(shù):參數(shù)(paramater)是指總體的統(tǒng)計指標,如總體均數(shù)、總體率等。總體參數(shù)
是固定的常數(shù)。多數(shù)情況下,總體參數(shù)是不易知道的,但可通過隨機抽樣抽取有代表性的樣
本,用算得的樣本統(tǒng)計量估計未知的總體參數(shù)。
統(tǒng)計量:統(tǒng)計量(statistic)是指樣本的統(tǒng)計指標,如樣本均數(shù)、樣本率等。樣本
統(tǒng)計量可用來估計總體參數(shù)??傮w參數(shù)是固定的常數(shù),統(tǒng)計量是在總體參數(shù)附近波動的隨機
變量。
第二章
頻數(shù)表的制作步驟以及頻數(shù)分布表的用途(問答題)頻數(shù)分布表的編制步驟:
例:某市1982年50名7歲男童的身高(cm)資料如下,試編制頻數(shù)表。
114.4 117.2 122.7 124.0 114.0 110.8 118.2 116.7 118.9 118.1 123.5 118.3 120.3 116.2 114.7 119.7 114.8 119.6 113.2 120.0 119.8 116.8 119.8 122.5 119.7 120.7 114.3 122.0 117.0 122.5 119.7 124.9 126.1 120.0 124.6 120.0 121.5 114.3 124.1 117.2 120.2 120.8 126.6 121.5 126.1 117.7 124.1 128.3 121.8 118.7
1、找出觀察值中的最大值(largest value)、最小值(smallest value),求極差(range)。
極差等于最大值減最小值。本例最大值=128.3,最小值=110.8,則極差=128.3-110.8=17.5(cm)
2、確定分組數(shù)和組距(class interval)。
組數(shù)的多少是根據(jù)例數(shù)的多少來確定的,以能夠反映出頻數(shù)分布的特征為原則,一般分10—15組。組距為相鄰兩組的間隔,組距=極差/組數(shù)。本例擬分10組,則組距=17.5/10=1.75≈2,為劃記方便,可取稍大或稍小的數(shù)(當然本例組距也可取1.5)。
3、確定組段。
第一組段包括要最小值,取較最小值稍小且劃分方便的數(shù),本例取“110~”。最后組段包括最大值并寫出其上限值。
4、劃記。
將各觀察值以劃“正”字的方法,一筆代表一例,劃在相應組段中。例如第一個數(shù)l14.4應在組段“114~”處劃,第二個數(shù)117.2應在“116~”處劃,以此類推。
5、統(tǒng)計各組段的頻數(shù)。全部數(shù)據(jù)劃記完后,清點各組段的人數(shù)。
根據(jù)編制出的頻數(shù)表即可了解該數(shù)值變量資料的頻數(shù)分布特征。頻數(shù)分布表的用途
1、描述資料的分布特征和分布類型。
頻數(shù)分布有兩個重要特征:集中趨勢和離散趨勢。大部分觀察值向某一數(shù)值集中的趨勢稱為集中趨勢,常用平均數(shù)指標來表示,各觀察值之間大小參差不齊。頻數(shù)由中央位置向兩側(cè)逐漸減少,稱離散趨勢,是個體差異所致,可用一系列的變異指標來反映。
2、便于進一步計算有關(guān)指標或進行統(tǒng)計分析。當數(shù)據(jù)較多且需手工計算時,常先編制頻數(shù)表,再進行統(tǒng)計計算。
3、發(fā)現(xiàn)特大、特小的可疑值。
如果頻數(shù)表的一端或兩端出現(xiàn)連續(xù)幾個組段的頻數(shù)為零后,又出現(xiàn)少數(shù)幾個特大值或特小值,使人懷疑其是否準確,需進一步檢查和核對并做相應處理。
4、據(jù)此繪制頻數(shù)分布圖。
描述數(shù)據(jù)分布集中趨勢的指標和描述數(shù)據(jù)分布離散程度的指標(考選擇或者填空)
2. 描述數(shù)據(jù)分布集中趨勢的指標
算術(shù)均數(shù)、幾何均數(shù)、中位數(shù)。
3. 描述數(shù)據(jù)分布離散程度的指標
極差、四分位數(shù)間距、方差、標準差、變異系數(shù)。正態(tài)分布的特征(考選擇題 υ、σ對圖形的影響)
服從正態(tài)分布的變量的頻數(shù)分布由υ、σ 完全決定。
(1)υ 是正態(tài)分布的位置參數(shù),描述正態(tài)分布的集中趨勢位置。正態(tài)分布以 x =υ為對
稱軸,左右完全對稱。正態(tài)分布的均數(shù)、中位數(shù)、眾數(shù)相同,均等于υ。(2)σ描述正態(tài)分布資料數(shù)據(jù)分布的離散程度,σ越大,數(shù)據(jù)分布越分散,σ越小,數(shù) 據(jù)分布越集中。σ也稱為是正態(tài)分布的形狀參數(shù),σ越大,曲線越扁平,反之,σ越小,曲
線越瘦高。
標準正態(tài)分布(填空)
1.標準正態(tài)分布是一種特殊的正態(tài)分布,標準正態(tài)分布的υ ?常用u(或Z)表示服從標準正態(tài)分布的變量,記為υ~N(0,1)。
正態(tài)分布的應用(簡答)
某些醫(yī)學現(xiàn)象,如同質(zhì)群體的身高、紅細胞數(shù)、血紅蛋白量,以及實驗中的隨機誤差,呈現(xiàn)為正態(tài)或近似正態(tài)分布;有些指標(變量)雖服從偏態(tài)分布,但經(jīng)數(shù)據(jù)轉(zhuǎn)換后的新變量可服從正態(tài)或近似正態(tài)分布,可按正態(tài)分布規(guī)律處理。其中經(jīng)對數(shù)轉(zhuǎn)換后服從正態(tài)分布的指標,被稱為服從對數(shù)正態(tài)分布。
1.估計頻數(shù)分布 一個服從正態(tài)分布的變量只要知道其均數(shù)與標準差就可根據(jù)公式即可估計任意取值范圍內(nèi)頻數(shù)比例。
2.制定參考值范圍
(1)正態(tài)分布法 適用于服從正態(tài)(或近似正態(tài))分布指標以及可以通過轉(zhuǎn)換后服從正態(tài)分布的指標。
(2)百分位數(shù)法 常用于偏態(tài)分布的指標。表3-1中兩種方法的單雙側(cè)界值都應熟練掌握。
3.質(zhì)量控制:為了控制實驗中的測量(或?qū)嶒灒┱`差,常以 作為上、下警戒值,以 作為上、下控制值。這樣做的依據(jù)是:正常情況下測量(或?qū)嶒灒┱`差服從正態(tài)分布。4.正態(tài)分布是許多統(tǒng)計方法的理論基礎(chǔ)。檢驗、方差分析、相關(guān)和回歸分析等多種統(tǒng)計方法均要求分析的指標服從正態(tài)分布。許多統(tǒng)計方法雖然不要求分析指標服從正態(tài)分布,但相應的統(tǒng)計量在大樣本時近似正態(tài)分布,因而大樣本時這些統(tǒng)計推斷方法也是以正態(tài)分布為理論基礎(chǔ)的。
醫(yī)學參考值范圍的制定(計算題)
確定參考值范圍的單雙側(cè):一般生理物質(zhì)指標多為雙側(cè)、毒物指標則多為單側(cè)。確定百分位點:一般取95%或99%。
20,σ2 ?1,通
例題
某市 20 歲男學生 160 人的脈搏數(shù)(次/分鐘),經(jīng)正態(tài)性檢驗服從正態(tài)分布。求得76.10,S =9.32。試估計脈搏數(shù)的95%、99%參考值范圍。
解:脈搏數(shù)的95%正常值范圍為:脈搏數(shù)的99%正常值范圍為:
±1.96 S=76.10 ± 1.96(9.32)=57.83~94.37 ±2.58 S =76.10 ± 2.58(9.32)=52.05~100.37
第三章
= 標準誤的概念,計算公式。標準誤:抽樣研究中,樣本統(tǒng)計量與總體參數(shù)間的差別稱為抽樣誤差(sampling error)。統(tǒng)計上用標準誤(standard error,SE)來衡量抽樣誤差的大小,即樣本均數(shù)的標準差,是描述均數(shù)抽樣分布的離散程度及衡量均數(shù)抽樣誤差大小的尺度。
t分布的圖形特征及其與正態(tài)分布的區(qū)別(簡答)t分布的圖形特征
1.以0為中心,左右對稱的單峰分布;
2.t分布是一簇曲線,其形態(tài)變化與n(確切地說與自由度ν)大小有關(guān)。自由度ν越小,t分布曲線越低平;自由度ν越大,t分布曲線越接近標準正態(tài)分布(u分布)曲線。
t分布
對應于每一個自由度ν,就有一條t分布曲線,每條曲線都有其曲線下統(tǒng)計量t的分布規(guī)律,計算較復雜。
t 分布與正態(tài)分布比較的區(qū)別 t 分布與標準正態(tài)分布相比有以下特點:①都是單峰、對稱分布;②t 分布峰值較低,而尾部較高;③隨自由度增大,t 分布趨近與標準正態(tài)分布;當ν趨向∞,t 分布的極限分布是標準正態(tài)分布。
置信區(qū)間和參數(shù)估計(名解2選1)
置信區(qū)間:在統(tǒng)計學中,一個概率樣本的置信區(qū)間(Confidence interval)是對這個樣本的某個總體參數(shù)的區(qū)間估計。置信區(qū)間展現(xiàn)的是這個參數(shù)的真實值有一定概率落在測量結(jié)果的周圍的程度。給出的是被測量參數(shù)的測量值的可信程度。
1、對于具有特定的發(fā)生概率的隨機變量,其特定的價值區(qū)間------一個確定的數(shù)值范圍(“一個區(qū)間”)。
2、在一定置信水平時,以測量結(jié)果為中心,包括總體均值在內(nèi)的可信范圍。
3、該區(qū)間包含了參數(shù)θ真值的可信程度。
4、參數(shù)的置信區(qū)間可以通過點估計量構(gòu)造,也可以通過假設(shè)檢驗構(gòu)造。
參數(shù)估計:指用樣本指標值(統(tǒng)計量)估計總體指標值(參數(shù))。參數(shù)估計有兩種方法:點估計和區(qū)間估計。
可信區(qū)間與參考值范圍的不同點(簡答)
應注意:可信區(qū)間與參考值范圍的意義、計算公式和用途均不同。
1.從意義和用途來看
95%參考值范圍是指同質(zhì)總體內(nèi)包括95%個體值的估計范圍,而總體均數(shù)95%可信區(qū)間是指按95%可信度估計的總體均數(shù)的所在范圍。可信區(qū)間用于估計總體參數(shù),總體參數(shù)只有一個。參考值范圍用于估計變量值的分布范圍,變量值可能很多甚至無限。2.從計算公式看
若指標服從正態(tài)分布,95%參考值范圍的公式是:
±1.96s。
總體均數(shù)95%可信區(qū)間的公式是:。
前者用標準差,后者用標準誤。前者用1.96,后者用α為0.05,自由度為v的t界值。t檢驗的應用條件和類型(填空)
t檢驗的應用條件:要求各樣本來自相互獨立的正態(tài)總體且各總體方差齊。t檢驗的類型:單樣本t檢驗,獨立t檢驗,配對t檢驗
配對設(shè)計和完全隨機設(shè)計(名解2選1)
完全隨機設(shè)計(completely random design):完全隨機設(shè)計僅涉及一個處理因素(但可為多水平),故又稱單因素(one-way)設(shè)計。它是將受試對象按隨機化的方法分配到各個處理組中,觀察實驗效應,臨床試驗中的隨機對照試驗也屬于此類設(shè)計。
配對設(shè)計(paired design):是將受試對象按一定條件匹配成對,再隨機分配每對中的兩個受試對象到不同處理組。配對的因素是影響實驗效應的主要非處理兇素。
假設(shè)檢驗的基本求解步驟或者注意事項。(簡答2選1)
假設(shè)檢驗的基本步驟
1.建立假設(shè),確定檢驗水準α
假設(shè)有零假設(shè)(H0)和備擇假設(shè)(H1)兩個,零假設(shè)又叫作無效假設(shè)或檢驗假設(shè)。H0和H1的關(guān)系是互相對立的,如果拒絕H0,就要接受H1.根據(jù)備擇假設(shè)不同,假設(shè)檢驗有單、雙側(cè)檢驗兩種。檢驗水準用α表示,通常取0.05或0.10.檢驗水準說明了該檢驗犯第一類錯誤的概率。2.根據(jù)研究目的和設(shè)計類型選擇適合的檢驗方法
這里的檢驗方法,是指參數(shù)檢驗方法,有u檢驗、t檢驗和方差分析三種,對應于不同的檢驗公式。對雙樣本資料,要注意區(qū)分成組設(shè)計和配對設(shè)計的資料類型。如果資料里有“配成對子”字樣,或者是對同一對象用兩種方法來處理,一般就可以判定是配對設(shè)計資料。3.確定P值并作出統(tǒng)計結(jié)論
u檢驗得到的是u統(tǒng)計量或稱u值,t檢驗得到的是t統(tǒng)計量或稱t值。方差分析得到的是F統(tǒng)計量或稱F值。將求得的統(tǒng)計量絕對值與界值相比,可以確定P值。當α=0.05時,u值要和u界值1.96相比較,確定P值。如果u<1.96,則P>0.05.反之,如u>1.96,則P<0.05.t值 要和某自由度的t界值相比較,確定P值。如果t值<t界值,故P>0.05.反之,如t>t界值,則P<0.05.相同自由度的情況下,單側(cè)檢驗的t界值 要小于雙側(cè)檢驗的t界值,因此有可能出現(xiàn)算得的t值大于單側(cè)t界值,而小于雙側(cè)t界值的情況,即單側(cè)檢驗顯著,雙側(cè)檢驗未必就顯著,反之,雙側(cè)檢驗顯著,單側(cè)檢驗必然會顯著。即單側(cè)檢驗更容易出現(xiàn)陽性結(jié)論。
當P>0.05時,接受零假設(shè),認為差異無統(tǒng)計學意義,或者說二者不存在質(zhì)的區(qū)別。當P<0.05時,拒絕零假設(shè),接受備擇假設(shè),認為差異有統(tǒng) 計學意義,也可以理解為二者存在質(zhì)的區(qū)別。但即使檢驗結(jié)果是P<0.01甚至P<0.001,都不說明差異相差很大,只表示更有把握認為二者存在差異。
假設(shè)檢驗時應注意的事項
(一)要有嚴密的抽樣研究設(shè)計;樣本必須是從同質(zhì)總體中隨機抽取的;要保證組間的均衡性和資料的可比性。
(二)根據(jù)現(xiàn)有的資料的性質(zhì)、設(shè)計類型、樣本含量大小正確選用檢驗方法。
(三)對差別有無統(tǒng)計學意義的判斷不能絕對化,因檢驗水準只是人為規(guī)定的界限,是相對的。差別有統(tǒng)計學意義時,是指無效假設(shè)h0被接受的可能性只有5%或不到5%,甚至不到1%,根據(jù)小概率事件一次不可能拒h0,但尚不能排除有5%或1%出現(xiàn)的可能,所以可能產(chǎn)生第一類錯誤;同樣,若不拒絕h0,可能產(chǎn)生第二類錯誤。
(四)統(tǒng)計學上差別顯著與否,與實際意義是有區(qū)別的。如應用某藥治療高血壓,平均降低舒張壓0.5kpa,并得出差別有高度統(tǒng)計學意義的結(jié)論。從統(tǒng)計學角度,說明該藥有降壓作用,但實際上,降低0.5kpa是無臨床意義。因此要結(jié)合專業(yè)作出恰如其分的結(jié)論。
第一類錯誤與第二類錯誤(名解 2選1)
Ⅰ型錯誤又稱第一類錯誤(type Ⅰ error):拒絕了實際上成立的,為“棄真”的錯誤,其概率通常用表示??扇挝惨部扇‰p尾,假設(shè)檢驗時研究者可以根據(jù)需要確定值大小,一般規(guī)定=0.05或=0.01,其意義為:假設(shè)檢驗中如果拒絕Ⅰ型錯誤的概率為5%或1%,即100次拒絕
時,發(fā)生的結(jié)論中,平均有5次或1次是錯誤的。,為“存?zhèn)巍雹蛐湾e誤又稱第二類錯誤(type Ⅱ error):不拒絕實際上不成立的的錯誤,其概率通常用
表示。
只取單尾,假設(shè)檢驗時
值一般不知道,在一定情況下可以測算出,如已知兩總體的差值(如)、樣本含量和檢驗水準。以下圖說明兩類錯誤:
第四章
為什么等級資料不可用方差分析?資料不相互獨立
方差分析的基本思想 應用條件(簡答)
方差分析(analysis of variance,ANOVA)的基本思想就是根據(jù)資料的設(shè)計類型,即變異的不同來源將全部觀察值總的離均差平方和(sum of squares of deviations from mean,SS)和自由度分解為兩個或多個部分,除隨機誤差外,其余每個部分的變異可由某個因素的作用(或某幾個因素的交互作用)加以解釋,如各組均數(shù)的變異SS 組間可由處理因素的作用加以解釋。通過各變異來源的均方與誤差均方比值的大小,借助F 分布作出統(tǒng)計推斷,判斷各因素對各組均數(shù)有無影響。
方差分析的應用條件
(1)各樣本是相互獨立的隨機樣本,且來自正態(tài)分布總體。
(2)各樣本的總體方差相等,即方差齊性(homoscedasticity)。
第五章 分類資料的統(tǒng)計描述(幾個常用相對數(shù)指標 填空題)率(強度相對數(shù),頻率相對數(shù))、構(gòu)成比、相對比 應用相對數(shù)時應注意的問題(簡答題 六條)⑴ 計算相對數(shù)的分母一般不宜過小。⑵ 分析時不能以構(gòu)成比代替率。
⑶ 不能用構(gòu)成比的動態(tài)分析代替率的動態(tài)分析。
⑷ 對觀察單位數(shù)不等的幾個率,不能直接相加求其總率。⑸ 在比較相對數(shù)時應注意可比性。
⑹ 對樣本率(或構(gòu)成比)的比較應隨機抽樣,并做假設(shè)檢驗。率的標準化的基本思想,應注意的問題(分析題)
率的標準化的基本思想 :
要比較兩個總率時,發(fā)現(xiàn)兩組資料的內(nèi)部構(gòu)成(如年齡、性別構(gòu)成等)存在明顯不同,而且影響到了總率的結(jié)果,這時就不宜再直接比較總率,而應考慮采用標準化法。
標準化法的基本思想,就是采用統(tǒng)一的標準(統(tǒng)一的內(nèi)部構(gòu)成)計算出消除內(nèi)部構(gòu)成不同影響后的標準化率(調(diào)整率),然后再進行比較。
二、直接標準化法的計算方法
當已知所比較資料各組率Pi,可選用直接法計算標化率。
三、間接標準化死亡比的計算方法
當所比較的資料已知各自某現(xiàn)象總發(fā)生數(shù)r及各分組觀察單位數(shù)時,宜采用間接法計算標化率。
第六章
二項分布,Piosson分布 在什么條件下接近正態(tài)分布(選擇或填空)
第七章(考計算題)
配對與完全隨機設(shè)計下的四格表的計算 列四格表
公式選擇
給個例題把
為研究靜脈曲張是否與肥胖有關(guān),觀察 122 對同胞兄弟,每對同胞兄弟中有一個屬肥胖,另一個屬正常體重,記錄得靜脈曲張發(fā)生情況見表8-2,試分析之。
[評析]這是一個配對設(shè)計的資料,因此用配對
檢驗公式計算。
第八章
參數(shù)統(tǒng)計與非參數(shù)統(tǒng)計(名解 2選1)1. 參數(shù)統(tǒng)計
樣本所來自的總體分布具有某個已知的函數(shù)形式,而其中有的參數(shù)是未知的,統(tǒng)計分析的目的就是對這些未知的參數(shù)進行估計或檢驗。此類方法稱為參數(shù)統(tǒng)計。
2. 非參數(shù)統(tǒng)計
樣本所來自的總體分布難以用某種函數(shù)式來表達,還有一些資料的總體分布的函數(shù)式是未知的,只知道總體分布是連續(xù)型的或離散型的,解決這類問題的一種不依賴總體分布的具體形式的統(tǒng)計方法。由于這類方法不受總體參數(shù)的限制,故稱非參數(shù)統(tǒng)計法(non-parametric statistics),或稱為不拘分布(distribution-free statistics)的統(tǒng)計分析方法,又稱為無分布型式假定(assumption free statistics)的統(tǒng)計分析方法。它檢驗的是分布,而不是參數(shù)。非參數(shù)統(tǒng)計不需對總體分布(總體參數(shù))作出特殊假設(shè)。
非參數(shù)統(tǒng)計的特點和適用范圍(簡答)1.特點
(1)樣本所來自的總體的分布形式為任何形式,甚至是未知的,都能適用。(2)收集資料方便,可用“等級”或“符號”來評定觀察結(jié)果。
(3)多數(shù)非參數(shù)方法比較簡便,易于理解和掌握。
(4)缺點是損失信息量,適用于參數(shù)統(tǒng)計法的資料用非參數(shù)統(tǒng)計方法進行檢驗將降低檢驗效能。
2.適用范圍
(1)等級資料。
(2)偏態(tài)分布資料。當觀察資料呈偏態(tài)或極度偏態(tài)分布而又未作變量變換,或雖經(jīng)變量變換仍未達到正態(tài)或近似正態(tài)分布時,宜用非參數(shù)檢驗。
(3)各組離散程度相差懸殊,即方差明顯不齊,且不能變換達到齊性。(4)個別數(shù)據(jù)偏離過大,或資料為單側(cè)或雙側(cè)沒有上限或下限值。(5)分布類型不明。(6)初步分析。有些醫(yī)學資料由于統(tǒng)計工作量大,可采用非參數(shù)統(tǒng)計方法進行初步分析,挑選其中有意義者再進一步分析(包括參數(shù)統(tǒng)計內(nèi)容)。
(7)對于一些特殊情況,如從幾個總體所獲得的數(shù)據(jù),往往難以對其原有總體分布作出估計,在這種情況下可用非參數(shù)統(tǒng)計方法。
非參數(shù)檢驗的優(yōu)缺點:(簡答)
非參數(shù)統(tǒng)計與傳統(tǒng)的參數(shù)統(tǒng)計相比,有以下優(yōu)點:
1、非參數(shù)統(tǒng)計方法要求的假定條件比較少,因而它的適用范圍比較廣泛。
2、多數(shù)非參數(shù)統(tǒng)計方法要求的運算比較簡單,可以迅速完成計算取得結(jié)果,因而比較節(jié)約時間。
3、大多數(shù)非參數(shù)統(tǒng)計方法在直觀上比較容易理解,不需要太多的數(shù)學基礎(chǔ)知識和統(tǒng)計學知識。
4、大多數(shù)非參數(shù)統(tǒng)計方法可用來分析如象由等級構(gòu)成的數(shù)據(jù)資料,而對計量水準較低的數(shù)據(jù)資料,參數(shù)統(tǒng)計方法卻不適用。
5、當推論多達3個以上時,非參數(shù)統(tǒng)計方法尤具優(yōu)越性。
但非參數(shù)統(tǒng)計方法也有以下缺點:
1、由于方法簡單,用的計量水準較低,因此,如果能與參數(shù)統(tǒng)計方法同時使用時,就不如參數(shù)統(tǒng)計方法敏感。若為追求簡單而使用非參數(shù)統(tǒng)計方法,其檢驗功效就要差些。這就是說,在給定的顯著性水平下進行檢驗時,非參數(shù)統(tǒng)計方法與參數(shù)統(tǒng)計方法相比,第Ⅱ類錯誤的概率β要大些。
2、對于大樣本,如不采用適當?shù)慕疲嬎憧赡茏兊檬謴碗s。注 意: 凡符合或經(jīng)過變換后符合參數(shù)檢驗條件的資料,最好用參數(shù)檢驗。當資料不具備參數(shù)檢驗的條件時,非參數(shù)檢驗是一種有效的分析方法。
配對設(shè)計的符號秩和檢驗方法(簡答)(1)假設(shè):H0:差值總體中位數(shù)Md=0 H1:Md≠0 α =0.05(2)求差值
(3)編秩次:依差值的絕對值從小到大編秩次。編秩次時遇差數(shù)等于 0,舍去不計,同時樣本例數(shù)減1;遇絕對值相等差數(shù),符號相同順次編秩次,符號相反取平均秩次,且符號相反。
(4)求秩和并確定檢驗統(tǒng)計量:分別求出正負秩次之和,正秩和以 T+表示,負秩和的絕對值以T-表示。T+及T-之和應等于 n(n+1)/2,任取T+(或 T-)作檢驗統(tǒng)計量T。
(5)確定 P 值和作出推斷結(jié)論:當 n≤50 時,查 T 界值表,得出 P值。若檢驗統(tǒng)計量T值在上、下界值范圍內(nèi),其 P值大于表上方相應概率水平;若 T值在上、下界值上若范圍外,其 P值小于表上方相應概率水平。
第九章
線性相關(guān)系數(shù)(名解)
線性相關(guān)系數(shù):表示兩個變數(shù)線性相關(guān)方向及程度的統(tǒng)計數(shù)或參數(shù)。又叫直線相關(guān)系數(shù),簡稱相關(guān)系數(shù)。,|R|的極值為1,|R|越大(接近1),則直線關(guān)系越好。
線性相關(guān)系數(shù)取值范圍(填空)
-1≤r≤1 樣本相關(guān)系數(shù) r的假設(shè)檢驗(填空題)(1)r 界值表法;(2)t檢驗法。
線性相關(guān)或回歸應用應注意的問題(簡答)
⑴作回歸分析和相關(guān)分析時要有實際意義,不能把毫無關(guān)聯(lián)的兩種現(xiàn)象作回歸、相關(guān)分析,必須對兩種現(xiàn)象間的內(nèi)在聯(lián)系有所認識。
⑵在進行回歸分析和相關(guān)分析之前,應繪制散點圖。但觀察點的分布有直線趨勢時,才適宜作回歸、相關(guān)分析。如果散點圖呈明顯曲線趨勢,應使之直線化再行分析。散點圖還能提示資料有無可疑異常點。
⑶直線回歸方程的應用范圍一般以自變量的取值范圍為限。若無充分理由證明超過自變量取值范圍外還是直線,應避免外延。
⑷雙變量的小樣本經(jīng) t 檢驗只能推斷兩變量間有無直線關(guān)系,而不能推斷相關(guān)的緊密程度,要推斷相關(guān)的緊密程度,樣本含量必須很大。
⑸相關(guān)或回歸關(guān)系不一定是因果關(guān)系,也可能是伴隨關(guān)系,有相關(guān)或回歸關(guān)系不能證明事物間確有內(nèi)在聯(lián)系。
秩相關(guān)的應用適用范圍(簡答)
秩相關(guān),又稱等級相關(guān)(rank correlation),是用雙變量等級數(shù)據(jù)作直線相關(guān)分析,適用于下列資料:
⒈ 不服從雙變量正態(tài)分布而不宜作積差相關(guān)分析; ⒉ 總體分布型未知;
⒊ 用等級表示的原始數(shù)據(jù)。相關(guān)與回歸的區(qū)別與聯(lián)系(簡答)區(qū)別:?
1.意義 :相關(guān)反映兩變量的相互關(guān)系,即在兩個變量中,任何一個的變化都會引起另一個的變化,是一種雙向變化的關(guān)系。回歸是反映兩個變量的依存關(guān)系,一個變量的改變會引起另一個變量的變化,是一種單向的關(guān)系。
2.應用:研究兩個變量的相互關(guān)系用相關(guān)分析。研究兩個變量的依存關(guān)系用回歸分析。3.研究性質(zhì):相關(guān)是對兩個變量之間的關(guān)系進行描述,看兩個變量是否有關(guān),關(guān)系是否密切,關(guān)系的性質(zhì)是什么,是正相關(guān)還是負相關(guān)?;貧w是對兩個變量做定量描述,研究兩個變量的數(shù)量關(guān)系,已知一個變量值可以預測出另一個變量值,可以得到定量結(jié)果。
4.相關(guān)系數(shù)r與回歸系數(shù)b :r與b的絕對值反映的意義不同。r的絕對值越大,散點圖中的點越趨向于一條直線,表明兩變量的關(guān)系越密切,相關(guān)程度越高。b的絕對值越大,回歸直線越陡,說明當X變化一個單位時,Y的平均變化就越大。反之也是一樣。
聯(lián)系:
1.r與b值可相互換算; 2.r與b正負號一致;
3.r與b的假設(shè)檢驗等價;
4.回歸可解釋相關(guān)。相關(guān)系數(shù)的平方r2(又稱決定系數(shù))是回歸平方和與總的離均差平方和之比,故回歸平方和是引入相關(guān)變量后總平方和減少的部分。
回歸系數(shù)的估計原則:最小二乘(least squares)原則(填空)應用直線回歸時的注意事項(簡答)
應用直線回歸時的注意事項:
1.作回歸分析要有實際意義,不能把毫無關(guān)聯(lián)的兩種現(xiàn)象作回歸分析,必須對兩種現(xiàn)象間的內(nèi)在聯(lián)系有所認識。2.在進行直線回歸分析之前,應繪制散點圖,當觀察點的分布有直線趨勢時,才適宜作直線回歸分析,散點圖還能提示資料有無異常點。異常點的存在往往對方程中的系數(shù)(a、b)的估計產(chǎn)生較大影響。因此,需對異常點進行復查。
3.建立直線回歸方程后,要對系數(shù)進行假設(shè)檢驗,以確定回歸方程有無意義。
4.直線回歸方程的適用范圍一般以自變量的取值范圍為限,避免外延。獲得自變量值的手段也應與建立方程時相同。否則會產(chǎn)生較大偏差。
第三篇:醫(yī)學統(tǒng)計學總結(jié)
1、同一資料的標準差是否一定小于均數(shù)?
答:均數(shù)是描述定量資料集中趨勢的指標,而標準差是描述定量資料離散程度的指標,二者反映的是資料分布特征的兩個不同方面。
2、極差、四分位間距、標準差、變異系數(shù)的適用范圍有何異同?
答:這四個指標的相同點在于均用于描述計量資料的離散程度。不同點為:極差可用于各種分布的資料,一般常用于描述單峰對稱分布小樣本資料的變異程度,或用于初步了解資料的變異程度。若樣本含量相差較大,則不宜用極差來比較資料的離散程度。四分位間距:適用于描述偏態(tài)分布資料、兩端無確切值或分布不明確資料的離散程度。標準差常用于描述對稱分布,特別是正態(tài)分布或近似分布資料的離散程度。變異系數(shù)適用于比較計量單位不同或均數(shù)相差懸殊的幾組資料的離散程度。
3、x2檢驗用于什么?
答:x檢驗用于:推斷兩個及兩個以上總體率或構(gòu)成比是否有差別,兩個分類變量間有無相關(guān)關(guān)系,多個率的趨勢檢驗,以及兩個率的等效檢驗等。此外,也用于頻數(shù)分布的擬合優(yōu)度檢驗。
4、四格表的U檢驗和x2檢驗有何聯(lián)系?
答:(1)相同點:四格表的u檢驗的根據(jù)是正態(tài)近似原理(n足夠大,∏和1-∏均不太?。D苡盟母癖淼膗檢驗進行兩個率比較檢驗的資料,都可以用x檢驗。四格表的雙側(cè)u檢驗與x檢驗是完全等價的,兩個統(tǒng)計量的關(guān)系為u= x,u20.05/2= u20.05/1.u檢驗和卡方檢驗都存在連續(xù)性矯正問題(2)不同點:①正態(tài)分布可以確定單、雙側(cè)檢驗界值,滿足正態(tài)近似條件時,可以使用四格表的單側(cè)u檢驗。②滿足四格表u檢驗的資料,計算兩率之間的95%可信區(qū)間,尚可分析兩率之差有無實際意義。③x2檢驗還可以用于配對設(shè)計四格表,但這時推斷∏1,∏2是否有差別的x2公式不同。5.參數(shù)檢驗和非參數(shù)檢驗的區(qū)別何在?各有何優(yōu)缺點? 答:區(qū)別:參數(shù)檢驗,其應用條件是已知總體的分布類型,對總體參數(shù)進行估計或檢驗。非參數(shù)檢驗,不依賴總體分布的具體形式,目的在于檢驗總體分布是否不同。(2)參數(shù)檢驗優(yōu)點是符合應用條件時,檢驗效能較高。缺點是對資料要求嚴格,不能用于等級數(shù)據(jù)、一端或兩端有不確切數(shù)據(jù),此外,還要求資料的分布類型已知和總體方差齊等條件。非參數(shù)檢驗優(yōu)點是應用范圍廣,計算簡便,對資料的要求不高;缺點是若對符合參數(shù)檢驗條件的資料用非參數(shù)檢驗,則會降低檢驗效能。如需檢驗出同樣大小的差異,非參數(shù)檢驗往往需要更大的樣本含量。
6.對同一資料,又出自同一研究目的,用參數(shù)檢驗和非參數(shù)檢驗所得不一致時,宜以何者為準?答:兩者各有使用條件,究竟取哪種結(jié)論,要根據(jù)資料是否滿足該種檢驗方法的應用條件進行選擇。在符合參數(shù)檢驗的條件時,可接受參數(shù)檢驗的結(jié)論,而資料不符合參數(shù)檢驗的條件時,應以非參數(shù)檢驗的結(jié)論為佳。如總體分布為極度偏態(tài)或其他非正態(tài)分布,或者兩總體方差不齊時,此時宜采用秩和檢驗的結(jié)果。7.非參數(shù)檢驗適用于哪些情況?
答:①等級資料②偏態(tài)資料。當觀察資料成偏態(tài)或極度偏態(tài)而又未經(jīng)任何變量變換,或雖經(jīng)變量變換但仍未達到正態(tài)或近似正態(tài)分布時③總體分布類型未知的資料④要比較的各組資料方差不齊⑤一端或兩端有不確定數(shù)據(jù)。
8.兩樣本比較的秩和檢驗,當n1>n2>10時采用u檢驗,這時檢驗是屬于參數(shù)檢驗還是非參數(shù)檢驗?為什么?答:兩組比較的秩和檢驗,當n很大時,可利用秩和T的分布隨n增大漸進正態(tài)分布的性質(zhì),進行u檢驗,此時利用的并非原始數(shù)據(jù),而是經(jīng)秩變換后的數(shù)據(jù),故仍屬非參數(shù)檢驗。9.直線回歸分析中應注意哪些問題?
答:做回歸分析一定要有專業(yè)意義,不能將毫無聯(lián)系的兩個變量作直線回歸分析;回歸分析之前首先應繪制散點圖,考查x與y之間有無直線趨勢以及是否存在異常點;考慮是否滿足建立線性回歸模型的基本假定;直線回歸方程的應用與圖示一般以自變量x的取值范圍為限;兩變量的直線關(guān)系不一定是因果關(guān)系,也可能是伴隨關(guān)系。
10.簡述直線回歸與直線相關(guān)的區(qū)別與聯(lián)系。
答:區(qū)別:①資料要求不同:直線回歸中因變量y是來自正態(tài)總體的隨機變量,而r既可以是來自正態(tài)總體中的隨機變量,也可以是嚴密控制、精確測量的變量;相關(guān)分析則要求x,y是來自雙變量正態(tài)分布總體的隨機變量,②分析目的不同:直線回歸用于說明兩變量間依存變化的數(shù)量關(guān)系;直線相關(guān)用于說明變量間的直線相關(guān)關(guān)系。聯(lián)系:①方向一致:對一組數(shù)據(jù)計算,r與b,它們的正負號是一致的。②假設(shè)檢驗等價:對同一樣本r和b的假設(shè)檢驗得到的t值相等。③用回歸解釋相關(guān):由r2=SS回/SS總可知,若回歸平方和越接近總平方和,則r越接近于1。
11.簡述直線相關(guān)、秩相關(guān)的區(qū)別與聯(lián)系。
答:區(qū)別:①資料要求不同:直線相關(guān)要求x、y是來自雙變量正態(tài)總體的隨機變量;秩相關(guān)適用于不服從雙變量正態(tài)分布或總體分布類型未知以及用等級表示的原始數(shù)據(jù)。②相關(guān)意義不同:直線相關(guān)表示兩變量的直線相關(guān)關(guān)系存在,秩相關(guān)表示兩變量的相關(guān)關(guān)系。聯(lián)系:相關(guān)系數(shù)的取值范圍相同;秩相關(guān)是將原始數(shù)據(jù)進行秩變換,以秩次計算直線相關(guān)系數(shù)。
12.均數(shù)的可信區(qū)間和參考值范圍有何不同?
222
22答:均數(shù)的可信區(qū)間:按一定的概率100(1-α)%(即可信度)估計總體均數(shù)所在的范圍,得到的范圍亦稱可信區(qū)間。參考值范圍:醫(yī)學參考值范圍指包括絕大多數(shù)正常人的人體形態(tài)、功能和代謝產(chǎn)物等各種生理及生化指標常數(shù),也稱正常值。由于存在著個體差異,生物醫(yī)學數(shù)據(jù)并非常數(shù),而是一定范圍內(nèi)波動,故采用醫(yī)學參考值范圍作為判定正常和異常的參考標準。
13秩和檢驗的優(yōu)缺點是什么? 答:①不受總體分布限制,適用面廣②適用于等級資料及兩端無確定值的資料③易于理解,易于計算。缺點:是對分布類型的廣泛適應性,使其很難充分利用資料提供的信息,有時會導致檢驗效能降低。14在t檢驗和u檢驗時,何種情況下采用單側(cè)檢驗?
答:單側(cè)檢驗的備擇假設(shè)帶有方向性,如:m>m0,實際中只可能出現(xiàn)一種情況。雙側(cè)檢驗的備擇假設(shè)中包含不等號(如:m≠m0),實際上包括兩種情況:m>m0或m<m0,無方向性。15.均數(shù)、幾何均數(shù)和中位數(shù)的適用范圍是什么?
答:均數(shù)適用于描述單峰對稱分布,特別是正態(tài)分布或近似正態(tài)分布資料的集中趨勢。(由于均數(shù)易受到極端值的影響,故不適用于描述偏態(tài)分布資料的集中趨勢,只是需采用幾何均數(shù)或中位數(shù)。)幾何均數(shù)對于原始觀察值呈偏態(tài)分布,但經(jīng)過對數(shù)變換后呈正態(tài)分布或近似正態(tài)分布的資料,易用幾何均數(shù)描述其集中趨勢。常用于等比級資料或?qū)?shù)正態(tài)分布資料。中位數(shù)可用于各種分布的資料。對于正態(tài)分布資料,中位數(shù)等于均數(shù);對于對數(shù)正態(tài)分布資料,中位數(shù)等于幾何均數(shù)。由于中位數(shù)不受極端值的影響,主要用于偏態(tài)分布資料,兩端無確切值或分布不明確的資料。16.標準差和標準誤有何區(qū)別與聯(lián)系,他們的用途是什么?
答:標準差:是描述對稱分布,特別是正態(tài)分布或近似正態(tài)分布資料離散趨勢(變異程度)的常用指標??傮w標準差用δ表示,樣本標準差用s表示。標準誤:樣本均數(shù)的標準差稱為標準誤。樣本均數(shù)⊙的總體均數(shù)為H,各⊙圍繞H的離散程度,可以用樣本均數(shù)的標準差來描述。用途:標準差用途:①表示變量分布的離散程度②結(jié)合均數(shù)計算變異系數(shù)③結(jié)合樣本含量計算標準誤④結(jié)合均數(shù)描述分布特征。標準誤用途:表示每個樣本均數(shù)間的變異程度,描述樣本均數(shù)的抽樣誤差,即樣本均數(shù)與總體均數(shù)的接近程度,也可稱為樣本均數(shù)的標準差。17.統(tǒng)計圖制作的一般原則?
答:首先,根據(jù)資料性質(zhì)和分析目的正確選用適當?shù)慕y(tǒng)計圖。其次,除圓圖外,一般用直角坐標系的第一象限的位置表示。最后,繪制圖形應注意準確、美觀,給人以清晰的印象。18.各種統(tǒng)計圖適合于何種資料? 答:描述某連續(xù)變量的頻數(shù)分布宜選用直方圖;分析、比較獨立的或不連續(xù)的多個組或多個類別的統(tǒng)計量宜選用條圖,分析某指標隨時間或其它連續(xù)變量變化而變化的趨勢宜選用線圖,描述或比較不同事物內(nèi)部構(gòu)成時用圓圖或百分比條圖等。
19.為什么要做r和b的假設(shè)檢驗?
答:b:即使從總體回歸系數(shù)β等于零的總體中作隨機抽樣,由于抽樣誤差的存在,其樣本回歸系數(shù)b也不一定全為零。因此,求得一個樣本回歸系數(shù)時,首先,需考慮線性方程是否成立?并進行回歸系數(shù)β是否為零的檢驗。以推斷自變量x與應變量y見是否有直線關(guān)系存在。
r:假定從總體相關(guān)系數(shù)t=0的總體中隨機抽樣,由于存在抽樣誤差,所得樣本相關(guān)系數(shù)r不一定全為零。故此,求得一個樣本相關(guān)系數(shù)r值后,仍需進行總體相關(guān)系數(shù)t是否為零的假設(shè)檢驗。
20.服從二項分布的條件是什么?
答:凡具有貝努力試驗序列3個特點的變量,一般可認為服從二項分布①每次試驗的結(jié)果只能是兩種互斥的結(jié)果中的一種(A或者非A)②各次試驗的結(jié)果互不影響,即各次試驗獨立③在相同試驗條件下,各次試驗中出現(xiàn)某一結(jié)果A具有相同的概率∏(非A的概率1-∏)。
21.相關(guān)系數(shù)和回歸系數(shù)有什么區(qū)別和聯(lián)系?
答:直線的斜率稱為回歸系數(shù),直線相關(guān)系數(shù)也稱積距相關(guān)系數(shù),說明具有直線關(guān)系的兩變量間的相關(guān)方向與密切程度。它們的聯(lián)系——方向一致即r與b正負一致,假設(shè)檢驗等價。區(qū)別:資料要求不同,回歸系數(shù)方程要求服從正態(tài)分布,x精確測量嚴格控制Ⅰ型回歸,相關(guān)方程要求x,y雙重復正態(tài)Ⅱ型回歸。22多個樣本均數(shù)間的比較為什么不能用t檢驗?
答:多個樣本均數(shù)的兩兩比較又稱多重比較,其目的是推斷究竟哪些總體均數(shù)之間存在差別,由于涉及的對比組數(shù)大于2,若仍用前述的t檢驗對兩個對比組做比較,會使犯第Ⅰ類錯誤的概率增大,即可能吧本來無差別的兩個總體均數(shù)判為有差別,因此,多重比較不宜用t檢驗分別作兩兩比較。
23對同一資料,有出自同一研究目的,用參數(shù)檢驗和非參數(shù)檢驗所得結(jié)果不一致時,宜以何者為準?答:參數(shù)檢驗要求其總體分布為正態(tài)分布,總體方差齊性,非參數(shù)檢驗常用解決那些總體分布未知的統(tǒng)計問題,對于同一資料,又出自同一研究目的,采用參數(shù)研究還是非參數(shù)檢驗取決于資料的類型。24.為什么要進行抽樣研究?抽樣時為什么會產(chǎn)生抽樣誤差?
答:計量資料的總體中所含的樣本數(shù)量巨大,要獲取資料的總體均數(shù)、標準差等數(shù)據(jù)十分困難,因此醫(yī)學科學研究中通常采用的抽樣研究方法,是指從總體中隨機抽取一個樣本,用樣本信息推斷總體特征,這種分析方法稱為統(tǒng)計推斷。但通常情況下,樣本均數(shù)(x拔)不可能與總體均數(shù)μ正好相等,這種由個體變異產(chǎn)生的,隨機抽樣引起的樣本統(tǒng)計量與總體參數(shù)間的差異稱為抽樣誤差。25.相關(guān)系數(shù)的意義?
答:相關(guān)系數(shù)r沒有單位,取值范圍為-1≤r≤1。兩變量相關(guān)的方向用r的正負號表示,即r>0表示正相關(guān);r<0表示負相關(guān)。相關(guān)系數(shù)r的大小表示密切程度,r絕對值越接近1,表示兩變量間相關(guān)關(guān)系密切程度越高。∣r∣=1表示完全相關(guān),∣r∣=0表示無直線相關(guān)。26.方差分析的應用條件?
答:①各樣本是相互獨立的隨機樣本②各樣本來自正態(tài)分布③各樣本方差相等,即方差齊。
27.χ2檢驗要注意的問題(注意事項)?
答:① 計算χ2 值時必須用絕對數(shù)。而不能用相對數(shù),因為χ2 值的大小與頻數(shù)大小有關(guān)。②χ2 檢驗要求理論頻數(shù)不宜太小,一般認為不宜有1/5以上格子理論頻數(shù)小于5,或一個格子的理論頻數(shù)小于1。對理論頻數(shù)太小有三種處理方法:A 增大樣本例數(shù) B 刪除理論數(shù)太小的行或列 C 合并③當多個樣本率(或構(gòu)成比)比較的χ2 檢驗結(jié)論為拒絕檢驗假設(shè),只能認為各總體率(或總體構(gòu)成比)之間總的說來有差別,但不能說它們彼此間都有差別?;蚰硟烧唛g有差別。
28.非參數(shù)檢驗適用哪些情況?
答:①等級順序資料。②偏態(tài)資料。當觀察資料成偏態(tài)或極度偏態(tài)分布而又未經(jīng)變量變換未達到正態(tài)或近似正態(tài)分布時,宜用非參數(shù)檢驗。③未知分布類型資料④要比較的各組資料變異度相差較大,方差不齊,且不能變換達到齊性。⑤初步分析。有些醫(yī)學資料由于統(tǒng)計工作量過大,可采用非參數(shù)統(tǒng)計方法進行初步分析,挑選其中有意義者再進一步分析⑥對于一些特殊情況,如從幾個總體所獲得的數(shù)據(jù),往往難以對其原有總體分布作出估計,在這種情況下可用非參數(shù)統(tǒng)計方法。
29.為什么秩和檢驗的編秩在不同對比組間出現(xiàn)相同數(shù)據(jù)要給予“平均秩次”,而同一組的相同數(shù)據(jù)不必計算“平均秩次”?
答:因為在不同對比組,不取平均秩次會加大或減小某一組的秩和;而在同一組內(nèi),出現(xiàn)相同數(shù)據(jù)不編平均秩次,該組秩和不受影響。
30.怎樣正確使用單側(cè)檢驗和雙側(cè)檢驗?
答:根據(jù)專業(yè)知識推斷兩個總體是否有差別時,是甲高于乙,還是以高于甲,當兩種可能都存在時,一般選雙側(cè);若根據(jù)專業(yè)知識,如果甲不會低于乙,或研究者僅關(guān)心其中一種可能時,可選用單側(cè)。一般來講,雙側(cè)檢驗較穩(wěn)妥故較多用,在預實驗有探索性質(zhì)時,對結(jié)果的考慮以思路較寬為好,也用雙側(cè)檢驗。單側(cè)檢驗,應以專業(yè)知識為依據(jù),他充分利用了另一側(cè)的不可能性,故檢出效率高,但應慎用。
31.回歸系數(shù):直線的斜率b,也稱回歸系數(shù)。統(tǒng)計學意義是自變量x改變一個單位時,應變量y平均變化b個單位。32.相關(guān)系數(shù):也稱pearson積距相關(guān)系數(shù),說明具有直線相關(guān)的兩變量間相關(guān)方向與密切程度。33.直線回歸分析中應注意的問題?
答:①做直線回歸一定要有實際意義②回歸分析之前首先應繪制散點圖。③考慮建立線性模型的基本假定④取值范圍,避免外延。⑤兩變量間有直線關(guān)系不一定是因果關(guān)系。34.相關(guān)分析應用中應注意的問題?
答:①資料要求x、y都應來自雙變量正態(tài)總體的隨機變量。②進行相關(guān)分析前,應先繪制散點圖,有線性趨勢時,才可進行相關(guān)分析。③滿足應用條件的同一份雙變量資料,回歸系數(shù)b與相關(guān)系數(shù)r的正負號一致,假設(shè)檢驗等價。④相關(guān)分析時,小樣本資料經(jīng)t檢驗只能推斷兩變量間有無直線關(guān)系,而不能推斷其相關(guān)的密切程度。要推斷兩樣本間相關(guān)的程度,樣本含量必須足夠大,當r有統(tǒng)計學意義時,但r2較小時,下結(jié)論要慎重。35.方差分析的應用條件? 答:①各樣本是相互獨立的隨機樣本②各樣本來自正態(tài)分布③各樣本方差相等,即方差齊。
36.二項分布:貝努力試驗序列中結(jié)果A出現(xiàn)次數(shù)的概率分布就是~。
37.率的標準化法:為解決因內(nèi)部構(gòu)成不同而導致分組率比較的結(jié)果與和紀律比較結(jié)果的矛盾,選定一個共同的標準人口或標準人口構(gòu)成,分別計算兩組的標準化率,這種方法稱~。
38.抽樣誤差:由個體變異產(chǎn)生的,隨機抽樣引起的樣本統(tǒng)計量與總體參考數(shù)間的差異稱~
第四篇:醫(yī)學統(tǒng)計學總結(jié)
醫(yī)學統(tǒng)計學總結(jié)
一、兩組或多組計量資料的比較1.兩組資料: 1)大樣本資料或服從正態(tài)分布的小樣本資料(1)若方差齊性,則作成組t檢驗(2)若方差不齊,則作t’檢驗或用成組的Wilcoxon秩和檢驗 2)小樣本偏態(tài)分布資料,則用成組的Wilcoxon秩和檢驗 2.多組資料: 1)若大樣本資料或服從正態(tài)分布,并且方差齊性,則作完全隨機的方差分析。如果方差分析的統(tǒng)計檢驗為有統(tǒng)計學意義,則進一步作統(tǒng)計分析:選擇合適的方法(如:LSD檢驗,Bonferroni檢驗等)進行兩兩比較。2)如果小樣本的偏態(tài)分布資料或方差不齊,則作Kruskal Wallis的統(tǒng)計檢驗。如果Kruskal Wallis的統(tǒng)計檢驗為有統(tǒng)計學意義,則進一步作統(tǒng)計分析:選擇合適的方法(如:用成組的Wilcoxon秩和檢驗,但用Bonferroni方法校正P值等)進行兩兩比較。
二、分類資料的統(tǒng)計分析1.單樣本資料與總體比較 1)二分類資料:(1)小樣本時:用二項分布進行確切概率法檢驗;(2)大樣本時:用U檢驗。2)多分類資料:用Pearson c2檢驗(又稱擬合優(yōu)度檢驗)。2.四格表資料 1)n>40并且所以理論數(shù)大于5,則用Pearson c2 2)n>40并且所以理論數(shù)大于1并且至少存在一個理論數(shù)<5,則用校正c2或用Fisher’s 確切概率法檢驗 3)n£40或存在理論數(shù)<1,則用Fisher’s 檢驗 3.2×C表資料的統(tǒng)計分析 1)列變量為效應指標,并且為有序多分類變量,行變量為分組變量,則行評分的CMH c2或成組的Wilcoxon秩和檢驗 2)列變量為效應指標并且為二分類,列變量為有序多分類變量,則用趨勢c2檢驗 3)行變量和列變量均為無序分類變量(1)n>40并且理論數(shù)小于5的格子數(shù)<行列表中格子總數(shù)的25%,則用Pearson c2(2)n£40或理論數(shù)小于5的格子數(shù)>行列表中格子總數(shù)的25%,則用Fisher’s 確切概率法檢驗 4.R×C表資料的統(tǒng)計分析 1)列變量為效應指標,并且為有序多分類變量,行變量為分組變量,則CMH c2或Kruskal Wallis的秩和檢驗 2)列變量為效應指標,并且為無序多分類變量,行變
量為有序多分類變量,作none zero correlation analysis的CMH c
23)列變量和行變量均為有序多分類變量,可以作Spearman相關(guān)分析 4)列變量和行變量均為無序多分類變量,(1)n>40并且理論數(shù)小于5的格子數(shù)<行列表中格子總數(shù)的25%,則用Pearson c2(2)n£40或理論數(shù)小于5的格子數(shù)>行列表中格子總數(shù)的25%,則用Fisher’s 確切概率法檢驗
三、Poisson分布資料1.單樣本資料與總體比較: 1)觀察值較小時:用確切概率法進行檢驗。2)觀察值較大時:用正態(tài)近似的U檢驗。2.兩個樣本比較:用正態(tài)近似的U檢驗。配對設(shè)計或隨機區(qū)組設(shè)計
四、兩組或多組計量資料的比較 1.兩組資料: 1)大樣本資料或配對差值服從正態(tài)分布的小樣本資料,作配對t檢驗 2)小樣本并且差值呈偏態(tài)分布資料,則用Wilcoxon的符號配對秩檢驗 2.多組資料: 1)若大樣本資料或殘差服從正態(tài)分布,并且方差齊性,則作隨機區(qū)組的方差分析。如果方差分析的統(tǒng)計檢驗為有統(tǒng)計學意義,則進一步作統(tǒng)計分析:選擇合適的方法(如:LSD檢驗,Bonferroni檢驗等)進行兩兩比較。2)如果小樣本時,差值呈偏態(tài)分布資料或方差不齊,則作Fredman的統(tǒng)計檢驗。如果Fredman的統(tǒng)計檢驗為有統(tǒng)計學意義,則進一步作統(tǒng)計分析:選擇合適的方法(如:用Wilcoxon的符號配對秩檢驗,但用Bonferroni方法校正P值等)進行兩兩比較。
五、分類資料的統(tǒng)計分析1.四格表資料 1)b+c>40,則用McNemar配對c2檢驗或配對邊際c2檢驗 2)b+c<40,則用二項分布確切概率法檢驗 2.C×C表資料: 1)配對比較:用McNemar配對c2檢驗或配對邊際c2檢驗 2)一致性問題(Agreement):用Kap檢驗 變量之間的關(guān)聯(lián)性分析
六、兩個變量之間的關(guān)聯(lián)性分析 1.兩個變量均為連續(xù)型變量 1)小樣本并且兩個變量服從雙正態(tài)分布,則用Pearson相關(guān)系數(shù)做統(tǒng)計分析 2)大樣本或兩個變量不服
第五篇:醫(yī)學統(tǒng)計學
A.總體中任意的一部分B.總體中的典型部分
C.總體中有意義的一部分
1、measurement date2、coefficient of variation(變異系數(shù))
3、sampling error(抽樣誤差)
4、linear correlation coefficient(直線相關(guān)系數(shù))
5、population(總體)
D.總體中有價值的一部分E.總體中有代表性的一部分
5、以下檢驗方法屬非參數(shù)法的是。
A.T檢驗B.t檢驗C.u 檢驗D.F檢驗E.以上都是
6、樣本含量的確定下面哪種說法合理。
A.樣本越大越好B.樣本越小越好C.保證一定檢驗效能條件下盡量增大樣本含量D.保證一定檢驗效能條件下盡量減少樣本含量E.越易于組織實施的樣本含量越好
7、對計數(shù)資料進行統(tǒng)計描述的主要指標是。
A.平均數(shù)B.相對數(shù)C.標準差D.變異系數(shù)E.中位數(shù)
1、用樣本推論總體,具有代表性的樣本指的是
A.總體中最容易獲得的部分個體B.在總體中隨意抽取任意個體 C.挑選總體中的有代表性的部分個體D.用配對方法抽取的部分個體 E.依照隨機原則抽取總體中的有代表性部分個體
2、計量資料,計數(shù)資料和等級分組資料的關(guān)系是。A.計量資料兼有計數(shù)資料和等級分組資料的一些性質(zhì)B.計數(shù)資料兼有計量資料和等級分組資料的一些性質(zhì)
8、由兩樣本均數(shù)的差別推斷兩總體均數(shù)的差別,得到此差別具有統(tǒng)計意義的結(jié)論是指
A.兩樣本均數(shù)差別有顯著性B.兩總體均數(shù)差別有顯著性
C.兩樣本均數(shù)和兩總體均數(shù)的差別都有顯著性
D.其中一個樣本均數(shù)和它的總體均數(shù)差別有顯著性
9、說明某現(xiàn)象發(fā)生強度的指標為。A.構(gòu)成比B.相對比C.定基比D.環(huán)比E.率
10、配對設(shè)計的秩和檢驗中,其H0假設(shè)為。A.差值的總體均數(shù)為0B.差值的總體中位數(shù)為0C.μd≠0D.Md≠0
C.等級分組資料兼有計量資料和計數(shù)資料的一些性質(zhì) D.計數(shù)資料有計量資料的一些性質(zhì)E.等級分組資料又稱半計數(shù)資料
3、總體率95%可信區(qū)間的意義是。
A.95%的正常值在此范圍B.95%的樣本率在此范圍
C.95%的總體率在此范圍D.總體率在此范圍內(nèi)的可能性為95%E.樣本率在此范圍內(nèi)的可能性為95%
4、為了由樣本推斷總體,樣本應該是。
命題組組長簽字:第頁(本試卷共4頁)
E.μ1≠μ211、單因素方差分析中,不正確的計算公式是。A.SS組內(nèi)=SS總-SS組間B.v總=v組間-v組內(nèi)C.MS組間=SS組間/v組間D.MS組內(nèi)=SS組內(nèi)/v組內(nèi)E.F=MS組內(nèi)/MS組間
12、方差分析中,組內(nèi)變異反映的是。A.測量誤差B.個體差異
C.隨機誤差,包括個體差異及測量誤差D.抽樣誤差E.系統(tǒng)誤差
13、對統(tǒng)計圖中的的坐標有如下規(guī)定。
A.所有統(tǒng)計圖的縱坐標都必須從零點開始B.所有統(tǒng)計圖坐標中都不能有折斷線
C.條圖、線圖、直方圖的縱坐標必須從零開始D.線圖、直方圖的縱坐標必須從零開始E.條圖、直方圖的縱坐標必須從零開始
14、制統(tǒng)計圖時要求。
A.標題應說明圖的主要內(nèi)容,一般在圖的上方B.縱橫兩軸應有標目,一般不注單位C.縱軸尺度必須從零開始
D.直條圖和線圖,其長寬比例一般取5:7E.以上都不對
15、下列關(guān)于醫(yī)學參考值范圍描述中,不正確的是
A.排除了有關(guān)疾病等因素對所研究指標有影響的正常人的解剖、生理、生化 等數(shù)據(jù)的波動范圍
B.沒有任何疾病的人的解剖、生理、生化等數(shù)據(jù)的波動范圍C.習慣確定只包含95%或99%的人的界值來源:D.根據(jù)專業(yè)知識確定取單側(cè)界限或雙側(cè)界限E.資料為正態(tài)分布時,可用正態(tài)近似法計算
16、各觀察值均加(或減)同一數(shù)后A.均數(shù)改變,標準差不變B.均數(shù)不變,標準差改變
C.兩者均不變D.兩者均改變
E.根據(jù)實際資料而定
17、統(tǒng)計工作的步驟為
A.統(tǒng)計研究調(diào)查、搜集資料、整理資料、分析資料B.統(tǒng)計資料收集、整理資料、統(tǒng)計描述、統(tǒng)計推斷C.統(tǒng)計研究設(shè)計、搜集資料、整理資料、分析資料D.統(tǒng)計研究調(diào)查、統(tǒng)計描述、統(tǒng)計推斷、統(tǒng)計圖表E.統(tǒng)計研究設(shè)計、統(tǒng)計描述、統(tǒng)計推斷、統(tǒng)計圖表
18、兩個樣本率判別的假設(shè)檢驗,其目的是。A.推斷兩個樣本率有無差別B.推斷兩個總體率有無差別
C.推斷兩個樣本率和兩個總體率有無差別
D.推斷兩個樣本率和兩個總體率的差別有無統(tǒng)計意義E.推斷兩個總體分布是否相同
19、假設(shè)檢驗過程中,下列哪一項不可以由研究者事先設(shè)定。A.所比較的總體參數(shù)B.單側(cè)或雙側(cè)檢驗C.檢驗水準D.P值E.以上都不對 20、統(tǒng)計資料的類型包括。
A.頻數(shù)分布資料和等級分類資料B.多項分類資料和二項分類資料C.正態(tài)分布資料和頻數(shù)分布資料
D.數(shù)值變量資料和等級資料E.數(shù)值變量資料和分類變量資料
21、有關(guān)離散度指標意義中,描述不正確的是。A.數(shù)值越大,說明個體差異越大B.數(shù)值越大,說明觀察值的變異度越大C.數(shù)值越小,說明平均數(shù)的代表性越好D.數(shù)值越小,說明平均數(shù)的代表性越差E.應與平均數(shù)結(jié)合起來進行分析
22、秩和檢驗和t檢驗相比,其優(yōu)點是。
A.計算簡便,不受分布限制B.公式更為合理C.檢驗效能高D.抽樣誤差小E.第二類錯誤概率小
23、總體標準差描述的是。
A.所有個體值對總體均數(shù)的離散程度B.某樣本均數(shù)對總體均數(shù)的離散程度C.所有樣本均數(shù)對總體均數(shù)的離散程度D.某些樣本均數(shù)對總體均數(shù)的離散程度
E.所有某個含量相同的樣本均數(shù)對總體均數(shù)的離散程度
24、比較身高和體重兩組數(shù)據(jù)變異度大小宜采用。A.變異系數(shù)B.方差
C.極差D.標準差E.四分位數(shù)間距
25、當樣本例數(shù)相同時,兩組計量資料的成組t檢驗與配對t檢驗相比,一般情況下為
A.成組t檢驗效率高一些B.配對t檢驗效率高一些C.兩者效率相等
D.大樣本時兩者效率一致E.與兩組樣本均數(shù)的大小有關(guān)
26、樣本的兩變量(X,Y)的相關(guān)系數(shù)r=0時,說明。(B)A.兩變量不存在任何關(guān)系
B.兩變量間不存在直線關(guān)系,但不排除存在某種曲線關(guān)系
C.兩變量間存在相互關(guān)系的可能性很小D.兩變量必然存在某種曲線關(guān)系E.兩變量間的關(guān)系不能確定
27、在標準差與標準誤的關(guān)系中。A.二者均反映抽樣誤差大小
B.總體標準差增大時,總體標準誤也增大
C.樣本例數(shù)增大時,樣本標準差和標準誤都減小
D.可信區(qū)間大小與標準差有關(guān),而參考值范圍與標準誤有關(guān)E.總體標準差一定時,增大樣本例數(shù)會減小標準誤
28、說明兩個有關(guān)聯(lián)的同類指標之比為。
A.率B.構(gòu)成比C.頻率D.相對比E.頻數(shù)
29、下列觀測結(jié)果屬于等級資料的是(D)
A.收縮壓測量值B.脈搏數(shù) C.住院天數(shù)D.病情程度 E.四種血型
30、收集資料不可避免的誤差是
A.隨機誤差B.系統(tǒng)誤差 C.過失誤差D.記錄誤差 E.儀器故障誤差
31、算術(shù)均數(shù)與中位數(shù)相比,其特點是
A.不易受極端值的影響B(tài).能充分利用數(shù)據(jù)的信息C.抽樣誤差較大D.更適用于偏態(tài)分布資料E.更適用于分布不明確資料
32、描述一組對稱(或正態(tài))分布資料的變異程度,用(A)較好
A標準差B 方差C 離均差平方和D 變異系數(shù)E以上都可以
33、變異系數(shù)主要用于
A.比較不同計量指標的變異程度B.衡量正態(tài)分布的變異程度
C.衡量測量的準確度D.衡量偏態(tài)分布的變異程度
E.衡量樣本抽樣誤差的大小
34、正態(tài)曲線下,從均數(shù)μ到μ+1.0σ的面積
A、45%B、90%C、95.00%D、47.5%E、34.14%
35、方差分析的基本思想和要點是
A.組間均方大于組內(nèi)均方B.組內(nèi)均方大于組間均方 C.不同來源的方差必須相等D.兩方差之比服從F分布 E.總變異及其自由度可按不同來源分解
36、多組均數(shù)比較的方差分析,如果P?0.05,則應該進一步做的是 A.兩均數(shù)的t檢驗B.區(qū)組方差分析C.方差齊性檢驗D.q檢驗 E.確定單獨效應
37、兩樣本均數(shù)比較,檢驗結(jié)果P>0.05說明(D)
A.兩總體均數(shù)的差別較小B.兩總體均數(shù)的差別較大C.支持兩總體無差別的結(jié)論D.不支持兩總體有差別的結(jié)論E.可以確認兩總體無差別
38、計算標準化死亡率的目的是(D)
A.減少死亡率估計的偏倚B.減少死亡率估計的抽樣誤差 C.便于進行不同地區(qū)死亡率的比較D.消除各地區(qū)內(nèi)部構(gòu)成不同的影響 E.便于進行不同時間死亡率的比較
39、標準化后的總死亡率:
A、僅僅作為比較的基礎(chǔ),它反映了一種相對水平B、它反映了實際水平
C、它不隨標準的選擇變化而變化 D、它反映了事物實際發(fā)生的強度 E、它反映了實際率的水平
2?40、利用檢驗公式不適合解決的實際問題是(C)
A.比較兩種藥物的有效率B.檢驗某種疾病與基因多態(tài)性的關(guān)系 C.兩組有序試驗結(jié)果的藥物療效D.藥物三種不同劑量顯效率有無差別 E.兩組病情“輕、中、重”的構(gòu)成比例
41、對醫(yī)學計量資料成組比較, 相對參數(shù)檢驗來說,非參數(shù)秩和檢驗的優(yōu)點是(A)A.適用范圍廣B.檢驗效能高 C.檢驗結(jié)果更準確D.充分利用資料信息 E.不易出現(xiàn)假陰性錯誤
42、對于計量資料的比較,在滿足參數(shù)法條件下用非參方法分析,可能產(chǎn)生的結(jié)果是(B)
A.增加Ⅰ類錯誤B.增加Ⅱ類錯誤C.減少Ⅰ類錯誤D.減少Ⅱ類錯誤 E.兩類錯誤都增加
43、對于兩組資料的比較,方差分析與t檢驗的關(guān)系是(E)A.t檢驗結(jié)果更準確B.方差分析結(jié)果更準確 C.t檢驗對數(shù)據(jù)的要求更為嚴格D.近似等價 E.完全等價
44、四格表如有一個實際數(shù)為0(C)A、就不能作χ2檢驗
B、就必須用校正χ2檢驗
C、還不能決定是否可作χ2檢驗 D、肯定可作校正χ2檢驗 E、肯定不可作校正χ2檢驗
45、行×列表的χ2檢驗中,P<0.05說明(D)A、被比較的幾個樣本率之間的差異均有顯著性 B、樣本率間的差異沒有顯著性
C、任意兩個率之間的差異均有顯著性 D、至少某兩個樣本率間的差異有顯著性 E、只有兩個樣本率間的差異有顯著性
46、兩數(shù)值變量相關(guān)關(guān)系越強,表示(B)
A.相關(guān)系數(shù)越大B.相關(guān)系數(shù)的絕對值越大 B.回歸系數(shù)越大C.回歸系數(shù)的絕對值越大 E.相關(guān)系數(shù)檢驗統(tǒng)計量的t值越大
47、t分布比標準正態(tài)分布(D)
A、中心位置左移,但分布曲線相同 B、中心位置右移,但分布曲線相同 C、中心位置不變,但分布曲線峰高
D、中心位置不變,但分布曲線峰低,兩側(cè)較伸展 E、中心位置右移,但分布曲線峰高
三、判斷題(10分)
1、相關(guān)系數(shù)r=0.98,說明兩變量密切正相關(guān)(對)
2、構(gòu)成比資料可以選用圓圖和條圖(錯)
3、標準差和標準誤都是反映變異程度大小的指標(錯)
4、多個樣本均數(shù)的兩兩比較可以用成組的t檢驗(錯)
5、正常值范圍屬于統(tǒng)計描述,可信區(qū)間的估計屬于統(tǒng)計推斷(對)
6、、數(shù)值變量資料的標準差一定比均數(shù)?。ㄥe)
7、等級資料比較宜用秩和檢驗。(對)
8、兩變量的相關(guān)分析中,若散點圖的散點完全在一條直線上,則r=1(錯)
9、對統(tǒng)計圖中的的坐標所有統(tǒng)計圖的縱坐標都必須從零點開始(錯)
10、非參數(shù)統(tǒng)計進行假設(shè)檢驗要求的條件是總體是正態(tài)分布(錯)
四、簡答題(25分)
1、醫(yī)學參考值范圍和可信區(qū)間的區(qū)別(5)
2、非參數(shù)檢驗的適用條件(5)
3、標準正態(tài)分布曲線下的面積規(guī)律(5)
4、標準差與標準誤有何區(qū)別?(5分)
5、描述數(shù)值變量集中趨勢的指標有哪些?適用條件分別是什么?(5分)
五、作圖(10分)
某藥治療老年慢性氣管炎的近期療效結(jié)果如下:
1、單純型共221例,其中按病情分為重、中、輕,分別觀察了136例、54例、31例;療效:治愈60人、顯效98人、好轉(zhuǎn)51人、無效12人,有效率94.6%。
2、喘息型共182例,其中按病情分為重、中、輕,分別觀察了93例,56例、33例;療效:治愈23人、顯效83人、好轉(zhuǎn)65人、無效11人,有效率94.0%。請根據(jù)題目要求做出合適的統(tǒng)計圖。