第一篇:衛(wèi)生統(tǒng)計學(xué)名詞解釋
1.總體:總體(population)是根據(jù)研究目的確定的同質(zhì)的觀察單位的全體,更確切的說,是同質(zhì)的所有觀察單位某種觀察值(變量值)的集合。總體可分為有限總體和無限總體??傮w中的所有單位都能夠標(biāo)識者為有限總體,反之為無限總體。
樣本:從總體中隨機(jī)抽取部分觀察單位,其測量結(jié)果的集合稱為樣本(sample)。樣本應(yīng)具有代表性。所謂有代表性的樣本,是指用隨機(jī)抽樣方法獲得的樣本。
2.隨機(jī)抽樣:隨機(jī)抽樣(random sampling)是指按照隨機(jī)化的原則(總體中每一個觀察單位都有同等的機(jī)會被選入到樣本中),從總體中抽取部分觀察單位的過程。隨機(jī)抽樣是樣本具有代表性的保證。
3.變異:在自然狀態(tài)下,個體間測量結(jié)果的差異稱為變異(variation)。變異是生物醫(yī)學(xué)研究領(lǐng)域普遍存在的現(xiàn)象。嚴(yán)格的說,在自然狀態(tài)下,任何兩個患者或研究群體間都存在差異,其表現(xiàn)為各種生理測量值的參差不齊。
4.計量資料:對每個觀察單位用定量的方法測定某項指標(biāo)量的大小,所得的資料稱為計量資料(measurement data)。計量資料亦稱定量資料、測量資料。.其變量值是定量的,表現(xiàn)為數(shù)值大小,一般有度量衡單位。如某一患者的身高(cm)、體重(kg)、紅細(xì)胞計數(shù)(1012/L)、脈搏(次/分)、血壓(KPa)等
計數(shù)資料:將觀察單位按某種屬性或類別分組,所得的觀察單位數(shù)稱為計數(shù)資料(count data)。計數(shù)資料亦稱定性資料或分類資料。其觀察值是定性的,表現(xiàn)為互不相容的類別或?qū)傩浴H缯{(diào)查某地某時的男、女性人口數(shù);治療一批患者,其治療效果為有效、無效的人數(shù);調(diào)查一批少數(shù)民族居民的A、B、AB、O 四種血型的人數(shù)等。
等級資料:將觀察單位按測量結(jié)果的某種屬性的不同程度分組,所得各組的觀察單位數(shù),稱為等級資料(ordinal data)。等級資料又稱有序變量。如患者的治療結(jié)果可分為治愈、好轉(zhuǎn)、有效、無效或死亡,各種結(jié)果既是分類結(jié)果,又有順序和等級差別,但這種差別卻不能準(zhǔn)確測量;一批腎病患者尿蛋白含量的測定結(jié)果分為 +、++、+++等。
等級資料與計數(shù)資料不同:屬性分組有程度差別,各組按大小順序排列。
等級資料與計量資料不同:每個觀察單位未確切定量,故亦稱為半計量資料。
5.概率:概率(probability)又稱幾率,是度量某一隨機(jī)事件A發(fā)生可能性大小的一個數(shù)值,記為P(A),P(A)越大,說明A事件發(fā)生的可能性越大。0﹤P(A)﹤1。頻率:在相同的條件下,獨立重復(fù)做n 次試驗,事件A 出現(xiàn)了m 次,則比值m/n 稱為隨機(jī)事件A 在n 次試驗中出現(xiàn)的頻率(freqency)。當(dāng)試驗重復(fù)很多次時P(A)= m/n。
2.概率是描述隨機(jī)事件發(fā)生可能性大小的數(shù)值,常用P表示。隨機(jī)事件概率的大小在0與1之間,P越接近1,表示某事件發(fā)生的可能性越大;P越接近0,表示某事件發(fā)生的可能性越小。習(xí)慣上將P≤0.05的事件,稱為小概率事件,表示在一次實驗或觀察中該事件發(fā)生的可能性很小,可視為不發(fā)生。6.隨機(jī)誤差:隨機(jī)誤差(random error)又稱偶然誤差,是指排除了系統(tǒng)誤差后尚存的差。它受多種因素的影響,使觀察值不按方向性和系統(tǒng)性而隨機(jī)的變化。誤差變量一般服從正態(tài)分布。隨機(jī)誤差可以通過統(tǒng)計處理來估計。
抽樣誤差(sampling error)是指樣本統(tǒng)計量與總體參數(shù)的差別。在總體確定的情況下,總體參數(shù)是固定的常數(shù),統(tǒng)計量是在總體參數(shù)附近波動的隨機(jī)變量。
7.系統(tǒng)誤差:系統(tǒng)誤差(systematic error)是指由于儀器未校正、測量者感官的某種偏差、醫(yī)生掌握療效標(biāo)準(zhǔn)偏高或偏低等原因,使觀察值不是分散在真值的兩側(cè),而是有方向性、系統(tǒng)性或周期性地偏離真值。系統(tǒng)誤差可以通過實驗設(shè)計和完善技術(shù)措施來消除或使之減少。
8.隨機(jī)變量:隨機(jī)變量(random variable)是指取指不能事先確定的觀察結(jié)果。隨機(jī)量的具體內(nèi)容雖然是各式各樣的,但共同的特點是不能用一個常數(shù)來表示,而且,理論上講,每個變量的取值服從特定的概率分布。
9.參數(shù):參數(shù)(paramater)是指總體的統(tǒng)計指標(biāo),如總體均數(shù)、總體率等。總體參數(shù)是固定的常數(shù)。多數(shù)情況下,總體參數(shù)是不易知道的,但可通過隨機(jī)抽樣抽取有代表性的樣本,用算得的樣本統(tǒng)計量估計未知的總體參數(shù)。10.統(tǒng)計量:統(tǒng)計量(statistic)是指樣本的統(tǒng)計指標(biāo),如樣本均數(shù)、樣本率等。樣本統(tǒng)計量可用來估計總體參數(shù)。總體參數(shù)是固定的常數(shù),統(tǒng)計量是在總體參數(shù)附近波動的隨機(jī)變量。
11.頻數(shù)表(frequency table)用來表示一批數(shù)據(jù)各觀察值或在不同取值區(qū)間的出現(xiàn)的頻繁程度(頻數(shù))。對于離散數(shù)據(jù),每一個觀察值即對應(yīng)一個頻數(shù),如某醫(yī)院某年度一日內(nèi)死亡0,1,2?個病人的天數(shù)。對于散布區(qū)間很大的離散數(shù)據(jù)和連續(xù)型數(shù)據(jù),數(shù)據(jù)散布區(qū)間由若干組段組成,每個組段對應(yīng)一個頻數(shù)。
12.算術(shù)均數(shù)(arithmetic mean)描述一組數(shù)據(jù)在數(shù)量上的平均水平??傮w均數(shù)用μ表示,樣本均數(shù)用X 表示。
13.幾何均數(shù)(geometric mean)用以描述對數(shù)正態(tài)分布或數(shù)據(jù)呈倍數(shù)變化資料的水平。記為G。
14.中位數(shù)(median)Md將一組觀察值由小到大排列,n 為奇數(shù)時取位次居中的變量值;為偶數(shù)時,取位次居中的兩個變量的平均值。反映一批觀察值在位次上的平均水平。
15.極差(range)亦稱全距,即最大值與最小值之差,用于資料的粗略分析,其計算簡便但穩(wěn)定性較差。
16.百分位數(shù)(percentile)是將n 個觀察值從小到大依次排列,再把它們的位次依次轉(zhuǎn)化為百分位。百分位數(shù)的另一個重要用途是確定醫(yī)學(xué)參考值范圍。
17.四分位數(shù)間距(inter-quartile range)是由第3 四分位數(shù)和第1 四分位數(shù)相減計算而得,常與中位數(shù)一起使用,描述偏態(tài)分布資料的分布特征,較極差穩(wěn)定。
18.方差(variance):方差表示一組數(shù)據(jù)的平均離散情況,由離均差的平方和除以樣本個數(shù)得到。
19.標(biāo)準(zhǔn)差(standard deviation)是方差的正平方根,使用的量綱與原量綱相同,適用于近似正態(tài)分布的資料,大樣本、小樣本均可,最為常用。
20.變異系數(shù)(coefficient of variation)用于觀察指標(biāo)單位不同或均數(shù)相差較大時兩組資料變異程度的比較。用CV 表示。計算:標(biāo)準(zhǔn)差/均數(shù)*100%
21.統(tǒng)計推斷:通過樣本指標(biāo)來說明總體特征,這種從樣本獲取有關(guān)總體信息的過程稱為統(tǒng)計推斷(statistical inference)。
22.抽樣誤差:由個體變異產(chǎn)生的,抽樣造成的樣本統(tǒng)計量與總體參數(shù)的差異,稱為抽樣誤差(sampling error)。
23.標(biāo)準(zhǔn)誤及X s :通常將樣本統(tǒng)計量的標(biāo)準(zhǔn)差稱為標(biāo)準(zhǔn)誤。許多樣本均數(shù)的標(biāo)準(zhǔn)差X s稱為均數(shù)的標(biāo)準(zhǔn)誤(standard error of mean,SEM),它反映了樣本均數(shù)間的離散程度,也反映了樣本均數(shù)與總體均數(shù)的差異,說明均數(shù)抽樣誤差的大小。
24.可信區(qū)間:按預(yù)先給定的概率確定的包含未知總體參數(shù)的可能范圍。該范圍稱為總體參數(shù)的可信區(qū)間(confidence interval,CI)。它的確切含義是:可信區(qū)間包含總體參數(shù)的可能性是1-α,而不是總體參數(shù)落在該范圍的可能性為1-α。
25.參數(shù)估計:指用樣本指標(biāo)值(統(tǒng)計量)估計總體指標(biāo)值(參數(shù))。參數(shù)估計有兩種方法:點估計和區(qū)間估計。
26.假設(shè)檢驗中P 的含義:指從H0 規(guī)定的總體隨機(jī)抽得等于及大于(或等于及小于)現(xiàn)有樣本獲得的檢驗統(tǒng)計量值的概率。
27.I 型和II 型錯誤:I 型錯誤(type I error),指拒絕了實際上成立的H0,這類“棄真”的錯誤稱為I 型錯誤,其概率大小用α表示;II 型錯誤(type II error),指接受了實際上不成立的H0,這類“存?zhèn)巍钡恼`稱為II 型錯誤,其概率大小用β表示。
28.檢驗效能:1-β稱為檢驗效能(power of test),它是指當(dāng)兩總體確有差別,按規(guī)定的檢驗水準(zhǔn)a 所能發(fā)現(xiàn)該差異的能力。
29.檢驗水準(zhǔn):是預(yù)先規(guī)定的,當(dāng)假設(shè)檢驗結(jié)果拒絕H0,接受H1,下“有差別”的結(jié)論時犯錯誤的概率稱為檢驗水準(zhǔn)(level of a test),記為α。
30..率(rate)又稱頻率指標(biāo),說明一定時期內(nèi)某現(xiàn)象發(fā)生的頻率或強度。計算公式為:發(fā)生某現(xiàn)象的觀察單位數(shù)/可能發(fā)生某現(xiàn)象的觀察單位總數(shù)*100%,表示方式有:百分率(%)、千分率(?)等。
31.構(gòu)成比(proportion)又稱構(gòu)成指標(biāo),說明某一事物內(nèi)部各組成部分所占的比重或分布。計算公式為:某一組成部分的觀察單位數(shù)/同一事物各組成部分的觀察單位總數(shù)*100%,表示方式有:百分?jǐn)?shù)等。
32.比(ratio)又稱相對比,是A、B 兩個有關(guān)指標(biāo)之比,說明A 是B 的若干倍或百分之幾。計算公式為:A/B,表示方式有:倍數(shù)或分?jǐn)?shù)等。
33.非參數(shù)統(tǒng)計:針對某些資料的總體分布難以用某種函數(shù)式來表達(dá),或者資料的總體分布的函數(shù)式是未知的,只知道總體分布是連續(xù)型的或離散型的,用于解決這類問題的一種不依賴總體分布的具體形式的統(tǒng)計分析方法。由于這類方法不受總體參數(shù)的限制,故稱非參數(shù)統(tǒng)計法(non-parametric statistics),或稱為不拘分布(distribution-free statistics)的統(tǒng)計分析方法,又稱為無分布型式假定(assumption free statistics)的統(tǒng)計分析方法。
34.參數(shù)統(tǒng)計:通常要求樣本來自總體分布型是已知的(如正態(tài)分布),在這種假設(shè)的基礎(chǔ)上,對總體參數(shù)(如總體均數(shù))進(jìn)行估計和檢驗,稱為參數(shù)統(tǒng)計(parametric statistics)
35.秩次:變量值按照從小到大順序所編的秩序號稱為秩次(rank)。36.秩和:各組秩次的合計稱為秩和(rank sum),是非參數(shù)檢驗的基本統(tǒng)計量。
37.直線回歸(linear regression)建立一個描述應(yīng)變量依自變量變化而變化的直線方程,并要求各點與該直線縱向距離的平方和為最小。直線回歸是回歸分析中最基本、最簡單的一種,故又稱簡單回歸(simple regression)。
38.回歸系數(shù)(regression coefficient)即直線的斜率(slope),在直線回歸方程中用b 表示,b 的統(tǒng)計意義為X每增(減)一個單位時,Y平均改變b 個單位。
39.相關(guān)系數(shù)r:用以描述兩個隨機(jī)變量之間線性相關(guān)關(guān)系的密切程度與相關(guān)方向的統(tǒng)計指標(biāo)。衛(wèi)生統(tǒng)計學(xué)中的概念資料的類型、總體和樣本、參數(shù)和統(tǒng)計量、概率和頻率。
(一)資料的類型
1.定量資料亦稱計量資料,其變量值是定量的,表現(xiàn)為數(shù)值大小,一般有度量衡單位,如調(diào)查某年某地7歲女童的生長發(fā)育狀況,以人為觀察單位,女童的身高(cm)、體重(kg)、血紅蛋白(g/L)等均屬定量資料。
2.定性資料亦稱分類資料,其觀察值是定性的,表現(xiàn)為互不相容的類別或?qū)傩?,分為兩種情況:
(1)無序分類資料:包括:①二項分類。如調(diào)查吸毒者的HIV感染情況,結(jié)果分為陽性與陰性兩類,表現(xiàn)為互不相容的兩類屬性。②多項分類。如人類的AB0血型,以人為觀察單位,結(jié)果分為A型、B型、AB型與O型,表現(xiàn)為互不相容的多個類別。
(2)有序分類資料:各類之間有程度的差別,給人以“半定量”的概念,亦稱等級資料。如測定某人群某血清學(xué)反應(yīng),以人為觀察單位,結(jié)果可分“-”、“±”、“+”、“++”4級;又如觀察某藥治療十二指腸潰瘍的療效,以每個患者為觀察單位,治療效果分為痊愈、顯效、好轉(zhuǎn)、無效4級。
(二)總體和樣本
總體就是所有同質(zhì)觀察單位某種觀察值(即變量值)的集合。樣本是總體中隨機(jī)抽取部分觀察單位的觀測值的集合。
(三)參數(shù)和統(tǒng)計量
總體的數(shù)值特征稱為參數(shù),用希臘字母表示。根據(jù)樣本算得的某些數(shù)值特征稱為統(tǒng)計量,用英文字母表示。在抽樣研究中,由個體變異產(chǎn)生,隨機(jī)抽樣引起的樣本統(tǒng)計量與總體參數(shù)之間的差別稱為抽樣誤差。
(四)概率和頻率
概率是描述隨機(jī)事件發(fā)生可能性大小的數(shù)值,常用P表示。隨機(jī)事件概率的大小在0與1之間,P越接近1,表示某事件發(fā)生的可能性越大;P越接近0,表示某事件發(fā)生的可能性越小。習(xí)慣上將P≤0.05的事件,稱為小概率事件,表示在一次實驗或觀察中該事件發(fā)生的可能性很小,可視為不發(fā)生。
在現(xiàn)實中,隨機(jī)事件的概率往往是未知的,因此,當(dāng)觀測單位足夠多時,常用樣本中事件的實際發(fā)生率來估計總體概率,這種實際發(fā)生率稱為頻率。設(shè)在相同條件下,獨立重復(fù)進(jìn)行n次試驗,事件A出現(xiàn)t次,則事件A出現(xiàn)的頻率為t/n.如治療200例患者,120名患者治愈,治愈率為60%,這就是一個頻率。當(dāng)觀測單位較少時,用頻率估計概率是不可靠的。
第二篇:統(tǒng)計學(xué)名詞解釋
中位數(shù):被研究對象各單位的標(biāo)志值依其大小順序排列,位于標(biāo)志值數(shù)列中間位置的標(biāo)志值發(fā)展速度:兩個不同時期發(fā)展水平對比而計算的動態(tài)相對數(shù)/標(biāo)志:是說明總體單位特征或?qū)傩缘拿Q//統(tǒng)計指標(biāo);是指表明總體某種數(shù)量特征的概念及其數(shù)量表現(xiàn)//統(tǒng)計設(shè)計;在進(jìn)行某項具體工作之前,根據(jù)統(tǒng)計對象的性質(zhì)和統(tǒng)計研究的目的要求,對整個統(tǒng)計工作預(yù)先制定的實施方案和程序//專門調(diào)查:是指為了解決某個專門問題而單獨組織的調(diào)查//分配數(shù)列:是指在統(tǒng)計分組的基礎(chǔ)上把分配到各組的總體單位數(shù)按順序排列起來得到的數(shù)列//總量指標(biāo):是用來反映社會經(jīng)濟(jì)現(xiàn)象在一定條件下的總規(guī)模、總水平或工作總量的統(tǒng)計指標(biāo)//平均指標(biāo):是指代表同質(zhì)總體各單位某一數(shù)量標(biāo)志值一般水平的統(tǒng)計指標(biāo)//隨機(jī)變量:指的是影響變量值變動的因素很多,作用不同,因而變量值變動無確定方向,有偶然性//統(tǒng)計指標(biāo)體系:在統(tǒng)計上,由多種相互聯(lián)系、相互依存的統(tǒng)計指標(biāo)結(jié)合而成的,具有特定功能的有機(jī)整體就稱統(tǒng)計指標(biāo)體系//統(tǒng)計整理:是指根據(jù)統(tǒng)計研究任務(wù)的要求,對統(tǒng)計調(diào)查所取得的各項資料進(jìn)行科學(xué)的分類、匯總,為統(tǒng)計分析提供準(zhǔn)確、系統(tǒng)、條理得綜合資料的工作過程//變量:就是可以取不同的值得量,在社會經(jīng)濟(jì)統(tǒng)計中,各種數(shù)量標(biāo)志和全部統(tǒng)計指標(biāo)都是標(biāo)量//統(tǒng)計調(diào)查:按照統(tǒng)計設(shè)計的要求和統(tǒng)計研究的目的,運用科學(xué)的方法,搜集資料的統(tǒng)計活動過程//相對指標(biāo):用對比的方法來反映某些社會經(jīng)濟(jì)現(xiàn)象總體內(nèi)部的結(jié)構(gòu),比例,發(fā)展?fàn)顩r以及彼此之間的聯(lián)系程度的綜合指標(biāo)
移動平均法:是采用逐項遞項遞移的辦法計算出一系列擴(kuò)大時距的序時平均數(shù),并以這一系列序時平均數(shù)作為對應(yīng)的時期的趨勢值//發(fā)展速度:是兩個不同時期發(fā)展水平對比而計算的動態(tài)相對數(shù)//增長速度:是各期增長量與基期水平之比,用以說明各期現(xiàn)象增長變化的相對程度//時點指標(biāo):是反應(yīng)事物在某一時點上的狀況//總體變異性:是指總體所有單位至少有一個以上的可變品質(zhì)標(biāo)志或數(shù)量標(biāo)志//同質(zhì)性:單位在某些標(biāo)志上有共同性//發(fā)展水平:是指動態(tài)數(shù)列中各項具體的指標(biāo)數(shù)值//全面調(diào)查:就是對調(diào)查對象中全部單位進(jìn)行的調(diào)查//數(shù)量標(biāo)志:表明總體單位數(shù)量的方面特征的名稱//無限總體:總體所包括的單位數(shù)可以使無限的,叫無限總體//變量值:變量的數(shù)值表現(xiàn)稱為變量值//問卷調(diào)查:是以問題的形式系統(tǒng)的地記載所要調(diào)查內(nèi)容與質(zhì)詢問表,向調(diào)查對象搜集資料的調(diào)查方法
平均指標(biāo):是指同類社會經(jīng)濟(jì)現(xiàn)象在一定時間、地點、條件下所達(dá)到的一般水平//回歸分析:是測定現(xiàn)象之間聯(lián)系的具體形式的統(tǒng)計分析方法//估計標(biāo)準(zhǔn)誤差:用來說明回歸方程推算結(jié)果的準(zhǔn)確程度的統(tǒng)計分析指標(biāo),或者是反映回歸直線代表性大小的統(tǒng)計分析指標(biāo)//置信度:總體參數(shù)落在置信區(qū)間內(nèi)的概率保證程度////抽樣調(diào)查:是按照隨機(jī)原則從被研究總體中抽選一部分調(diào)查單位作為樣本進(jìn)行調(diào)查的,并計算出樣本指標(biāo)數(shù)值,而后用以推算總體指標(biāo)數(shù)值的一種方法//頻數(shù)分布:在統(tǒng)計分組的基礎(chǔ)上,將總體中所有單位按組歸類整理,形成總體中各個單位在各組間的分布//抽樣推斷:是在抽樣調(diào)查的基礎(chǔ)上,利用樣本的實際資料計算樣本指標(biāo),并據(jù)以推算總體分布或總體參數(shù)的一種統(tǒng)計分析方法/
第三篇:衛(wèi)生統(tǒng)計學(xué)總結(jié)
衛(wèi)生統(tǒng)計學(xué)總結(jié)
王玉林 石河子大學(xué)醫(yī)學(xué)院預(yù)防醫(yī)學(xué)系
(一)簡答題
一.方差分析的基本思想是什么?
方差分析的基本思想就是把全部觀察值間的變異(總變異)按設(shè)計和需要分解成兩個或多個組成部分,然后將各部分的變異與隨機(jī)誤差進(jìn)行比較,以判斷各部分的變異是否具有統(tǒng)計學(xué)意義,總自由度也分解成相應(yīng)的幾個部分,再做分析。分解的每一部分代表不同的含義,其中至少有一部分代表各均數(shù)間的變異情況,另一部分代表誤差。
二.標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)誤的區(qū)別與聯(lián)系?
標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)誤都是變異指標(biāo),但它們之間有區(qū)別,也有聯(lián)系。
1.區(qū)別:①概念不同:標(biāo)準(zhǔn)差是描述觀察值(個體值)之間的變異程度;標(biāo)準(zhǔn)誤是描述樣本均
數(shù)的抽樣誤差;
②用途不同:標(biāo)準(zhǔn)差與均數(shù)結(jié)合估計參考值范圍,計算變異系數(shù),計算標(biāo)準(zhǔn)誤等。
標(biāo)準(zhǔn)誤用于估計參數(shù)的可信區(qū)間,進(jìn)行假設(shè)檢驗等。
③它們與樣本含量的關(guān)系不同:當(dāng)樣本含量 n 足夠大時,標(biāo)準(zhǔn)差趨向穩(wěn)定;而標(biāo)
準(zhǔn)誤隨n的增大而減小,甚至趨于0。
2.聯(lián)系:標(biāo)準(zhǔn)差,標(biāo)準(zhǔn)誤均為變異指標(biāo),當(dāng)樣本含量不變時,標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差成正比。
三.假設(shè)檢驗的原理是什么?
假設(shè)檢驗:統(tǒng)計學(xué)中的一種推論過程,通過樣本統(tǒng)計量得出的差異作為一般性結(jié)論,判斷總體參數(shù)之間是否存在差異。
假設(shè)檢驗的實質(zhì)是對可置信性的評價,是對一個不確定問題的決策過程,其結(jié)果在一定概率上正確的,而不是全部。
1.兩類假設(shè)
對于任何一種研究而言,其結(jié)果無外乎有兩種可能,即是否符合我們預(yù)期。一般來說證偽一件事情比證實一件事容易,在行為科學(xué)的研究中,由于我們無法了解總體中除樣本以外的個體情況,因此嘗試拒絕虛無假設(shè)的方法優(yōu)于證明備擇假設(shè)。備則假設(shè):因變量的變化、差異確實是由于自變量的作用
往往是我們對研究結(jié)果的預(yù)期,用H1表示。
虛無假設(shè):實際上什么也沒有發(fā)生,我們所預(yù)計的改變、差異、處理效果都不存在 觀察到的差異只是隨機(jī)誤差在起作用,用H0表示。2.小概率原理
小概率原理:小概率事件在一次試驗中幾乎是不可能發(fā)生的
至于什么就算小概率事件,那就是我們在計算前明確的決策標(biāo)準(zhǔn),也就是顯著性水平α。在檢驗過程中,我們假設(shè)虛無假設(shè)是真實的,同時計算出觀測到的差異完全是由于隨機(jī)誤差所致的概率。之后將其與我們實現(xiàn)界定好的顯著性水平比較,從而考慮是否依據(jù)小概率原理來拒絕虛無假設(shè)。
3.兩類錯誤 第Ⅰ類錯誤:當(dāng)虛無假設(shè)正確時,我們拒絕了它所犯的錯誤,也叫α錯誤 研究者得出了處理有效果的結(jié)論,而實際上并沒有效果,即所謂“無中生有” 第Ⅱ類錯誤:當(dāng)虛無假設(shè)是錯誤的時候,我們沒有拒絕所犯的錯誤,也叫β錯誤 假設(shè)檢驗未能偵查到實際存在的處理效應(yīng),即所謂“失之交臂” 兩類檢驗的關(guān)系 ①α+β不一定等于1 ②在其他條件不變的情況下,α與β不可能同時減小或增大 4.檢驗的方向性
單側(cè)檢驗:強調(diào)某一方向的檢驗,顯著性的百分等級為α
雙側(cè)檢驗:只強調(diào)差異不強調(diào)方向性的檢驗,顯著性百分等級為α/2 對于同樣的顯著性標(biāo)準(zhǔn),在某一方向上,單側(cè)檢驗的臨界區(qū)域要大于雙側(cè)檢驗,因此如果差異發(fā)生在該方向,單側(cè)檢驗犯β錯誤的概率較小,我們也說它的檢驗效力更高。5.假設(shè)檢驗的步驟
①根據(jù)問題要求,提出虛無假設(shè)和備擇假設(shè) ②選擇適當(dāng)?shù)臋z驗統(tǒng)計量 ③確定檢驗的方向性并規(guī)定顯著性水平④計算檢驗統(tǒng)計量的值 ⑤將統(tǒng)計量的值與臨界值對比做出決策
附:假設(shè)檢驗基本推斷原理:小概率事件在一次隨機(jī)試驗中不(大)可能發(fā)生。
假設(shè)檢驗基本邏輯:在零假設(shè)成立的情形下計算統(tǒng)計量和P值,把“不太可能出現(xiàn)的 假陽性”當(dāng)做“不可能出現(xiàn)假陽性”,從而拒絕零假設(shè)。
四.直線相關(guān)與直線回歸的區(qū)別與聯(lián)系?
1.區(qū)別:①相關(guān)分析資料雙變量正態(tài)分布,回歸資料只要求Y為正態(tài)分布,X可是正態(tài)分布
資料,也可為一般變量。
②意義上,相關(guān)說明互相關(guān)系,回歸反應(yīng)依存關(guān)系。2.聯(lián)系:①同一資料,r與b的正負(fù)號相同
②r與b的假設(shè)檢驗等價,同一資料tb=tr
③用回歸解釋相關(guān)R2=SS回/SS總
五.應(yīng)用相對數(shù)時的注意事項?
1.理解相對數(shù)的含義不可望文生義 2.頻率型指標(biāo)的解釋要緊扣總體與屬性 3.計算相對數(shù)時分母應(yīng)有足夠數(shù)量 4.正確計算合計率 5.注意資料的可比性 6.樣本相對數(shù)的統(tǒng)計推斷
六.非參數(shù)檢驗的特點和適用范圍
1.特點:①對樣本所來自的總體分布形式?jīng)]有要求。
②收集資料方便,可用“等級”或“符號”來記錄觀察結(jié)果。
③多數(shù)非參數(shù)檢驗方法比較簡便,易于理解和掌握。
④缺點是損失信息量,適用于參數(shù)檢驗的資料用非參數(shù)檢驗會降低檢驗效能。2.適用范圍:①等級資料。②偏態(tài)分布資料。③方差不齊,且不能通過變量變換達(dá)到齊性。
④個體數(shù)據(jù)偏離過大,或一端或兩端無界的資料。⑤分布類型不明。⑥初步分析。七.卡方檢驗的用途?
1.單樣本分布的擬合優(yōu)度;
2.比較兩個或多個獨立樣本頻率或獨立樣本頻率分布; 3.比較配對設(shè)計兩樣本和兩頻率分布。
八.均數(shù)比較的方法有哪些?
1.t檢驗
①單樣本資料的t檢驗:樣本均數(shù)與總體均屬比較的t檢驗,推斷樣本是否來自已知總體。
應(yīng)用條件:計量資料,具有獨立性、正態(tài)性、方差齊性。
②兩獨立樣本資料的t檢驗:推斷兩樣本總體均數(shù)是否相等(或兩樣本是否來自同一總體)。
應(yīng)用條件:計量資料,具有獨立性、正態(tài)性、方差齊性。
③配對設(shè)計資料的t檢驗:配對計量資料比較的t檢驗,差值均數(shù)的比較,包括異體配對和
自身配對。
應(yīng)用條件:計量資料,具有獨立性、正態(tài)性、方差齊性。2.方差分析
①完全隨機(jī)設(shè)計資料的方差分析:多個樣本均數(shù)的比較。
應(yīng)用條件:計量資料,具有獨立性、正態(tài)性、方差齊性。②隨機(jī)區(qū)組設(shè)計資料的方差分析:多個樣本均數(shù)的比較。
應(yīng)用條件:計量資料,具有獨立性、正態(tài)性、方差齊性。
③析因設(shè)計資料的方差分析:分析個實驗因素的單獨效應(yīng)、主效應(yīng)和因素間的交互效應(yīng)。
應(yīng)用條件:計量資料,具有獨立性、正態(tài)性、方差齊性。
3.非參數(shù)檢驗
①單樣本資料的秩和檢驗:用于不滿足t檢驗條件的單樣本定量變量資料的比較,推斷樣本中位數(shù)與已知總體中位數(shù)是否相等。
應(yīng)用條件:計量資料,不具有獨立性、正態(tài)性、方差齊性。
②配對設(shè)計資料的秩和檢驗:當(dāng)差值d不滿足正態(tài)分布時使用,推斷兩個總體中位數(shù)是否相等,即兩種處理效應(yīng)是否相同。
應(yīng)用條件:計量資料,差值具有正態(tài)性。③兩獨立樣本比較的秩和檢驗:推斷連續(xù)型變量資料或有序變量資料的兩個獨立樣本代表的兩個總體分布是否有差別。
應(yīng)用條件:兩樣本來自非正態(tài)總體或方差不齊。
④多組獨立樣本比較的秩和檢驗:推斷定量變量或有序分類變量的多個總體分布有無差別。
應(yīng)用條件:多個獨立樣本對應(yīng)總體不滿足正態(tài)性或方差齊性。⑤隨機(jī)區(qū)組設(shè)計的秩和檢驗:多個樣本均數(shù)的比較。
應(yīng)用條件:多個獨立樣本對應(yīng)總體不滿足正態(tài)性或方差齊性。
九.參考值范圍和可信區(qū)間的區(qū)別與聯(lián)系
1.從意義來看
95%參考值范圍是指同質(zhì)總體內(nèi)包括95%個體值的估計范圍,而總體均數(shù)95%可信區(qū)間是指按95%可信度估計的總體均數(shù)的所在范圍。2.從計算公式看
若指標(biāo)服從正態(tài)分布,95%參考值范圍的公式是:
±1.96s??傮w均數(shù)95%可信區(qū)間的公式是:。
前者用標(biāo)準(zhǔn)差,后者用標(biāo)準(zhǔn)誤。前者用1.96,后者用α為0.05,自由度為v的t界值。
十.頻率分布表(圖)的用途是什么?
1.揭示資料的分布類型
2.描述分布的集中趨勢和離散趨勢 3.便于發(fā)現(xiàn)某些特大和特小的可疑值 4.便于進(jìn)一步計算指標(biāo)和統(tǒng)計分析
(二)名詞解釋
1.醫(yī)學(xué)統(tǒng)計學(xué)(medical statistics)應(yīng)用概率論和數(shù)理統(tǒng)計學(xué)原理結(jié)合醫(yī)學(xué)實際解決醫(yī)學(xué)科研中設(shè)計,資料收集、整理、分析的科學(xué)。
2.總體(population)是根據(jù)研究目的確定的同質(zhì)研究對象的全體。3.樣本(sample)是指從研究總體中抽取的一部分有代表性的個體。
4.同質(zhì)(homogeneity)是指同一總體中個體的性質(zhì)、影響條件或背景相同或非常相近。5.變異(variation)是指同質(zhì)的個體之間存在的差異。6.參數(shù)(parameter)是指反映總體特征的統(tǒng)計指標(biāo)。
7.樣本統(tǒng)計量(statistic)由樣本觀察資料計算出來的反映樣本特征的兩稱為樣本統(tǒng)計量。8.頻率分布表(frequency distribution table)當(dāng)變量值個數(shù)較多時,對各變量值出現(xiàn)的頻率列表即為頻率分布表,簡稱頻率表。
9.二項分布(binomial distribution)是指在只會產(chǎn)生兩種可能結(jié)果的n次獨立重復(fù)試驗中,當(dāng)每次試驗的“陽性”概率保持不變時,出現(xiàn)“陽性”的次數(shù)X=0,1,2,3...,n的一種概率分布。
10.醫(yī)學(xué)參考值范圍(reference range)是指特定的“正常”人群的解剖、生理、生化指標(biāo)及組織代謝產(chǎn)物含量等數(shù)據(jù)中大多數(shù)個體的取值所在的范圍。
11.抽樣誤差(sampling error)由于生物固有的個體變異的存在,從某一總體中隨機(jī)抽取一個樣本,所得樣本統(tǒng)計量與相應(yīng)的總體參數(shù)往往是不同的,這種差異稱為抽樣誤差。
12.置信區(qū)間(confidence interval,CI)區(qū)間估計是將樣本統(tǒng)計量與標(biāo)準(zhǔn)誤結(jié)合起來,確定一個具有較大置信度的包含總體參數(shù)的范圍,該范圍稱為總體參數(shù)的置信區(qū)間。
13.統(tǒng)計推斷(statistical inference)由樣本信息對相應(yīng)總體的特征進(jìn)行推斷稱為統(tǒng)計推斷。14.假設(shè)檢驗(hypothesis testing)若對所估計的總體首先提出一個假設(shè),然后通過樣本數(shù)據(jù)去推斷是否拒絕這一假設(shè),稱為假設(shè)檢驗。
15.析因設(shè)計(factorial design)是將兩個或多個實驗因素的個水平進(jìn)行全面組合的實驗,能夠分析個實驗因素的單獨效應(yīng)、主效應(yīng)和因素間的交互效應(yīng)。
16.單獨效應(yīng)(simple effect)是指其他因素水平固定時,同一因素不同水平的效應(yīng)之差。17.主效應(yīng)(main effect)是指某一因素單獨效應(yīng)的平均值。
18.交互效應(yīng)(interaction)是指兩個或多個因素間的效應(yīng)互不獨立的情形。
19.參數(shù)檢驗(parametric test)凡是以特定的總體分布為前提,對未知的總體參數(shù)做推斷的假設(shè)檢驗方法統(tǒng)稱為參數(shù)檢驗。
20.非參數(shù)檢驗(nonparametric test)不以特定的總體分布為前提,也不針對決定總體分布的幾個參數(shù)做推斷,故又稱任意分布檢驗(distribution-free test)。
21.線性相關(guān)系數(shù)(linear correlation coefficient)是表示兩個隨機(jī)變量之間線性相關(guān)強度和方向的統(tǒng)計量。
22.回歸系數(shù)(regression coefficient)回歸分析中度量依變量對自變量的相依程度的指標(biāo),它反映當(dāng)自變量每變化一個單位時,依變量所期望的變化量。(回歸系數(shù)βj表示在控制其他自變量時,自變量Xj變化一個單位所引起logit(π)的改變量)
23.決定系數(shù)(coefficient of determination)回歸平方和與總離均差平方和之比稱為決定系數(shù)。它反映了回歸貢獻(xiàn)的相對程度,即在因變量Y的總變異中回歸關(guān)系所能解釋的比例。24.生存分析(survival analysis)就是將終點事件的出現(xiàn)與否和達(dá)到終點所經(jīng)歷的時間結(jié)合起來分析的一類統(tǒng)計分析方法。
第四篇:醫(yī)學(xué)統(tǒng)計學(xué)名詞解釋、簡答、問答
名詞解釋
1.總體:總體(population)是根據(jù)研究目的確定的同質(zhì)的觀察單位的全體,更確切的說,是同質(zhì)的所有觀察單位某種觀察值(變量值)的集合??傮w可分為有限總體和無限總體??傮w中的所有單位都能夠標(biāo)識者為有限總體,反之為無限總體。樣本:從總體中隨機(jī)抽取部分觀察單位,其測量結(jié)果的集合稱為樣本(sample)。樣本應(yīng)具有代表性。所謂有代表性的樣本,是指用隨機(jī)抽樣方法獲得的樣本。2.隨機(jī)抽樣:隨機(jī)抽樣(random sampling)是指按照隨機(jī)化的原則(總體中每一個觀察單位都有同等的機(jī)會被選入到樣本中),從總體中抽取部分觀察單位的過程。隨機(jī)抽樣是樣本具有代表性的保證。3.變異:在自然狀態(tài)下,個體間測量結(jié)果的差異稱為變異(variation)。變異是生物醫(yī)學(xué)研究領(lǐng)域普遍存在的現(xiàn)象。嚴(yán)格的說,在自然狀態(tài)下,任何兩個患者或研究群體間都存在差異,其表現(xiàn)為各種生理測量值的參差不齊。4.計量資料:對每個觀察單位用定量的方法測定某項指標(biāo)量的大小,所得的資料稱為計量資料(measurement data)。計量資料亦稱定量資料、測量資料。.其變量值是定量的,表現(xiàn)為數(shù)值大小,一般有度量衡單位。如某一患者的身高(cm)、體重(kg)、紅細(xì)胞計數(shù)(1012/L)、脈搏(次/分)、血壓(KPa)等。計數(shù)資料:將觀察單位按某種屬性或類別分組,所得的觀察單位數(shù)稱為計數(shù)資料(count data)。計數(shù)資料亦稱定性資料或分類資料。其觀察值是定性的,表現(xiàn)為互不相容的類別或?qū)傩浴H缯{(diào)查某地某時的男、女性人口數(shù);治療一批患者,其治療效果為有效、無效的人數(shù);調(diào)查一批少數(shù)民族居民的A、B、AB、O 四種血型的人數(shù)等。等級資料:將觀察單位按測量結(jié)果的某種屬性的不同程度分組,所得各組的觀察單位數(shù),稱為等級資料(ordinal data)。等級資料又稱有序變量。如患者的治療結(jié)果可分為治愈、好轉(zhuǎn)、有效、無效或死亡,各種結(jié)果既是分類結(jié)果,又有順序和等級差別,但這種差別卻不能準(zhǔn)確測量;一批腎病患者尿蛋白含量的測定結(jié)果分為 +、++、+++等。等級資料與計數(shù)資料不同:屬性分組有程度差別,各組按大小順序排列。等級資料與計量資料不同:每個觀察單位未確切定量,故亦稱為半計量資料。5.概率:概率(probability)又稱幾率,是度量某一隨機(jī)事件A發(fā)生可能性大小的一個數(shù)值,記為P(A),P(A)越大,說明A事件發(fā)生的可能性越大。0﹤P(A)﹤1。頻率:在相同的條件下,獨立重復(fù)做n 次試驗,事件A 出現(xiàn)了m 次,則比值m/n 稱為隨機(jī)事件A 在n 次試驗中出現(xiàn)的頻率(freqency)。當(dāng)試驗重復(fù)很多次時P(A)= m/n。6.隨機(jī)誤差(random error)又稱偶然誤差,是指排除了系統(tǒng)誤差后尚存的差。它受多種因素的影響,使觀察值不按方向性和系統(tǒng)性而隨機(jī)的變化。誤差變量一般服從正態(tài)分布。隨機(jī)誤差可以通過統(tǒng)計處理來估計。抽樣誤差(sampling error)是指樣本統(tǒng)計量與總體參數(shù)的差別。在總體確定的情況下,總體參數(shù)是固定的常數(shù),統(tǒng)計量是在總體參數(shù)附近波動的隨機(jī)變量。7.系統(tǒng)誤差:系統(tǒng)誤差(systematic error)是指由于儀器未校正、測量者感官的某種偏差、醫(yī)生掌握療效標(biāo)準(zhǔn)偏高或偏低等原因,使觀察值不是分散在真值的兩側(cè),而是有方向性、系統(tǒng)性或周期性地偏離真值。系統(tǒng)誤差可以通過實驗設(shè)計和完善技術(shù)措施來消除或使之減少。8.隨機(jī)變量:隨機(jī)變量(random variable)是指取指不能事先確定的觀察結(jié)果。隨機(jī)量的具體內(nèi)容雖然是各式各樣的,但共同的特點是不能用一個常數(shù)來表示,而且,理論上講,每個變量的取值服從特定的概率分布9.參數(shù):參數(shù)(paramater)是指總體的統(tǒng)計指標(biāo),如總體均數(shù)、總體率等??傮w參數(shù)是固定的常數(shù)。多數(shù)情況下,總體參數(shù)是不易知道的,但可通過隨機(jī)抽樣抽取有代表性的樣本,用算得的樣本統(tǒng)計量估計未知的總體參數(shù)10.統(tǒng)計量:統(tǒng)計量(statistic)是指樣本的統(tǒng)計指標(biāo),如樣本均數(shù)、樣本率等。樣本統(tǒng)計量可用來估計總體參數(shù)??傮w參數(shù)是固定的常數(shù),統(tǒng)計量是在總體參數(shù)附近波動的隨機(jī)變量。11.頻數(shù)表(frequency table)用來表示一批數(shù)據(jù)各觀察值或在不同取值區(qū)間的出現(xiàn)的頻繁程度(頻數(shù))。對于離散數(shù)據(jù),每一個觀察值即對應(yīng)一個頻數(shù),如某醫(yī)院某一日內(nèi)死亡0,1,2?個病人的天數(shù)。對于散布區(qū)間很大的離散數(shù)據(jù)和連續(xù)型數(shù)據(jù),數(shù)據(jù)散布區(qū)間由若干組段組成,每個組段對應(yīng)一個頻數(shù)。12.算術(shù)均數(shù)(arithmetic mean)描述一組數(shù)據(jù)在數(shù)量上的平均水平??傮w均數(shù)用μ表示,樣本均數(shù)用X 表示。13.幾何均數(shù)(geometric mean)用以描述對數(shù)正態(tài)分布或數(shù)據(jù)呈倍數(shù)變化資料的水平。記為G。14.中位數(shù)(median)Md將一組觀察值由小到大排列,n 為奇數(shù)時取位次居中的變量值;為偶數(shù)時,取位次居中的兩個變量的平均值。反映一批觀察值在位次上的平均水平。15.極差(range)亦稱全距,即最大值與最小值之差,用于資料的粗略分析,其計算簡便但穩(wěn)定性較差。16.百分位數(shù)(percentile)是將n 個觀察值從小到大依次排列,再把它們的位次依次轉(zhuǎn)化為百分位。百分位數(shù)的另一個重要用途是確定醫(yī)學(xué)參考值范圍。17.四分位數(shù)間距(inter-quartile range)是由第3 四分位數(shù)和第1 四分位數(shù)相減計算而得,常與中位數(shù)一起使用,描述偏態(tài)分布資料的分布特征,較極差穩(wěn)定。18.方差(variance):方差表示一組數(shù)據(jù)的平均離散情況,由離均差的平方和除以樣本個數(shù)得到。19.標(biāo)準(zhǔn)差(standard deviation)是方差的正平方根,使用的量綱與原量綱相同,適用于近似正態(tài)分布的資料,大樣本、小樣本均可,最為常用。20.變異系數(shù)(coefficient of variation)用于觀察指標(biāo)單位不同或均數(shù)相差較大時兩組資料變異程度的比較。用CV 表示。計算:標(biāo)準(zhǔn)差/均數(shù)*100% 21.統(tǒng)計推斷:通過樣本指標(biāo)來說明總體特征,這種從樣本獲取有關(guān)總體信息的過程稱為統(tǒng)計推斷(statistical inference)。22.抽樣誤差:由個體變異產(chǎn)生的,抽樣造成的樣本統(tǒng)計量與總體參數(shù)的差異,稱為抽樣誤差(sampling error)。23.標(biāo)準(zhǔn)誤及X s :通常將樣本統(tǒng)計量的標(biāo)準(zhǔn)差稱為標(biāo)準(zhǔn)誤。許多樣本均數(shù)的標(biāo)準(zhǔn)差X s稱為均數(shù)的標(biāo)準(zhǔn)誤(standard error of mean,SEM),它反映了樣本均數(shù)間的離散程度,也反映了樣本均數(shù)與總體均數(shù)的差異,說明均數(shù)抽樣誤差的大小。24.可信區(qū)間:按預(yù)先給定的概率確定的包含未知總體參數(shù)的可能范圍。該范圍稱為總體參數(shù)的可信區(qū)間(confidence interval,CI)。它的確切含義是:可信區(qū)間包含總體參數(shù)的可能性是1-α,而不是總體參數(shù)落在該范圍的可能性為1-α。25.參數(shù)估計:指用樣本指標(biāo)值(統(tǒng)計量)估計總體指標(biāo)值(參數(shù))。參數(shù)估計有兩種方法:點估計和區(qū)間估計。26.假設(shè)檢驗中P 的含義:指從H0 規(guī)定的總體隨機(jī)抽得等于及大于(或等于及小于)現(xiàn)有樣本獲得的檢驗統(tǒng)計量值的概率。27.I 型和II 型錯誤:I 型錯誤(type I error),指拒絕了實際上成立的H0,這類“棄真”的錯誤稱為I 型錯誤,其概率大小用α表示;II 型錯誤(type II error),指接受了實際上不成立的H0,這類“存?zhèn)巍钡恼`稱為II 型錯誤,其概率大小用β表示。28.檢驗效能:1-β稱為檢驗效能(power of test),它是指當(dāng)兩總體確有差別,按規(guī)定的檢驗水準(zhǔn)a 所能發(fā)現(xiàn)該差異的能力。29.檢驗水準(zhǔn):是預(yù)先規(guī)定的,當(dāng)假設(shè)檢驗結(jié)果拒絕H0,接受H1,下“有差別”的結(jié)論時犯錯誤的概率稱為檢驗水準(zhǔn)(level of a test),記為α。30..率(rate)又稱頻率指標(biāo),說明一定時期內(nèi)某現(xiàn)象發(fā)生的頻率或強度。計算公式為:發(fā)生某現(xiàn)象的觀察單位數(shù)/可能發(fā)生某現(xiàn)象的觀察單位總數(shù)*100%,表示方式有:百分率(%)、千分率(?)等。31.構(gòu)成比(proportion)又稱構(gòu)成指標(biāo),說明某一事物內(nèi)部各組成部分所占的比重或分布。計算公式為:某一組 1
成部分的觀察單位數(shù)/同一事物各組成部分的觀察單位總數(shù)*100%,表示方式有:百分?jǐn)?shù)等。32.比(ratio)又稱相對比,是A、B 兩個有關(guān)指標(biāo)之比,說明A 是B 的若干倍或百分之幾。計算公式為:A/B,表示方式有:倍數(shù)或分?jǐn)?shù)等。
33.非參數(shù)統(tǒng)計:針對某些資料的總體分布難以用某種函數(shù)式來表達(dá),或者資料的總體分布的函數(shù)式是未知的,只知道總體分布是連續(xù)型的或離散型的,用于解決這類問題的一種不依賴總體分布的具體形式的統(tǒng)計分析方法。由于這類方法不受總體參數(shù)的限制,故稱非參數(shù)統(tǒng)計法(non-parametric statistics),或稱為不拘分布(distribution-free statistics)的統(tǒng)計分析方法,又稱為無分布型式假定(assumption free statistics)的統(tǒng)計分析方法。34.參數(shù)統(tǒng)計:通常要求樣本來自總體分布型是已知的(如正態(tài)分布),在這種假設(shè)的基礎(chǔ)上,對總體參數(shù)(如總體均數(shù))進(jìn)行估計和檢驗,稱為參數(shù)統(tǒng)計(parametric statistics)35.秩次:變量值按照從小到大順序所編的秩序號稱為秩次(rank)。
36.秩和:各組秩次的合計稱為秩和(rank sum),是非參數(shù)檢驗的基本統(tǒng)計量。37.直線回歸(linear regression)建立一個描述應(yīng)變量依自變量變化而變化的直線方程,并要求各點與該直線縱向距離的平方和為最小。直線回歸是回歸分析中最基本、最簡單的一種,故又稱簡單回歸(simple regression)。38.回歸系數(shù)(regression coefficient)即直線的斜率(slope),在直線回歸方程中用b 表示,b 的統(tǒng)計意義為X每增(減)一個單位時,Y平均改變b 個單位。
39.相關(guān)系數(shù)r:用以描述兩個隨機(jī)變量之間線性相關(guān)關(guān)系的密切程度與相關(guān)方向的統(tǒng)計指標(biāo)。
簡答題
1.醫(yī)學(xué)統(tǒng)計工作的內(nèi)容:1)實驗設(shè)計2)收集資料3)整理資料4)分析資料2.資料的類型:1)計量資料2)計數(shù)資料3)等級分組資料。3.抽樣包括四種特征:1)代表性2)隨機(jī)性3)可靠性4)可比性。4.頻數(shù)表的編制方法和應(yīng)注意的問題:1)確定組數(shù)2)確定組距3)確定組限4)用手工編制劃計表.5.正態(tài)分布的幾個主要特征:1)正態(tài)分布以均值u為中心,左右對稱。2)正態(tài)分布中曲線下面積集中以均值u為中心的中心部分,越遠(yuǎn)離中心曲線越接近X軸曲線下面積越小,超過一定范圍以外的面積可以忽略。3)正態(tài)分布曲線下的面積分布有一定的規(guī)律。4)正態(tài)分布完全由參數(shù)u和6決定,當(dāng)6一定后u增大,曲線沿橫軸向右移動,反之u減小曲線沿橫軸向左移動。6.總體均數(shù)的估計方法有兩種:
1)點估計2)區(qū)間估計7.T分布的特點:分布曲線的形態(tài)變化與自由度V(V=N—1)有關(guān),當(dāng)自由度V逼近OO時,T分布趨向于標(biāo)準(zhǔn)正態(tài)分布。8.配對設(shè)計主要有三種情況:1)兩種同質(zhì)受試對象分別接受兩種處理,如:把同窩同性別和體重相近的動物配成一對,或把同性別和年齡相近的相同病人配成一對。2)同一受試對象或同一樣本的兩個部分,分別接受兩種不同處理。3)自身對比,即將同一受試對象處理前后的結(jié)果進(jìn)行比較。9.總體方差具有齊性時的兩獨立樣本T檢驗:兩獨立樣本T檢驗的檢驗統(tǒng)計量在H0:即=0的條件下為:。10.假設(shè)檢驗中的兩類錯誤:1)型錯誤:指拒絕了實際上成立的H0即”棄真”的錯誤,其概率用 表示。2)型錯誤:指接受了實際上不成立的H0即“存?zhèn)巍钡腻e誤,其概率用 表示。11.相對數(shù)常用的種類有:率構(gòu)成比 相對比12.相對數(shù)使用應(yīng)注意的問題:1)不要把構(gòu)成比與率相混淆。2)使用相對數(shù)時,分母不宜過小。3)要注意資料的可比性。4)要注意使用率的標(biāo)準(zhǔn)化。5)要考慮存在抽樣誤差。13.T分布圖形特征:1)單峰分布:以0為中心,左右對稱,類似于標(biāo)準(zhǔn)正態(tài)分布的單峰分布。2)T分布圖形不是一條曲線,而是一族曲線其形態(tài)變化與自由度大小有關(guān),自由度越小,則SX越大。T值越分散,曲線的峰部越矮尾部越粗,則T分布曲線越低。3)自由度V越大,T分布越接近于正態(tài)分布。14.方差分析的三種變異:1)總變異
2)組間變異3)組內(nèi)變異自由度V=N-1(例數(shù))V=K-1(組數(shù))V=N-K(例數(shù)-組數(shù))15.標(biāo)準(zhǔn)化的意義:是為了在比較兩個不同人群的患病率發(fā)病率死亡率等資料時,消除其內(nèi)部構(gòu)成(如:年齡性別工齡病情長短等)的影響。16.常用疾病統(tǒng)計的指標(biāo):1)發(fā)病率:表示某一時期內(nèi)某人群中患某病新病例的頻率。2)患病率:表示某一時點某人群中患某病的頻率。3)病死率:表示某期間內(nèi)某病患者中因某病死亡的頻率。4)治愈率:表示接受治療的病人中治愈的頻率。17.X的適用條件:1)當(dāng)N 40有理論頻數(shù)1 T 5時,須對X值進(jìn)行連續(xù)性校正。2)若遇到總倒數(shù)N 40或有理論頻數(shù)T 1,即使采用校正公式計算的X值也會有偏差。因此,直接計算有利于拒絕H0的概率,以作出檢驗判斷的方法。18.非參數(shù)檢驗方法適用于:1)總體分布為偏態(tài)或分布形態(tài)未知的計量資料2)等級資料3)個別數(shù)據(jù)偏大或數(shù)據(jù)的某一端無確定數(shù)值4)各組離散程度相差懸殊,即各總體方差不齊。如:有一題需列出:不滿意 滿意 很滿意 非常滿意等,則選用非參數(shù)檢驗方法。19.非參數(shù)檢驗的優(yōu)點為:適應(yīng)性強缺點為:非參數(shù)檢驗方法犯第二類錯誤的可能性大于參數(shù)檢驗法,對于適合參數(shù)檢驗的資料最好還是用參數(shù)檢驗20.統(tǒng)計圖通常由五部分組成:1)標(biāo)題2)圖域3)標(biāo)目4)圖例5)刻度21.統(tǒng)計圖和統(tǒng)計表的作用:代替文字,以表或圖的形式進(jìn)行了闡述。22.怎樣確定P值:
(1)當(dāng)N 25時,可查T界值表,T越小P越小。當(dāng)N 25時,無法查T界值表,可按近似正態(tài)分布用u檢驗(2)如果T值在查表界值內(nèi) 0.05;如果T值在查表界值外 0.05.23.常用的統(tǒng)計圖有:直系圖 百分系圖 圓圖 直方圖 構(gòu)成圖。
24.樣本均數(shù)的抽樣分布具有以下特點:1)各樣本均數(shù)未必等于總體均數(shù)2)樣本之間存在差異3)樣本均數(shù)的分布很有規(guī)律,圍繞著總體均數(shù)中間多兩邊少左右基本對稱,也服從對稱分布4)樣本均數(shù)變異較原變量的差異大大縮小。25.直方圖與直條圖區(qū)別:1)直方圖:適用于表示連續(xù)變量頻數(shù)分布情況。2)直條圖:適用于無連續(xù)關(guān)系,各自獨立的統(tǒng)計指標(biāo)。26.圓圖與百分條圖:1)圓圖:是一種構(gòu)成圖,適用于構(gòu)成比資料,在圓圖中圓的總面積表示事物的全部,而圓內(nèi)的各扇形面積用來表示全體中各部分所占的比。2)百分條圖:也是一種構(gòu)成圖,用矩形條子的面積表示事物全部,而用其中各段表示各構(gòu)成部分。27.方差分析的應(yīng)用條件:各樣本相互獨立且均來自總體方差具有齊性的正態(tài)分布。問答題
1、標(biāo)準(zhǔn)正態(tài)分布(u分布)與t分布有何異同?
相同點:集中位置都為0,都是單峰分布,是對稱分布,標(biāo)準(zhǔn)正態(tài)分布是t分布的特例(自由度是無限大時)
不同點:t分布是一簇分布曲線,t 分布的曲線的形狀是隨自由度的變化而變化,標(biāo)準(zhǔn)正態(tài)分布的曲線的形狀不變,是固定不變的,因為它的形狀參數(shù)為1。
3、簡述直線回歸與直線相關(guān)的區(qū)別。
1資料要求上不同:直線回歸分析適用于應(yīng)變量是服從正態(tài)分布的隨機(jī)變量,自變量是選定變量;直線相關(guān)分析適用于服從雙變量正態(tài)分布的資料。兩種系數(shù)的意義不同:回歸系數(shù)是表明兩個變量之間數(shù)量上的依存關(guān)系,回歸系數(shù)越大回歸直線越陡峭,表示應(yīng)變
量隨自變量變化越快;相關(guān)系數(shù)是表明兩個變量之間相關(guān)的方向和緊密程度的,相關(guān)系數(shù)越大,兩個變量的關(guān)聯(lián)程度越大。
4、抽樣中要求每一個樣本應(yīng)該具有哪三性?
從總體中抽取樣本,其樣本應(yīng)具有“代表性”、“隨機(jī)性”和“可靠性”。
(1)代表性: 就是要求樣本中的每一個個體必須符合總體的規(guī)定。
(2)隨機(jī)性: 就是要保證總體中的每個個體均有相同的幾率被抽作樣本。
(3)可靠性: 即實驗的結(jié)果要具有可重復(fù)性,即由科研課題的樣本得出的結(jié)果所推測總體的結(jié)論有較大的可信度。由于個體之間存在差異, 只有觀察一定數(shù)量的個體方能體現(xiàn)出其客觀規(guī)律性。每個樣本的含量越多,可靠性會越大,但是例數(shù)增加,人力、物力都會發(fā)生困難,所以應(yīng)以“足夠”為準(zhǔn)。需要作“樣本例數(shù)估計”。
5、什么是兩個樣本之間的可比性?
可比性是指處理組(臨床設(shè)計中稱為治療組)與對照組之間,除處理因素不同外,其他可能影響實驗結(jié)果的因素要求基本齊同,也稱為齊同對比原則。
6、什么叫醫(yī)學(xué)統(tǒng)計學(xué)?醫(yī)學(xué)統(tǒng)計學(xué)與統(tǒng)計學(xué)、衛(wèi)生統(tǒng)計學(xué)、生物統(tǒng)計學(xué)有何聯(lián)系與區(qū)別? 醫(yī)學(xué)統(tǒng)計學(xué):是運用統(tǒng)計學(xué)原理和方法研究生物醫(yī)學(xué)資料的搜索、整理、分析和推斷的一門學(xué)科 統(tǒng)計學(xué):是研究數(shù)據(jù)的收集、整理、分析與推斷的科學(xué)。衛(wèi)生統(tǒng)計學(xué):是把統(tǒng)計理論、方法應(yīng)用于居民健康狀況研究、醫(yī)療衛(wèi)生實踐、衛(wèi)生事業(yè)管理和醫(yī)學(xué)科研的一門應(yīng)用學(xué)科。生物統(tǒng)計學(xué):是一門探討如何從不完整的信息中獲取科學(xué)可靠的結(jié)論從而進(jìn)一步進(jìn)行生物學(xué)實驗研究的設(shè)計,取樣,分析,資料整理與推論的科學(xué)。
7、醫(yī)學(xué)統(tǒng)計的資料主要來源于那些方面?有何要求?
醫(yī)學(xué)統(tǒng)計資料主要有實驗數(shù)據(jù)和現(xiàn)場調(diào)查資料、醫(yī)療衛(wèi)生工作記錄、報表和報告卡等。實驗數(shù)據(jù)是指在試驗過程中活的的數(shù)據(jù);現(xiàn)場調(diào)查資料主要來源于大規(guī)模的流行病調(diào)查獲取的資料;醫(yī)療衛(wèi)生工作記錄有門診病歷卡、住院病歷卡、化驗報告等;報表有衛(wèi)生工作基本情況年報表、傳染年(月、日)報表、疫情旬(年、月、日)報表等;報表卡有傳染病發(fā)病報告卡、出生報告卡、死亡報告卡等等。這些資料的手機(jī)過程中,必須進(jìn)行質(zhì)量抗旨,包括它的統(tǒng)一性、確切性、可重復(fù)性。這些原始數(shù)據(jù)的精讀和偏性應(yīng)有明確的范圍。
8、醫(yī)學(xué)統(tǒng)計學(xué)的資料類型有哪些?
(1)計量資料:對每個觀察單位用定量的方法測定某項指標(biāo)量的大小,所得的資料稱為計量資料(measurement data)。計量資料亦稱定量資料、測量資料。.其變量值是定量的,表現(xiàn)為數(shù)值大小,一般有度量衡單位。如某一患者的身高(cm)、12體重(kg)、紅細(xì)胞計數(shù)(10/L)、脈搏(次/分)、血壓(KPa)等。
(2)計數(shù)資料:將觀察單位按某種屬性或類別分組,所得的觀察單位數(shù)稱為計數(shù)資料(count data)。計數(shù)資料亦稱定性資料或分類資料。其觀察值是定性的,表現(xiàn)為互不相容的類別或?qū)傩?。如調(diào)查某地某時的男、女性人口數(shù);治療一批患者,其治療效果為有效、無效的人數(shù);調(diào)查一批少數(shù)民族居民的A、B、AB、O 四種血型的人數(shù)等。(3)等級資料:將觀察單位按測量結(jié)果的某種屬性的不同程度分組,所得各組的觀察單位數(shù),稱為等級資料(ordinal data)。等級資料又稱有序變量。如患者的治療結(jié)果可分為治愈、好轉(zhuǎn)、有效、無效或死亡,各種結(jié)果既是分類結(jié)果,又有順序和等級差別,但這種差別卻不能準(zhǔn)確測量;一批腎病患者尿蛋白含量的測定結(jié)果分為+、++、+++等。等級資料與計數(shù)資料不同:屬性分組有程度差別,各組按大小順序排列。等級資料與計量資料不同:每個觀察單位未確切定量,故亦稱為半計量資料。
9、常見的三類誤差是什么?應(yīng)采取什么措施和方法加以控制?
常見的三類誤差是:(1)系統(tǒng)誤差:在收集資料過程中,由于儀器初始狀態(tài)未調(diào)整到零、標(biāo)準(zhǔn)試劑未經(jīng)校正、醫(yī)生掌握療效標(biāo)準(zhǔn)偏高或偏低等原因,可造成觀察結(jié)果傾向性的偏大或偏小,這叫系統(tǒng)誤差。要盡量查明其原因,必須克服。
(2)隨機(jī)測量誤差:在收集原始資料過程中,即使儀器初始狀態(tài)及標(biāo)準(zhǔn)試劑已經(jīng)校正,但是,由于各種偶然因素的影響也會造成同一對象多次測定的結(jié)果不完全一致。譬如,實驗操作員操作技術(shù)不穩(wěn)定,不同實驗操作員之間的操作差異,電壓不穩(wěn)及環(huán)境溫度差異等因素造成測量結(jié)果的誤差。對于這種誤差應(yīng)采取相應(yīng)的措施加以控制,至少應(yīng)控制在一定的允許范圍內(nèi)。一般可以用技術(shù)培訓(xùn)、指定固定實驗操作員、加強責(zé)任感教育及購置一定精度的穩(wěn)壓器、恒溫裝置等措施,從而達(dá)到控制的目的。(3)抽樣誤差:即使在消除了系統(tǒng)誤差,并把隨機(jī)測量誤差控制在允許范圍內(nèi),樣本均數(shù)(或其它統(tǒng)計量)與總體均數(shù)(或其它參數(shù))之間仍可能有差異。這種差異是由抽樣引起的,故這種誤差叫做抽樣誤差,要用統(tǒng)計方法進(jìn)行正確分析。
10、試述頻數(shù)表的要素及用途。
要素:組段,頻距。用途:① 描述資料的分布特征和分布類型。頻數(shù)分布有兩個重要特征:集中趨勢和離散趨勢。大部分觀察值向某一數(shù)值集中的趨勢稱為集中趨勢,常用平均數(shù)指標(biāo)來表示,各觀察值之間大小參差不齊。頻數(shù)由中央位置向兩側(cè)逐漸減少,稱離散趨勢,是個體差異所致,可用一系列的變異指標(biāo)來反映。② 便于進(jìn)一步計算有關(guān)指標(biāo)或進(jìn)行統(tǒng)計分析。當(dāng)數(shù)據(jù)較多且需手工計算時,常先編制頻數(shù)表,再進(jìn)行統(tǒng)計計算。③ 發(fā)現(xiàn)特大、特小的可疑值。如果頻數(shù)表的一端或兩端出現(xiàn)連續(xù)幾個組段的頻數(shù)為零后,又出現(xiàn)少數(shù)幾個特大值或特小值,使人懷疑其是否準(zhǔn)確,需進(jìn)一步檢查和核對并做相應(yīng)處理。④ 當(dāng)樣本含量比較大時,可用各組段的平率作為概率的估計值。
11、描述單變量資料的統(tǒng)計指標(biāo)分哪兩大類,分別是什么指標(biāo)? 分類:①描述數(shù)據(jù)分布集中趨勢的指標(biāo):算術(shù)均數(shù)、幾何均數(shù)、中位數(shù)。②描述數(shù)據(jù)分布離散程度的指標(biāo):極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差、變異系數(shù)。
12、試述平均數(shù)、標(biāo)準(zhǔn)差、變異系數(shù)的含義及用途?
13、標(biāo)準(zhǔn)正態(tài)分布曲線下面積有何分布規(guī)律?
所有的正態(tài)分布曲線,在υ左右的相同倍數(shù)的標(biāo)準(zhǔn)差范圍內(nèi)的面積相同。并且,在υ±σ范圍內(nèi)的面積約為68.3%;在υ±1.96σ范圍內(nèi)的面積約為95%;在υ±2.58σ范圍內(nèi)面積約為99%。
14、同一資料的標(biāo)準(zhǔn)差是否一定小于均數(shù)?
均數(shù)和標(biāo)準(zhǔn)差是兩類不同性質(zhì)的統(tǒng)計指標(biāo).標(biāo)準(zhǔn)差用于描述數(shù)據(jù)的變異程度,變異程度大,則該值大,變異程度小,則該值小.標(biāo)準(zhǔn)差可大于均數(shù),也可小于均數(shù)。
15、標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤有何區(qū)別和聯(lián)系?
?區(qū)別:1.含義不同:⑴sx)之間的變異度大小,s越大,變量值(x)越分散;反之變量值越集中,均數(shù)的代表性越強。⑵標(biāo)準(zhǔn)誤是描述樣本均數(shù)之間的變異度大小,標(biāo)準(zhǔn)誤越大,樣本均數(shù)與總體均數(shù)間差異越大,抽樣誤差越大;反之,樣本均數(shù)越接近總體均數(shù),抽樣誤差越小。2.與n的關(guān)系不同: n增大時,⑴sσ(恒定)。⑵標(biāo)準(zhǔn)誤減少并趨于0(不存在抽樣誤差)。3.用途不同: ⑴s:表示x的變異度大小,計算cv,估計正常值范圍,計算標(biāo)準(zhǔn)誤等 ⑵ :參數(shù)估計和假設(shè)檢驗。?聯(lián)系: 二者均為變異度指標(biāo),樣本均數(shù)的標(biāo)準(zhǔn)差即為標(biāo)準(zhǔn)誤,標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤成正比。
16、簡述Ⅰ型錯誤和Ⅱ型錯誤的區(qū)別和聯(lián)系。
·區(qū)別:Ⅰ型錯誤(棄真):拒絕實際成立的H0,型錯誤的概率記為α。(1-a)即置信度:重復(fù)抽樣時,樣本區(qū)間包含總體參數(shù)(μ)的百分?jǐn)?shù)。當(dāng)p≤α而拒絕H0時,只能犯Ⅰ型錯誤,不可能犯Ⅱ型錯誤。
Ⅱ型錯誤(存?zhèn)危翰痪芙^實際不成立的H0,Ⅱ型錯誤的概率記為β。(1-β)即把握度(或檢驗效能:兩總體確有差別,被檢出有差別的能力。當(dāng)p≥α而拒絕H0時,只能犯Ⅱ型錯誤,不可能犯Ⅰ型錯誤。
·聯(lián)系:對同一資料,α與β反方向變化,若要同時減小α與β,唯一的辦法是增加樣本含量。
17、可信區(qū)間與參考值范圍的不同點。
應(yīng)注意:可信區(qū)間與參考值范圍的意義、計算公式和用途均不同。1.從意義和用途來看95%參考值范圍是指同質(zhì)總體內(nèi)包括95%個體值的估計范圍,而總體均數(shù)95%可信區(qū)間是指按95%可信度估計的總體均數(shù)的所在范圍??尚艆^(qū)間用于估計總體參數(shù),總體參數(shù)只有一個。參考值范圍用于估計變量值的分布范圍,變量值可能很多甚至無限。2.從計算公式看:若指標(biāo)服從正態(tài)分布,95%參考值范圍的公式是:±1.96s??傮w均數(shù)95%可信區(qū)間的公式是:
。前者用標(biāo)準(zhǔn)差,后者用標(biāo)準(zhǔn)誤。前者用1.96,后者用α為0.05,自由度為v的t界值。
18、在統(tǒng)計推斷中,如何區(qū)別單側(cè)檢驗和雙側(cè)檢驗?
如果將拒絕性概率平分于理論抽樣分布的兩側(cè),稱為雙側(cè)檢驗。例如選定顯著性水平α= 0.05,雙側(cè)檢驗就是將α概率所規(guī)定的拒絕區(qū)域平分為兩部分而置于概率分布的兩邊,每邊占有 =0.025。雙側(cè)檢驗只強調(diào)差異是否顯著而不強調(diào)方向性。如果將拒絕性概率置于理論抽樣分布的一側(cè)(左側(cè)或右側(cè)),稱為單側(cè)檢驗(右側(cè)檢驗或左側(cè)檢驗)。單側(cè)檢驗強調(diào)差異的方向性。在具體的假設(shè)檢驗中,選擇雙側(cè)檢驗或單側(cè)檢驗可分為以下三種情況: 第一種:H0:μ=μ0 :μ≠μ0雙側(cè) 第二種:H0:μ≥μ0 :μ<μ0單側(cè)(左側(cè))第三種:H0:μ≤μ0 :μ>μ0單側(cè)(右側(cè))
19、t檢驗、z檢驗的公式有那些類型,在應(yīng)用上有何異同?
t檢驗:當(dāng)樣本例數(shù)n較小時,要求樣本取自正態(tài)總體。t檢驗的類型:單樣本t檢驗,獨立t檢驗,配對t檢驗z檢驗:樣本例數(shù)較大,或n雖小而總體標(biāo)準(zhǔn)差已知。
20、假設(shè)檢驗和總體均數(shù)區(qū)間估計有何聯(lián)系?
假設(shè)檢驗:是對總體做出某種假定,然后根據(jù)樣本信息推斷總體是否成立的一類統(tǒng)計學(xué)方法總稱。假設(shè)檢驗有三個基本步驟:①建立假設(shè)和確定檢驗水準(zhǔn);②選擇檢驗方法和計算檢驗統(tǒng)計量;③確定P值和做出統(tǒng)計推斷結(jié)論。總體均數(shù)的估計:
1、點估計:樣本統(tǒng)計量直接作為總體指標(biāo)的估計值。它未考慮抽樣誤差的大小。
2、區(qū)間估計:按預(yù)先給定的概率(1-α)確定的包含未知總體參數(shù)的可能范圍。
21、方差分析的基本思想是什么?
方差分析(analysis of variance,ANOVA)的基本思想就是根據(jù)資料的設(shè)計類型,即變異的不同來源將全部觀察值總的離均差平方和(sum of squares of deviations from mean,SS)和自由度分解為兩個或多個部分,除隨機(jī)誤差外,其余每個部分的變異可由某個因素的作用(或某幾個因素的交互作用)加以解釋,如各組均數(shù)的變異SS 組間可由處理因素的作用加以解釋。通過各變異來源的均方與誤差均方比值的大小,借助F 分布作出統(tǒng)計推斷,判斷各因素對各組均數(shù)有無影響。
22、t檢驗和F檢驗的使用條件和應(yīng)用范圍有何異同?
t檢驗適用于兩個樣本均數(shù)的比較,F(xiàn)檢驗適用于多個樣本的比較。t檢驗的應(yīng)用條件:要求各樣本來自相互獨立的正態(tài)總體且各總體方差齊。方差分析的應(yīng)用條件(1)各樣本是相互獨立的隨機(jī)樣本,且來自正態(tài)分布總體。(2)各樣本的總體方差相等,即方差齊性。
23率的標(biāo)準(zhǔn)化的意義及基本思想。
當(dāng)比較的兩組資料內(nèi)部各小組率明顯不同,且各小組觀測例數(shù)的構(gòu)成比也明顯不同時,直接比較兩個合計率是不合理的。因為期內(nèi)部構(gòu)成比不同,往往影響合計率的大小,需要統(tǒng)一的內(nèi)部構(gòu)成進(jìn)行調(diào)整后計算標(biāo)準(zhǔn)化率,使其具有可比性,這種方法稱為率的標(biāo)準(zhǔn)化。率的標(biāo)準(zhǔn)化的基本思想:要比較兩個總率時,發(fā)現(xiàn)兩組資料的內(nèi)部構(gòu)成(如年齡、性別構(gòu)成等)存在明顯不同,而且影響到了總率的結(jié)果,這時就不宜再直接比較總率,而應(yīng)考慮采用標(biāo)準(zhǔn)化法。標(biāo)準(zhǔn)化法的基本思想,就是采用統(tǒng)一的標(biāo)準(zhǔn)(統(tǒng)一的內(nèi)部構(gòu)成)計算出消除內(nèi)部構(gòu)成不同影響后的標(biāo)準(zhǔn)化率(調(diào)整率),然后再進(jìn)行比較。
24常用相對數(shù)指標(biāo)有哪些?它們在計算和意義上有何不同?
率(強度相對數(shù),頻率相對數(shù))、構(gòu)成比、相對比應(yīng)用相對數(shù)時應(yīng)注意的問題:⑴ 計算相對數(shù)的分母一般不宜過小。⑵ 分析時不能以構(gòu)成比代替率。⑶ 不能用構(gòu)成比的動態(tài)分析代替率的動態(tài)分析。⑷ 對觀察單位數(shù)不等的幾個率,不能直接相加求其總率。⑸ 在比較相對數(shù)時應(yīng)注意可比性。⑹ 對樣本率(或構(gòu)成比)的比較應(yīng)隨機(jī)抽樣,并做假設(shè)檢驗。
25卡方檢驗的使用范圍和各個公式的適用條件是什么?
卡方檢驗用于:推斷兩個及兩個以上總體率或構(gòu)成比是否有差別,兩個分類變量間有無相關(guān)關(guān)系,多個率的趨勢檢驗,以及兩個率的等效檢驗等。此外,也用于頻數(shù)分布的擬合優(yōu)度檢驗。
對不同的設(shè)計類型的資料,檢驗的應(yīng)用條件不同:(1)完全隨機(jī)設(shè)計兩樣本率的比較1)當(dāng)n>40,且T≥5時,用非連續(xù)性校正值;若所得P≈α,則改用四格表的確切概率法。2)當(dāng)n≥40,且有1≤T<5時,用連續(xù)性校正值。3)n<40,或有T<1時,不能用檢驗,應(yīng)當(dāng)用四格表的確切概率法。(2)配對設(shè)計四格表1)當(dāng)b+c≥40,2)當(dāng)b+c<40,需作連續(xù)性校正,(3)行列表資料1)不宜有1/5以上格子的理論頻數(shù)小于5,或有1個格子的理論頻數(shù)小于1;2)單向有序行列表,在比較各處理組的效應(yīng)有無差別時,應(yīng)該用秩和檢驗或Ridit檢驗;3)多個樣本率(或構(gòu)成比)比較的檢驗時,結(jié)論為拒絕無效假設(shè)時,只能認(rèn)為各總體率(或總體構(gòu)成比)之間總的說來有差別,但不能說明它們彼此之間都有差別,或某兩者間有差別。若想進(jìn)一步了解哪兩者的差別有統(tǒng)計學(xué)意義,可用分割法。26率的標(biāo)準(zhǔn)誤的意義和用途。
意義:由于抽樣的原因所造成的樣本率與總體率的不一致就是率的抽樣誤差。率的抽樣誤差的大小是用率的標(biāo)準(zhǔn)誤來表示。用途:①表示抽樣誤差的大小,說明樣本率的代表性、可靠性。②對總體率的可信區(qū)間進(jìn)行估計
27、非參數(shù)統(tǒng)計方法的概念及適用范圍。
概念:樣本所來自的總體分布難以用某種函數(shù)式來表達(dá),還有一些資料的總體分布的函數(shù)式是未知的,只知道總體分布是連續(xù)型的或離散型的,解決這類問題的一種不依賴總體分布的具體形式的統(tǒng)計方法。由于這類方法不受總體參數(shù)的限制,故稱非參數(shù)統(tǒng)計法,或稱為不拘分布的統(tǒng)計分析方法,又稱為無分布型式假定的統(tǒng)計分析方法。它檢驗的是分布,而不是參數(shù)。非參數(shù)統(tǒng)計不需對總體分布(總體參數(shù))作出特殊假設(shè)。適用范圍:(1)等級資料。(2)偏態(tài)分布資料。當(dāng)觀察資料呈偏態(tài)或極度偏態(tài)分布而又未作變量變換,或雖經(jīng)變量變換仍未達(dá)到正態(tài)或近似正態(tài)分布時,宜用非參數(shù)檢驗。(3)各組離散程度相差懸殊,即方差明顯不齊,且不能變換達(dá)到齊性。(4)個別數(shù)據(jù)偏離過大,或資料為單側(cè)或雙側(cè)沒有上限或下限值。(5)分布類型不明。(6)初步分析。有些醫(yī)學(xué)資料由于統(tǒng)計工作量大,可采用非參數(shù)統(tǒng)計方法進(jìn)行初步分析,挑選其中有意義者再進(jìn)一步分析(包括參數(shù)統(tǒng)計內(nèi)容)。(7)對于一些特殊情況,如從幾個總體所獲得的數(shù)據(jù),往往難以對其原有總體分布作出估計,在這種情況下可用非參數(shù)統(tǒng)計方法。
28、非參數(shù)檢驗的優(yōu)缺點。優(yōu)點:①非參數(shù)統(tǒng)計方法要求的假定條件比較少,因而它的適用范圍比較廣泛。②多數(shù)非參數(shù)統(tǒng)計方法要求的運算比較簡單,可以迅速完成計算取得結(jié)果,因而比較節(jié)約時間。③大多數(shù)非參數(shù)統(tǒng)計方法在直觀上比較容易理解,不需要太多的數(shù)學(xué)基礎(chǔ)知識和統(tǒng)計學(xué)知識。④大多數(shù)非參數(shù)統(tǒng)計方法可用來分析如象由等級構(gòu)成的數(shù)據(jù)資料,而對計量水準(zhǔn)較低的數(shù)據(jù)資料,參數(shù)統(tǒng)計方法卻不適用。⑤當(dāng)推論多達(dá)3個以上時,非參數(shù)統(tǒng)計方法尤具優(yōu)越性。缺點:①由于方法簡單,用的計量水準(zhǔn)較低,因此,如果能與參數(shù)統(tǒng)計方法同時使用時,就不如參數(shù)統(tǒng)計方法敏感。若為追求簡單而使用非參數(shù)統(tǒng)計方法,其檢驗功效就要差些。這就是說,在給定的顯著性水平下進(jìn)行檢驗時,非參數(shù)統(tǒng)計方法與參數(shù)統(tǒng)計方法相比,第Ⅱ類錯誤的概率β要大些。②對于大樣本,如不采用適當(dāng)?shù)慕?,計算可能變得十分?fù)雜。注意: 凡符合或經(jīng)過變換后符合參數(shù)檢驗條件的資料,最好用參數(shù)檢驗。當(dāng)資料不具備參數(shù)檢驗的條件時,非參數(shù)檢驗是一種有效的分析方法。
29、相關(guān)與回歸的聯(lián)系和區(qū)別。區(qū)別:
意義 :相關(guān)反映兩變量的相互關(guān)系,即在兩個變量中,任何一個的變化都會引起另一個的變化,是一種雙向變化的關(guān)系?;貧w是反映兩個變量的依存關(guān)系,一個變量的改變會引起另一個變量的變化,是一種單向的關(guān)系。應(yīng)用:研究兩個變量的相互關(guān)系用相關(guān)分析。研究兩個變量的依存關(guān)系用回歸分析。研究性質(zhì):相關(guān)是對兩個變量之間的關(guān)系進(jìn)行描述,看兩個變量是否有關(guān),關(guān)系是否密切,關(guān)系的性質(zhì)是什么,是正相關(guān)還是負(fù)相關(guān)?;貧w是對兩個變量做定量描述,研究兩個變量的數(shù)量關(guān)系,已知一個變量值可以預(yù)測出另一個變量值,可以得到定量結(jié)果。相關(guān)系數(shù)r與回歸系數(shù)b :r與b的絕對值反映的意義不同。r的絕對值越大,散點圖中的點越趨向于一條直線,表明兩變量的關(guān)系越密切,相關(guān)程度越高。b的絕對值越大,回歸直線越陡,說明當(dāng)X變化一個單位時,Y的平均變化就越大。反之也是一樣。聯(lián)系:
2r與b值可相互換算;r與b正負(fù)號一致;r與b的假設(shè)檢驗等價;回歸可解釋相關(guān)。相關(guān)系數(shù)的平方r(又稱決定系數(shù))是回
歸平方和與總的離均差平方和之比,故回歸平方和是引入相關(guān)變量后總平方和減少的部分。
30、直線相關(guān)、秩相關(guān)的區(qū)別與聯(lián)系。
區(qū)別:(1)資料要求不同:直線相關(guān)要求x、y是來自雙變量正態(tài)總體的隨機(jī)變量;秩相關(guān)適用于不服從雙變量正態(tài)分布或總體分布類型未知以及用等級表示的原始數(shù)據(jù)。(2)相關(guān)意義不同:直線相關(guān)表示兩變量的直線相關(guān)關(guān)系存在,秩相關(guān)表示兩變量的相關(guān)關(guān)系。聯(lián)系:相關(guān)系數(shù)的取值范圍相同;秩相關(guān)將原始數(shù)據(jù)進(jìn)行秩變換,以秩次計算直線相關(guān)系數(shù)。
31、統(tǒng)計表及統(tǒng)計圖的制表原則和要求。
統(tǒng)計表:(1)統(tǒng)計表的制表原則1)應(yīng)重點突出,即一張表一般只包括一個中心內(nèi)容,內(nèi)容較多時可以用多個表格表達(dá)不同指標(biāo)和內(nèi)容。2)統(tǒng)計表要層次清楚,即標(biāo)目的安排及分組符合邏輯,便于分析比較。主謂分明,通常主語放在表的左邊,作為橫標(biāo)目;謂語放在右邊,作為縱標(biāo)目。由左向右讀,構(gòu)成完整的一句話。但若統(tǒng)計表的主語項目少而謂語項目多或主語項目多而謂語只有一項,亦可將縱標(biāo)目作主語、橫標(biāo)目作謂語,閱讀時從上至下。3)統(tǒng)計表應(yīng)簡單明了,一切文字、數(shù)字和線條都應(yīng)盡量從簡。
(2)制表要求:統(tǒng)計表通常由標(biāo)題、標(biāo)目、線條、數(shù)字4部分組成。表中數(shù)字區(qū)不插入文字,也不列備注項。必須說明者標(biāo)“*”號等,在表下方說明。1)標(biāo)題:應(yīng)高度概括表的主要內(nèi)容,一般包括研究的時間、地點和研究內(nèi)容,左側(cè)加表號,置于表的上方。2)標(biāo)目:有橫標(biāo)目和縱標(biāo)目,分別說明表格每行和每列數(shù)字的意義。橫標(biāo)目位于表頭的左側(cè),代表研究的對象;縱標(biāo)目位于表頭右側(cè),表達(dá)研究對象的指標(biāo)。注意標(biāo)明指標(biāo)的單位。3)線條:力求簡潔,多采用三條線,即頂線、底線、縱標(biāo)目下橫線。部分表格可再用短橫線將“合計”分隔開,或用短橫線將兩重縱標(biāo)目分割開。其它豎線和斜線一概省去。4)數(shù)字:用阿拉伯?dāng)?shù)字表示。同一指標(biāo)小數(shù)點位數(shù)一致,位次對齊。表內(nèi)不留空項,無數(shù)字用“—”表示,缺失數(shù)字用“”表示,數(shù)值為0者記為“0”。統(tǒng)計圖:①根據(jù)資料性質(zhì)和分析目的正確選用適當(dāng)?shù)慕y(tǒng)計圖。②除圓圖外,一般用直角坐標(biāo)系的第一象限的位置表示圖域(制圖空間),或者用長方形的框架表示。③
繪制圖形應(yīng)注意準(zhǔn)確、美觀,給人以清晰的印象。
32、常見的統(tǒng)計圖有哪幾種?它們的使用條件各是什么?
常用的統(tǒng)計圖有直條圖、直方圖、百分比條圖和圓圖、線圖、散點圖、統(tǒng)計地圖、箱式圖等?!ぶ睏l圖:適用于比較、分析獨立的或離散變量的多個組或多個類別的統(tǒng)計指標(biāo)。指標(biāo)既可以是絕對數(shù),也可以是相對數(shù)?!ぶ狈綀D:主要應(yīng)用于頻數(shù)分布資料,描述連續(xù)變量的頻數(shù)分布。百分比條圖和圓圖:表示事物內(nèi)部各構(gòu)成部分所占的比重,適合描述分類變量的各類別所占的構(gòu)成比。其中,百分比條圖特別適合作多個構(gòu)成比的比較?!ぞ€圖:適合于描述某統(tǒng)計量隨另一連續(xù)性數(shù)值變量的變化而變化的趨勢,常用于描述統(tǒng)計量隨時間變化而變化的趨勢。普通線圖描述的是絕對變化趨勢,半對數(shù)線圖描述的是相對變化趨勢,特別適宜作不同指標(biāo)或相同指標(biāo)不同組別的變化速度的比較?!どⅫc圖:以直角坐標(biāo)上點的密集程度和趨勢來表示兩個變量間的相關(guān)關(guān)系?!そy(tǒng)計地圖:以不同的顏色和花紋表示統(tǒng)計量的值在地理分布上的變化,適宜描述研究指標(biāo)的地理分布。·箱式圖:通過使用5個統(tǒng)計量(數(shù)據(jù)分布的中心位置、分布、偏度、變異范圍和異常值)來反映原始數(shù)據(jù)的分布特征。特別適合多組數(shù)據(jù)分布的比較。
33普通線圖和半對數(shù)線圖的主要區(qū)別是什么?
從形式上看,二者的不同點在于縱坐標(biāo)的尺度不同,普通線圖的縱坐標(biāo)為算術(shù)尺度,而半對數(shù)線圖的縱坐標(biāo)為對數(shù)尺度。從用途上看,普通線圖描述的是統(tǒng)計量的絕對變化趨勢,半對數(shù)線圖描述的是相對變化趨勢,特別適宜作不同指標(biāo)或相同指標(biāo)不同組別的變化速度的比較。
34四種基本抽樣方法的概念、優(yōu)缺點和應(yīng)用條件是什么?
(1)單純隨機(jī)抽樣:是在總體中以完全隨機(jī)的方法抽取一部分觀察單位組成樣本,其整個抽樣過程,都體現(xiàn)了隨機(jī)化的原則。單純隨機(jī)抽樣的優(yōu)點:簡單直觀,是最基本的概率抽樣方法,也是其他概率抽樣方法的基礎(chǔ)。單純隨機(jī)抽樣的缺點:當(dāng)總體例數(shù)較多時,編號麻煩,實際工作中難以實施;樣本分散,組織困難。單純隨機(jī)抽樣方法多用于總體例數(shù)較少的情況。(2)系統(tǒng)抽樣:是將總體的觀察單位,按一定順序號平均分成n個部分,每一部分抽取第k號觀察單位組成樣本,這里的k是隨機(jī)確定的,其體現(xiàn)了系統(tǒng)抽樣中的隨機(jī)性。系統(tǒng)抽樣的優(yōu)點是:1)易于理解,簡便易行;
2)容易得到一個按比例分配的樣本;3)一般情況下樣本的觀察單位在總體中分布均勻,其抽樣誤差小于單純隨機(jī)抽樣。系統(tǒng)抽樣的缺點是如果總體中觀察單位按順序有周期趨勢或單調(diào)遞增(減)趨勢時,采用系統(tǒng)抽樣可能產(chǎn)生明顯的系統(tǒng)誤差。系統(tǒng)抽樣方法多用于觀察單位具有現(xiàn)成且與試驗無關(guān)的自然編號,同時觀察單位在總體中分布均勻。(3)整群抽樣:是先將總體按照某種與主要研究指標(biāo)無關(guān)的特征劃分為K個“群”,每個群包含若干觀察單位,然后再隨機(jī)抽取k個“群”,由抽取的各個群的全部觀察單位組成樣本。其隨機(jī)性主要體現(xiàn)在“群”的抽取過程。整群抽樣的優(yōu)點是便于組織調(diào)查、易于質(zhì)量控制和節(jié)省調(diào)查成本。整群抽樣的缺點是當(dāng)樣本含量一定時,因為樣本觀察單位并非廣泛散布于總體中,整群抽樣的抽樣誤差一般大于單純隨機(jī)抽樣。整群抽樣較為常用,尤其當(dāng)“群”間的個體變異較小時。
(4)分層抽樣:是先按對主要研究指標(biāo)影響較大的某種特征,將總體分為若干類別(統(tǒng)計上稱之為“層”),再從每一層內(nèi)隨機(jī)抽取一定數(shù)量的觀察單位,合起來組成樣本。其隨機(jī)性體現(xiàn)在層內(nèi)的抽樣過程。分層抽樣的優(yōu)點是:1)由于分層后增加了層內(nèi)的同質(zhì)性,觀察指標(biāo)變異減小,各層的抽樣誤差減小。2)分層抽樣便于對不同層采用不同的抽樣方法。3)分層抽樣便于對各層獨立進(jìn)行分析。分層抽樣的缺點是:層間變異較大,抽樣誤差較??;如果分層特征選擇不當(dāng),層內(nèi)變異較大,層間變異較小,抽樣誤差仍然較大,分層抽樣就失去了意義。一般情況下,當(dāng)樣本含量一定,幾種方法抽樣誤差大小的排序為:分層抽樣≤系統(tǒng)抽樣≤單純隨機(jī)抽樣≤整群抽樣。
35何謂調(diào)查研究和實驗研究?各自的特點是什么?
調(diào)查研究:是指研究者通過客觀地觀察、描述調(diào)查對象來搜集資料,未加任何的干預(yù)措施。實驗研究:是指研究者根據(jù)研究假設(shè)主動地對研究對象加以干預(yù)措施,并觀察總結(jié)其結(jié)果,回答研究假設(shè)所提出的問題。
36何謂實驗效應(yīng),對實驗效應(yīng)指標(biāo)的要求是什么?
實驗效應(yīng):指處理作用于實驗對象的反應(yīng),一般是通過某些觀察指標(biāo),定量或定性地反映實驗效應(yīng)。選擇觀察指標(biāo)的基本原則: 指標(biāo)的選擇必須與研究目的密切關(guān)聯(lián)客觀性盡可能選擇客觀指標(biāo),避免一些籠統(tǒng)的、不確切的指標(biāo)。準(zhǔn)確性選用的指標(biāo)應(yīng)盡量精確。靈敏性和特異性 實驗效應(yīng)指標(biāo)應(yīng)當(dāng)同時兼顧其靈敏性和特異性,盡量使靈敏性和特異性都高。
37實驗研究中為什么要設(shè)立對照,常見的對照有幾種,各自有何特點?
設(shè)立對照組的目的是襯托處理因素的效應(yīng)。對照原則:所設(shè)立的對照組必須與實驗組達(dá)到均衡可比。除干預(yù)措施外,組間其他影響結(jié)果的非處理因素等盡可能相同。對所研究疾病的易感度及發(fā)病機(jī)會相等。檢測和觀察方法及診斷標(biāo)準(zhǔn)必須一致。自身對照對照與實驗在同一受試者身上進(jìn)行,如用藥前后作為對比。
空白對照對照組不施加任何處理因素。安慰劑對照主要目的是為了平衡對照組病人心理因素的影響。實驗對照(陽性對照)對照組不施加處理因素,但施加某種實驗因素。標(biāo)準(zhǔn)對照不設(shè)立專門的對照組,而是用現(xiàn)有標(biāo)準(zhǔn)值或正常值做對照。歷史對照
38實驗設(shè)計為什么要遵循重復(fù)原則,影響重復(fù)性的因素有哪些?
重復(fù)原則包含重現(xiàn)性和觀察單位數(shù)量兩方面的含義??煽康膶嶒灲Y(jié)果應(yīng)能在相同的條件下重現(xiàn);可靠的實驗結(jié)論也不能憑一次實驗或3~5例結(jié)果獲得,一定要有足夠量的觀察單位數(shù)。
第五篇:旅游統(tǒng)計學(xué)名詞解釋
1,旅游統(tǒng)計學(xué),是應(yīng)用統(tǒng)計理論與方法,對旅游經(jīng)濟(jì)現(xiàn)象進(jìn)行集中深入的研究而產(chǎn)生的一門分支統(tǒng)計學(xué)科。
2,總體,總體單位,總體,統(tǒng)計所要求的具有某種共同特征事物的全體,總體單位指組成總體的基本單位,即具有某種共同特征事物的基本單位。
3,標(biāo)志,表明總體單位屬性或特征的名稱,按性質(zhì)分,a品質(zhì)標(biāo)志,b數(shù)量標(biāo)志,按變異性分a不變標(biāo)志,b可變標(biāo)志。
4,變異,標(biāo)志在總體各單位之間存在具體表現(xiàn)的差異性,變異中,有屬性變異與數(shù)量變異。
5,變量,把數(shù)量變異的名稱稱為變量,按是否連續(xù),分為連續(xù)變量離散變量。
6,指標(biāo),表明總體數(shù)量特征的社會經(jīng)濟(jì)概念或范疇,1,特征2,可量性3,綜合性,7,指標(biāo)分類,安表現(xiàn)形式分為,總體指標(biāo),相對指標(biāo),平均指標(biāo),安總體特征,數(shù)量指標(biāo),質(zhì)量指標(biāo).8,總量指標(biāo),在一定時間地點條件下表明某種旅游經(jīng)濟(jì)活動的總規(guī)模或總水平的指標(biāo)。其表現(xiàn)形式為絕對數(shù),按其所反映的時間狀況不同,分為時點指標(biāo)與時期指標(biāo)。
9,相對指標(biāo),將兩個性質(zhì)相同或相互聯(lián)系的指標(biāo)總值進(jìn)行對比求得的比率或商數(shù)就構(gòu)成相對指標(biāo)。
表現(xiàn)形式,無名數(shù)與有名數(shù)
計算方法,結(jié)構(gòu)相對數(shù)=總體部分?jǐn)?shù)值/總體全部數(shù)值
10,環(huán)比發(fā)展速度,以報告期的前一期為基期的發(fā)展過程比較。11,定期發(fā)展速度,以定期為基期的反展過程比較。12,動態(tài)數(shù)列將某種旅游經(jīng)濟(jì)現(xiàn)象指標(biāo),在不同時間讓其按先后順序排列得到的數(shù)列,又稱時間數(shù)列。
13學(xué)列平均數(shù),動態(tài)數(shù)列各時期或時點發(fā)展水平的平均數(shù),是根據(jù)動態(tài)數(shù)列計算而得,塌縮平均的是現(xiàn)象在不容時期發(fā)展水平的差異。
14,統(tǒng)計指數(shù),綜合反映所研究社會經(jīng)濟(jì)現(xiàn)象復(fù)雜總體數(shù)量變動狀況的相對數(shù)。
15,因素分析內(nèi)容,a,相對數(shù)分析,b絕對數(shù)分析,16,普查,根據(jù)經(jīng)濟(jì)旅游工作特定目的與任務(wù)而專門組織的一次全面調(diào)查。
17,統(tǒng)計分組概念,根據(jù)被研究對象總體的內(nèi)在特征,與旅游統(tǒng)計學(xué)研究目的,將統(tǒng)計總體按一定標(biāo)志劃分為若干相異的組成部分的一種方法。
18,逐級匯總,按照一定旅游管理機(jī)制,由上而下逐級匯總,上級統(tǒng)計資料的一種形式。
19,手工匯總,劃分法,過錄法,折疊法,卡片法。20,旅游換匯率,我國提供單位本國貨幣的旅游產(chǎn)品換取的外匯數(shù)量。
21,旅游對象物資源,指供旅游者參觀游覽娛樂修養(yǎng)的地區(qū)。條件,a具有旅游價值b經(jīng)專家堅定,世人公認(rèn)。C可進(jìn)入性,d對國際旅游者須經(jīng)政府批準(zhǔn)開放。
22旅游交通,指旅游者利用某種手段途徑從一個地點到另一個地點的空間轉(zhuǎn)移過程,類型,水上陸地,空中。
23,交通統(tǒng)計,a車船數(shù)量構(gòu)成,b車船變動量,c利用維修狀況。
24,統(tǒng)計報表制度,按照國家統(tǒng)一規(guī)定調(diào)查要求,和表格形式等,自下而上提供統(tǒng)計資料的一種報表制度。