第一篇:教育統(tǒng)計學知識點學前教育統(tǒng)計學復習總結
1.1教育統(tǒng)計學是運用數(shù)理統(tǒng)計的原理和方法,研究教育問題的一門應用科學。它的主要任務是研究如何搜集、整理、分析由教育調(diào)查和教育試驗所獲得的數(shù)字資料,并以此為依據(jù),進行科學推斷,揭示教育現(xiàn)象所蘊含的客觀規(guī)律。
1.2教育統(tǒng)計學的研究內(nèi)容從具體應用的角度來分,可分為性質(zhì)類別和數(shù)量類別。性質(zhì)類別是按事物的不同性質(zhì)進行分類。數(shù)量類別是按數(shù)值的大小進行分類,并排成順序。
3.1統(tǒng)計表的結構及其編制的原則和要求
1.標題:表的名稱;上方;簡明扼要;2.表號:表的序號;左方;時間順序。3.標目:表中對統(tǒng)計數(shù)可以分成:1.描述統(tǒng)計2.推斷統(tǒng)計3.試驗設計 1.3統(tǒng)計推理的方法是歸納法。1.4教育統(tǒng)計學是教育科研定量分析的重要工具。
1.5教育統(tǒng)計學的的具體意義:①可以順利的閱讀運用統(tǒng)計方法進行定量分析的科研報告和文獻,從中可以間接地學習國內(nèi)外先進的研究成果;②可以提高教育工作的科學性和效率;③為學習教育測量和教育評價打下基礎。
1.6變量:試驗結果的數(shù)值不是恒定不變的量,我們把它稱為變量,也說是 可變的數(shù)量標志。常量:數(shù)值保持恒定的量。隨機變量:能表示隨機現(xiàn)象各種結果的變量稱為隨機變量。統(tǒng)計處理的變量都是隨機變量。一般用X、Y、Z來表示。
1.7隨機現(xiàn)象:第一,一次試驗有多種可能結果,其所有可能結果是已知的;第二,試驗之前不能預料哪一種結果會出現(xiàn);第三,在相同的條件下可以重復試驗。1.8標志:人或事物的屬性或特征的名稱。1.9總體:是我們所研究的具有某種共同特征的個體的總和。有同質(zhì)性、大量性、變異性的特點。2.1個體:總體中的每個單位稱為個體。
2.2樣本:是從總體中抽取的作為觀察對象的一部分個體。樣本中包含的個體數(shù)目稱為樣本的容量,一般用n表示。樣本中個體數(shù)目大于30稱為大洋本,等于或小于30稱為小樣本。
2.3統(tǒng)計量:樣本上的數(shù)字特征是統(tǒng)計量。也就是說,根據(jù)教育調(diào)查或試驗獲得的數(shù)據(jù)所計算出來的能夠描述這組數(shù)據(jù)各種特征的數(shù)量是統(tǒng)計量。2.4參數(shù):總體上的各種數(shù)字特征是參數(shù)。也即反映總體上各種特征的數(shù)量是參數(shù)。
2.5數(shù)據(jù)的分類:經(jīng)常性資料、專題性資料
2.6教育調(diào)查:是指在沒有預定因子、不施行控制的條件下,對現(xiàn)成的教育方面有關客觀事實所進行的觀察和分析。它是教育科學研究中普遍采用的一種方法。從調(diào)查方法來分,可分為現(xiàn)情調(diào)查、回顧調(diào)查和追蹤調(diào)查。從調(diào)查范圍來分,可分為全面調(diào)查和費全面調(diào)查。
2.7教育實驗:是指在預定的控制因子影響下,對教育方面有關客觀事實所進行的的觀察和分析。2.8數(shù)據(jù)的種類數(shù)據(jù)就是隨機變量的觀察值。1.按來源分:點計數(shù)據(jù)和度量數(shù)據(jù)。
點計數(shù)據(jù)是指計算個數(shù)所獲得的數(shù)據(jù)。度量數(shù)據(jù)是指用一定的工具或一定的標準測量所獲得的數(shù)據(jù)。2.按隨機變量取值是否具有連續(xù)性分:
間斷型隨機變量的數(shù)據(jù):取值個數(shù)有限的數(shù)據(jù) 連續(xù)型隨機變量的數(shù)據(jù):取值個數(shù)無限的數(shù)據(jù) 2.9數(shù)據(jù)的統(tǒng)計分類:數(shù)據(jù)的統(tǒng)計分類,是指按照研究對象的本質(zhì)特征,根據(jù)分析研究的目的、任務,以及統(tǒng)計分析時所用統(tǒng)計方法的可能性,將所獲得的數(shù)據(jù)進行分組歸類。它是對數(shù)據(jù)進行歸納、整理、簡化、概括的第一步,為進一步分析研究打下了基礎。統(tǒng)計分類不僅以研究對象的本質(zhì)特性為依據(jù),還要以研究目的、任務的需要為依據(jù),當然也應當考慮到統(tǒng)計方法的可能性。分類標志按形式劃分,據(jù)分類的項目。4.線條:四條基本線條;不宜多。5.數(shù)字:一般用阿拉伯數(shù)字表示;如又小數(shù),數(shù)位要一致,要對齊;盡量不要有空格;咱卻數(shù)字可用省略號或問號表示;無數(shù)字可畫橫杠。6.表注:不是必要組成部分;下方;補充說明表的來源或補充說明數(shù)字;字號不要大于表中的其他文字。基本原則:簡單明了重點突出(科學簡明使用美觀)3.2統(tǒng)計表的種類
1.簡單表:只列出觀察對象的名稱、地點、時序或統(tǒng)計指標名稱的統(tǒng)計表為簡單表。2.分組表:只按一個標志分組的統(tǒng)計表為分組表。3.復合表:按兩個或兩個以上標志分組的統(tǒng)計表為復合表。3.3頻數(shù):某一個隨機事件在n次試驗中出現(xiàn)的次數(shù)稱為這個隨機事件的頻數(shù)。一般用f表示。頻數(shù)分布:各種隨機事件在n次試驗種出現(xiàn)的次數(shù)分布稱為頻數(shù)分布,即把隨機事件出現(xiàn)的次數(shù)都呈現(xiàn)出來。頻數(shù)分布表:把頻數(shù)分布用表格的形式表示出來就是頻數(shù)分布表。
3.4頻數(shù)分布表分類: 1.簡單頻數(shù)分布表(1)間斷變量的頻數(shù)分布表(2)連續(xù)變量的頻數(shù)分布表2.累積頻數(shù)和累積百分比分布表:累積頻數(shù)就是把頻數(shù)一組一組累加起來,得到的頻數(shù)叫累積頻數(shù)。累積百分比就是把頻數(shù)用百分比變成相對頻數(shù)。用表格把這兩種頻數(shù)表示出來就是累積頻數(shù)分布表和累積百分比分布表。
3.5累積頻數(shù)分布表制作A.先制作頻數(shù)分布表B.從最低一組的頻數(shù)開始登記
3.6統(tǒng)計圖是用來表達統(tǒng)計指標與被說明的事物之間數(shù)量關系的圖形。它是整理數(shù)據(jù)的一種方法。在運用統(tǒng)計圖時,一般附有統(tǒng)計表。3.7統(tǒng)計圖的結構及其繪制規(guī)則
統(tǒng)計圖由標題、圖號、標目、圖形、圖注等項構成。1.標題。簡明扼要;切合內(nèi)容;必要時注明時間地點;字體在圖中為最大;一般在圖的下方。
2.圖號。按出現(xiàn)的順序編序號;在圖題的左前方。3.標目。即統(tǒng)計的項目。對于有縱橫軸的統(tǒng)計圖,應在縱橫軸上分別標明統(tǒng)計項目及其尺度。
4.圖形。圖形線在圖中為最粗,要清晰,圖形的高與寬之比3:5為宜,以美觀為準。5.圖注。不是必要組成部分,而是補充說明;文字簡明扼要;字體要??;寫在圖題的下方。
3.8算術平均數(shù)的概念及特性
1.算術平均數(shù)是所有觀察值的總和除以總頻數(shù)所得之商,簡稱平均數(shù)或均數(shù)、均值。2.算術平均數(shù)的特性:(1)觀察值的總和等于算術平均數(shù)的N倍,即:X=∑x/n(2)各觀察值與其算術平均數(shù)之差的總和等于零,即:∑x=Xn(3)若一組觀察值是由兩部分或幾部分組成,這組觀察值的算術平均數(shù)可以組成部分的算術平均數(shù)而求得。即:X= naXa+nbXb/na+nb
(4)各個觀察值與其算術平均數(shù)之差的平方和最小。即:∑(x-X)2=min 3.計算法:X=∑fx/n
3.9算術平均數(shù):最常用,優(yōu)點也最多。
優(yōu)點:1感應靈敏2嚴密確定3簡明易懂,計算簡便4適合代數(shù)運算5受抽樣變動的影響較小
缺點:1易受兩極端數(shù)值的影響2有一兩個數(shù)據(jù)模糊不請時,無法計算。這時通常選擇中位數(shù)。
4.1中位數(shù)是位于以一定順序(從小到大或從大到?。┡帕械囊唤M數(shù)據(jù)中央位置的數(shù)值,在這一數(shù)值上、下各有一半頻數(shù)分布著。用Md表示。它是集中量的一種指標,也是百分位數(shù)的一種。
4.2中位數(shù)頻數(shù)分布表計算法:Md=Lmd+(n/2-n1)i/fmd 4.3百份位數(shù)是位于以一定順序(一般是由小到大)排列的一組數(shù)據(jù)中某一百分位置的 計算方法: 常用的百分位距有兩種:
P90=L90+(0.9n-n1)i/f90
P10=L10+(0.1n-n2)i/f10
5.6平均差的概念:所謂平方差就是每一個數(shù)據(jù)與該組數(shù)據(jù)的中位數(shù)(或算術平均數(shù))離差的絕對值的算術平均數(shù)。通常用MD表示。5.7平均差的計算方法
1.原始數(shù)據(jù)計算法:MD=∑∣x-Md∣/n 2.頻數(shù)分布表計算法:MD=∑f∣x-Md∣/n
評價1.優(yōu)點:意義明確,計算容易,每個數(shù)據(jù)都參加了運算,考慮到全面的離差,反應靈敏。
2.缺點:因為計算要用絕對值,不適合代數(shù)運算。正是由于這個缺點,在統(tǒng)計分析中應用較少。
Pp=Lp+(pn-n1)i/fp
4.4中位數(shù) :優(yōu)點有嚴密確定、容易理解、計算簡便、受抽樣變動影響較小 主要優(yōu)點,即區(qū)別于別的集中量的優(yōu)點在于適用于以下幾種情況:1一組數(shù)據(jù)中有特大或特小兩極端數(shù)值時;2一組數(shù)據(jù)中有個別數(shù)據(jù)不確切、不清楚時; 3資料屬于等級性質(zhì)時。缺點:1反應不靈敏,所以代表性不如算術平均數(shù);2不穩(wěn)定可靠3不適合代數(shù)運算所以,中位數(shù)一般情況下不用,除非別無選擇。
4.5眾數(shù)是集中量的一種指標,用M0表示。
理論眾數(shù)是指與頻數(shù)分布曲線最高點相對應的橫坐標上的一點。
粗略眾數(shù)是指一組數(shù)據(jù)中頻數(shù)出現(xiàn)最多的那個數(shù)。4.6眾數(shù)的求法
1.觀察法。直接查找粗略眾數(shù)的方法 先把數(shù)據(jù)列出來,然后找出現(xiàn)頻數(shù)最大的數(shù),即為眾數(shù)。2.公式計算法(近似計算法):
(1)皮爾遜的經(jīng)驗法:M0≈ 3Md-2X
使用條件:頻數(shù)呈正態(tài)分布或者接近正態(tài)分布。(2)金氏插補法:M0=Lmo+fa/fa+fb * i當頻數(shù)呈正態(tài)分布或偏態(tài)分布時,都可使用此公式。4.7眾數(shù) 優(yōu)點少:(1)可以很快捷地知道變化的趨勢;知道一組數(shù)據(jù)的代表值。如了解一個年級的代表年齡。缺點多:(1)不準確,受分組的影響比較大;受波動的影響比較大;受抽樣的影響比較大。(2)不適合作進一步的代數(shù)運算。所以只有當我們想了解數(shù)據(jù)的大概水平時,才使用。4.8算術平均數(shù),中位數(shù),眾數(shù)三者的關系 當頻數(shù)分布呈正態(tài)時,三者重合為一點。
當頻數(shù)分布為正偏態(tài)時,X-Md/X-M0=1/3,且X>Md>M0, 負偏態(tài)時,X 5.1幾何平均數(shù):Xng=√x1x2…xn 當一個數(shù)列的后一個數(shù)據(jù)時以前一個數(shù)據(jù)為基礎成比率(即等比級數(shù))增長時,要用幾何平均數(shù)求其平均增長率(即等比級數(shù)中的比率)。常用作速率的集中量。 5.2調(diào)和平均數(shù):是一組數(shù)據(jù)倒數(shù)的算術平均數(shù)的倒數(shù),亦稱倒數(shù)平均數(shù)。XH=1/∑(1/x)/n 5.3全距一組數(shù)據(jù)的最大值和最小值之差又稱極差。5.4四分位距: 以一定順序排列的一組數(shù)據(jù)中間部位50%個頻數(shù)距離的一半作為差異量指標。原始數(shù)據(jù)計算法: QD=Q3-Q1/2 Q3 表示第三個四分位數(shù)(第75百分位數(shù))Q1 表示第一個四分位數(shù)(第25百分位數(shù))Q1=LQ1+(n/4-n1)i/fQ1 5.5百分位距:百分位距是指兩個百分位數(shù)之差。 5.8方差也叫變異數(shù),是指離差平方的算術平均數(shù)。每個數(shù)據(jù)與算術平均數(shù)的離差平方的平均值。 其定義公式為:ó2∑(x-X) 2x=/n數(shù)學性質(zhì): 1、ó 2=X2-x22、ó2=∑(x-A)2/n-[∑(x-A)/n]2 3、ó2=∑x2/n-(∑x/n) 24、ó2=i*∑[(x-A)/i] 2/n-i*[∑ (x-A)/n]2 /n 標準差是指離差平方和平均后的方根。其定義公式為:ó=√∑(x-X)2 x/n 二、方差和標準差的計算方法 1.原始數(shù)據(jù)計算法:ó2/n-(∑x/n) 2x=√∑x 2.頻數(shù)分布表計算法:ó22 x=√∑fx/n-(∑fx/n)評價1.優(yōu)點:反應靈敏;嚴密確定;適合代數(shù)計算;計算簡單;用樣本數(shù)據(jù)推斷總體差異量時,方差和標準差是最好的估計量。一般和算術平均數(shù)結合在一起使用。2.缺點:不太容易理解;易受兩極端數(shù)值的影響;有個別數(shù)值模糊時,無法計算;單位的平方不好理解。 5.9差異系數(shù)的用途:比較不同單位資料的差異程度;或比較單位相同而兩個平均數(shù)相差較大的資料的差異程度;可判斷他書差異情況。所謂差異系數(shù)是指標準差與其算術平均數(shù)的百分比。用公式可表示為:CV=óx/X*100% 6.1差異系數(shù)的應用條件: 主要用于等比量表的數(shù)據(jù)。即既具有等距的單位,有具有絕對的零點(即測量的起點為絕對零)6.2偏態(tài)量有兩種計算方法。 1.利用算術平均數(shù)與眾數(shù)或中位數(shù)的距離來計算 公式為:①SK=X-M0/óx當SK=0,則分布呈對稱型;當SK>0,分布為正偏態(tài);當SK<0,分布為負偏態(tài)。②由于M0具有不穩(wěn)定性,不確定性,常可用中位數(shù)和算術平均數(shù)來表示眾數(shù)。SK=3(X-Md)/óx 2.根據(jù)動差來計算:用三級動差來計算頻數(shù)分布的偏態(tài)系數(shù):u=∑(x-X)3/n或u 333=∑f(x-X)/n,則a=∑(x-X)3/n/ó333 3x或a3=∑f(x-X)/n/óx 當a3=0,表明頻數(shù)分布呈對稱形;a3>0,表明頻數(shù)分布呈正偏態(tài);a3<0,表明頻數(shù)分布呈負偏態(tài)。當總頻數(shù)n>200時,所計算出的偏態(tài)系數(shù)才比較可靠。 二、峰態(tài)量計算方法:1.用兩個百分位距來計算。判斷是高狹峰還是低闊峰。Ku=P75-P25/2(P90-P10)當Ku=0.263,分布呈正態(tài)峰,當Ku<0.263,分布呈高狹峰;Ku>0.263,分布呈低闊峰。 2.根據(jù)動差來計算。a∑(x-X)4/n/ó4 4=x-3或a4=∑ f(x-X)4/n/ó4 x-3當a4=0,分布呈正態(tài)峰;a4>0, 分布呈高狹峰;a4<0,分布呈低狹峰。只有當n>1000時,所計算出的峰態(tài)系數(shù)才比較可靠。 3.樣本:從總體中抽樣部分個體的過程稱為抽樣,所抽得的部分為樣本。(從樣本中隨機抽取的有代表性的一部分) 4.統(tǒng)計量:是統(tǒng)計理論中用來對數(shù)據(jù)進行分析、檢驗的變量。 5.頻率:是指單位時間內(nèi)完成振動的次數(shù),是描述振動物體往復運動頻繁程度的量。 6.概率:是描寫某一事件發(fā)生的可能性大小的一個量度。 8.系統(tǒng)誤差:在收集資料過程中,由于儀器初始狀態(tài)未調(diào)整到零、標準試劑未經(jīng)校正、醫(yī)生掌握療效標準偏高或偏低等原因,可造成觀察結果傾向性的偏大或偏小。 9.隨機測量誤差:在收集原始資料過程中,即使儀器初始狀態(tài)及標準試劑以校正,但是由于各種偶然因素的影響也會造成同一對象多次測定的結果完全不一致。這種誤差往往沒有固定的傾向,有時高有時低。 12.標準誤:也稱標準誤差,即樣本均數(shù)的標準差,是描述均數(shù)抽樣分布的離散程度及衡量均數(shù)抽樣誤差大小的尺度。 13.標準差:是一種表示分散程度的統(tǒng)計觀念。 14.指標:指預期中打算達到的指數(shù)、規(guī)格、標準。 15.相對數(shù):是兩個相關的絕對數(shù)之比,也可以是兩個統(tǒng)計指標之比。 16.率:表示在一定范圍內(nèi)某現(xiàn)象的發(fā)生數(shù)與可能發(fā)生的總數(shù)之比,說明某現(xiàn)象出現(xiàn)的強度活頻率。 17.構成比:表示某事物內(nèi)部各組成部分在整體中所占的比重,常以百分比表示。 18.相對比:是A、B兩個關聯(lián)指標之比,用以描述兩者的對比水平。19 統(tǒng)計學是一門用于觀察資料的應用科學它具有嚴密的科學邏輯無限的應用性和以高等數(shù)學為基礎的計算性它廣泛的涉及到自然科學人文科學和管理科學的各個領域 20醫(yī)學統(tǒng)計研究對象及特征同質(zhì)性 大量性變異性平均數(shù)是描述一組同質(zhì)的計量資料集中趨勢(平均水平)的指標 22 算術均數(shù) 是描述一組同質(zhì)的計量資料集中趨勢(平均水平)的指標 23幾何均數(shù)是描述一組同質(zhì)的呈對數(shù)整臺分布的計量資料變異系數(shù)的指標 1極差即最大值與最小值之差。四分位數(shù)間距2離均差平方和 方差 標準差 變異系數(shù) 3方差4標準差5變異系數(shù) 25參數(shù)估計包括點估計和區(qū)間估計搜集資料 一資料來源 1統(tǒng)計報表 2報告卡如報出生率換染率 3日常工作記錄如 住院病歷 4專題研究或實驗研究 5學術專題研究會討論會經(jīng)驗交流會 6圖書資料 7國際互聯(lián)網(wǎng) 二資料要求 (一)三性及時性 正確性完整性 (二)四原則對照原則均衡原則隨機化原則重復原則 三 整理資料核對 2 分組按質(zhì)量等級分組3 歸納 手工法 機械法 4 列表 1.什么叫醫(yī)學統(tǒng)計學?醫(yī)學統(tǒng)計學與統(tǒng)計學、衛(wèi)生統(tǒng)計學、生物統(tǒng)計學有何聯(lián)系與區(qū)別? 醫(yī)學統(tǒng)計學:是統(tǒng)計學的重要應用領域,它運用概率論、數(shù)理統(tǒng)計的原理和方法,結合醫(yī)學實踐,闡述統(tǒng)計設計的基本原理和步驟,研究資料和信息收集、整理和分析,進行科學推斷的一門應用統(tǒng)計學。醫(yī)學統(tǒng)計學與生物統(tǒng)計學、衛(wèi)生統(tǒng)計學是統(tǒng)計學原理和方法在互有聯(lián)系的不同學科領域的應用,三者間既有區(qū)別,又有交叉,故難以截然劃定界限。生物統(tǒng)計學應用于生物學研究,從生物范疇的角度來看,顯然比醫(yī)學統(tǒng)計學的范圍更廣,其原理和方法一般均可應用于醫(yī)學研究。醫(yī)學統(tǒng)計學和衛(wèi)生統(tǒng)計學均應用于醫(yī)學研究,而前者側重于醫(yī)學的生物性方面,后者側重于公共衛(wèi)生學的社會性方面。 2.標準差和標準誤有何區(qū)別和聯(lián)系? 區(qū)別:標準差與標準誤的意義、作用和使用范圍均不同。 (1)標準差一般用s 表示,是表示個體間變異大小的指標,反映了整個樣本對樣本平均數(shù)的離散程度,是數(shù)據(jù)精密度的衡量指標。 標準誤一般用sx 表示,反映樣本平均數(shù)對總體平均數(shù)的變異程度,從而反映抽樣誤差的大小,是量度結果精密度的指標。 (2)隨著樣本數(shù)(或測量次數(shù))n 的增大, 標準差趨向某個穩(wěn)定值,即樣本標準差s 越接近總體標準差σ。 標準誤則隨著樣本數(shù)(或測量次數(shù))n 的增大逐漸減小,即樣本平均數(shù)越接近總體平均數(shù)μ;故在實驗中也經(jīng)常采用適當增加樣本數(shù)(或測量次數(shù))n 減小sx 的方法來減小實驗誤差,但樣本數(shù)太大意義也不大。 (3)標準差是最常用的統(tǒng)計量, 一般用于表示一組樣本變量的分散程度,當資料呈正態(tài)分布時,與均數(shù)結合可估計正常值范圍,計算變異系數(shù)等 標準誤一般用于統(tǒng)計推斷中,主要包括假設檢驗和參數(shù)估計,如樣本平均數(shù)的假設檢驗、參數(shù)的區(qū)間估計與點估計等。 聯(lián)系:標準差與標準誤盡管都是反映變異程度的指標。標準誤是標準差的1/ n;二者都是衡量樣本變量(觀測值)隨機性的指標,只是從不同角度來反映誤差;二者在統(tǒng)計推斷和誤差分析中都有重要的應用。 3.方差分析的基本思想是什么? 通過分析研究中不同來源的變異對總變異的貢獻大小,從而確定可控因素對研究結果影響力的大小。將總變異及自由度按其來源分解 4.常用相對數(shù)指標有哪些?它們在計算和意義上有何不同? 常用的有率、構成比和相對比,5.x2檢驗的適用范圍和各個公式的適用條件是什么? 6.簡述非參數(shù)統(tǒng)計方法的概念及適用范圍? 在對總體的分布不作假設或僅作非常一般性假設條件下的統(tǒng)計方法 稱為“非參數(shù)統(tǒng)計”。適用范圍:(1)待分析數(shù)據(jù)不滿足參數(shù)檢驗所要求的假定,因而無法應用參數(shù)檢驗。(2)僅由一些等級構成的數(shù)據(jù),不能應用參數(shù)檢驗。(3)所提的問題中并不包含參數(shù),也不能用參數(shù)檢驗。(4)當我們需要迅速得出結果時,也可以不用參數(shù)統(tǒng)計方法而用非參數(shù)統(tǒng)計方法來達到目的。 7.非參數(shù)統(tǒng)計方法有何優(yōu)缺點? 優(yōu)點 1等級資料2對資料沒有特殊要求總體為偏態(tài)總體分布未知計量資料(N《30)有過大或過小的數(shù)值 3總體方差不齊 缺點檢驗效率低容易犯第二類錯誤 8.相關與回歸的區(qū)別與聯(lián)系? 回歸分與相關分的聯(lián)系:研究在專業(yè)上有一定聯(lián)系的兩個變量之間是否存在直線關系以及如何求得直線回歸方程等問題,需進行直線相關和回歸分析。從研究的目的來說,若僅僅為了了解兩變量之間呈直線關系的密切程度和方向,宜選用線性相關分析;若僅僅為了建立由自變量推算因變量的直線回歸方程,宜選用直線回歸分析。從資料所具備的條件來說,作相關分析時要求兩變量都是隨機變量;作回歸分析時要求因變量是隨機變量,自變量可以是隨機的,也可以是一般變量。差別主要是:(1)在回歸分析中,y被稱為因變量,處在被解釋的特殊地位,而在相關分析中,x與y處于平等的地位,即研究x與y的密切程度和研究y與x的密切程度是一致的;(2)相關分析中,x與y都是隨機變量,而在回歸分析中,y是隨機變量,x可以是隨機變量,也可以是非隨機的,通常在回歸模型中,總是假定x是非隨機的;(3)相關分析的研究主要是兩個變量之間的密切程度,而回歸分析不僅可以揭示x對y的影響大小,還可以由回歸方程進行數(shù)量上的預測和控制。 9.直線相關與等級相關有何區(qū)別? 直線相關又稱為簡單相關,是探討服從正態(tài)分布的兩個隨機變量X和Y有無線性相關關系的一種統(tǒng)計分析方法。直線相關的性質(zhì)可由散點圖直觀地說明。等級相關又稱秩相關,方法簡單,易學易用,適用范圍較廣;兩事物或現(xiàn)象間是否存在直線相關關系,也可用等級相關來檢驗。尤其適用于某些指標不便準確地測量,而只能以嚴重程度、成效大小、名次先后或綜合判斷等方式定出等級或次序的資統(tǒng)計工作的基本步驟 1 統(tǒng)計設計2資料搜集3資料整理4資料分析 第二章 統(tǒng)計數(shù)據(jù)的搜集 1、四種統(tǒng)計測量尺度(定類、定序、定距、定比)的含義 2、四種專門調(diào)查(普查、重點調(diào)查、典型調(diào)查、抽樣調(diào)查)的適用條件 第三章 統(tǒng)計數(shù)據(jù)的整理與顯示 1、單值數(shù)列的編制程序 2、組距數(shù)列的編制程序 3、向上(下)累計次數(shù)的計算 第四章 統(tǒng)計資料的描述 1、時期指標、時點指標的含義 2、結構、比例、比較、動態(tài)、強度相對數(shù)的含義 3、計劃任務數(shù)為計劃期內(nèi)各年的總和時計劃完成程度和提前計劃完成時間的計算 4、計劃任務數(shù)為計劃末期應達到的水平時計劃完成程度和提前計劃完成時間的計算 5、計劃任務數(shù)為相對數(shù)時計劃完成程度的計算 6、算術平均數(shù)的計算(數(shù)學性質(zhì)的內(nèi)容) 7、幾何平均數(shù)的計算 8、未分組資料中位數(shù)的計算 9、單值數(shù)列中位數(shù)的計算 10、組距數(shù)列中位數(shù)的計算 11、單值數(shù)列眾數(shù)的計算 12、組距數(shù)列眾數(shù)的計算 13、眾數(shù)、中位數(shù)和平均數(shù)的關系公式 14、未分組資料四分位差的計算 15、組距數(shù)列四分位差的計算 16、標準差的計算(簡捷公式) 17、離散系數(shù)的計算(比較不同均值總體的離散程度) 18、偏態(tài)系數(shù)的說明 19、峰度系數(shù)的說明 第五章 統(tǒng)計資料的推斷 1、總體、樣本的含義 2、是非標志總體指標(均值、標準差、離散系數(shù))的計算 3、樣本方差的計算 4、重復抽樣和不重復抽樣下樣本均值和樣本成數(shù)抽樣平均誤差的理論公式計算 5、重復抽樣和不重復抽樣下樣本均值和樣本成數(shù)抽樣平均誤差的實際公式計算(不重復抽樣下修正系數(shù)的兩點說明) 6、大樣本下樣本均值和樣本成數(shù)抽樣極限誤差的計算 9、總體均值的區(qū)間估計步驟 10、大樣本下總體比例的區(qū)間估計步驟 11、總體均值的假設檢驗步驟(單側檢驗和雙側檢驗) 12、大樣本下總體比例的假設檢驗步驟(單側檢驗和雙側檢驗) 13、常見Z值(注意:如假設檢驗需區(qū)分單側和雙側的情況)第六章 方差分析 1、單因素方差分析的步驟 2、雙因素方差分析的步驟 第七章 相關與回歸 1、常見散點圖的形式 2、相關系數(shù)的公式及含義 3、相關與回歸的關系(胡說相關) 4、一元線性回歸直線方程系數(shù)a和b的計算 5、系數(shù)b和相關系數(shù)r的關系 6、可決系數(shù)的計算及直觀含義和經(jīng)濟含義 第八章 時間數(shù)列分析 1、絕對數(shù)時期數(shù)列序時平均數(shù)的計算 2、絕對數(shù)連續(xù)時點數(shù)列序時平均數(shù)的計算 3、絕對數(shù)間斷時點數(shù)列序時平均數(shù)的計算 4、三種情況下相對數(shù)時間數(shù)列序時平均數(shù)的計算 5、平均增長量的計算 6、發(fā)展速度與增長速度的計算 7、增長1%的絕對值 8、平均發(fā)展速度和平均增長速度及相關指標的計算 9、偶數(shù)項移動平均需作移正平均 10、移動平均的幾點說明 11、最小二乘法測定長期趨勢時簡捷公式如何令 12、三種趨勢方程的數(shù)據(jù)特征 第九章 統(tǒng)計指數(shù) 1、數(shù)量指標綜合指數(shù)的計算 2、質(zhì)量指標綜合指數(shù)的計算 3、數(shù)量指標加權算術平均指數(shù)的計算 4、質(zhì)量指標加權調(diào)和平均指數(shù)的計算 5、總量指標變動兩因素分析絕對數(shù)、相對數(shù)形式的計算 6、平均指標變動兩因素分析絕對數(shù)、相對數(shù)形式的計算 ?t?0 知識點 1.統(tǒng)計學是應用概率論和數(shù)理統(tǒng)計的基本原理和方法,研究數(shù)據(jù)的搜集、整理、分析、表達和解釋的一門學科。 2.醫(yī)學統(tǒng)計學是應用統(tǒng)計學的基本原理和方法,研究醫(yī)學及其有關領域數(shù)據(jù)信息的搜集、整理、分析、表達和解釋的一門學科。 3.統(tǒng)計軟件包是對資料進行各種統(tǒng)計處理分析的一系列程序的組合。4.統(tǒng)計工作的基本步驟:研究設計、搜集資料、整理資料和分析資料。 5.科研結果的好壞取決于研究設計的好壞,研究設計是統(tǒng)計工作中的基礎和關鍵,決定著整個統(tǒng)計工作的成敗。 6.統(tǒng)計分析包括統(tǒng)計描述和統(tǒng)計推斷。統(tǒng)計描述是對已知的樣本(或總體)的分布情況或特征值進行分析表述;統(tǒng)計推斷是根據(jù)已知的樣本信息來推斷未知的總體。7.醫(yī)學原始資料的類型有:計量資料、計數(shù)資料、等級資料。 8.計量資料是用定量的方法對每一個觀察單位的某項指標進行測定所得的資料。 9.計數(shù)資料是把觀察單位按某種屬性(性質(zhì))或類別進行分組,清點各組觀察單位數(shù)所得資料。 10.等級資料是把觀察單位按屬性程度或等級順序分組,清點各組觀察單位數(shù)所得資料。各屬性之間有程度的差別。等級資料的等級順序不能任意顛倒。11.同質(zhì):是指所研究的觀察對象具有某些相同的性質(zhì)或特征。 12.變異:是同質(zhì)個體的某項指標之間的差異,即個體變異或個體差異性。13.總體是根據(jù)研究目的確定的同質(zhì)研究對象的總體。樣本是總體中具有代表性的一部分個體。 14.抽樣研究是通過從總體中隨機抽取樣本,對樣本信息進行分析,從而推斷總體的研究方法。抽樣誤差是由隨機抽樣造成的樣本指標與總體指標之間、樣本指標與樣本指標之間的差異,其根源在于總體中的個體存在變異性,只要是抽樣研究,就一定存在抽樣誤差,不能用樣本的指標直接下結論。 15.統(tǒng)計學的主要任務是進行統(tǒng)計推斷,包括參數(shù)估計和假設檢驗。16.概率是某隨機事件發(fā)生可能性大?。ɑ驒C會大小)的數(shù)值度量。概率的取值為0≤P≤1。小概率事件是指P≤0.05的隨機事件。 17.頻數(shù)表和頻數(shù)分布圖的用途:(1)揭示計量資料的分布類型。(2)揭示計量資料分布的重要特征—集中趨勢與離散趨勢。(3)便于發(fā)現(xiàn)特大或特小的可疑值。(4)作為陳述資料的形式。例數(shù)大時,可以頻率估計概率。(5)便于資料的進一步統(tǒng)計分析。18.均數(shù)應用于計量資料的正態(tài)分布或近似正態(tài)分布資料。19.當資料呈正態(tài)分布時,均數(shù)位于分布的中心。 20.每個觀察值都加一個常數(shù)a,則均數(shù)為原均數(shù)加常數(shù)a;每個觀察值都乘以一個常數(shù)b,則均數(shù)為原均數(shù)的b倍。 21.幾何均數(shù)應用于對數(shù)正態(tài)分布或近似正態(tài)分布資料,也可用于呈倍數(shù)關系的等比資料。在醫(yī)院中主要用于抗原(體)滴度資料。 22.計算幾何均數(shù)的資料一般不能有觀察值為0,也不能同時包含正負觀察值。 23.中位數(shù)可用于描述任何分布類型計量資料的集中趨勢,但對于正態(tài)分布或近似正態(tài)分布的資料,中位數(shù)不利于進一步的統(tǒng)計分析,故對正態(tài)分布或近似正態(tài)分布資料應首選均數(shù)描述其集中趨勢。 24.中位數(shù)適用于描述偏態(tài)分布資料、一端或兩端無確定數(shù)據(jù)的資料和分布不明資料的集中趨勢。 25.極差與四分位數(shù)間距可用于描述計量資料的離散程度,但都比較粗略,而四分位數(shù)間距較極差穩(wěn)定,他們用于描述偏態(tài)分布資料。 26.中位數(shù)M是一個特殊的百分位數(shù),即第50百分位數(shù)P50,。百分位數(shù)是一種位置指標,樣本的第X百分位數(shù)記為Px,它表示將全部觀測值X1、X2,?,Xn由小到大依次排列后位于第X百分位置的數(shù)值。 27.方差和標準差用于描述正態(tài)分布計量資料的離散程度。 28.均數(shù)與標準差結合用于全面描述正態(tài)分布計量資料的集中趨勢與離散趨勢。 29.變異系數(shù)描述的是相對離散程度,無度量衡單位。用于單位不同,或雖單位相同,但均數(shù)相差較大的資料間變異程度的比較。 30.正態(tài)分布是橫軸上方以均數(shù)處最高的單峰對稱分布,以均數(shù)為中心,左右兩側對稱。正態(tài)分布N(μ,σ2)中有兩個參數(shù):總體均數(shù)μ和總體標準差σ。μ是位置參數(shù),σ是變異度參數(shù)。 31.正態(tài)分布曲線下的面積是1,其分布有一定的規(guī)律,x±1.64s內(nèi)的面積為90%,x±1.96s內(nèi)的面積為95%,x±2.58s內(nèi)的面積為99%。32.常用相對數(shù)有:率、構成比、相對比。 33.率是說明某現(xiàn)象發(fā)生的頻率或強度。某一分率的改變不影響其他分率變化。 34.構成比是表示某事物內(nèi)部各組成部分所占的比重或分布。某一部分構成比的改變將影響其他構成比的變化。 35.相對比表示兩個有關事物指標,用以說明一個指標是另一個指標的幾倍或幾分之幾。兩個指標可以是絕對比、相對數(shù)或平均數(shù)。 36.應用相對數(shù)注意事項:(1)計算相對數(shù)時分母應該有足夠數(shù)量即例數(shù)不能太小。(2)計算合計率或平均率時,不能把n個率相加后除以n,應該絕對數(shù)相加后再計算相對數(shù)。(3)正確區(qū)分構成比與率,分析時不能以構成比代替率。(4)相對數(shù)的比較應注意其可比性。對比組之間除了被研究的因素不同以外,其他相對數(shù)造成影響的因素應可能在構成比代替率。(5)樣本率或樣本構成比在比較時應做假設檢驗。 37.常用的標準化方法有直接標準化法、間接標準化法和反推標準法,簡稱直接法、間接法和反推法。 38.一般選擇“標準”的方法有兩種:(1)選擇具有代表性的,較穩(wěn)定的、數(shù)量較大的人群作為“標準”;(2)互相比較資料中任選一組數(shù)據(jù)作“標準”。 39.標準化死亡比(SMR)是被標化組的實際死亡數(shù)與預期死亡數(shù)之比,若SMR>1,表示被標化組死亡率高于標準組;若SMR<1,表示被標化組死亡率低于標準組; 40.計算標準化率的步驟:⑴根據(jù)資料所具備的條件選用直接法或間接法;⑵選定標準構成;⑶選擇公式計算標準化率。 41.應用標準化法的注意事項:(1)標準化法只適用于內(nèi)部構成不同影響到總率比較的情況; (2)由于選擇的標準不同,算出的標準化率也不同,但比較的結論一致;(3)標準化后的標準化率,已經(jīng)不再反映當時當?shù)氐膶嶋H水平,它只表示相互比較的資料間的相對水平;(4)樣本標準化率也存在抽樣誤差,也需要進行假設檢驗。 42.發(fā)病率是計算一定期間內(nèi)某人群中的新發(fā)病例數(shù),而患病率是計算調(diào)查時點被調(diào)查人群中的現(xiàn)患病例數(shù)。 43.在一定期間內(nèi)某人可能發(fā)病一次以上而成為多個病例,所以發(fā)病率可能會大于100%;;而患病率不會出現(xiàn)大于100%的情況。 44.發(fā)病率高的疾病稱為多發(fā)?。换疾÷矢叩募膊》Q為常見病。患病率高,發(fā)病率也高的疾病稱為常見多發(fā)病。 45.統(tǒng)計表一般由標題、標目、線條、數(shù)字和備注等部分組成。統(tǒng)計表的編制應:⑴重點突出,簡單明了,一張統(tǒng)計表至應包括一個中心內(nèi)容;⑵主謂分明,層次清楚;⑶結構完整,有自明性。 46.常用的統(tǒng)計圖有條圖、圓圖、百分條圖、直方圖、線圖、半對數(shù)線圖、散點圖、箱式圖和統(tǒng)計地圖等。 47.單個構成比的描述,可選用圓圖或百分條圖;多個構成比的描述和比較,宜選用百分條圖。 48.普通線圖適用于描述某項指標隨某個連續(xù)型數(shù)值變量變化而變化的幅度(絕對變化趨勢);半對數(shù)線圖適用于描述某項指標隨某個連續(xù)型數(shù)值變量變化而變化的速度(相對變化趨勢)。 49.箱式圖通常選用5個描述統(tǒng)計量來繪制,即最小值、下四分位數(shù)(P25)、中位數(shù)(M)、上四分位數(shù)(P75)、最大值;可用于描述某個連續(xù)型數(shù)值變量的分布特征,也可用于比較不同類別之間某個連續(xù)型數(shù)值變量分布特征的差異。 50.均數(shù)抽樣誤差是抽樣產(chǎn)生的由于個體差異所導致的樣本均數(shù)與樣本均數(shù)之間、樣本均數(shù)與總體均數(shù)之間的差異。 51.標準誤是樣本均數(shù)的標準差,是描述均數(shù)抽樣誤差大小的指標。增加樣本含量可減小樣本均數(shù)的標準誤,從而降低抽樣誤差。 52.參數(shù)估計是指用樣本指標(統(tǒng)計量)來推斷總體指標(參數(shù))。估計方法有點估計和區(qū)間估計,區(qū)間估計是按預先給定的概率1-α,由樣本指標確定的包含總體參數(shù)的一個范圍。 53.可信區(qū)間是指總體均數(shù)可能所在的范圍。用于推斷總體參數(shù)所在的范圍。總體均數(shù)95%可信區(qū)間的意義為:總體均數(shù)在x±t0.05,νSx或x±1.96Sx范圍內(nèi)的可能性為95%。 54.在抽樣研究中,由于有抽樣誤差存在,不能直接通過比較樣本均數(shù)與樣本均數(shù)之間、樣本均數(shù)與總體均數(shù)之間的大小得出結論,要進行假設檢驗。55.假設檢驗的基本思想包括小概率思想和反證法思想。56.假設檢驗是先對總體作出某種假定(檢驗假設),然后根據(jù)樣本信息來推斷其是否成立的一類統(tǒng)計方法的總稱。用于推斷總體參數(shù)是否相等。 57.假設檢驗的基本步驟:⑴建立檢驗假設,確定檢驗水準;⑵計算檢驗統(tǒng)計量;⑶確定P值,作出統(tǒng)計判斷。 58.單樣本t檢驗的目的是推斷樣本均數(shù)所代表的總體均數(shù)與已知總體均數(shù)是否相同,它要求樣本取自正態(tài)總體。 59.配對設計包括:⑴兩個受試對象按某特征相同或相近配成對子,分別給予不同的處理;⑵同一受試對象給予不同處理或處理前后比較。它可以降低抽樣誤差,提高統(tǒng)計效率。60.配對t檢驗適用于配對設計的計量資料的比較,且要求差值服從正態(tài)分布。 61.完全隨機設計可以將一批同質(zhì)受試對象隨機分配到各組,也可以是隨機抽取幾組不同的受試對象,觀察其實驗效應。 62.完全隨機設計兩樣本均數(shù)比較的t檢驗是推斷計量資料的兩個總體均數(shù)之間有無差別的假設檢驗方法,要求樣本來自正態(tài)總體,且兩總體方差相等(方差齊)。 63.方差齊性檢驗的適用條件是兩樣本均來自正態(tài)分布的總體,方差齊性檢驗中的檢驗統(tǒng)計量F服從F分布,有兩個自由度,分子的自由度(較大方差)和分母的自由度(較小方差)。F值越大,P值越小。 64.兩個樣本均數(shù)比較,方差不齊時刻選擇:⑴近似t′檢驗;⑵通過一定的變量變換以達到方差齊;⑶選用非參數(shù)統(tǒng)計,如秩和檢驗等。65.Z檢驗適用于大樣本資料的假設檢驗。 66.第Ⅰ類錯誤:檢驗假設H0本來是成立的,經(jīng)過檢驗后被拒絕了,即“棄真”。其發(fā)生的的概率為α,為已知。 67.第Ⅱ類錯誤:檢驗假設H0本來是不成立的,經(jīng)過檢驗后被接受了,即“存?zhèn)巍?。其發(fā)生的概率為β,屬未知數(shù)。68.假設檢驗的注意事項:⑴要有嚴密的研究設計;⑵選用的假設檢驗方法應符合應用條件;⑶有統(tǒng)計學意義不等于有實際意義;⑷結論不能絕對化;⑸正確理解P值與差別有無統(tǒng)計意義;⑹平衡Ⅰ類錯誤和Ⅱ類錯誤。69.方差分析是一種以分析數(shù)據(jù)的變異為基礎,以F值為檢驗統(tǒng)計量的計量資料的假設檢驗方法,主要用于推斷計量資料單因素k水平(k≧3)或多因素不同水平總體均數(shù)間的差異性,其前提條件為資料服從正態(tài)分布,各組方差齊。 70.隨機區(qū)組設計資料的總變異被分解為3個部分,即處理組間變異、區(qū)組間變異和誤差。區(qū)組變異和誤差兩部分相當于單因素方差分析的組內(nèi)變異。 71.兩兩比較的方法很多,常用q檢驗、LSD—t檢驗等;q檢驗適用于探索性研究,對每兩個樣本均數(shù)都進行檢驗;LSD—t檢驗適用于事先有明確假設的證實性研究。72.常用數(shù)據(jù)變換的方法有對數(shù)變換、平方根變換、平方根反正弦變換、倒數(shù)變換。 273.X檢驗是一種以Χ2分布為基礎,以Χ2值為檢驗統(tǒng)計量的計數(shù)資料的假設檢驗方法。 274.X值反映實際頻數(shù)(A)和理論頻數(shù)(T)的符合程度。 275.X檢驗的主要用途:⑴推斷兩個或兩個以上總體率(或構成比)之間有無差別;⑵兩變量間有無相關關系;⑶檢驗頻數(shù)分布的擬合優(yōu)度。 2276.四格表X檢驗的注意事項:(1)當n≥40,T≥5時,用四格表x檢驗的基本公式或專用22公式計算X 值;(2)當n≥40,1≤T<5時,需要用校正公式計算X 值;(3)當n<40或2T 2277.行×列表資料X檢驗的注意事項:(1)行×列表X檢驗允許有1/5的基本格子的理論頻數(shù)小于5大于1,但不能有理論頻數(shù)小于1。⑵如果有1/5以上格子的理論頻數(shù)小于5大于1,或有一個格子的理論頻數(shù)小于1,可采用以下處理方法:①增加樣本含量:可以增大理論頻數(shù);②將理論頻數(shù)太小的行或列與性質(zhì)相近的鄰行或鄰列中的實際頻數(shù)合并;③刪去理論頻數(shù)太小的格子所對應的行或例。 78.依次增減四格表中某個格子(一般選用行合計與列合計均為最小的那個格子)的數(shù)據(jù),可列出周邊合計不變條件下各種組合的四格表(一般可列出最小周邊合計數(shù)加1個四格表)。 79.非參數(shù)檢驗是一類不依賴于總體分布類型的檢驗,即在應用中可以不考慮被研究對象為何種分布以及分布是否已知,檢驗假設中沒有包括總體參數(shù)的一類統(tǒng)計方法。80.秩和檢驗的適用范圍:⑴未加精確測量的資料(包括等級資料);⑵偏態(tài)分布且無法轉化為正態(tài)分布的資料;⑶分布不清的資料。 81.配對資料的秩和檢驗用于配對設計計量資料差值的比較和單一樣本與總體中位數(shù)的比較。 82.直線相關是分析服從正態(tài)分布的兩個隨機變量x和y有無線性相關關系的一種統(tǒng)計分析方法。 83.相關系數(shù)是描述兩個變量間線性相關關系的密切程度與方向的統(tǒng)計指標。相關系數(shù)的符號表示兩變量的線性相關的方向。其特點為:⑴相關系數(shù)r沒有單位;⑵取值范圍在﹣1和1之間;⑶r為正表示正相關,r為1表示完全正相關;r值為負表示負相關,r為﹣1表示完全負相關;⑷r絕對值越接近1,表示兩個變量間相關關系密切程度越高;越接近0,則相關關系越不密切。 84.相關分析的前提條件:兩個隨機變量;散點圖呈線性相關;服從雙變量正態(tài)分布。85.在有相關關系時,根據(jù)r值判斷兩變量相關的密切程度:⑴|r|≥0.7,兩變量有高度相關關系;⑵0.7>|r|≥0.4,兩變量有中度相關關系;⑶|r|<0.4,兩變量有低度相關關系。 86.直線回歸分析的前提條件:⑴線性:兩個變量間存在線性關系;⑵獨立性:任意兩個觀察值互相獨立;⑶正態(tài)性:應變量y是服從正態(tài)分布的隨機變量;⑷方差齊:給定x后,應變量y的方差相等。 87.等級相關應用范圍:⑴不服從雙變量正態(tài)分布或偏態(tài)分布;⑵總體分布類型未知;⑶原始數(shù)據(jù)是等級變量。 88.對同一資料,相關系數(shù)t檢驗與回歸系數(shù)t 檢驗效果相同。 89.決定系數(shù)r2決定回歸效果的好壞,r2越接近1,回歸的效果越好。 90.直線回歸方程:y=a+bx其中a為回歸直線在Y軸上的截距:⑴a>0表示直線與縱軸的交點在原點的上方;⑵a<0則交點在原點的下方;⑶a=0則回歸直線通過原點;b為回歸系數(shù),即直線的斜率:⑴b>0表示直線從左下方走向右上方,即 y隨 x的增大而增大;⑵b<0表示直線從左上方走向右下方,即 y隨 x的增大而減?。虎莃=0表示直線與 x軸平行,即x與 y無直線關系;⑷b的統(tǒng)計學意義是x每增(減)一個單位,y平均改變b個單位。 91.實驗設計的特點:⑴研究者能人為設置處理因素;⑵受試對象接受何種處理因素或水平是由隨機分配而定的。 92.醫(yī)學實驗設計包括處理因素或研究因素,受試對象和實驗效應三個基本要素。 93.常用對照的形式為空白對照、安慰劑對照、實驗對照、標準對照、自身對照、相互對照及歷史對照等。 94.隨機化包括隨機抽樣和隨機分組,隨機抽樣指保證總體中的每一個個體都有同等的機會被抽出來作為樣本;隨機分組指保證樣本中的每一個個體都有同等的機會被分配到實驗組或對照組。 95.實驗設計的基本原則:對照、隨機、重復、均衡。 96.重復是指研究樣本要有一定的數(shù)量,即在保證研究結果具有一定可靠性的條件下,確定最少的樣本例數(shù)。 97.均衡原則又稱齊同對比原則,指實驗組和對照組或各實驗組之間,除了處理因素以外,其他一切條件應盡可能相同或一致。 98.完全隨機設計又稱隨機對照試驗,屬于單因素研究設計。 99.樣本含量估計需要確定四個基本因素:α、1-β、σ、δ。α、δ與樣本含量成反比,σ(或s)、1-β與樣本含量成正比。 100.劑量反應是實驗物質(zhì)引起實驗動物總體中產(chǎn)生某種反應的劑量。 知識點 1.統(tǒng)計學是應用概率論和數(shù)理統(tǒng)計的基本原理和方法,研究數(shù)據(jù)的搜集、整理、分析、表 達和解釋的一門學科。 2.醫(yī)學統(tǒng)計學是應用統(tǒng)計學的基本原理和方法,研究醫(yī)學及其有關領域數(shù)據(jù)信息的搜集、整理、分析、表達和解釋的一門學科。 3.統(tǒng)計軟件包是對資料進行各種統(tǒng)計處理分析的一系列程序的組合。 4.統(tǒng)計工作的基本步驟:研究設計、搜集資料、整理資料和分析資料。 5.科研結果的好壞取決于研究設計的好壞,研究設計是統(tǒng)計工作中的基礎和關鍵,決定著 整個統(tǒng)計工作的成敗。 6.統(tǒng)計分析包括統(tǒng)計描述和統(tǒng)計推斷。統(tǒng)計描述是對已知的樣本(或總體)的分布情況或 特征值進行分析表述;統(tǒng)計推斷是根據(jù)已知的樣本信息來推斷未知的總體。 7.醫(yī)學原始資料的類型有:計量資料、計數(shù)資料、等級資料。 8.計量資料是用定量的方法對每一個觀察單位的某項指標進行測定所得的資料。 9.計數(shù)資料是把觀察單位按某種屬性(性質(zhì))或類別進行分組,清點各組觀察單位數(shù)所得 資料。 10.等級資料是把觀察單位按屬性程度或等級順序分組,清點各組觀察單位數(shù)所得資料。各 屬性之間有程度的差別。等級資料的等級順序不能任意顛倒。 11.同質(zhì):是指所研究的觀察對象具有某些相同的性質(zhì)或特征。 12.變異:是同質(zhì)個體的某項指標之間的差異,即個體變異或個體差異性。 13.總體是根據(jù)研究目的確定的同質(zhì)研究對象的總體。樣本是總體中具有代表性的一部分個 體。 14.抽樣研究是通過從總體中隨機抽取樣本,對樣本信息進行分析,從而推斷總體的研究方 法。抽樣誤差是由隨機抽樣造成的樣本指標與總體指標之間、樣本指標與樣本指標之間的差異,其根源在于總體中的個體存在變異性,只要是抽樣研究,就一定存在抽樣誤差,不能用樣本的指標直接下結論。 15.統(tǒng)計學的主要任務是進行統(tǒng)計推斷,包括參數(shù)估計和假設檢驗。 16.概率是某隨機事件發(fā)生可能性大小(或機會大?。┑臄?shù)值度量。概率的取值為0≤P≤1。 小概率事件是指P≤0.05的隨機事件。 17.頻數(shù)表和頻數(shù)分布圖的用途:(1)揭示計量資料的分布類型。(2)揭示計量資料分布的重 要特征—集中趨勢與離散趨勢。(3)便于發(fā)現(xiàn)特大或特小的可疑值。(4)作為陳述資料的形式。例數(shù)大時,可以頻率估計概率。(5)便于資料的進一步統(tǒng)計分析。 18.均數(shù)應用于計量資料的正態(tài)分布或近似正態(tài)分布資料。 19.當資料呈正態(tài)分布時,均數(shù)位于分布的中心。 20.每個觀察值都加一個常數(shù)a,則均數(shù)為原均數(shù)加常數(shù)a;每個觀察值都乘以一個常數(shù)b,則均數(shù)為原均數(shù)的b倍。 21.幾何均數(shù)應用于對數(shù)正態(tài)分布或近似正態(tài)分布資料,也可用于呈倍數(shù)關系的等比資料。 在醫(yī)院中主要用于抗原(體)滴度資料。 22.計算幾何均數(shù)的資料一般不能有觀察值為0,也不能同時包含正負觀察值。 23.中位數(shù)可用于描述任何分布類型計量資料的集中趨勢,但對于正態(tài)分布或近似正態(tài)分布的資料,中位數(shù)不利于進一步的統(tǒng)計分析,故對正態(tài)分布或近似正態(tài)分布資料應首選均數(shù)描述其集中趨勢。 24.中位數(shù)適用于描述偏態(tài)分布資料、一端或兩端無確定數(shù)據(jù)的資料和分布不明資料的集中 趨勢。 25.極差與四分位數(shù)間距可用于描述計量資料的離散程度,但都比較粗略,而四分位數(shù)間距 較極差穩(wěn)定,他們用于描述偏態(tài)分布資料。 26.中位數(shù)M是一個特殊的百分位數(shù),即第50百分位數(shù)P50,。百分位數(shù)是一種位置指標,樣本的第X百分位數(shù)記為Px,它表示將全部觀測值X1、X2,?,Xn由小到大依次排列后位于第X百分位置的數(shù)值。 27.方差和標準差用于描述正態(tài)分布計量資料的離散程度。 28.均數(shù)與標準差結合用于全面描述正態(tài)分布計量資料的集中趨勢與離散趨勢。 29.變異系數(shù)描述的是相對離散程度,無度量衡單位。用于單位不同,或雖單位相同,但均 數(shù)相差較大的資料間變異程度的比較。 30.正態(tài)分布是橫軸上方以均數(shù)處最高的單峰對稱分布,以均數(shù)為中心,左右兩側對稱。正 態(tài)分布N(μ,σ2)中有兩個參數(shù):總體均數(shù)μ和總體標準差σ。μ是位置參數(shù),σ是變異度參數(shù)。 31.正態(tài)分布曲線下的面積是1,其分布有一定的規(guī)律,±1.64s內(nèi)的面積為90%,± 1.96s內(nèi)的面積為95%,±2.58s內(nèi)的面積為99%。 32.常用相對數(shù)有:率、構成比、相對比。 33.率是說明某現(xiàn)象發(fā)生的頻率或強度。某一分率的改變不影響其他分率變化。 34.構成比是表示某事物內(nèi)部各組成部分所占的比重或分布。某一部分構成比的改變將影響 其他構成比的變化。 35.相對比表示兩個有關事物指標,用以說明一個指標是另一個指標的幾倍或幾分之幾。兩 個指標可以是絕對比、相對數(shù)或平均數(shù)。 36.應用相對數(shù)注意事項:(1)計算相對數(shù)時分母應該有足夠數(shù)量即例數(shù)不能太小。(2)計算 合計率或平均率時,不能把n個率相加后除以n,應該絕對數(shù)相加后再計算相對數(shù)。(3)正確區(qū)分構成比與率,分析時不能以構成比代替率。(4)相對數(shù)的比較應注意其可比性。對比組之間除了被研究的因素不同以外,其他相對數(shù)造成影響的因素應可能在構成比代替率。(5)樣本率或樣本構成比在比較時應做假設檢驗。 37.常用的標準化方法有直接標準化法、間接標準化法和反推標準法,簡稱直接法、間接法 和反推法。 38.一般選擇“標準”的方法有兩種:(1)選擇具有代表性的,較穩(wěn)定的、數(shù)量較大的人群 作為“標準”;(2)互相比較資料中任選一組數(shù)據(jù)作“標準”。 39.標準化死亡比(SMR)是被標化組的實際死亡數(shù)與預期死亡數(shù)之比,若SMR>1,表示被 標化組死亡率高于標準組;若SMR<1,表示被標化組死亡率低于標準組; 40.計算標準化率的步驟:⑴根據(jù)資料所具備的條件選用直接法或間接法;⑵選定標準構成; ⑶選擇公式計算標準化率。 41.應用標準化法的注意事項:(1)標準化法只適用于內(nèi)部構成不同影響到總率比較的情況; (2)由于選擇的標準不同,算出的標準化率也不同,但比較的結論一致;(3)標準化后的標準化率,已經(jīng)不再反映當時當?shù)氐膶嶋H水平,它只表示相互比較的資料間的相對水平; (4)樣本標準化率也存在抽樣誤差,也需要進行假設檢驗。 42.發(fā)病率是計算一定期間內(nèi)某人群中的新發(fā)病例數(shù),而患病率是計算調(diào)查時點被調(diào)查人群 中的現(xiàn)患病例數(shù)。 43.在一定期間內(nèi)某人可能發(fā)病一次以上而成為多個病例,所以發(fā)病率可能會大于100%;; 而患病率不會出現(xiàn)大于100%的情況。 44.發(fā)病率高的疾病稱為多發(fā)??;患病率高的疾病稱為常見病。患病率高,發(fā)病率也高的疾 病稱為常見多發(fā)病。 45.統(tǒng)計表一般由標題、標目、線條、數(shù)字和備注等部分組成。統(tǒng)計表的編制應:⑴重點突 出,簡單明了,一張統(tǒng)計表至應包括一個中心內(nèi)容;⑵主謂分明,層次清楚;⑶結構完 整,有自明性。 46.常用的統(tǒng)計圖有條圖、圓圖、百分條圖、直方圖、線圖、半對數(shù)線圖、散點圖、箱式圖 和統(tǒng)計地圖等。 47.單個構成比的描述,可選用圓圖或百分條圖;多個構成比的描述和比較,宜選用百分條 圖。 48.普通線圖適用于描述某項指標隨某個連續(xù)型數(shù)值變量變化而變化的幅度(絕對變化趨 勢);半對數(shù)線圖適用于描述某項指標隨某個連續(xù)型數(shù)值變量變化而變化的速度(相對變化趨勢)。 49.箱式圖通常選用5個描述統(tǒng)計量來繪制,即最小值、下四分位數(shù)(P25)、中位數(shù)(M)、上四分位數(shù)(P75)、最大值;可用于描述某個連續(xù)型數(shù)值變量的分布特征,也可用于比較不同類別之間某個連續(xù)型數(shù)值變量分布特征的差異。 50.均數(shù)抽樣誤差是抽樣產(chǎn)生的由于個體差異所導致的樣本均數(shù)與樣本均數(shù)之間、樣本均數(shù) 與總體均數(shù)之間的差異。 51.標準誤是樣本均數(shù)的標準差,是描述均數(shù)抽樣誤差大小的指標。增加樣本含量可減小樣 本均數(shù)的標準誤,從而降低抽樣誤差。 52.參數(shù)估計是指用樣本指標(統(tǒng)計量)來推斷總體指標(參數(shù))。估計方法有點估計和區(qū) 間估計,區(qū)間估計是按預先給定的概率1-α,由樣本指標確定的包含總體參數(shù)的一個范圍。 53.可信區(qū)間是指總體均數(shù)可能所在的范圍。用于推斷總體參數(shù)所在的范圍??傮w均數(shù)95%可信區(qū)間的意義為:總體均數(shù)在±t0.05,νS或±1.96S范圍內(nèi)的可能性為95%。 54.在抽樣研究中,由于有抽樣誤差存在,不能直接通過比較樣本均數(shù)與樣本均數(shù)之間、樣 本均數(shù)與總體均數(shù)之間的大小得出結論,要進行假設檢驗。 55.假設檢驗的基本思想包括小概率思想和反證法思想。 56.假設檢驗是先對總體作出某種假定(檢驗假設),然后根據(jù)樣本信息來推斷其是否成立的一類統(tǒng)計方法的總稱。用于推斷總體參數(shù)是否相等。 57.假設檢驗的基本步驟:⑴建立檢驗假設,確定檢驗水準;⑵計算檢驗統(tǒng)計量;⑶確定P 值,作出統(tǒng)計判斷。 58.單樣本t檢驗的目的是推斷樣本均數(shù)所代表的總體均數(shù)與已知總體均數(shù)是否相同,它要 求樣本取自正態(tài)總體。 59.配對設計包括:⑴兩個受試對象按某特征相同或相近配成對子,分別給予不同的處理; ⑵同一受試對象給予不同處理或處理前后比較。它可以降低抽樣誤差,提高統(tǒng)計效率。 60.配對t檢驗適用于配對設計的計量資料的比較,且要求差值服從正態(tài)分布。 61.完全隨機設計可以將一批同質(zhì)受試對象隨機分配到各組,也可以是隨機抽取幾組不同的受試對象,觀察其實驗效應。 62.完全隨機設計兩樣本均數(shù)比較的t檢驗是推斷計量資料的兩個總體均數(shù)之間有無差別的假設檢驗方法,要求樣本來自正態(tài)總體,且兩總體方差相等(方差齊)。 63.方差齊性檢驗的適用條件是兩樣本均來自正態(tài)分布的總體,方差齊性檢驗中的檢驗統(tǒng)計 量F服從F分布,有兩個自由度,分子的自由度(較大方差)和分母的自由度(較小方差)。F值越大,P值越小。 64.兩個樣本均數(shù)比較,方差不齊時刻選擇:⑴近似t′檢驗;⑵通過一定的變量變換以達 到方差齊;⑶選用非參數(shù)統(tǒng)計,如秩和檢驗等。 65.Z檢驗適用于大樣本資料的假設檢驗。 66.第Ⅰ類錯誤:檢驗假設H0本來是成立的,經(jīng)過檢驗后被拒絕了,即“棄真”。其發(fā)生的的概率為α,為已知。 67.第Ⅱ類錯誤:檢驗假設H0本來是不成立的,經(jīng)過檢驗后被接受了,即“存?zhèn)巍?。其發(fā) 生的概率為β,屬未知數(shù)。 68.假設檢驗的注意事項:⑴要有嚴密的研究設計;⑵選用的假設檢驗方法應符合應用條件; ⑶有統(tǒng)計學意義不等于有實際意義;⑷結論不能絕對化;⑸正確理解P值與差別有無統(tǒng)計意義;⑹平衡Ⅰ類錯誤和Ⅱ類錯誤。 69.方差分析是一種以分析數(shù)據(jù)的變異為基礎,以F值為檢驗統(tǒng)計量的計量資料的假設檢驗 方法,主要用于推斷計量資料單因素k水平(k≧3)或多因素不同水平總體均數(shù)間的差異性,其前提條件為資料服從正態(tài)分布,各組方差齊。 70.隨機區(qū)組設計資料的總變異被分解為3個部分,即處理組間變異、區(qū)組間變異和誤差。 區(qū)組變異和誤差兩部分相當于單因素方差分析的組內(nèi)變異。 71.兩兩比較的方法很多,常用q檢驗、LSD—t檢驗等;q檢驗適用于探索性研究,對每兩 個樣本均數(shù)都進行檢驗;LSD—t檢驗適用于事先有明確假設的證實性研究。 72.常用數(shù)據(jù)變換的方法有對數(shù)變換、平方根變換、平方根反正弦變換、倒數(shù)變換。 273.X檢驗是一種以Χ2分布為基礎,以Χ2值為檢驗統(tǒng)計量的計數(shù)資料的假設檢驗方法。274.X值反映實際頻數(shù)(A)和理論頻數(shù)(T)的符合程度。 275.X檢驗的主要用途:⑴推斷兩個或兩個以上總體率(或構成比)之間有無差別;⑵兩變量間有無相關關系;⑶檢驗頻數(shù)分布的擬合優(yōu)度。 2276.四格表X檢驗的注意事項:(1)當n≥40,T≥5時,用四格表x檢驗的基本公式或專用 22公式計算X 值;(2)當n≥40,1≤T<5時,需要用校正公式計算X 值;(3)當n<40或 2T 2277.行×列表資料X檢驗的注意事項:(1)行×列表X檢驗允許有1/5的基本格子的理論 頻數(shù)小于5大于1,但不能有理論頻數(shù)小于1。⑵如果有1/5以上格子的理論頻數(shù)小于5大于1,或有一個格子的理論頻數(shù)小于1,可采用以下處理方法:①增加樣本含量:可以增大理論頻數(shù);②將理論頻數(shù)太小的行或列與性質(zhì)相近的鄰行或鄰列中的實際頻數(shù)合并;③刪去理論頻數(shù)太小的格子所對應的行或例。 78.依次增減四格表中某個格子(一般選用行合計與列合計均為最小的那個格子)的數(shù)據(jù),可列出周邊合計不變條件下各種組合的四格表(一般可列出最小周邊合計數(shù)加1個四格表)。 79.非參數(shù)檢驗是一類不依賴于總體分布類型的檢驗,即在應用中可以不考慮被研究對象為 何種分布以及分布是否已知,檢驗假設中沒有包括總體參數(shù)的一類統(tǒng)計方法。 80.秩和檢驗的適用范圍:⑴未加精確測量的資料(包括等級資料);⑵偏態(tài)分布且無法轉 化為正態(tài)分布的資料;⑶分布不清的資料。 81.配對資料的秩和檢驗用于配對設計計量資料差值的比較和單一樣本與總體中位數(shù)的比 較。 82.直線相關是分析服從正態(tài)分布的兩個隨機變量x和y有無線性相關關系的一種統(tǒng)計分析 方法。 83.相關系數(shù)是描述兩個變量間線性相關關系的密切程度與方向的統(tǒng)計指標。相關系數(shù)的符 號表示兩變量的線性相關的方向。其特點為:⑴相關系數(shù)r沒有單位;⑵取值范圍在﹣1和1之間;⑶r為正表示正相關,r為1表示完全正相關;r值為負表示負相關,r為﹣1表示完全負相關;⑷r絕對值越接近1,表示兩個變量間相關關系密切程度越高;越接近0,則相關關系越不密切。 84.相關分析的前提條件:兩個隨機變量;散點圖呈線性相關;服從雙變量正態(tài)分布。 85.在有相關關系時,根據(jù)r值判斷兩變量相關的密切程度:⑴|r|≥0.7,兩變量有高度 相關關系;⑵0.7>|r|≥0.4,兩變量有中度相關關系;⑶|r|<0.4,兩變量有低度相關關系。 86.直線回歸分析的前提條件:⑴線性:兩個變量間存在線性關系;⑵獨立性:任意兩個觀 察值互相獨立;⑶正態(tài)性:應變量y是服從正態(tài)分布的隨機變量;⑷方差齊:給定x后,應變量y的方差相等。 87.等級相關應用范圍:⑴不服從雙變量正態(tài)分布或偏態(tài)分布;⑵總體分布類型未知;⑶原 始數(shù)據(jù)是等級變量。 88.對同一資料,相關系數(shù)t檢驗與回歸系數(shù)t 檢驗效果相同。 89.決定系數(shù)r2決定回歸效果的好壞,r2越接近1,回歸的效果越好。 90.直線回歸方程:y=a+bx其中a為回歸直線在Y軸上的截距:⑴a>0表示直線與縱軸的交點在原點的上方;⑵a<0則交點在原點的下方;⑶a=0則回歸直線通過原點;b為回歸系數(shù),即直線的斜率:⑴b>0表示直線從左下方走向右上方,即 y隨 x的增大而增大;⑵b<0表示直線從左上方走向右下方,即 y隨 x的增大而減??;⑶b=0表示直線與 x軸平行,即x與 y無直線關系;⑷b的統(tǒng)計學意義是x每增(減)一個單位,y平均改變b個單位。 91.實驗設計的特點:⑴研究者能人為設置處理因素;⑵受試對象接受何種處理因素或水平 是由隨機分配而定的。 92.醫(yī)學實驗設計包括處理因素或研究因素,受試對象和實驗效應三個基本要素。 93.常用對照的形式為空白對照、安慰劑對照、實驗對照、標準對照、自身對照、相互對照 及歷史對照等。 94.隨機化包括隨機抽樣和隨機分組,隨機抽樣指保證總體中的每一個個體都有同等的機會 被抽出來作為樣本;隨機分組指保證樣本中的每一個個體都有同等的機會被分配到實驗組或對照組。 95.實驗設計的基本原則:對照、隨機、重復、均衡。 96.重復是指研究樣本要有一定的數(shù)量,即在保證研究結果具有一定可靠性的條件下,確定 最少的樣本例數(shù)。 97.均衡原則又稱齊同對比原則,指實驗組和對照組或各實驗組之間,除了處理因素以外,其他一切條件應盡可能相同或一致。 98.完全隨機設計又稱隨機對照試驗,屬于單因素研究設計。 99.樣本含量估計需要確定四個基本因素:α、1-β、σ、δ。α、δ與樣本含量成反比,σ(或s)、1-β與樣本含量成正比。 100.劑量反應是實驗物質(zhì)引起實驗動物總體中產(chǎn)生某種反應的劑量。第二篇:統(tǒng)計學復習總結
第三篇:統(tǒng)計學復習總結
第四篇:醫(yī)學統(tǒng)計學知識點總結
第五篇:醫(yī)學統(tǒng)計學知識點總結