第一篇:統(tǒng)計(jì)方法總結(jié)
統(tǒng)計(jì)方法總結(jié)
統(tǒng)計(jì)方法是指有關(guān)收集、整理、分析和解釋統(tǒng)計(jì)數(shù)據(jù),并對(duì)其所反映的問題作出一定結(jié)論的方法。
一、統(tǒng)計(jì)方法的選擇
統(tǒng)計(jì)資料豐富且錯(cuò)綜復(fù)雜,要想做到合理選用統(tǒng)計(jì)分析方法并非易事。對(duì)于同一個(gè)資料,若選擇不同的統(tǒng)計(jì)分析方法處理,有時(shí)其結(jié)論是截然不同的。
正確選擇統(tǒng)計(jì)方法的依據(jù)是:
①根據(jù)研究的目的,明確研究試驗(yàn)設(shè)計(jì)類型、研究因素與水平數(shù);
②確定數(shù)據(jù)特征(是否正態(tài)分布等)和樣本量大小;
③正確判斷統(tǒng)計(jì)資料所對(duì)應(yīng)的類型(計(jì)量、計(jì)數(shù)和等級(jí)資料),同時(shí)應(yīng)根據(jù)統(tǒng)計(jì)方法的適宜條件進(jìn)行正確的統(tǒng)計(jì)量值計(jì)算;
最后,還要根據(jù)專業(yè)知識(shí)與資料的實(shí)際情況,結(jié)合統(tǒng)計(jì)學(xué)原則,靈活地選擇統(tǒng)計(jì)分析方法。
二、統(tǒng)計(jì)分析的步驟
(一)收集數(shù)據(jù)
收集數(shù)據(jù)是進(jìn)行統(tǒng)計(jì)分析的前提和基礎(chǔ)。收集數(shù)據(jù)的途徑眾多,可通過實(shí)驗(yàn)、觀察、測(cè)量、調(diào)查等獲得直接資料,也可通過文獻(xiàn)檢索、閱讀等來(lái)獲得間接資料。收集數(shù)據(jù)的過程中除了要注意資料的真實(shí)性和可靠性外,還要特別注意區(qū)分兩類不同性質(zhì)的資料:一是連續(xù)數(shù)據(jù),也叫計(jì)量資料,指通過實(shí)際測(cè)量得到的數(shù)據(jù);二是間斷數(shù)據(jù),也叫計(jì)數(shù)資料,指通過對(duì)
(二)整理數(shù)據(jù)
整理數(shù)據(jù)就是按一定的標(biāo)準(zhǔn)對(duì)收集到的數(shù)據(jù)進(jìn)行歸類匯總的過程。由于收集到的數(shù)據(jù)大多是無(wú)序的、零散的、不系統(tǒng)的,在進(jìn)入統(tǒng)計(jì)運(yùn)算之前,需要按照研究的目的和要求對(duì)數(shù)據(jù)進(jìn)行核實(shí),剔除其中不真實(shí)的部分,再分組匯總或列表,從而使原始資料簡(jiǎn)單化、形象化、系統(tǒng)化,并能初步反映數(shù)據(jù)的分布特征。
(三)分析數(shù)據(jù)
分析數(shù)據(jù)指在整理數(shù)據(jù)的基礎(chǔ)上,通過統(tǒng)計(jì)運(yùn)算,得出結(jié)論的過程,它是統(tǒng)計(jì)分析的核心和關(guān)鍵。數(shù)據(jù)分析通??煞譃閮蓚€(gè)層次:第一個(gè)層次是用描述統(tǒng)計(jì)的方法計(jì)算出反映數(shù)據(jù)集中趨勢(shì)、離散程度和相關(guān)強(qiáng)度的具有外在代表性的指標(biāo);第二個(gè)層次是在描述統(tǒng)計(jì)基礎(chǔ)上,用推斷統(tǒng)計(jì)的方法對(duì)數(shù)據(jù)進(jìn)行處理,以樣本信息推斷總體情況,并分析和推測(cè)總體的特征和規(guī)律。
三、統(tǒng)計(jì)數(shù)據(jù)的搜集獲取方法
統(tǒng)計(jì)數(shù)據(jù)或稱統(tǒng)計(jì)資料,它是統(tǒng)計(jì)分析的基礎(chǔ),是進(jìn)行經(jīng)濟(jì)研究和制定發(fā)展計(jì)劃,作出各種投資、管理決策的依據(jù)。根據(jù)數(shù)據(jù)來(lái)源,社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)資料可以分為初級(jí)資料和次級(jí)資料兩種。
1、次級(jí)資料搜集的方法
次級(jí)資料來(lái)源于各種出版物和各級(jí)政府統(tǒng)計(jì)網(wǎng)站所公布的統(tǒng)計(jì)公報(bào)、統(tǒng)計(jì)分析報(bào)告和統(tǒng)計(jì)數(shù)據(jù)資料。隨著現(xiàn)代信息的廣泛傳播,數(shù)據(jù)搜集可以從網(wǎng)絡(luò)、報(bào)表等多方面搜集。
2、初級(jí)資料搜集的方法
初級(jí)資料又稱第一手資料,可以通過抽樣調(diào)查、重點(diǎn)調(diào)查、典型調(diào)查、普查等調(diào)查方法搜集數(shù)據(jù)。
(1)抽樣調(diào)查:抽樣調(diào)查是一種非全面調(diào)查。根據(jù)隨機(jī)抽樣原則從總體中抽取一定數(shù)量的單位(樣本)進(jìn)行調(diào)查,并由得到的結(jié)果來(lái)推斷總體的一般情況。與其他方法相比,抽樣調(diào)查周期短、時(shí)效性強(qiáng),能大大降低調(diào)查費(fèi)用,能提高調(diào)查的質(zhì)量,還可以用于評(píng)價(jià)、修正和補(bǔ)充其他調(diào)查方式得到的統(tǒng)計(jì)資料。因此,抽樣調(diào)查不僅是一種科學(xué)的、有效地、國(guó)際通行的統(tǒng)計(jì)調(diào)查方法,也將逐步成為我國(guó)統(tǒng)計(jì)調(diào)查的主體。
(2)重點(diǎn)調(diào)查:是在所調(diào)查的對(duì)象中選擇一部分重點(diǎn)單位進(jìn)行調(diào)查,也是一種非全面調(diào)查。優(yōu)點(diǎn)在于投入少、效益高、速度快,可調(diào)查較多的項(xiàng)目和指標(biāo),了解較詳細(xì)的情況。但重點(diǎn)調(diào)查一般不用于推斷總體,因?yàn)橹攸c(diǎn)單位與一般單位的情況通常差別較大。
(3)典型調(diào)查:是根據(jù)調(diào)查研究的目的和要求,在對(duì)調(diào)查對(duì)象進(jìn)行全面分析的基礎(chǔ)上有意識(shí)地選擇一些具有代表性的典型單位進(jìn)行深入調(diào)查。對(duì)于研究、分析社會(huì)經(jīng)濟(jì)生活中的新生事物,深入了解典型單位的情況以及補(bǔ)充、驗(yàn)證說(shuō)明全面調(diào)查資料,都具有重要的意義。
(4)普查:是為了研究某種社會(huì)經(jīng)濟(jì)現(xiàn)象而專門組織的一時(shí)性全面調(diào)查,如全國(guó)人口普查、工業(yè)普查、物資普查等。普查項(xiàng)目一般都屬于重要的國(guó)情國(guó)力調(diào)查,通過普查能搜集到全面而系統(tǒng)的資料,因此在統(tǒng)計(jì)調(diào)查方法體系中處于基礎(chǔ)地位。
3、統(tǒng)計(jì)數(shù)據(jù)調(diào)查的方法
具體有直接觀察法、報(bào)告法、采訪法和通訊法。
四、各種資料的統(tǒng)計(jì)方法
1、計(jì)量資料的統(tǒng)計(jì)方法
分析計(jì)量資料的統(tǒng)計(jì)分析方法可分為參數(shù)檢驗(yàn)法和非參數(shù)檢驗(yàn)法。參數(shù)檢驗(yàn)法主要為t檢驗(yàn)和方差分析(ANOVN,即F檢驗(yàn))等,兩組間均數(shù)比較時(shí)常用t檢驗(yàn)和u檢驗(yàn),兩組以上均數(shù)比較時(shí)常用方差分析;非參數(shù)檢驗(yàn)法主要包括秩和檢驗(yàn)等。t檢驗(yàn)可分為單組設(shè)計(jì)資料的t檢驗(yàn)、配對(duì)設(shè)計(jì)資料的t檢驗(yàn)和成組設(shè)計(jì)資料的t檢驗(yàn);當(dāng)兩個(gè)小樣本比較時(shí)要求兩總體分布為正態(tài)分布且方差齊性,若不能滿足以上要求,宜用t 檢驗(yàn)或非參數(shù)方法(秩和檢驗(yàn))。方差分析可用于兩個(gè)以上樣本均數(shù)的比較,應(yīng)用該方法時(shí),要求各個(gè)樣本是相互獨(dú)立的隨機(jī)樣本,各樣本來(lái)自正態(tài)總體且各處理組總體方差齊性。根據(jù)設(shè)計(jì)類型不同,方差分析中又包含了多種不同的方法。對(duì)于定量資料,應(yīng)根據(jù)所采用的設(shè)計(jì)類型、資料所具備的條件和分析目的,選用合適的統(tǒng)計(jì)分析方法,不應(yīng)盲目套用t檢驗(yàn)和單因素方差分析。
2、計(jì)數(shù)資料的統(tǒng)計(jì)方法
計(jì)數(shù)資料的統(tǒng)計(jì)方法主要針對(duì)四格表和R×C表利用
檢驗(yàn)進(jìn)行分析。四格表資料:組間比較用檢驗(yàn)或u檢驗(yàn),若不能滿足 檢驗(yàn):當(dāng)計(jì)數(shù)資料呈配對(duì)設(shè)計(jì)時(shí),獲得的四格表為配對(duì)四格表,其用到的檢驗(yàn)公式和校正公式可參考書籍。R×C表可以分為雙向無(wú)序,單向有序、雙向有序?qū)傩韵嗤碗p向有序?qū)傩圆煌念悾煌惖男辛斜砀鶕?jù)其研究目的,其選擇的方法也不一樣。
3、等級(jí)資料的統(tǒng)計(jì)方法
等級(jí)資料(有序變量)是對(duì)性質(zhì)和類別的等級(jí)進(jìn)行分組,再清點(diǎn)每組觀察單位個(gè)數(shù)所得到的資料。在臨床醫(yī)學(xué)資料中,常遇到一些定性指標(biāo),如臨床療效的評(píng)價(jià)、疾病的臨床分期、病癥嚴(yán)重程度的臨床分級(jí)等,對(duì)這些指標(biāo)常采用分成若干個(gè)等級(jí)然后分類計(jì)數(shù)的辦法來(lái)解決它的量化問題,這樣的資料統(tǒng)計(jì)上稱為等級(jí)資料。
五、按不同標(biāo)志分類的統(tǒng)計(jì)方法
統(tǒng)計(jì)分析方法,按不同的分類標(biāo)志,可劃分為不同的類別,而常用的分類標(biāo)準(zhǔn)是功能標(biāo)準(zhǔn),依此標(biāo)準(zhǔn)進(jìn)行劃分,統(tǒng)計(jì)分析可分為描述統(tǒng)計(jì)和推斷統(tǒng)計(jì)。
1、描述統(tǒng)計(jì)
描述統(tǒng)計(jì)是將研究中所得的數(shù)據(jù)加以整理、歸類、簡(jiǎn)化或繪制成圖表,以此描述和歸納數(shù)據(jù)的特征及變量之間的關(guān)系的一種最基本的統(tǒng)計(jì)方法。描述統(tǒng)計(jì)主要涉及數(shù)據(jù)的集中趨勢(shì)、離散程度和相關(guān)強(qiáng)度,最常用的指標(biāo)有平均數(shù)()、標(biāo)準(zhǔn)差(σx)、相關(guān)系數(shù)(r)等。
2、推斷統(tǒng)計(jì)
推斷統(tǒng)計(jì)指用概率形式來(lái)決斷數(shù)據(jù)之間是否存在某種關(guān)系及用樣本統(tǒng)計(jì)值來(lái)推測(cè)總體特征的一種重要的統(tǒng)計(jì)方法。推斷統(tǒng)計(jì)包括總體參數(shù)估計(jì)和假設(shè)檢驗(yàn),最常用的方法有Z檢驗(yàn)、T檢驗(yàn)、卡方檢驗(yàn)等。
描述統(tǒng)計(jì)和推斷統(tǒng)計(jì)二者彼此聯(lián)系,相輔相成,描述統(tǒng)計(jì)是推斷統(tǒng)計(jì)的基礎(chǔ),推斷統(tǒng)計(jì)是描述統(tǒng)計(jì)的升華。具體研究中,是采用描述統(tǒng)計(jì)還是推斷統(tǒng)計(jì),應(yīng)視具體的研究目的而定,如研究的目的是要描述數(shù)據(jù)的特征,則需描述統(tǒng)計(jì);若還需對(duì)多組數(shù)據(jù)進(jìn)行比較或需以樣本信息來(lái)推斷總體的情況,則需用推斷統(tǒng)計(jì)。
例如,在教育領(lǐng)域中,在對(duì)某幼兒園大班開展一項(xiàng)識(shí)字教改實(shí)驗(yàn),期末進(jìn)行一次測(cè)試,并對(duì)測(cè)試所得數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。如果只需了解該班兒童識(shí)字的成績(jī)(平均數(shù)及標(biāo)準(zhǔn)差)及其分布,此時(shí),應(yīng)采用描述統(tǒng)計(jì)方法;若還需進(jìn)一步了解該實(shí)驗(yàn)班與另一對(duì)照班(未進(jìn)行教改實(shí)驗(yàn))兒童的識(shí)字成績(jī)有無(wú)差異,從而判斷教改實(shí)驗(yàn)是否有效時(shí),除了要對(duì)兩個(gè)班的成績(jī)進(jìn)行描述統(tǒng)計(jì)之外,還需采用推斷統(tǒng)計(jì)方法。六、一些常用統(tǒng)計(jì)方法概述
(一)參數(shù)估計(jì)
參數(shù)估計(jì)(parameter estimation)是根據(jù)從總體中抽取的樣本估計(jì)總體分布中包含的未知參數(shù)的方法。它是統(tǒng)計(jì)推斷的一種基本形式,是數(shù)理統(tǒng)計(jì)學(xué)的一個(gè)重要分支,分為點(diǎn)估計(jì)和區(qū)間估計(jì)兩部分。
點(diǎn)估計(jì)是依據(jù)樣本估計(jì)總體分布中所含的未知參數(shù)或未知參數(shù)的函數(shù)。通常它們是總體的某個(gè)特征值,如數(shù)學(xué)期望、方差和相關(guān)系數(shù)等。點(diǎn)估計(jì)問題就是要構(gòu)造一個(gè)只依賴于樣本的量,作為未知參數(shù)或未知參數(shù)的函數(shù)的估計(jì)值。例如,設(shè)一批產(chǎn)品的廢品率為θ。為估計(jì)θ,從這批產(chǎn)品中隨機(jī)地抽出n個(gè)作檢查,以X記其中的廢品個(gè)數(shù),用X/n估計(jì)θ,這就是一個(gè)點(diǎn)估計(jì)。構(gòu)造點(diǎn)估計(jì)常用的方法是:①矩估計(jì)法。用樣本矩估計(jì)總體矩,如用樣本均值估計(jì)總體均值。②最大似然估計(jì)法。于1912年由英國(guó)統(tǒng)計(jì)學(xué)家R.A.費(fèi)希爾提出,利用樣本分布密度構(gòu)造似然函數(shù)來(lái)求出參數(shù)的最大似然估計(jì)。③最小二乘法。主要用于線性統(tǒng)計(jì)模型中的參數(shù)估計(jì)問題。④貝葉斯估計(jì)法?;谪惾~斯學(xué)派(見貝葉斯統(tǒng)計(jì))的觀點(diǎn)而提出的估計(jì)法??梢杂脕?lái)估計(jì)未知參數(shù)的估計(jì)量很多,于是產(chǎn)生了怎樣選擇一個(gè)優(yōu)良估計(jì)量的問題。首先必須對(duì)優(yōu)良性定出準(zhǔn)則,這種準(zhǔn)則是不唯一的,可以根據(jù)實(shí)際問題和理論研究的方便進(jìn)行選擇。優(yōu)良性準(zhǔn)則有兩大類:一類是小樣本準(zhǔn)則,即在樣本大小固定時(shí)的優(yōu)良性準(zhǔn)則;另一類是大樣本準(zhǔn)則,即在樣本大小趨于無(wú)窮時(shí)的優(yōu)良性準(zhǔn)則。最重要的小樣本優(yōu)良性準(zhǔn)則是無(wú)偏性及與此相關(guān)的一致最小方差無(wú)偏估計(jì),其次有容許性準(zhǔn)則,最小化最大準(zhǔn)則,最優(yōu)同變準(zhǔn)則等。大樣本優(yōu)良性準(zhǔn)則有相合性、最優(yōu)漸近正態(tài)估計(jì)和漸近有效估計(jì)等。
區(qū)間估計(jì)是依據(jù)抽取的樣本,根據(jù)一定的正確度與精確度的要求,構(gòu)造出適當(dāng)?shù)膮^(qū)間,作為總體分布的未知參數(shù)或參數(shù)的函數(shù)的真值所在范圍的估計(jì)。例如人們常說(shuō)的有百分之多少的把握保證某值在某個(gè)范圍內(nèi),即是區(qū)間估計(jì)的最簡(jiǎn)單的應(yīng)用。1934年統(tǒng)計(jì)學(xué)家J.奈曼創(chuàng)立了一種嚴(yán)格的區(qū)間估計(jì)理論。求置信區(qū)間常用的三種方法:①利用已知的抽樣分布。②利用區(qū)間估計(jì)與假設(shè)檢驗(yàn)的聯(lián)系。③利用大樣本理論。
參數(shù)估計(jì)的基本方法有:
(1)矩估計(jì)法:用樣本矩估計(jì)總體矩,如用樣本均值估計(jì)總體均值。
(2)最小二乘法:為了選出使得模型輸出與系統(tǒng)輸出yt盡可能接近的參數(shù)估計(jì)值,可用模型與系統(tǒng)輸出的誤差的平方和來(lái)度量接近程度。使誤差平方和最小的參數(shù)值即為所求的估計(jì)值。
(3)極大似然法:選擇參數(shù)θ,使已知數(shù)據(jù)Y在某種意義下最可能出現(xiàn)。某種意義是指似然函數(shù)P(Y│θ)最大,這里P(Y│θ)是數(shù)據(jù)Y的概率分布函數(shù)。與最小二乘法不同的是,極大似然法需要已知這個(gè)概率分布函數(shù)P(Y│θ)。在實(shí)踐中這是困難的,一般可假設(shè)P(Y│θ)是正態(tài)分布函數(shù),這時(shí)極大似然估計(jì)與最小二乘估計(jì)相同。
(二)假設(shè)檢驗(yàn)
假設(shè)檢驗(yàn)是數(shù)理統(tǒng)計(jì)學(xué)中根據(jù)一定假設(shè)條件由樣本推斷總體的一種方法。
參數(shù)估計(jì)和假設(shè)檢驗(yàn)是統(tǒng)計(jì)推斷的兩個(gè)組成部分,它們都是用樣本對(duì)總體進(jìn)行某種推斷,然而推斷的角度不同。參數(shù)估計(jì)討論的是用樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)的方法,總體參數(shù)在估計(jì)前是未知的。而在假設(shè)檢驗(yàn)中,則是先對(duì)總體參數(shù)的值提出一個(gè)假設(shè),然后利用樣本信息去檢驗(yàn)這個(gè)假設(shè)是否成立。
基本原理:先對(duì)總體的特征作出某種假設(shè),然后通過抽樣研究的統(tǒng)計(jì)推理,對(duì)此假設(shè)應(yīng)該被拒絕還是接受作出推斷。生物現(xiàn)象的個(gè)體差異是客觀存在,以致抽樣誤差不可避免,所以我們不能僅憑個(gè)別樣本的值來(lái)下結(jié)論。當(dāng)遇到兩個(gè)或幾個(gè)樣本均數(shù)(或率)、樣本均數(shù)(率)與已知總體均數(shù)(率)有大有小時(shí),應(yīng)當(dāng)考慮到造成這種差別的原因有兩種可能:一是這兩個(gè)或幾個(gè)樣本均數(shù)(或率)來(lái)自同一總體,其差別僅僅由于抽樣誤差即偶然性所造成;二是這兩個(gè)或幾個(gè)樣本均數(shù)(或率)來(lái)自不同的總體,即其差別不僅由抽樣誤差造成,而主要是由實(shí)驗(yàn)因素不同所引起的。假設(shè)檢驗(yàn)的目的就在于排除抽樣誤差的影響,區(qū)分差別在統(tǒng)計(jì)上是否成立,并了解事件發(fā)生的概率。假設(shè)檢驗(yàn)的基本思想是小概率反證法思想。小概率思想是指小概率事件(P<0.01或P<0.05)在一次試驗(yàn)中基本上不會(huì)發(fā)生。反證法思想是先提出假設(shè)(檢驗(yàn)假設(shè)H0),再用適當(dāng)?shù)慕y(tǒng)計(jì)方法確定假設(shè)成立的可能性大小,如可能性小,則認(rèn)為假設(shè)不成立,若可能性大,則還不能認(rèn)為假設(shè)成立。
具體做法:根據(jù)問題的需要對(duì)所研究的總體作某種假設(shè),記作H0;選取合適的統(tǒng)計(jì)量,這個(gè)統(tǒng)計(jì)量的選取要使得在假設(shè)H0成立時(shí),其分布為已知;由實(shí)測(cè)的樣本,計(jì)算出統(tǒng)計(jì)量的值,并根據(jù)預(yù)先給定的顯著性水平進(jìn)行檢驗(yàn),作出拒絕或接受假設(shè)H。的判斷。常用的假設(shè)檢驗(yàn)方法有u—檢驗(yàn)法、t—檢驗(yàn)法、X2檢驗(yàn)法、F—檢驗(yàn)法,秩和檢驗(yàn)等。
基本步驟:
1、提出檢驗(yàn)假設(shè)(又稱無(wú)效假設(shè),符號(hào)是H0))和備擇假設(shè)(符號(hào)是H1)。
H0:樣本與總體或樣本與樣本間的差異是由抽樣誤差引起的;
H1:樣本與總體或樣本與樣本間存在本質(zhì)差異;
預(yù)先設(shè)定的檢驗(yàn)水準(zhǔn)為0.05;當(dāng)檢驗(yàn)假設(shè)為真,但被錯(cuò)誤地拒絕的概率,記作α,通常取α=0.05或α=0.01。
2、選定統(tǒng)計(jì)方法,由樣本觀察值按相應(yīng)的公式計(jì)算出統(tǒng)計(jì)量的大小,如X2值、t值等。根據(jù)資料的類型和特點(diǎn),可分別選用Z檢驗(yàn),T檢驗(yàn),秩和檢驗(yàn)和卡方檢驗(yàn)等。
3、根據(jù)統(tǒng)計(jì)量的大小及其分布確定檢驗(yàn)假設(shè)成立的可能性P的大小并判斷結(jié)果。若P>α,結(jié)論為按α所取水準(zhǔn)不顯著,不拒絕H0,即認(rèn)為差別很可能是由于抽樣誤差造成的,在統(tǒng)計(jì)上不成立;如果P≤α,結(jié)論為按所取α水準(zhǔn)顯著,拒絕H0,接受H1,則認(rèn)為此差別不大可能僅由抽樣誤差所致,很可能是實(shí)驗(yàn)因素不同造成的,故在統(tǒng)計(jì)上成立。P值的大小一般可通過查閱相應(yīng)的界值表得到。
應(yīng)注意的問題:
1、做假設(shè)檢驗(yàn)之前,應(yīng)注意資料本身是否有可比性。
2、當(dāng)差別有統(tǒng)計(jì)學(xué)意義時(shí)應(yīng)注意這樣的差別在實(shí)際應(yīng)用中有無(wú)意義。
3、根據(jù)資料類型和特點(diǎn)選用正確的假設(shè)檢驗(yàn)方法。
4、根據(jù)專業(yè)及經(jīng)驗(yàn)確定是選用單側(cè)檢驗(yàn)還是雙側(cè)檢驗(yàn)。
5、當(dāng)檢驗(yàn)結(jié)果為拒絕無(wú)效假設(shè)時(shí),應(yīng)注意有發(fā)生I類錯(cuò)誤的可能性,即錯(cuò)誤地拒絕了本身成立的H0,發(fā)生這種錯(cuò)誤的可能性預(yù)先是知道的,即檢驗(yàn)水準(zhǔn)那么大;當(dāng)檢驗(yàn)結(jié)果為不拒絕無(wú)效假設(shè)時(shí),應(yīng)注意有發(fā)生II類錯(cuò)誤的可能性,即仍有可能錯(cuò)誤地接受了本身就不成立的H0,發(fā)生這種錯(cuò)誤的可能性預(yù)先是不知道的,但與樣本含量和I類錯(cuò)誤的大小有關(guān)系。
6、判斷結(jié)論時(shí)不能絕對(duì)化,應(yīng)注意無(wú)論接受或拒絕檢驗(yàn)假設(shè),都有判斷錯(cuò)誤的可能。
7、報(bào)告結(jié)論時(shí)是應(yīng)注意說(shuō)明所用的統(tǒng)計(jì)量,檢驗(yàn)的單雙側(cè)及P值的確切范圍。
(三)方差分析
方差分析(Analysis of Variance,簡(jiǎn)稱ANOVA),又稱“變異數(shù)分析”或“F檢驗(yàn)”,是R.A.Fisher發(fā)明的,用于兩個(gè)及兩個(gè)以上樣本均數(shù)差別的顯著性檢驗(yàn)。由于各種因素的影響,研究所得的數(shù)據(jù)呈現(xiàn)波動(dòng)狀。造成波動(dòng)的原因可分成兩類,一是不可控的隨機(jī)因素,另一是研究中施加的對(duì)結(jié)果形成影響的可控因素。
方差分析是從觀測(cè)變量的方差入手,研究諸多控制變量中哪些變量是對(duì)觀測(cè)變量有顯著影響的變量。
1.方差分析的假定條件為:
(1)各處理?xiàng)l件下的樣本是隨機(jī)的。
(2)各處理?xiàng)l件下的樣本是相互獨(dú)立的,否則可能出現(xiàn)無(wú)法解析的輸出結(jié)果。
(3)各處理?xiàng)l件下的樣本分別來(lái)自正態(tài)分布總體,否則使用非參數(shù)分析。
(4)各處理?xiàng)l件下的樣本方差相同,即具有齊效性。
2.方差分析的假設(shè)檢驗(yàn)
假設(shè)有K個(gè)樣本,如果原假設(shè)H0樣本均數(shù)都相同,K個(gè)樣本有共同的方差σ,則K個(gè)樣本來(lái)自具有共同方差σ和相同均數(shù)的總體。
如果經(jīng)過計(jì)算,組間均方遠(yuǎn)遠(yuǎn)大于組內(nèi)均方,則推翻原假設(shè),說(shuō)明樣本來(lái)自不同的正態(tài)總體,說(shuō)明處理造成均值的差異有統(tǒng)計(jì)意義。否則承認(rèn)原假設(shè),樣本來(lái)自相同總體,處理間無(wú)差異。
方差分析的作用:一個(gè)復(fù)雜的事物,其中往往有許多因素互相制約又互相依存。方差分析的目的是通過數(shù)據(jù)分析找出對(duì)該事物有顯著影響的因素,各因素之間的交互作用,以及顯著影響因素的最佳水平等。方差分析是在可比較的數(shù)組中,把數(shù)據(jù)間的總的“變差”按各指定的變差來(lái)源進(jìn)行分解的一種技術(shù)。對(duì)變差的度量,采用離差平方和。方差分析方法就是從總離差平方和分解出可追溯到指定來(lái)源的部分離差平方和,這是一個(gè)很重要的思想。
經(jīng)過方差分析若拒絕了檢驗(yàn)假設(shè),只能說(shuō)明多個(gè)樣本總體均數(shù)不相等或不全相等。若要得到各組均數(shù)間更詳細(xì)的信息,應(yīng)在方差分析的基礎(chǔ)上進(jìn)行多個(gè)樣本均數(shù)的兩兩比較。
單因素方差分析
1、單因素方差分析概念理解步驟
是用來(lái)研究一個(gè)控制變量的不同水平是否對(duì)觀測(cè)變量產(chǎn)生了顯著影響。這里,由于僅研究單個(gè)因素對(duì)觀測(cè)變量的影響,因此稱為單因素方差分析。
例如,分析不同施肥量是否給農(nóng)作物產(chǎn)量帶來(lái)顯著影響,考察地區(qū)差異是否影響婦女的生育率,研究學(xué)歷對(duì)工資收入的影響等。這些問題都可以通過單因素方差 分析得到答案。
單因素方差分析的第一步是明確觀測(cè)變量和控制變量。例如,上述問題中的觀測(cè)變量分別是農(nóng)作物產(chǎn)量、婦女生育率、工資收入;控制變量分別為施肥量、地區(qū)、學(xué)歷。
單因素方差分析的第二步是剖析觀測(cè)變量的方差。方差分析認(rèn)為:觀測(cè)變量值得變動(dòng)會(huì)受控制變量和隨機(jī)變量?jī)煞矫娴挠绊憽?jù)此,單因素方差分析將觀測(cè)變量總的離差平方和分解為組間離差平方和和組內(nèi)離差平方和兩部分,用數(shù)學(xué)形式表述為:SST=SSA+SSE。
單因素方差分析的第三步是通過比較觀測(cè)變量總離差平方和各部分所占的比例,推斷控制變量是否給觀測(cè)變量帶來(lái)了顯著影響。
2、單因素方差分析原理總結(jié):在觀測(cè)變量總離差平方和中,如果組間離差平方和所占比例較大,則說(shuō)明觀測(cè)變量的變動(dòng)主要是由控制變量引起的,可以主要由控制變量來(lái)解釋,控制變量給觀測(cè)變量帶來(lái)了顯著影響;反之,如果組間離差平方和所占比例小,則說(shuō)明觀測(cè)變量的變動(dòng)不是主要由控制變量引起的,不可以主要由控制變量來(lái)解釋,控制變量的不同水平?jīng)]有給觀測(cè)變量帶來(lái)顯著影響,觀測(cè)變量值的變動(dòng)是由隨機(jī)變量因素引起的。
3、單因素方差分析基本步驟
1提出原假設(shè):H0——無(wú)差異;H1——有顯著差異
○2選擇檢驗(yàn)統(tǒng)計(jì)量:方差分析采用的檢驗(yàn)統(tǒng)計(jì)量是F統(tǒng)計(jì)量,即F值檢
○驗(yàn)。
3計(jì)算檢驗(yàn)統(tǒng)計(jì)量的觀測(cè)值和概率P值:該步驟的目的就是計(jì)算檢驗(yàn)統(tǒng)
○計(jì)量的觀測(cè)值和相應(yīng)的概率P值。
4給定顯著性水平,并作出決策 ○多因素方差分析
多因素方差分析基本思想:多因素方差分析用來(lái)研究?jī)蓚€(gè)及兩個(gè)以上控制變量是否對(duì)觀測(cè)變量產(chǎn)生顯著影響。這里,由于研究多個(gè)因素對(duì)觀測(cè)變量的影響,因此稱為多因素方差分析。多因素方差分析不僅能夠分析多個(gè)因素對(duì)觀測(cè)變量的獨(dú)立影響,更能夠分析多個(gè)控制因素的交互作用能否對(duì)觀測(cè)變量的分布產(chǎn)生顯著影響,進(jìn)而最終找到利于觀測(cè)變量的最優(yōu)組合。
例如:分析不同品種、不同施肥量對(duì)農(nóng)作物產(chǎn)量的影響時(shí),可將農(nóng)作物產(chǎn)量作為觀測(cè)變量,品種和施肥量作為控制變量。利用多因素方差分析方法,研究不同品種、不同施肥量是如何影響農(nóng)作物產(chǎn)量的,并進(jìn)一步研究哪種品種與哪種水平的施肥量是提高農(nóng)作物產(chǎn)量的最優(yōu)組合。
(四)列聯(lián)表檢驗(yàn)
在統(tǒng)計(jì)實(shí)踐中,人們經(jīng)常需要對(duì)樣本資料進(jìn)行各種各樣的分類,以便分析研究。如果對(duì)樣本資料按照兩個(gè)指標(biāo)變量進(jìn)行復(fù)合分組,其結(jié)果必然就是各種雙向列聯(lián)表。對(duì)于列聯(lián)表資料,人們經(jīng)常需要檢驗(yàn)所依據(jù)分類的兩個(gè)變量是否獨(dú)立或相關(guān)。如在市場(chǎng)調(diào)查中,將被調(diào)查者對(duì)所擬推銷商品的狀態(tài)與被調(diào)查者的性別或年齡以及職業(yè)等指標(biāo)變量進(jìn)行雙向復(fù)合分組,然后檢驗(yàn)分類變量是否獨(dú)立或相關(guān),可發(fā)現(xiàn)和確定潛在的購(gòu)買者群體,等等。這種對(duì)列聯(lián)表中兩分類變量是否獨(dú)立的檢驗(yàn),也是假設(shè)檢驗(yàn)的一個(gè)重要內(nèi)容,稱為列聯(lián)表分析或列聯(lián)表檢驗(yàn)。
一般,若總體中的個(gè)體可按兩個(gè)屬性A與B分類,A有r個(gè)等級(jí)A1,A2,…,Ar,B有c個(gè)等級(jí)B1,B2,…,Bc,從總體中抽取大小為n的樣本,設(shè)其中有nij個(gè)個(gè)體的屬性屬于等級(jí)Ai和Bj,nij稱為 頻數(shù),將r×c個(gè)nij排列為一個(gè)r行c列的二維列聯(lián)表,簡(jiǎn)稱r×c表。若所考慮的屬性多于兩個(gè),也可按類似的方式作出列聯(lián)表,稱為多維列聯(lián)表。
(五)回歸分析
1、介紹:
回歸分析(regression analysis)是確定兩種或兩種以上變數(shù)間相互依賴的定量關(guān)系的一種統(tǒng)計(jì)分析方法。運(yùn)用十分廣泛,回歸分析按照涉及的自變量的多少,可分為一元回歸分析和多元回歸分析;按照自變量和因變量之間的關(guān)系類型,可分為線性回歸分析和非線性回歸分析。如果在回歸分析中,只包括一個(gè)自變量和一個(gè)因變量,且二者的關(guān)系可用一條直線近似表示,這種回歸分析稱為一元線性回歸分析。如果回歸分析中包括兩個(gè)或兩個(gè)以上的自變量,且因變量和自變量之間是線性關(guān)系,則稱為多元線性回歸分析。
2、回歸分析的步驟 1根據(jù)預(yù)測(cè)目標(biāo),確定自變量和因變量 ○
明確預(yù)測(cè)的具體目標(biāo),也就確定了因變量。如預(yù)測(cè)具體目標(biāo)是下一年度的銷售量,那么銷售量Y就是因變量。通過市場(chǎng)調(diào)查和查閱資料,尋找與預(yù)測(cè)目標(biāo)的相關(guān)影響因素,即自變量,并從中選出主要的影響因素。
2建立回歸預(yù)測(cè)模型 ○
依據(jù)自變量和因變量的歷史統(tǒng)計(jì)資料進(jìn)行計(jì)算,在此基礎(chǔ)上建立回歸分析方程,即回歸分析預(yù)測(cè)模型。
3進(jìn)行相關(guān)分析 ○
回歸分析是對(duì)具有因果關(guān)系的影響因素(自變量)和預(yù)測(cè)對(duì)象(因變量)所進(jìn)行的數(shù)理統(tǒng)計(jì)分析處理。只有當(dāng)變量與因變量確實(shí)存在某種關(guān)系時(shí),建立的回歸方程才有意義。因此,作為自變量的因素與作為因變量的預(yù)測(cè)對(duì)象是否有關(guān),相關(guān)程度如何,以及判斷這種相關(guān)程度的把握性多大,就成為進(jìn)行回歸分析必須要解決的問題。進(jìn)行相關(guān)分析,一般要求出相關(guān)關(guān)系,以相關(guān)系數(shù)的大小來(lái)判斷自變量和因變量的相關(guān)的程度。
4檢驗(yàn)回歸預(yù)測(cè)模型,計(jì)算預(yù)測(cè)誤差 ○
回歸預(yù)測(cè)模型是否可用于實(shí)際預(yù)測(cè),取決于對(duì)回歸預(yù)測(cè)模型的檢驗(yàn)和對(duì)預(yù)測(cè)誤差的計(jì)算?;貧w方程只有通過各種檢驗(yàn),且預(yù)測(cè)誤差較小,才能將回歸方程作為預(yù)測(cè)模型進(jìn)行預(yù)測(cè)。
5計(jì)算并確定預(yù)測(cè)值 ○
利用回歸預(yù)測(cè)模型計(jì)算預(yù)測(cè)值,并對(duì)預(yù)測(cè)值進(jìn)行綜合分析,確定最后的預(yù)測(cè)值。
3、應(yīng)注意的問題
應(yīng)用回歸預(yù)測(cè)法時(shí)應(yīng)首先確定變量之間是否存在相關(guān)關(guān)系。如果變量之間不存在相關(guān)關(guān)系,對(duì)這些變量應(yīng)用回歸預(yù)測(cè)法就會(huì)得出錯(cuò)誤的結(jié)果。正確應(yīng)用回歸分析預(yù)測(cè)時(shí)應(yīng)注意:
①用定性分析判斷現(xiàn)象之間的依存關(guān)系;
②避免回歸預(yù)測(cè)的任意外推;
③應(yīng)用合適的數(shù)據(jù)資料;
(六)時(shí)間序列分析
1、介紹:
時(shí)間序列分析(Time series analysis)是一種動(dòng)態(tài)數(shù)據(jù)處理的統(tǒng)計(jì)方法。該方法基于隨機(jī)過程理論和數(shù)理統(tǒng)計(jì)學(xué)方法,研究隨機(jī)數(shù)據(jù)序列所遵從的統(tǒng)計(jì)規(guī)律,以用于解決實(shí)際問題。
它包括一般統(tǒng)計(jì)分析(如自相關(guān)分析,譜分析等),統(tǒng)計(jì)模型的建立與推斷,以及關(guān)于時(shí)間序列的最優(yōu)預(yù)測(cè)、控制與濾波等內(nèi)容。經(jīng)典的統(tǒng)計(jì)分析都假定數(shù)據(jù)序列具有獨(dú)立性,而時(shí)間序列分析則側(cè)重研究數(shù)據(jù)序列的互相依賴關(guān)系。后者實(shí)際上是對(duì)離散指標(biāo)的隨機(jī)過程的統(tǒng)計(jì)分析,所以又可看作是隨機(jī)過程統(tǒng)計(jì)的一個(gè)組成部分。例如,記錄了某地區(qū)第一個(gè)月,第二個(gè)月,……,第N個(gè)月的降雨量,利用時(shí)間序列分析方法,可以對(duì)未來(lái)各月的雨量進(jìn)行預(yù)報(bào)。
2、時(shí)間序列的組成要素
一個(gè)時(shí)間序列通常由4種要素組成:趨勢(shì)、季節(jié)變動(dòng)、循環(huán)波動(dòng)和不規(guī)則波動(dòng)。
1趨勢(shì):是時(shí)間序列在長(zhǎng)時(shí)期內(nèi)呈現(xiàn)出來(lái)的持續(xù)向上或持續(xù)向下的變動(dòng)。
○
2季節(jié)變動(dòng):是時(shí)間序列在一年內(nèi)重復(fù)出現(xiàn)的周期性波動(dòng)。它是諸如氣
○候條件、生產(chǎn)條件、節(jié)假日或人們的風(fēng)俗習(xí)慣等各種因素影響的結(jié)果。
3循環(huán)波動(dòng):是時(shí)間序列呈現(xiàn)出得非固定長(zhǎng)度的周期性變動(dòng)。循環(huán)波動(dòng)
○的周期可能會(huì)持續(xù)一段時(shí)間,但與趨勢(shì)不同,它不是朝著單一方向的持續(xù)變動(dòng),而是漲落相同的交替波動(dòng)。
4不規(guī)則波動(dòng):是時(shí)間序列中除去趨勢(shì)、季節(jié)變動(dòng)和周期波動(dòng)之后的隨機(jī)○波動(dòng)。不規(guī)則波動(dòng)通??偸菉A雜在時(shí)間序列中,致使時(shí)間序列產(chǎn)生一種波浪形或震蕩式的變動(dòng)。只含有隨機(jī)波動(dòng)的序列也稱為平穩(wěn)序列。
3、基本步驟:
時(shí)間序列建模基本步驟是:①用觀測(cè)、調(diào)查、統(tǒng)計(jì)、抽樣等方法取得被觀測(cè)系統(tǒng)時(shí)間序列動(dòng)態(tài)數(shù)據(jù)。②根據(jù)動(dòng)態(tài)數(shù)據(jù)作相關(guān)圖,進(jìn)行相關(guān)分析,求自相關(guān)函數(shù)。相關(guān)圖能顯示出變化的趨勢(shì)和周期,并能發(fā)現(xiàn)跳點(diǎn)和拐點(diǎn)。跳點(diǎn)是指與其他數(shù)據(jù)不一致的觀測(cè)值。如果跳點(diǎn)是正確的觀測(cè)值,在建模時(shí)應(yīng)考慮進(jìn)去,如果是反?,F(xiàn)象,則應(yīng)把跳點(diǎn)調(diào)整到期望值。拐點(diǎn)則是指時(shí)間序列從上升趨勢(shì)突然變?yōu)橄陆第厔?shì)的點(diǎn)。如果存在拐點(diǎn),則在建模時(shí)必須用不同的模型去分段擬合該時(shí)間序列,例如采用門限回歸模型。③辨識(shí)合適的隨機(jī)模型,進(jìn)行曲線擬合,即用通用隨機(jī)模型去擬合時(shí)間序列的觀測(cè)數(shù)據(jù)。對(duì)于短的或簡(jiǎn)單的時(shí)間序列,可用趨勢(shì)模型和季節(jié)模型加上誤差來(lái)進(jìn)行擬合。對(duì)于平穩(wěn)時(shí)間序列,可用通用ARMA模型(自回歸滑動(dòng)平均模型)及其特殊情況的自回歸模型、滑動(dòng)平均模型或組合-ARMA模型等來(lái)進(jìn)行擬合。當(dāng)觀測(cè)值多于50個(gè)時(shí)一般都采用ARMA模型。對(duì)于非平穩(wěn)時(shí)間序列則要先將觀測(cè)到的時(shí)間序列進(jìn)行差分運(yùn)算,化為平穩(wěn)時(shí)間序列,再用適當(dāng)模型去擬合這個(gè)差分序列。
4、主要用途:
1系統(tǒng)描述:根據(jù)對(duì)系統(tǒng)進(jìn)行觀測(cè)得到的時(shí)間序列數(shù)據(jù),用曲線擬合方法對(duì)○系統(tǒng)進(jìn)行客觀的描述。
2系統(tǒng)分析:當(dāng)觀測(cè)值取自兩個(gè)以上變量時(shí),可用一個(gè)時(shí)間序列中的變化去○說(shuō)明另一個(gè)時(shí)間序列中的變化,從而深入了解給定時(shí)間序列產(chǎn)生的機(jī)理。
3預(yù)測(cè)未來(lái):一般用ARMA模型擬合時(shí)間序列,預(yù)測(cè)該時(shí)間序列未來(lái)值。
○4決策和控制:根據(jù)時(shí)間序列模型可調(diào)整輸入變量使系統(tǒng)發(fā)展過程保持在目○標(biāo)值上,即預(yù)測(cè)到過程要偏離目標(biāo)時(shí)便可進(jìn)行必要的控制。
七、統(tǒng)計(jì)方法選擇技巧
按照“定性——定量—— 定性”的順序,做到定量分析與定性分析巧妙結(jié)合,這就是統(tǒng)計(jì)分析技巧。首先是通過定性分析,選擇適當(dāng)?shù)慕y(tǒng)計(jì)分析方法,繼而進(jìn)行定量分析。有些最后還要落腳到定性分析。下面介紹幾種類型的統(tǒng)計(jì)分析內(nèi)容如何選擇適當(dāng)?shù)慕y(tǒng)計(jì)分析方法。
(一)狀態(tài)分析
對(duì)于客觀存在的事物,需要經(jīng)常研究一定時(shí)間、地點(diǎn)、條件下的狀態(tài),分析其量變情況,這屬于狀態(tài)分析。
例如我國(guó)1988年出現(xiàn)通貨膨脹現(xiàn)象,全國(guó)零售物價(jià)比上年上漲18.5%。黨的十三屆三中會(huì)制定了治理經(jīng)濟(jì)環(huán)境,整頓經(jīng)濟(jì)秩序的政策,1989年、1900年零售物價(jià)狀況如何?在這種情況下,就需要作狀態(tài)分析。什么方法分析全國(guó)零售物價(jià)狀況呢?這要經(jīng)過“定性——定量”的分析過程。全國(guó)零售物價(jià)包括所有零售商品的價(jià)格,是復(fù)雜總體的綜合變動(dòng),所以要用指數(shù)法計(jì)算總指數(shù)。全國(guó)零售物價(jià)總指數(shù)難以取得綜合指數(shù)公式所需要的資料,只能選擇平均數(shù)指數(shù)公式進(jìn)行計(jì)算。經(jīng)過統(tǒng)計(jì)分析,1989年全國(guó)零售物價(jià)比上年上漲17.8%,l990年比上年只上漲2.1%,出現(xiàn)了物價(jià)穩(wěn)定的局面。
狀態(tài)分析可以細(xì)分為若干不同性質(zhì)的種類,有靜態(tài)分析,有動(dòng)態(tài)分析,有簡(jiǎn)單總體的狀態(tài)分析,有復(fù)雜總體的狀態(tài)分析。不同性質(zhì)的狀態(tài)分析,要分別選用不同的統(tǒng)計(jì)分析方法,靜態(tài)分析一般用總量指標(biāo)、相對(duì)指標(biāo)、平均指標(biāo)、抽樣指標(biāo)推斷等方法,動(dòng)態(tài)分析一般用時(shí)間數(shù)列、統(tǒng)計(jì)指數(shù)等方法。指數(shù)法也可以用于靜態(tài)分析,如用指數(shù)法分析計(jì)劃完成程度,就屬于靜態(tài)分析。對(duì)于簡(jiǎn)單總體的狀態(tài)分析,上述方法均可以使用,而對(duì)于復(fù)雜總體的狀態(tài)分析,只能用指數(shù)法。
(二)因素分析
因素分析是對(duì)構(gòu)成事物的要素、成分和決定事物發(fā)展的內(nèi)部條件進(jìn)行定量分析。這是在統(tǒng)計(jì)分析中最常見的一種分析。例如,分析計(jì)劃完成好壞的原因,分析產(chǎn)品產(chǎn)量增加的原因,分析經(jīng)濟(jì)效益好壞的原因等。通過因素分析,可以揭示事物內(nèi)部最本質(zhì)的聯(lián)系,可以發(fā)現(xiàn)規(guī)律,還可以提出新的理論概念。
因素分析主要有兩種情況:一是各個(gè)因素變動(dòng)之和等于總變動(dòng);二足各個(gè)因素變動(dòng)的乘積等于總變動(dòng)。前者可以采用離差法,后者可以運(yùn)用指數(shù)體系,如果后者只需分析絕對(duì)數(shù)的變動(dòng),可以采用連環(huán)替代法。
(三)聯(lián)系分析
社會(huì)經(jīng)濟(jì)現(xiàn)象是相互聯(lián)系的,在其聯(lián)系中存在因果關(guān)系、比例關(guān)系、平衡關(guān)系等。聯(lián)系分析就是利用這種社會(huì)經(jīng)濟(jì)現(xiàn)象相瓦聯(lián)系進(jìn)行數(shù)量關(guān)系的分析,以研究其中存在的規(guī)律性。事物的發(fā)展變化,內(nèi)因是根據(jù),外因是條件。聯(lián)系分析主要有用于因果關(guān)系的相關(guān)回歸法,用于比例關(guān)系的比例法,用于平衡關(guān)系的平衡法等。
(四)趨勢(shì)分析
社會(huì)經(jīng)濟(jì)現(xiàn)象的發(fā)展變化受許多因素影響,有長(zhǎng)期起作用的基本因素,也有短期因素和偶然因素。趨勢(shì)分析就是排除短期偶然因索的影響,使動(dòng)態(tài)數(shù)列呈現(xiàn)出長(zhǎng)期因素所造成的長(zhǎng)期趨勢(shì),以揭示事物發(fā)展規(guī)律,據(jù)以預(yù)測(cè)未來(lái)。
趨勢(shì)分析的方法既有數(shù)學(xué)模型法,如趨勢(shì)線配合法,也有非數(shù)學(xué)模型法,如時(shí)距擴(kuò)大法、移動(dòng)平均法等對(duì)于趨勢(shì)線配合法的運(yùn)用。具體配合什么佯的趨勢(shì)線,首先也要作定性分析,即對(duì)客觀現(xiàn)象發(fā)展的形態(tài)進(jìn)行判斷,一種判斷方法是畫散點(diǎn)圖,另一種判斷方法是根據(jù)動(dòng)態(tài)指標(biāo)來(lái)判定,當(dāng)動(dòng)態(tài)數(shù)列的逐期增長(zhǎng)量大體相同,基本趨勢(shì)是直線型的,可配合直線方程式;若二級(jí)增長(zhǎng)量大體相同,基本趨勢(shì)是拋物線型的,可配合指數(shù)拋物線方程式。
(五)決策分析
決策分析是人們現(xiàn)在一定條件下,為尋找優(yōu)化目標(biāo)和優(yōu)化地達(dá)到目標(biāo)須采取的行動(dòng)方案,而進(jìn)行的一系列分析研究、對(duì)比選擇工作。決策方法很多,不同的內(nèi)容,不同的情況,要選用不同的決策方法。例如,按掌握的信息情報(bào)資料的不同,有確定型決策、風(fēng)險(xiǎn)I生決策和不確定型決策,各自要選擇相應(yīng)的決策方法。
(六)多層次分析
有些問題比較簡(jiǎn)單,一兩個(gè)層次就能把問題分析清楚。有些問題則比較復(fù)雜,需要進(jìn)行多層次的分析,層層解剖,才能找到問題的本質(zhì)和規(guī)律。對(duì)于多層次的分析,每一層次都要經(jīng)過定性——定量——定性的分析過程。
八、統(tǒng)計(jì)方法的局限性
統(tǒng)計(jì)分析方法有其自身的優(yōu)勢(shì)與局限,正確認(rèn)識(shí)其優(yōu)勢(shì)和局限,二者同樣重要。統(tǒng)計(jì)分析方法的局限,歸結(jié)起來(lái),主要有下列幾點(diǎn):
(一)現(xiàn)實(shí)生活極其復(fù)雜,諸多因素常常糾纏交錯(cuò)在一起,僅靠統(tǒng)計(jì)分析方法去控制和解釋這些因素及其相互關(guān)系,是不全面、不深刻的。
(二)統(tǒng)計(jì)分析方法的運(yùn)用是有條件的,它依賴于數(shù)據(jù)資料本身的性質(zhì)、統(tǒng)計(jì)方法的適用程度和研究者對(duì)統(tǒng)計(jì)原理及統(tǒng)計(jì)技術(shù)的理解、掌握程度與應(yīng)用水平。方法選擇不當(dāng),往往易得出錯(cuò)誤的結(jié)論。
(三)統(tǒng)計(jì)決斷以概率為基礎(chǔ),既然是概率,就存在誤差,因而可以說(shuō),統(tǒng)計(jì)決斷的結(jié)論并非絕對(duì)正確。例如,從樣本統(tǒng)計(jì)量推斷總體參數(shù)的信息時(shí),由于推斷建立在一定的概率基礎(chǔ)上,沒有百分之百的把握認(rèn)為推斷是正確的;當(dāng)在0.95概率基礎(chǔ)上比較兩個(gè)總體平均數(shù)是否相等并認(rèn)為它們之間存在或不存在顯著差異時(shí),從可靠度上看,決斷錯(cuò)誤的可能性尚有5%。
第二篇:統(tǒng)計(jì)方法總結(jié)
一、統(tǒng)計(jì)分析方法總結(jié)
1.連續(xù)性資料
1.1 兩組獨(dú)立樣本比較
1.1.1 資料符合正態(tài)分布,且兩組方差齊性,直接采用t檢驗(yàn)。
1.1.2 資料不符合正態(tài)分布,(1)可進(jìn)行數(shù)據(jù)轉(zhuǎn)換,如對(duì)數(shù)轉(zhuǎn)換等,使之服從正態(tài)分布,然后對(duì)轉(zhuǎn)換后的數(shù)據(jù)采用t檢驗(yàn);(2)采用非參數(shù)檢驗(yàn),如Wilcoxon檢驗(yàn)。
1.1.3 資料方差不齊,(1)采用Satterthwate 的t’檢驗(yàn);(2)采用非參數(shù)檢驗(yàn),如Wilcoxon檢驗(yàn)。
1.2 兩組配對(duì)樣本的比較
1.2.1 兩組差值服從正態(tài)分布,采用配對(duì)t檢驗(yàn)。
1.2.2 兩組差值不服從正態(tài)分布,采用wilcoxon的符號(hào)配對(duì)秩和檢驗(yàn)。
1.3 多組完全隨機(jī)樣本比較
1.3.1資料符合正態(tài)分布,且各組方差齊性,直接采用完全隨機(jī)的方差分析。如果檢驗(yàn)結(jié)果為有統(tǒng)計(jì)學(xué)意義,則進(jìn)一步作兩兩比較,兩兩比較的方法有LSD檢驗(yàn),Bonferroni法,tukey法,Scheffe法,SNK法等。
1.3.2資料不符合正態(tài)分布,或各組方差不齊,則采用非參數(shù)檢驗(yàn)的Kruscal-Wallis法。如果檢驗(yàn)結(jié)果為有統(tǒng)計(jì)學(xué)意義,則進(jìn)一步作兩兩比較,一般采用Bonferroni法校正P值,然后用成組的Wilcoxon檢驗(yàn)。
1.4 多組隨機(jī)區(qū)組樣本比較
1.4.1資料符合正態(tài)分布,且各組方差齊性,直接采用隨機(jī)區(qū)組的方差分析。如果檢驗(yàn)結(jié)果為有統(tǒng)計(jì)學(xué)意義,則進(jìn)一步作兩兩比較,兩兩比較的方法有LSD檢驗(yàn),Bonferroni法,tukey法,Scheffe法,SNK法等。
1.4.2資料不符合正態(tài)分布,或各組方差不齊,則采用非參數(shù)檢驗(yàn)的Fridman檢驗(yàn)法。如果檢驗(yàn)結(jié)果為有統(tǒng)計(jì)學(xué)意義,則進(jìn)一步作兩兩比較,一般采用Bonferroni法校正P值,然后用符號(hào)配對(duì)的Wilcoxon檢驗(yàn)。
****需要注意的問題:
(1)一般來(lái)說(shuō),如果是大樣本,比如各組例數(shù)大于50,可以不作正態(tài)性檢驗(yàn),直接采用t檢驗(yàn)或方差分析。因?yàn)榻y(tǒng)計(jì)學(xué)上有中心極限定理,假定大樣本是服從正態(tài)分布的。
(2)當(dāng)進(jìn)行多組比較時(shí),最容易犯的錯(cuò)誤是僅比較其中的兩組,而不顧其他組,這樣作容易增大犯假陽(yáng)性錯(cuò)誤的概率。正確的做法應(yīng)該是,先作總的各組間的比較,如果總的來(lái)說(shuō)差別有統(tǒng)計(jì)學(xué)意義,然后才能作其中任意兩組的比較,這些兩兩比較有特定的統(tǒng)計(jì)方法,如上面提到的LSD檢驗(yàn),Bonferroni法,tukey法,Scheffe法,SNK法等。**絕不能對(duì)其中的兩組直接采用t檢驗(yàn),這樣即使得出結(jié)果也未必正確**
(3)關(guān)于常用的設(shè)計(jì)方法:多組資料盡管最終分析都是采用方差分析,但不同設(shè)計(jì)會(huì)有差別。常用的設(shè)計(jì)如完全隨即設(shè)計(jì),隨機(jī)區(qū)組設(shè)計(jì),析因設(shè)計(jì),裂區(qū)設(shè)計(jì),嵌套設(shè)計(jì)等。
2.分類資料
2.1 四格表資料
2.1.1 例數(shù)大于40,且所有理論數(shù)大于5,則用普通的Pearson 檢驗(yàn)。
2.1.2 例數(shù)大于40,所有理論數(shù)大于1,且至少一個(gè)理論數(shù)小于5,則用校正的 檢驗(yàn)或Fisher’s確切概率法檢驗(yàn)。
2.1.3 例數(shù)小于40,或有理論數(shù)小于2,則用Fisher’s確切概率法檢驗(yàn)。
2.2 2×C表或R×2表資料的統(tǒng)計(jì)分析
2.2.1 列變量&行變量均為無(wú)序分類變量,則(1)例數(shù)大于40,且理論數(shù)小于5的格子數(shù)目<總格子數(shù)目的25%,則用普通的Pearson 檢驗(yàn)。(2)例數(shù)小于40,或理論數(shù)小于5的格子數(shù)目>總格子數(shù)目的25%,則用Fisher’s確切概率法檢驗(yàn)。
2.2.2列變量為效應(yīng)指標(biāo),且為有序多分類變量,行變量為分組變量,用普通的Pearson 檢驗(yàn)只說(shuō)明組間構(gòu)成比不同,如要說(shuō)明療效,則可用行平均分差檢驗(yàn)或成組的Wilcoxon秩和檢驗(yàn)。
2.2.3 列變量為效應(yīng)指標(biāo),且為二分類變量,行變量為有序多分類變量,則可采用普通的Pearson 檢驗(yàn)比較各組之間有無(wú)差別,如果總的來(lái)說(shuō)有差別,還可進(jìn)一步作兩兩比較,以說(shuō)明是否任意兩組之間的差別都有統(tǒng)計(jì)學(xué)意義。
2.3 R×C表資料的統(tǒng)計(jì)分析
2.2.1 列變量&行變量均為無(wú)序分類變量,則(1)例數(shù)大于40,且理論數(shù)小于5的格子數(shù)目<總格子數(shù)目的25%,則用普通的Pearson 檢驗(yàn)。(2)例數(shù)小于40,或理論數(shù)小于5的格子數(shù)目>總格子數(shù)目的25%,則用Fisher’s確切概率法檢驗(yàn)。(3)如果要作相關(guān)性分析,可采用Pearson相關(guān)系數(shù)。
2.2.2列變量為效應(yīng)指標(biāo),且為有序多分類變量,行變量為分組變量,用普通的Pearson 檢驗(yàn)只說(shuō)明組間構(gòu)成比不同,如要說(shuō)明療效或強(qiáng)弱程度的不同,則可用行平均分差檢驗(yàn)或成組的Wilcoxon秩和檢驗(yàn)或Ridit分析。
2.2.3 列變量為效應(yīng)指標(biāo),且為無(wú)序多分類變量,行變量為有序多分類變量,則可采用普通的Pearson 檢驗(yàn)比較各組之間有無(wú)差別,如果有差別,還可進(jìn)一步作兩兩比較,以說(shuō)明是否任意兩組之間的差別都有統(tǒng)計(jì)學(xué)意義。
2.2.4 列變量&行變量均為有序多分類變量,(1)如要做組間差別分析,則可用行平均分差檢驗(yàn)或成組的Wilcoxon秩和檢驗(yàn)或Ridit分析。如果總的來(lái)說(shuō)有差別,還可進(jìn)一步作兩兩比較,以說(shuō)明是否任意兩組之間的差別都有統(tǒng)計(jì)學(xué)意義。(2)如果要做兩變量之間的相關(guān)性,可采用Spearson相關(guān)分析。
2.4 配對(duì)分類資料的統(tǒng)計(jì)分析
2.4.1 四格表配對(duì)資料,(1)b+c>40,則用McNemar配對(duì) 檢驗(yàn)。(2)b+c<40,則用校正的配對(duì) 檢驗(yàn)。
2.4.1 C×C資料,(1)配對(duì)比較:用McNemar配對(duì) 檢驗(yàn)。(2)一致性檢驗(yàn),用Kappa檢驗(yàn)。
二、醫(yī)學(xué)科研程序
⑴科研選題——⑵研究設(shè)計(jì)——⑶實(shí)施方法——⑷統(tǒng)計(jì)分析——⑸總結(jié)歸納
其中科研選題和研究設(shè)計(jì)最關(guān)鍵??蒲性O(shè)計(jì)分為⑴專業(yè)設(shè)計(jì)⑵統(tǒng)計(jì)設(shè)計(jì)
統(tǒng)計(jì)設(shè)計(jì)的內(nèi)容:研究對(duì)象數(shù)量的確定、對(duì)照組的選定、隨機(jī)化分組原則、控制誤差及統(tǒng)計(jì)分析方法的選定等。
一、科研選題:⑴、查閱文獻(xiàn);⑵、選題原則:創(chuàng)新性、先進(jìn)性、科學(xué)性、可行性;⑶、研究條件和優(yōu)勢(shì)
二、實(shí)施方法:⑴、調(diào)查;⑵、實(shí)驗(yàn)⑶、臨床觀察。
三、統(tǒng)計(jì)分析:⑴、正確搜集資料;⑵、描述資料統(tǒng)計(jì)特征⑶、統(tǒng)計(jì)推斷并得出結(jié)論統(tǒng)計(jì)資料的要求:準(zhǔn)確、完整、及時(shí)
描述資料:統(tǒng)計(jì)表、統(tǒng)計(jì)圖、統(tǒng)計(jì)指標(biāo)
統(tǒng)計(jì)推斷:參數(shù)估計(jì)、假設(shè)檢驗(yàn)
醫(yī)學(xué)科研設(shè)計(jì)基本內(nèi)容(臨床實(shí)驗(yàn)設(shè)計(jì)參考用)
(社區(qū)干預(yù)試驗(yàn)設(shè)計(jì)可參照)
臨床科研是以病人為研究對(duì)象,因此,在進(jìn)行臨床科研設(shè)計(jì)時(shí)應(yīng)注意:①人有社會(huì)屬性,受精神因素、心理因素影響,要注意臨床科研要符合醫(yī)學(xué)倫理要求;②必須設(shè)立對(duì)照(設(shè)立對(duì)照的注意問題附后);③隨訪的起點(diǎn)和止點(diǎn)應(yīng)有明確的定義;④注意影響實(shí)驗(yàn)研究結(jié)果的因素,并適當(dāng)控制(具體內(nèi)容附后)。
1.國(guó)內(nèi)外研究現(xiàn)狀、水平、發(fā)展趨勢(shì)(簡(jiǎn)要介紹與本課題有關(guān)研究的國(guó)內(nèi)外現(xiàn)狀、水平、發(fā)展趨勢(shì)等,寫明本課題提出的依據(jù)及本課題研究目的;簡(jiǎn)要介紹預(yù)試驗(yàn)內(nèi)容及結(jié)果。)。
2.研究對(duì)象:
(1)具體診斷標(biāo)準(zhǔn)(用公認(rèn)的或統(tǒng)一的,并闡明出處;如沒有統(tǒng)一的標(biāo)準(zhǔn)也應(yīng)寫明是自定標(biāo)準(zhǔn)。)、制定入選(納入)標(biāo)準(zhǔn)及排除標(biāo)準(zhǔn);
(2)研究對(duì)象選擇范圍(包括對(duì)照組)及選樣和分組方法(使用正確的隨機(jī)方法選樣和分組;在實(shí)驗(yàn)對(duì)象的分組和施加因素分配實(shí)驗(yàn)組、對(duì)照組上,都要隨機(jī)化);
(3)樣本含量。(說(shuō)明確定樣本含量的依據(jù))3.處理因素:(詳細(xì)寫)
處理因素設(shè)置要求:①抓住主要因素;②找出非處理因素(混雜因素);③處理因素標(biāo)準(zhǔn)化。
(1)設(shè)備(或試劑或藥物)生產(chǎn)廠家(來(lái)源)及型號(hào)(劑量);(2)治療方法及操作程序(包括對(duì)照組);(3)操作過程中的質(zhì)量控制(包括方法、人員、設(shè)備三統(tǒng)一及實(shí)驗(yàn)質(zhì)控手段等);(4)技術(shù)關(guān)鍵。4.研究結(jié)果:
確定研究效應(yīng)的測(cè)量指標(biāo)及測(cè)定方法,要考慮與待評(píng)價(jià)的結(jié)果有關(guān)聯(lián)性、客觀性、靈敏性、特異性及實(shí)用性等。
(1)療效判斷標(biāo)準(zhǔn)(用公認(rèn)的或統(tǒng)一的,并闡明出處;如沒有統(tǒng)一的標(biāo)準(zhǔn)也應(yīng)寫明是自定標(biāo)準(zhǔn)。);
(2)(近期、遠(yuǎn)期)觀察指標(biāo)(各組觀察指標(biāo)應(yīng)一致)及觀察方法;(3)科研記錄表格及匯總表格式樣;(4)統(tǒng)計(jì)方法及指標(biāo)確定,預(yù)計(jì)結(jié)果;(5)科研質(zhì)量控制措施(包括科研全過程的各環(huán)節(jié),如預(yù)試驗(yàn)工作、分組、施加處理因素、臨床觀察及隨訪、原始資料的記錄及收集、資料整理等方面質(zhì)量控制措施)。
5.創(chuàng)新設(shè)想(本研究的):
6.工作時(shí)間安排(包括調(diào)研、設(shè)計(jì)、研究、統(tǒng)計(jì)分析、總結(jié)鑒定等): 7.研究人員分工(包括姓名、性別、年齡、職稱、工作單位及在本研究中的詳細(xì)分工):
8.經(jīng)費(fèi)的籌措及使用計(jì)劃:
9.存在(可能出現(xiàn))的問題、困難及解決辦法: 臨床科研的對(duì)照問題
為保證臨床科研實(shí)驗(yàn)組與對(duì)照組之間具有可比性,對(duì)照組中的觀察對(duì)象除了實(shí)驗(yàn)因素不同以外,實(shí)驗(yàn)過程中的實(shí)驗(yàn)條件和輔助措施,都應(yīng)與實(shí)驗(yàn)組相同。常用對(duì)照方式如下:
1、空白對(duì)照:對(duì)照組不施加任何處理因素。這種對(duì)照僅用在某些病情較輕或長(zhǎng)期穩(wěn)定無(wú)任何危險(xiǎn)的疾病,如:慢性關(guān)節(jié)炎、HbsAg攜帶者、近視等。
2、安慰劑對(duì)照:對(duì)照組采用無(wú)藥理作用且無(wú)害的“藥“,如:淀粉、生理鹽水等經(jīng)加工后其外形、味道等與試驗(yàn)藥相似,不被受試者識(shí)別。這種對(duì)照僅用在研究的疾病尚無(wú)有效治療方法,或使用安慰劑后該病的病情、臨床經(jīng)過、預(yù)后等影響小或無(wú)影響時(shí)。
3、實(shí)驗(yàn)對(duì)照:對(duì)照組不施加處理因素,但施加某種與處理因素有關(guān)的實(shí)驗(yàn)因素。
4、標(biāo)準(zhǔn)對(duì)照:用現(xiàn)有標(biāo)準(zhǔn)方法或常規(guī)方法做對(duì)照,注意以一種低療效的方法作對(duì)照來(lái)提高試驗(yàn)的療效是毫無(wú)意義的,甚至是有害的。
5、歷史對(duì)照:以過去的研究結(jié)果作對(duì)照,這是一種非隨機(jī)和非同期的對(duì)照,容易產(chǎn)生偏倚(可能因?yàn)榧膊∽匀徊〕虝?huì)隨時(shí)間而變化,或醫(yī)生的收治病人診斷標(biāo)準(zhǔn)和治療方法或水平因時(shí)間而變化等,使兩組失去可比性)。這種對(duì)照可用于狂犬病、骨折愈合等療效對(duì)照。
6、自身對(duì)照:對(duì)照和實(shí)驗(yàn)在同一受試對(duì)象進(jìn)行,這種對(duì)照簡(jiǎn)單易行,但應(yīng)注意該方法的兩個(gè)缺陷:一是實(shí)驗(yàn)總是把處理前作對(duì)照,這不符合隨機(jī)分配原則;二是實(shí)驗(yàn)前后某些環(huán)境因素或自身因素發(fā)生了改變,可能影響實(shí)驗(yàn)結(jié)果??煽紤]用交叉實(shí)驗(yàn)解決。
7、相互對(duì)照:多種待研究觀察因素相互對(duì)照。
目前常用的設(shè)計(jì)方案有:隨機(jī)對(duì)照實(shí)驗(yàn)、配對(duì)實(shí)驗(yàn)、交叉實(shí)驗(yàn)(適于病程較長(zhǎng)的實(shí)驗(yàn)研究),可根據(jù)具體情況,選用適合的方法進(jìn)行實(shí)驗(yàn)研究。
10、影響實(shí)驗(yàn)研究結(jié)果的因素及其控制
一、誤差:
1、隨機(jī)誤差:通過增加樣本含量,可減小隨機(jī)誤差,但不能消除。
2、非隨機(jī)誤差:
非系統(tǒng)誤差:偶然失誤造成的。
系統(tǒng)誤差:誤差值遵循一定的規(guī)律而存在或變化,增加樣本量,不能糾正。
二、編倚:(可以看成是一種系統(tǒng)誤差)
1、選擇性偏倚:防止選擇性偏倚的措施:①正確擬定觀察對(duì)象的納入和排除標(biāo)準(zhǔn);②采用分層抽樣方法;③正確設(shè)立對(duì)照;④遵守隨機(jī)化原則。
2、測(cè)量偏倚(或稱觀察偏倚或信息偏倚):
產(chǎn)生原因:①沾染(對(duì)照組也接受了處理措施);②干擾;③依從與非依從;④失訪(>20%);⑤檢查與診斷結(jié)果不一致;⑥觀察記錄有誤;⑦心理因素的干擾。
防止措施:①用盲法試驗(yàn);②簽定實(shí)驗(yàn)合同;③檢查實(shí)驗(yàn)對(duì)象的依從情況;④注意醫(yī)德問題;⑤定期檢查研究記錄;⑥對(duì)實(shí)驗(yàn)方法、診斷標(biāo)準(zhǔn)的一致性在實(shí)驗(yàn)前應(yīng)做出估計(jì)。
3、混雜偏倚:
產(chǎn)生原因:多在總結(jié)分析階段,評(píng)價(jià)被研究因素與疾病之間的關(guān)系時(shí),如果存在外來(lái)因素與該病和研究因素均有聯(lián)系,使研究因素效應(yīng)與外來(lái)因素效應(yīng)混
在一起,從而掩蓋或夸大研究因素與疾病的真實(shí)聯(lián)系。
防止措施:①設(shè)計(jì)時(shí),用配對(duì)設(shè)計(jì)或采用分層抽樣方法;②分析階段,用分層分析技術(shù)或多變量回歸分析技術(shù)。其目的是平衡混雜因素的作用。
醫(yī)學(xué)科研設(shè)計(jì)基本內(nèi)容(調(diào)查設(shè)計(jì)參考用)
1、國(guó)內(nèi)外研究現(xiàn)狀、水平、發(fā)展趨勢(shì)(簡(jiǎn)要介紹與本課題有關(guān)研究的國(guó)內(nèi)外現(xiàn)狀、水平、發(fā)展趨勢(shì)等,寫明本課題提出的依據(jù)及研究目的。注意:研究目的應(yīng)很明確,且圍繞一個(gè)中心;簡(jiǎn)要介紹預(yù)試驗(yàn)內(nèi)容及結(jié)果。)。
2、調(diào)查計(jì)劃:
⑴、確定觀察對(duì)象(所要研究的總體)和觀察單位(總體中的個(gè)體統(tǒng)計(jì)對(duì)象)⑵、選定調(diào)查指標(biāo)(調(diào)查指標(biāo)是調(diào)查目的的具體體現(xiàn)):指標(biāo)選擇要求:①精選、重點(diǎn)突出,不要貪多求全,分散精力。②計(jì)量指標(biāo)比計(jì)數(shù)指標(biāo)敏感。③客觀指標(biāo)優(yōu)于主觀指標(biāo)。④選用靈敏度高,特異度高的檢查方法作為診斷依據(jù)。
⑶、調(diào)查方法(普查、抽樣調(diào)查等)
⑷、樣本含量(說(shuō)明確定樣本含量的依據(jù))
⑸、收集原始資料的調(diào)查方式(直接觀察、直接采訪(訪問調(diào)查、自填調(diào)查)、間接采訪(信訪、電話))
⑹、設(shè)計(jì)調(diào)查表和問卷(調(diào)查表和問卷設(shè)計(jì)相關(guān)問題附后)
⑺、調(diào)查階段的組織工作(包括組織領(lǐng)導(dǎo)、關(guān)系協(xié)調(diào)、調(diào)查員培訓(xùn)等)
⑻、設(shè)計(jì)階段質(zhì)量控制:①正確劃分調(diào)查范圍;②盡量選擇客觀、明確的指標(biāo);③對(duì)調(diào)查問題進(jìn)行精選,避免問題過于繁雜;④對(duì)于可能引起混淆的調(diào)查項(xiàng)目給出明確的定義。
⑼、調(diào)查階段質(zhì)量控制:①通過預(yù)試驗(yàn)工作完善調(diào)查設(shè)計(jì);②抓好調(diào)查員的選拔和培訓(xùn),避免因調(diào)查員工作態(tài)度不好或業(yè)務(wù)水平不足而影響調(diào)查結(jié)果;③對(duì)被調(diào)查者可能存在的拒絕、躲避、隱瞞、等問題,采取相應(yīng)措施,如:開展宣傳、摸清被調(diào)查者在家的時(shí)間規(guī)律、對(duì)敏感問題做好解釋和保密工作,對(duì)記憶不清者,可請(qǐng)知情人幫助回憶;④在問卷中設(shè)置相反問題,以了解應(yīng)答的可靠性;⑤選擇調(diào)查方式時(shí)應(yīng)考慮年齡和文化水平因素;⑥對(duì)檢測(cè)項(xiàng)目的調(diào)查應(yīng)注明檢測(cè)設(shè)備、試劑等生產(chǎn)廠家、型號(hào)、批號(hào);操作過程應(yīng)注意操作方法(包括診斷標(biāo)準(zhǔn))、人員、設(shè)備(應(yīng)有明確的校正靈敏度及準(zhǔn)確度的方法及時(shí)間)三統(tǒng)一;⑦注意調(diào)查的效度(真實(shí)性)與信度(可靠性)問題,常采用現(xiàn)場(chǎng)抽樣復(fù)查來(lái)評(píng)價(jià)調(diào)查信度等。
3、整理計(jì)劃:(去粗取精,去偽存真)
⑴、計(jì)算機(jī)錄入與整理工作:應(yīng)提出確保錄入質(zhì)量的措施:①在建立數(shù)據(jù)庫(kù)時(shí),編寫邏輯查錯(cuò)程序;②同一資料用兩個(gè)錄入員輸入并用計(jì)算機(jī)核對(duì);③資料錄入完成后,做頻數(shù)表或散點(diǎn)圖,發(fā)現(xiàn)異常值;④正確選擇合適的指標(biāo)和分析方法等。
⑵、資料分組:(按數(shù)值大小分組、按類型分組等)⑶、分組組數(shù)確定:
4、統(tǒng)計(jì)分析計(jì)劃:(包括:①說(shuō)明指標(biāo)的內(nèi)涵和計(jì)算方法及預(yù)期進(jìn)行統(tǒng)計(jì)描述和推斷內(nèi)容;②擬進(jìn)行的探索性分析;③控制混雜因素的措施;④列出統(tǒng)計(jì)分析表,并通過統(tǒng)計(jì)分析表檢查調(diào)查、整理計(jì)劃有否遺漏。)
5、創(chuàng)新設(shè)想(本研究的):
6、工作時(shí)間安排(包括調(diào)研、設(shè)計(jì)、研究、統(tǒng)計(jì)分析、總結(jié)鑒定等):
7、研究人員分工(包括姓名、性別、年齡、職稱、單位及在本研究中的詳細(xì)分工):
8、經(jīng)費(fèi)的籌措及使用計(jì)劃:
9、存在(可能出現(xiàn))的問題、困難及解決辦法:
10、調(diào)查表及問卷設(shè)計(jì)相關(guān)問題 一、一般結(jié)構(gòu):
1、前言:用于說(shuō)明調(diào)查目的、重要性、回答問題的必要性以及對(duì)調(diào)查內(nèi)容保密等,以取得調(diào)查對(duì)象的合作。
2、填寫說(shuō)明:為保證所有調(diào)查員和調(diào)查對(duì)象均能對(duì)調(diào)查項(xiàng)目和填寫方法正確理解,統(tǒng)一認(rèn)識(shí)而編寫。
3、核(備)查項(xiàng)目:該部分與調(diào)查目的無(wú)關(guān),作核查核對(duì)用。內(nèi)容包括調(diào)查員姓名、調(diào)查日期、復(fù)核結(jié)果、未調(diào)查原因等。
4、調(diào)查(分析)項(xiàng)目:為直接用于調(diào)查指標(biāo)所必須以及排除混雜因素所必須的項(xiàng)目,包括調(diào)查對(duì)象的①背景資料,如:姓名、住址、單位、電話等;②人口學(xué)項(xiàng)目,如:年齡、性別、民族、婚姻狀況、文化程度、職業(yè)等;③研究項(xiàng)目(該部分是調(diào)查表的核心內(nèi)容,依不同調(diào)查目的而定,分問題項(xiàng)目和檢測(cè)項(xiàng)目)。
二、問題的形式:?jiǎn)栴}的基本形式有提問式和陳述式兩種;根據(jù)問題答案的形式分開放式問題(無(wú)統(tǒng)一答案)和封閉式問題(有固定答案)。
封閉式問題設(shè)計(jì)注意:
1、答案應(yīng)包括所有可能的答案,還應(yīng)有“其它”一欄;
2、各選擇答案不應(yīng)相互包含,不應(yīng)有重疊情況。
三、問題設(shè)計(jì)的一般原則:
1、盡量避免用專業(yè)術(shù)語(yǔ)(提問一般就低不就高);
2、避免混淆,對(duì)語(yǔ)義較模糊的詞(如:經(jīng)常、偶爾、普通、大概等)應(yīng)給出本次調(diào)查的定義或標(biāo)準(zhǔn)。
3、避免雙重問題,避免一個(gè)問題中實(shí)際提出兩個(gè)問題。
4、提問避免誘導(dǎo)或強(qiáng)制性(否定形式的提問有誘導(dǎo)之嫌);對(duì)有社會(huì)期望偏倚的問題應(yīng)注意。
5、問題應(yīng)適合全部調(diào)查對(duì)象并符合邏輯。
6、敏感問題的處理:對(duì)國(guó)家政策、倫理道德、經(jīng)濟(jì)收入、生活行為、其它個(gè)人隱私等敏感問題,可以采用對(duì)象轉(zhuǎn)移法或假定法提問;關(guān)于敏感問題調(diào)查的隨機(jī)應(yīng)答技術(shù)問題,須參考有關(guān)統(tǒng)計(jì)學(xué)專著。
7、調(diào)查項(xiàng)目的安排順序(注意問題順序的邏輯性)①、一般問題在前,特殊問題在后; ②、易答問題在前,難答問題在后;
③、敏感問題一般在最后;如敏感問題較多,可分散在問卷中,以降低其敏感性;
④、一般將問題項(xiàng)目放在前,檢測(cè)項(xiàng)目放在后。
第三篇:農(nóng)民收入統(tǒng)計(jì)方法
農(nóng)民收入統(tǒng)計(jì)方法
一、農(nóng)村住戶調(diào)查簡(jiǎn)介
農(nóng)民收入的統(tǒng)計(jì)是通過“農(nóng)村住戶調(diào)查”來(lái)完成的?!稗r(nóng)村住戶調(diào)查”是通過對(duì)農(nóng)村居民家庭的生產(chǎn)、收入、消費(fèi)、積累和社會(huì)活動(dòng)的調(diào)查,全面反映農(nóng)村居民的收入和生活質(zhì)量的變化,對(duì)農(nóng)村居民實(shí)現(xiàn)小康和擺脫貧困的進(jìn)程進(jìn)行監(jiān)測(cè),為各級(jí)政府制定農(nóng)村政策和決策提供依據(jù),也為國(guó)民經(jīng)濟(jì)核算提供了基礎(chǔ)數(shù)據(jù)。
國(guó)際上開展“住戶調(diào)查”已有很長(zhǎng)的歷史,我國(guó)農(nóng)村開展住戶調(diào)查始于1954年,在1954年至1977年間,該調(diào)查曾因“人民公社化”運(yùn)動(dòng)和“文化大革命”運(yùn)動(dòng)兩次中斷,1977年該調(diào)查再次恢復(fù)。1984年國(guó)家統(tǒng)計(jì)局農(nóng)村社會(huì)經(jīng)濟(jì)調(diào)查隊(duì)成立以后,農(nóng)村住戶調(diào)查獲得了長(zhǎng)足發(fā)展,調(diào)查方法、調(diào)查內(nèi)容逐漸與國(guó)際接軌,走上了科學(xué)化、規(guī)范化和現(xiàn)代化的道路。
二、農(nóng)民人均純收入的定義與計(jì)算方法
(一)“純收入”指標(biāo)的定義
在我國(guó)農(nóng)村社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)中,“純收入”指標(biāo)的應(yīng)用起始于“人民公社”時(shí)期的“農(nóng)村經(jīng)濟(jì)收益分配”統(tǒng)計(jì)。在收益分配統(tǒng)計(jì)中,“純收入”指的是農(nóng)村經(jīng)濟(jì)總收入扣除各項(xiàng)費(fèi)用后的余額部分,這個(gè)余額部分也叫“收益”?!凹兪杖搿备鶕?jù)國(guó)家有關(guān)規(guī)定在國(guó)家、集體和個(gè)人之間進(jìn)行分配。個(gè)人分配所得叫“農(nóng)村居民所得”,指的是當(dāng)年的農(nóng)村經(jīng)濟(jì)純收入減去國(guó)家稅收和集體提留后的剩余部分?!稗r(nóng)民人均純收入”指的是按農(nóng)村人口平均的農(nóng)村居民所得。這個(gè)指標(biāo)的口徑從收入分配的角度說(shuō),就是農(nóng)民初次分配得到的收入。
在開展農(nóng)村住戶調(diào)查中,初期的“純收入”概念與“農(nóng)村經(jīng)濟(jì)收益分配”統(tǒng)計(jì)中的概念是一致的,隨著我國(guó)社會(huì)主義市場(chǎng)經(jīng)濟(jì)的發(fā)展和收入分配政策的調(diào)整,現(xiàn)行農(nóng)村住戶調(diào)查“純收入”指標(biāo)的口徑有所調(diào)整,主要是包含了部分再分配的收入?!凹兪杖搿敝傅氖寝r(nóng)村居民當(dāng)年從各個(gè)來(lái)源渠道得到的總收入,相應(yīng)地扣除獲得收入所發(fā)生的費(fèi)用后的收入
總和?!稗r(nóng)民人均純收入”指的是按農(nóng)村人口平均的“農(nóng)民純收入”,反映的是一個(gè)國(guó)家或地區(qū)農(nóng)村居民收入的平均水平。
(二)計(jì)算方法
在農(nóng)村住戶抽樣調(diào)查中,農(nóng)民人均純收入計(jì)算的工作流程是,首先,由縣級(jí)農(nóng)調(diào)隊(duì)將農(nóng)戶每月記的帳錄入計(jì)算機(jī),按季度(或按月)上報(bào)省農(nóng)調(diào)隊(duì),年底由省農(nóng)調(diào)隊(duì)將全年的原始數(shù)據(jù)上報(bào)農(nóng)調(diào)總隊(duì),省農(nóng)調(diào)隊(duì)和農(nóng)調(diào)總隊(duì)同時(shí)用國(guó)家統(tǒng)計(jì)局開發(fā)的計(jì)算機(jī)數(shù)據(jù)處理程序?qū)υ颊{(diào)查數(shù)據(jù)進(jìn)行處理,計(jì)算各省和全國(guó)的農(nóng)民人均純收入。整個(gè)計(jì)算過程完全由計(jì)算機(jī)自動(dòng)完成,并有嚴(yán)格的制度規(guī)定。
農(nóng)民人均純收入的計(jì)算方法全國(guó)是完全統(tǒng)一的,計(jì)算公式為:農(nóng)民人均純收入=(農(nóng)村居民家庭總收入—家庭經(jīng)營(yíng)費(fèi)用支出—生產(chǎn)性固定資產(chǎn)折舊—稅金和上交承包費(fèi)用—調(diào)查補(bǔ)貼)/農(nóng)村居民家庭常住人口
從計(jì)算公式看,農(nóng)民純收入的計(jì)算方法并不復(fù)雜。但是,由于農(nóng)民收入是由兩部分組成的,一部分是現(xiàn)金收入,另一部分是實(shí)物收入,現(xiàn)金收入好計(jì)算,調(diào)查結(jié)果是多少就是多少,復(fù)雜的是實(shí)物收入。由于實(shí)物收入沒有經(jīng)過市場(chǎng),因此,必須采取一個(gè)客觀、準(zhǔn)確的計(jì)算方法來(lái)計(jì)算其價(jià)值量,才能正確反映農(nóng)民收入水平。在確保原始調(diào)查數(shù)據(jù)質(zhì)量的前提下,如何計(jì)算實(shí)物收入的價(jià)值量成為準(zhǔn)確計(jì)算農(nóng)民收入水平的關(guān)鍵。
在現(xiàn)行的農(nóng)村住戶調(diào)查中規(guī)定,實(shí)物收入的計(jì)算方法是將農(nóng)戶當(dāng)年生產(chǎn)的農(nóng)產(chǎn)品產(chǎn)量扣除出售部分,分品種作價(jià)后計(jì)算得出。對(duì)各品種農(nóng)產(chǎn)品的作價(jià)執(zhí)行的是與市場(chǎng)掛鉤的原則,即以農(nóng)民在市場(chǎng)出售農(nóng)產(chǎn)品的價(jià)格為基礎(chǔ),糧食、肉類打九折,其他農(nóng)產(chǎn)品打八五折。如果在下年出售了上年的結(jié)余農(nóng)產(chǎn)品,根據(jù)出售價(jià)格與上年實(shí)物作價(jià)的高低,將出售結(jié)余農(nóng)產(chǎn)品的損益計(jì)入下年收入。
對(duì)農(nóng)作物副產(chǎn)品計(jì)算收入的原則是,只有用于生產(chǎn)和生活或明確用于出售的農(nóng)作物副產(chǎn)品才計(jì)算收入,用于生產(chǎn)的農(nóng)作物副產(chǎn)品在計(jì)算收入的同時(shí)也要計(jì)入生產(chǎn)費(fèi)用中。農(nóng)作物副產(chǎn)品作價(jià)計(jì)算收入的方法,原則上按實(shí)物折算收入的作價(jià)方法執(zhí)行。
(三)與農(nóng)民人均純收入相關(guān)的一些指標(biāo)與定義
農(nóng)民既是一個(gè)消費(fèi)單位又是一個(gè)生產(chǎn)單位,既有生活消費(fèi)支出又有生產(chǎn)投入,既有現(xiàn)金收入也有實(shí)物收入。由于收入是對(duì)農(nóng)民生產(chǎn)經(jīng)營(yíng)活動(dòng)的全面反映,因此,為了準(zhǔn)確反映農(nóng)民的生產(chǎn)經(jīng)營(yíng)活動(dòng),在調(diào)查方案和分析中設(shè)計(jì)了較多的概念。主要有:總收入、純收入、現(xiàn)金收入、實(shí)物收入、現(xiàn)金純收入、實(shí)物純收入和可支配收入等。
1.總收入
總收入是調(diào)查期內(nèi)全部收入的總和,其中未扣除為獲得收入所發(fā)生的支出(生產(chǎn)費(fèi)用)和生活消費(fèi)支出。按收入來(lái)源的性質(zhì)劃分,總收入分為:工資性收入(報(bào)酬收入)、家庭經(jīng)營(yíng)總收入、財(cái)產(chǎn)性收入和轉(zhuǎn)移性收入。按收入的形態(tài)劃分,總收入中包含兩部分:實(shí)物總收入和現(xiàn)金總收入。
(1)工資性收入:指調(diào)查期內(nèi)農(nóng)村住戶和住戶成員受雇于單位和個(gè)人,靠出賣勞動(dòng)而獲得的收入。按收入來(lái)源渠道劃分為在非企業(yè)組織中勞動(dòng)得到的收入(如干部、教師收入)、在本地企業(yè)勞動(dòng)得到的收入、常住人口外出務(wù)工收入和從其他單位勞動(dòng)得到的收入。
(2)家庭經(jīng)營(yíng)總收入:指農(nóng)村住戶以家庭為生產(chǎn)經(jīng)營(yíng)單位進(jìn)行生產(chǎn)籌劃和管理而獲得的收入。家庭經(jīng)營(yíng)收入按劃分又可分為農(nóng)業(yè)收入、林業(yè)收入、牧業(yè)收入等(共分為十個(gè)行業(yè)和其他)。
(3)財(cái)產(chǎn)性收入:指擁有金融資產(chǎn)或有形非生產(chǎn)性資產(chǎn)的農(nóng)村住戶向其他機(jī)構(gòu)單位提供資金或?qū)⒂行畏巧a(chǎn)性資產(chǎn)供其支配,作為回報(bào)而從中獲得的收入。如利息、股息、紅利、土地征用補(bǔ)償?shù)取?/p>
(4)轉(zhuǎn)移性收入:指農(nóng)村住戶和住戶成員無(wú)須付出任何對(duì)應(yīng)物而獲得的貨物、服務(wù)、資金或資產(chǎn)所有權(quán)等。但不包括無(wú)償?shù)玫降挠糜诠潭ㄙY本形成的資金。
(5)現(xiàn)金總收入:指農(nóng)村住戶和住戶成員在調(diào)查期內(nèi)得到的以現(xiàn)金形態(tài)表現(xiàn)的收入總和。
(6)實(shí)物總收入:指的是農(nóng)戶當(dāng)年生產(chǎn)的各種農(nóng)產(chǎn)品總量扣除出售部分,按一定的價(jià)格計(jì)算得到的總收入。
2.純收入
和總收入一樣,純收入按收入來(lái)源的性質(zhì)劃分,可分為工資性收入、家庭經(jīng)營(yíng)純收入、財(cái)產(chǎn)性收入和轉(zhuǎn)移性收入,按收入的形態(tài)分為現(xiàn)金純收入和實(shí)物純收入。
工資性收入、財(cái)產(chǎn)性收入和轉(zhuǎn)移性收入與總收入中的定義和口徑完全一樣。
(1)家庭經(jīng)營(yíng)純收入:指的是家庭經(jīng)營(yíng)總收入相應(yīng)地扣除從事各項(xiàng)生產(chǎn)經(jīng)營(yíng)活動(dòng)獲得的支出后的收入總和。家庭經(jīng)營(yíng)純收入按行業(yè)又可分為農(nóng)業(yè)純收入、林業(yè)純收入、牧業(yè)純收入等(共分為十個(gè)行業(yè)和其他)。
(2)現(xiàn)金純收入:指當(dāng)年從各個(gè)來(lái)源得到的現(xiàn)金總收入相應(yīng)地扣除所發(fā)生的現(xiàn)金費(fèi)用支出后的收入總和?!艾F(xiàn)金純收入”是“純收入”中已經(jīng)“變現(xiàn)”的部分,反映的是在當(dāng)年“純收入”中,農(nóng)民對(duì)外進(jìn)行商品交換的現(xiàn)實(shí)支付能力。
(3)實(shí)物純收入: “純收入”減去“現(xiàn)金純收入”就是“實(shí)物純收入”。
3.可支配收入
可支配收入是收入分配的概念。由農(nóng)民生產(chǎn)活動(dòng)的凈收益和再分配凈收益構(gòu)成。也是通過總收入計(jì)算得到。
計(jì)算公式:農(nóng)村住戶可支配收入=農(nóng)村住戶總收入-家庭經(jīng)營(yíng)費(fèi)用支出-稅費(fèi)支出-生產(chǎn)性固定資產(chǎn)折舊-財(cái)產(chǎn)性支出-轉(zhuǎn)移性支出-調(diào)查補(bǔ)貼
按收入來(lái)源劃分,與總收入和純收入一樣也可劃分為四個(gè)部分,但名稱略有不同,部分指標(biāo)的口徑也不一樣,四個(gè)部分分別分為:工資性收入、家庭經(jīng)營(yíng)凈收入、財(cái)產(chǎn)性凈收入和轉(zhuǎn)移性凈收入。
工資性收入與總收入和純收入中的定義與口徑完全一樣;家庭經(jīng)營(yíng)凈收入等同于家庭經(jīng)營(yíng)純收入。
(1)財(cái)產(chǎn)性凈收入:指住戶和住戶成員在調(diào)查其內(nèi)獲得的財(cái)產(chǎn)性總收入扣除為獲得財(cái)產(chǎn)性收入所發(fā)生的費(fèi)用后的收入。
(2)轉(zhuǎn)移性凈收入:指住戶和住戶成員在調(diào)查其內(nèi)獲得的轉(zhuǎn)移性總收入減去調(diào)查期內(nèi)住戶和住戶成員的轉(zhuǎn)移性支出(再分配支出)后的收入。
在現(xiàn)行的純收入口徑中,財(cái)產(chǎn)性收入沒有扣除為獲得財(cái)產(chǎn)性收入而發(fā)生的費(fèi)用,轉(zhuǎn)移性收入只扣除了部分轉(zhuǎn)移性支出,這就是“純收入”與“可支配收入”指標(biāo)口徑的區(qū)別。
第四篇:氣象中的統(tǒng)計(jì)方法總結(jié)
中國(guó)近20年來(lái)氣象統(tǒng)計(jì)預(yù)報(bào)綜述
中國(guó)近20年來(lái)氣象統(tǒng)計(jì)預(yù)報(bào)綜述
謝炯光曾琮
(廣東省氣象臺(tái))
摘要
近20年來(lái),多元統(tǒng)計(jì)分析方法有了長(zhǎng)足的進(jìn)步,涌現(xiàn)出不少新方法、新技術(shù)。本文著重介紹了近20年來(lái)氣象統(tǒng)計(jì)預(yù)報(bào)在中國(guó)氣象業(yè)務(wù)科研中的一些應(yīng)用和發(fā)展,主要從多元統(tǒng)計(jì)分析意義上來(lái)選材。
關(guān)鍵詞:多元分析、氣象統(tǒng)計(jì)、預(yù)報(bào)。
一、前言
氣象統(tǒng)計(jì)預(yù)報(bào)在中國(guó)氣象業(yè)務(wù)預(yù)報(bào)和科研工作中占有重要的位置,特別是在模式統(tǒng)計(jì)釋用及中長(zhǎng)期預(yù)報(bào)業(yè)務(wù)中,統(tǒng)計(jì)預(yù)報(bào)更是扮演著一個(gè)重要的角色,多元分析中的回歸分析、典型相關(guān)分析、EOF分析等更是氣象預(yù)報(bào)和分析不可少缺的工具。近20年來(lái),氣象統(tǒng)計(jì)預(yù)報(bào)在中國(guó)取得了長(zhǎng)足的發(fā)展。本文主要綜述統(tǒng)計(jì)方法在氣象預(yù)報(bào)業(yè)務(wù)中的各個(gè)方面的應(yīng)用及其所取得的一些成績(jī)。
二、多元統(tǒng)計(jì)分析在氣象預(yù)報(bào)業(yè)務(wù)中的應(yīng)用
1、回歸分析
廣東、江西、河北、遼寧等氣象局[1]用0、1權(quán)重回歸、逐步回歸、多元回歸等方法,得出晴雨MOS預(yù)報(bào)方程。1978年曹鴻興等、史久恩等[2]用逐步回歸建立最高、最低氣溫預(yù)報(bào)方程。新疆自治區(qū)氣象臺(tái)張家寶等[3]以預(yù)報(bào)員經(jīng)驗(yàn)為基礎(chǔ),采用完全預(yù)報(bào)(Perfect Prog Method)方法,應(yīng)用0、1權(quán)重回歸建立了有無(wú)寒潮的預(yù)報(bào)。上海氣象臺(tái)丁長(zhǎng)根、黃家鑫[4]用逐步回歸建立U、V和S(全風(fēng)速)預(yù)報(bào)方程。1965年W.F.Massy[5]提出的主成份回歸、1970年Hoerl和Kennard[6]提出的嶺估計(jì)(Ridge estimate)以及Webster等人[7]提出的特征根回歸(Latent root regression, LRR)對(duì)在回歸分析中出現(xiàn)復(fù)共線性(Multi-collinearity)有較好的處理。馮耀煌[8]在預(yù)報(bào)集成中,應(yīng)用了嶺回歸技術(shù),李耀先[ 9]用嶺回歸作水稻產(chǎn)量年景預(yù)測(cè)。魏松林[10]用特征根回歸建立長(zhǎng)春6-8月平均氣溫的特征根回歸。
Furnialhe 和Wilson提出的窮盡所有回歸的算法,比較徹底地解決了最優(yōu)回歸(即最優(yōu)子集回歸)的問題。張萬(wàn)誠(chéng)[11]用最優(yōu)子集回歸作低緯高原雨季開始預(yù)報(bào)。在氣象預(yù)報(bào)的實(shí)際工作中,常要考慮多個(gè)自變量(預(yù)報(bào)因子)與多個(gè)因變量(預(yù)報(bào)量)的關(guān)系。中國(guó)數(shù)學(xué)家張堯庭[12]解決了這一問題的算法,徐一鳴等[13]用多預(yù)報(bào)量雙重篩選逐步回歸作臺(tái)風(fēng)路徑預(yù)報(bào),嚴(yán)華生等[14]用多因變量多自變量建立大氣環(huán)流--區(qū)域水稻產(chǎn)量預(yù)報(bào)。
引入非線性回歸是近年來(lái)發(fā)展的趨勢(shì)。馮耀煌等[15]、姜子俊等[16] 提出了一種選擇非線性最優(yōu)預(yù)報(bào)因子和建立非線性預(yù)報(bào)方程的方法,可用于長(zhǎng)、中短期預(yù)報(bào)。近年來(lái)由于數(shù)值預(yù)報(bào)模式的頻繁更迭,使模式輸出統(tǒng)計(jì)預(yù)報(bào)方法受到新的考驗(yàn),黃嘉佑等[17]介紹了卡爾曼濾波在天氣預(yù)報(bào)中的應(yīng)用,劉春霞等[18]用此方法制作了廣東省冬季的最低氣溫預(yù)報(bào)。近年來(lái),卡爾曼濾波技術(shù)在短期氣候預(yù)測(cè)中也得到了應(yīng)用[19]。
2、判別分析
廣東省徐聞氣象局[20]用二級(jí)判別做臺(tái)風(fēng)登陸地段的預(yù)報(bào)。Fisher、Bayes以及逐步判別等雖然在氣象實(shí)際中廣泛應(yīng)用,但嚴(yán)格地說(shuō),這些方法僅當(dāng)變量為正態(tài)分布時(shí)才可應(yīng)用,Logistic判別對(duì)變量的基本假設(shè)條件較寬,對(duì)未經(jīng)正態(tài)檢驗(yàn)的變量應(yīng)用本方法是可行的,且可用于既有連續(xù)變量又有多值離散變量的情形。呂純濂等[21]將Logistic判別引入中國(guó)氣象界,并研究了二次Logistic判別[22]分析及逐步判別[23]在氣象中的應(yīng)用。
3、相關(guān)分析
近20年來(lái)在氣象統(tǒng)計(jì)中用得較多的主要有典型相關(guān)(CCA)分析和奇異值分解(SVD)方法。CCA是提取兩個(gè)氣象場(chǎng)的最大線性相關(guān)摸態(tài)的方法。朱盛明、祝浩敏[24]在數(shù)值預(yù)報(bào)的解釋應(yīng)用中用典型相關(guān)分析提取有物理意義的預(yù)報(bào)因子作預(yù)報(bào)方程。陳嘉玲、謝炯光[25]用典型相關(guān)分析作中期冷空氣預(yù)報(bào)。黃嘉佑[26]用典型相關(guān)分析作副高的統(tǒng)計(jì)動(dòng)力預(yù)報(bào)。近年來(lái)發(fā)展了一種新的CCA改進(jìn)方法,稱為典型相關(guān)分析的BP(Barnert 和Preisendorfer)方法,在氣象統(tǒng)計(jì)中也得到了應(yīng)用[27]。
奇異值分解(SVD)也是提取兩個(gè)場(chǎng)的最大線性相關(guān)摸態(tài)的方法,SVD方法可以變成是兩個(gè)要素場(chǎng)關(guān)系的擴(kuò)大EOF分析。謝炯光等[28]用奇異值分解方法,求出了廣東省前汛期(4-6月)西太平洋場(chǎng)海溫與廣東省降水場(chǎng)的6對(duì)奇異向量,來(lái)作汛期降水趨勢(shì)預(yù)報(bào)。江志紅等[29]用SVD方法討論了中國(guó)夏半年降水與北太平洋海溫異常的關(guān)系。
4、氣象場(chǎng)的分解及其應(yīng)用
50年代中期由Loreng引入到大氣科學(xué)研究中的主成份分析以及后來(lái)發(fā)展的擴(kuò)展經(jīng)驗(yàn)正交函數(shù)、復(fù)經(jīng)驗(yàn)正交函數(shù)、旋轉(zhuǎn)主分量分析、R型、Q型因子分析、對(duì)應(yīng)分析、主震蕩型(Principal Oscillation Parterns,PPOS)。使氣象研究及業(yè)務(wù)水平進(jìn)入一個(gè)更高層次。
4.1 經(jīng)驗(yàn)正交函數(shù)(EOF)分解
章基嘉等[30]應(yīng)用經(jīng)驗(yàn)正交函數(shù)對(duì)亞洲500hPa侯平均環(huán)流與我國(guó)侯平均氣溫之關(guān)系的時(shí)空結(jié)構(gòu)進(jìn)行分析。用EOF逐年劃分自然天氣季節(jié),張邦林、丑紀(jì)范[31]提出了一種時(shí)空綜合的經(jīng)驗(yàn)正交函數(shù)分析方法,多數(shù)的經(jīng)驗(yàn)正交函數(shù)分解是在標(biāo)量場(chǎng)上展開的,但風(fēng)場(chǎng)也用經(jīng)驗(yàn)正交函數(shù)展開,周紫東等[32]、王盤興[33] ]討論了氣象向量場(chǎng)的經(jīng)驗(yàn)正交函數(shù)展開方法及其應(yīng)用。
4.2 主成份(主分量)分析及其因子分析
氣象分析預(yù)報(bào)中,常要分析許多變量,而變量間往往互有影響,如何從多個(gè)變量中找出很少幾個(gè)綜合性的指標(biāo)代替原來(lái)較多的指標(biāo),而且所找到的綜合指標(biāo)又能盡可能多地反映原來(lái)數(shù)據(jù)的信息,而且主成份之間又是相互獨(dú)立的主成份分析。
何敏等[34]用主分量研究了歐亞地區(qū)大氣環(huán)流年際振蕩的時(shí)空分布特征,謝炯光[35]用主分量與非線性降維和相似綜合作廣東月降水量分布預(yù)報(bào),陳創(chuàng)買等[36]提出一種氣候場(chǎng)的主分量逐步回歸預(yù)報(bào)模型,該模型將氣候場(chǎng)的預(yù)報(bào)變成對(duì)氣候場(chǎng)主分量的預(yù)報(bào),并通過相關(guān)分析和逐步回歸,求得氣候場(chǎng)的主分量與各種不同的因子場(chǎng)的主分量因子之間的聯(lián)系。用于廣東年降水的預(yù)報(bào)。
4.3 擴(kuò)展經(jīng)驗(yàn)正交函數(shù)(EEOF)
1982年Weare 和Nasstrom[37]提出的EEOF分解可以得到氣象場(chǎng)空間分布結(jié)構(gòu),也可以得到隨時(shí)間變化空間分布結(jié)構(gòu)的變化。張先恭等[38]用EEOF做太平洋海表溫度與中國(guó)降水準(zhǔn)3.5年周期變化。
謝炯光[39]提出一種月、季降水預(yù)測(cè)的新方法,用EEOF分解得到的前期特征向量
場(chǎng),來(lái)預(yù)測(cè)后期的降水場(chǎng)分布特征。
4.4復(fù)經(jīng)驗(yàn)正交函數(shù)(CEOF)
Rasmusson和Barnetl提出的復(fù)經(jīng)驗(yàn)正交函數(shù)(CEOF)[40]能表現(xiàn)出氣象場(chǎng)的位相變化及空間傳播特征。
黃嘉佑[41]使用復(fù)經(jīng)驗(yàn)正交函數(shù)分析中國(guó)降水長(zhǎng)期變化的準(zhǔn)兩年周期振動(dòng),魏鳳英等[42]用CEOF分析了近百年中國(guó)東部旱澇的分布及其年際變化特征,符綜斌等[43]曾將CEOF分析用于Elnino增暖的振幅和位相變化,畢幕瑩[44]用CEOF分析研究了夏季西太平洋副高的振蕩。
4.5 因子分析、旋轉(zhuǎn)主因子分析(RPC)
將主成份分析向前推進(jìn)一步,就是因子分析,因子分析又分R型分析和Q型分析兩種,我們知道,由于主因子是通過原始變量的線性組合得到的,因而可以了解到其天氣意義。但哪一個(gè)主因子的天氣意義更重要些,可通過因子荷載矩陣進(jìn)行分析,一般來(lái)說(shuō)因子荷載矩陣越簡(jiǎn)單越易解釋。為此,使每個(gè)因子的荷載平方按列向0或1兩端分化。使主因子在每個(gè)變量上的荷載趨近于1,而在其它變量上的荷載接近于0,這樣,就更容易解釋主因子的天氣意義。這種變換稱為旋轉(zhuǎn)主因子分析,一般分正交旋轉(zhuǎn)與斜交旋轉(zhuǎn)兩種方式。極大方差旋轉(zhuǎn)是正交旋轉(zhuǎn),是氣象預(yù)測(cè)、科研業(yè)務(wù)中最常用的旋轉(zhuǎn)方法。謝炯光等[45]用因子分析和旋轉(zhuǎn)因子分析對(duì)西太平洋8個(gè)海區(qū)進(jìn)行了分析,對(duì)頭4個(gè)主因子的物理意義進(jìn)行了初步的解釋,進(jìn)而用它建立了廣東省各月降水與海溫的預(yù)報(bào)方程。黃嘉佑[46]用斜旋主分量分析了我國(guó)夏季氣溫及降水場(chǎng)(1951-1987年)的時(shí)空特征,王敬方等[47]用旋轉(zhuǎn)主分量(RPC)方法,分析近40年來(lái)我國(guó)夏季溫度變化的規(guī)律。
4.6 對(duì)應(yīng)分析
對(duì)應(yīng)分析是一種綜合了R型及Q型因子分析特點(diǎn)的多元統(tǒng)計(jì)分析技術(shù),黃嘉佑[48]、李麥村等[49]用該方法發(fā)現(xiàn)副高逐月變化曲線與赤道海溫變化十分相似,謝炯光[50]用對(duì)應(yīng)分析對(duì)4-6月逐月的連續(xù)變化進(jìn)行分型,把各月的降水連續(xù)變化分為連升型、連降型、降后升型等四型,并利用回歸分析作出各型的預(yù)報(bào),在前汛期降水趨勢(shì)和冬半年(1-3月)氣溫趨勢(shì)的預(yù)測(cè)中收到了較好的效果。
4.7 主振蕩型(POP)分析
主振蕩型(POP)是Hasselmamm和Storch在20世紀(jì)80年代末提出來(lái)的[51]。章基嘉等[52]對(duì)離散化場(chǎng)時(shí)間序列推導(dǎo)了主振蕩型分析方法的兩個(gè)導(dǎo)出量:主振蕩型(POP)及其伴隨相關(guān)型(ACP)。通過熱帶太平洋SST矩平場(chǎng)時(shí)間序列POP及相應(yīng)區(qū)域850hPa風(fēng)場(chǎng)ACP的計(jì)算例子,給出了它們的實(shí)際算法。聚類分析
鄭祖光[53]在首先不能確定用幾個(gè)因子和分成幾類的情況下,提出用變K變N方案。章基嘉等[54]應(yīng)用K-均值聚類法對(duì)東亞各自然天氣季節(jié)500hPa平均環(huán)流進(jìn)行分型試驗(yàn)。在聚類分析中多數(shù)的分類樣品是相互獨(dú)立的,分類時(shí)彼此是平等的,但在一些問題中,樣品的分類是不能打破順序的。比如,對(duì)某一階段氣象要素?cái)?shù)據(jù)進(jìn)行分段以確定不同時(shí)段的氣候特征。這種分類,稱為分割更為形象一些,F(xiàn)isher提出了最優(yōu)分割的算法,謝炯光等[55]利用最優(yōu)分割,對(duì)中國(guó)T106數(shù)值預(yù)報(bào)輸出產(chǎn)品的各種物理意義明確的預(yù)報(bào)因子進(jìn)行最優(yōu)二分割,挑選出晴雨及有無(wú)大于25毫米降水的預(yù)報(bào)因子,建立概率回歸方法,做24-144小時(shí)的晴雨,大于25毫米降水的完全概率預(yù)報(bào),在業(yè)務(wù)中收到較好效果。最優(yōu)二分割的進(jìn)一步優(yōu)化,產(chǎn)生了一種叫做AID的分割算法(Automatic Interaction Detection),利用AID方法,不但可以分類,還可以根據(jù)新的樣品落區(qū)在哪一類作出預(yù)報(bào)。AID具有解決一些非線性問題的能力。謝炯光
等[56]據(jù)天氣學(xué)實(shí)踐選出47個(gè)與廣東省臺(tái)風(fēng)、暴雨關(guān)系密切的預(yù)報(bào)因子,利用AID方法,進(jìn)行計(jì)算做出臺(tái)風(fēng)暴雨的短期預(yù)報(bào)。譜分析
6.1 功率譜
李小泉等[57]利用譜分析研究500hPa環(huán)流指數(shù)的變化,譜分析也常常與其它方法相結(jié)合應(yīng)用于天氣分析與預(yù)報(bào)中,黃嘉佑[58]在研究海溫場(chǎng)與太平洋副熱帶高壓之間的關(guān)系時(shí)使用交叉譜發(fā)現(xiàn),海溫不單有明顯的兩年振動(dòng)周期,而且這種振動(dòng)存在于太平洋地區(qū)的氣壓系統(tǒng)中,關(guān)系十分密切,它們之間的凝譜平方值高值0.65的臨界值。符淙斌[59]利用協(xié)譜與正交譜研究緯向和經(jīng)向垂直環(huán)流強(qiáng)度之間的反相耦合振蕩關(guān)系。
6.2 最大熵譜分析
在連續(xù)功率譜估計(jì)中,自相關(guān)函數(shù)估計(jì)與樣本量大小有關(guān),1967年Burg提出了一種稱之為“最大熵”譜估計(jì)的方法,具有分辨率高、適用于短序列等優(yōu)點(diǎn)??婂\海[60]討論了最大熵譜的優(yōu)良特性和預(yù)報(bào)誤差過濾下系數(shù)階段的確定。曹鴻興等[61]討論了氣象歷史序列的最大熵譜分析。魏鳳英[62]用最大熵譜提取1952-1995年華北地區(qū)春季干旱指數(shù)序列的顯著周期。
6.3 奇異譜分析(SSA)
奇異譜分析(Singular Spectrum Analysis)是從時(shí)間序列的動(dòng)力重構(gòu)出發(fā)與經(jīng)驗(yàn)正交函數(shù)(EOF)相結(jié)合的一種統(tǒng)計(jì)分析技術(shù),特別適合用于大氣的非線性振動(dòng)。吳洪寶
[63]、、劉健文等[64]系統(tǒng)介紹了奇異譜的原理及其在氣象中的應(yīng)用。謝炯光等[65]用SSA方法對(duì)登陸廣東省的熱帶氣旋的演變規(guī)律進(jìn)行了分析,發(fā)現(xiàn)年登陸廣東的熱帶氣旋存在明顯的8年,準(zhǔn)3年的周期振蕩,登陸珠江口以西的熱帶氣旋,存在12年,準(zhǔn)2年的振蕩周期。
6.4 小波分析
小波分析是從傅立葉分析方法發(fā)展起來(lái)的并被認(rèn)為是傅立葉分析方法的突破性進(jìn)展。戴新剛和丑紀(jì)范[66]用子波變換研究了長(zhǎng)江和黃河流域徑流的周期性問題,紀(jì)忠萍等[67]用小波分析對(duì)廣州近百年來(lái)氣候變化的多時(shí)間尺度進(jìn)行分析,紀(jì)忠萍等[68]用小波變換分析廣東省低溫陰雨的年景趨勢(shì)變化,著重分析了重低溫陰雨年在小波系數(shù)圖中的分布特征,并根據(jù)分析結(jié)果對(duì)未來(lái)1-2年的低溫陰雨年景進(jìn)行了預(yù)測(cè)估計(jì)。7 時(shí)間序列分析模型
在氣象上用得較多的主要有自回歸模型(AR)、滑動(dòng)平均模型(MA)、自回歸滑動(dòng)平均模型(ARMA)、自回歸求和滑動(dòng)平均(ARIMA)模型。氣象要素的時(shí)間序列多數(shù)是屬非線性變化的,上述的時(shí)間序列建模模型均為線性模型。而時(shí)間序列分析中的門限自回歸模型(TAR)是一種非線性模型,它利用逐段線性化手段來(lái)處理非線性系統(tǒng)。由于門限的控制作用,保證了遞推的穩(wěn)定性。門限自回歸模型可以有效地描述非線性振動(dòng)現(xiàn)象,可以解釋自然界各種類型的穩(wěn)定循環(huán)。丁裕國(guó)等[69]利用奇異譜分析對(duì)Nino海區(qū)SSTA月際序列作短期氣候預(yù)測(cè)試驗(yàn),采用AR(P)模型,結(jié)果發(fā)現(xiàn)在SSA分析基礎(chǔ)上的AR模型對(duì)ENSO海區(qū)的SST預(yù)報(bào)特別有效。史久恩等[70]用自激勵(lì)門限自回歸模型作SOI(南方濤動(dòng)指數(shù))的預(yù)報(bào),其結(jié)果與線性AR模型相比較,結(jié)果表明非線性門限自回歸模型擬合SOI數(shù)據(jù),比線性模型更能有效地反映數(shù)據(jù)的內(nèi)在規(guī)律。多層遞階方法
1983年中國(guó)韓志剛教授[71]提出了建立在現(xiàn)代控制理論中“系統(tǒng)辨識(shí)”基礎(chǔ)上的含時(shí)變參數(shù)的新型統(tǒng)計(jì)預(yù)測(cè)方法―多層遞階方法。這種時(shí)間序列的新預(yù)報(bào)方法在氣象預(yù)
報(bào)服務(wù)中取得了較好的效果[72],不少學(xué)者在使用過程中對(duì)這種方法的應(yīng)用方面作了進(jìn)一步的改進(jìn),使其在氣象預(yù)報(bào)應(yīng)用上得到進(jìn)一步的提高[73]。均生函數(shù)模型
曹鴻興、魏鳳英等提出了時(shí)間序列的均值生成函數(shù)(Mean Generating Function, MGF,簡(jiǎn)稱均生函數(shù))模型。均生函數(shù)預(yù)測(cè)模型既可以作多步預(yù)測(cè),又可以較好地預(yù)測(cè)極值,為短期氣候預(yù)測(cè)開辟了一條新的途徑。魏鳳英、曹鴻興[74] 在《長(zhǎng)期預(yù)測(cè)的數(shù)學(xué)模型及其應(yīng)用》與《現(xiàn)代氣候統(tǒng)計(jì)診斷預(yù)測(cè)技術(shù)》兩書中對(duì)均生函數(shù)模型的數(shù)學(xué)原理及其在氣象中的應(yīng)用作了詳細(xì)的介紹?;疑到y(tǒng)預(yù)測(cè)模型
“灰色系統(tǒng)”理論,是我國(guó)學(xué)者鄧聚龍教授提出的新型理論。到目前為止,人們對(duì)天氣(氣候)系統(tǒng)的演變規(guī)律、發(fā)生、發(fā)展、消亡機(jī)制,子系統(tǒng)間的相互作用的了解尚不清楚、不充分,限制了動(dòng)力和統(tǒng)計(jì)方法對(duì)天氣(氣候)系統(tǒng)的深入研究。天氣氣候系統(tǒng),由于其復(fù)雜性,是一個(gè)典型的部分信息已知和部分信息未知的灰色系統(tǒng)。因此,鄧聚龍教授提出的灰色系統(tǒng)理論為氣象預(yù)測(cè)和分析研究提供了一個(gè)有力的工具。曹鴻興、翁文潔等人對(duì)灰色分析與預(yù)測(cè)及其在氣象中的應(yīng)用作了推廣[75],鄧聚龍[76]在“灰色預(yù)測(cè)與決策”一書中對(duì)灰色系統(tǒng)的理論的來(lái)龍去脈,具體計(jì)算方法作了詳細(xì)的介紹,并把GM(1,1)模型、災(zāi)變預(yù)測(cè)、季節(jié)災(zāi)變預(yù)測(cè)、拓?fù)漕A(yù)測(cè)等方法在氣象中的實(shí)際應(yīng)用作了介紹。謝定升等[77]根據(jù)GM(1,1)模型的方法原理,作降水峰日的中期預(yù)報(bào)。車貝雪夫多項(xiàng)式展開
經(jīng)典車貝雪夫多項(xiàng)式展開只適用于矩形網(wǎng)格,周家斌將車貝雪夫展開推廣到不規(guī)則格點(diǎn)上,并將其用于氣象要素的分布預(yù)報(bào)[78]。周家斌提出了一種用車貝雪夫多項(xiàng)式做時(shí)間序列預(yù)報(bào)的迭代算法,這是一個(gè)非線性、非參數(shù)方法,無(wú)需對(duì)序列作平穩(wěn)或其它假定。它的擬合和實(shí)際預(yù)報(bào)效果較好[79]。神經(jīng)網(wǎng)絡(luò)原理在氣象中的應(yīng)用
近年來(lái)神經(jīng)網(wǎng)絡(luò)在氣象中的應(yīng)用快速發(fā)展。周曾奎等[80]利用神經(jīng)BP網(wǎng)絡(luò)模型輸出判斷臺(tái)風(fēng)移向趨勢(shì)-西進(jìn)、北上、西北移。于波等[81]結(jié)合模糊判斷技術(shù)利用多層神經(jīng)網(wǎng)絡(luò)對(duì)GMS云圖的臺(tái)風(fēng)云系進(jìn)行圖像識(shí)別。謝炯光等[82]利用神經(jīng)BP網(wǎng)絡(luò)進(jìn)行月雨量集成預(yù)報(bào)試驗(yàn),金龍等[83]提出了小波變換與神經(jīng)網(wǎng)絡(luò)相結(jié)合的多步預(yù)測(cè)模型。非線性動(dòng)力學(xué)
林振山[84]首先提出了諾干相空間預(yù)報(bào)模型,并提出將相空間模處理組合法用于業(yè)務(wù)預(yù)報(bào)中。周家斌[85]提出了相空間向量相似方法,相軌跡變率方法,空間變換方法和相空間模方法等4種以混沌理論為基礎(chǔ)的預(yù)報(bào)方法,這些方法已經(jīng)用于南方濤動(dòng)強(qiáng)度、北京降水和華北降水分布的預(yù)報(bào)。分形
近年分形的思路和方法正逐步在氣象分析和業(yè)務(wù)中得到應(yīng)用。劉式達(dá)等[86]指出分?jǐn)?shù)維是氣候系統(tǒng)結(jié)構(gòu)的特征,是氣候系統(tǒng)中尺度變換后的不變數(shù)。付昱華[87]應(yīng)用分形分布模型N=C/rD的推廣形式,即連續(xù)變維分形(分維數(shù)D是r的連續(xù)函數(shù),而不是常量)預(yù)測(cè)臺(tái)風(fēng)路徑。
三、結(jié)束語(yǔ)
近20年來(lái)統(tǒng)計(jì)氣象學(xué)在中國(guó)取得了長(zhǎng)足的發(fā)展,統(tǒng)計(jì)預(yù)報(bào)在中國(guó)氣象業(yè)務(wù)預(yù)報(bào)和科研中占有重要的位置。主要表現(xiàn)在:在數(shù)值預(yù)報(bào)產(chǎn)品統(tǒng)計(jì)釋用中,統(tǒng)計(jì)預(yù)報(bào)方法發(fā)揮了積極的作用。隨著計(jì)算技術(shù)和計(jì)算機(jī)的發(fā)展,以場(chǎng)分析和場(chǎng)相關(guān)的統(tǒng)計(jì)預(yù)報(bào)方法如SVD、EEOF、CCA分析等方法得以在業(yè)務(wù)上得到了廣泛應(yīng)用,對(duì)提高業(yè)務(wù)預(yù)報(bào)精確率幫助很大。3 一些新的統(tǒng)計(jì)方法由于種種原因,用在氣候分析中較多,用在業(yè)務(wù)預(yù)測(cè)上較少,有待今后進(jìn)一步開發(fā)。近年來(lái)國(guó)內(nèi)外一些數(shù)學(xué)界的研究新成果,如自記憶方程、主振蕩模、混沌分形、小波分析等引入到氣象界的速度很快,如何使其在天氣預(yù)測(cè)中更快、更好地發(fā)揮作用值得研究。在統(tǒng)計(jì)預(yù)報(bào)的使用中,如何發(fā)揮統(tǒng)計(jì)預(yù)報(bào)的長(zhǎng)處,避免其不足的地方,要繼續(xù)研究
第五篇:醫(yī)學(xué)統(tǒng)計(jì)學(xué)統(tǒng)計(jì)方法總結(jié)
計(jì)量資料:
一、描述性分析
集中趨勢(shì):對(duì)稱——算術(shù)均數(shù)偏態(tài)——中位數(shù)等比——幾何均數(shù) 離散趨勢(shì):對(duì)稱——方差、標(biāo)準(zhǔn)差偏態(tài)——四分位數(shù)間距
均數(shù)懸殊或單位不同的資料比較——變異系數(shù)
二、統(tǒng)計(jì)推斷(根據(jù)樣本推斷總體)1.參數(shù)(均數(shù))估計(jì)總體方差未知——總體方差已知——
參考值范圍:?jiǎn)坞p側(cè)正態(tài)分布——
X?u?S
(x?t?/2v
snsn,x?t?/2v
s
sn))
(x?u?/2,x?u?/2
n
X?u?SX?u?S
偏態(tài)分布——百分位數(shù)法
二者的含義、用途 2.假設(shè)檢驗(yàn)
(1)均數(shù)的比較(正態(tài))
單個(gè)樣本、配對(duì)(與兩獨(dú)立樣本的區(qū)別)兩樣本(方差齊——t檢驗(yàn)
方差不齊——校正t檢驗(yàn)或秩和檢驗(yàn)或變量轉(zhuǎn)換)多樣本:方差齊完全隨機(jī)設(shè)計(jì)方差分析隨機(jī)區(qū)組設(shè)計(jì)方差分析
方差不齊——秩和檢驗(yàn)或變量轉(zhuǎn)換
非正態(tài):秩和檢驗(yàn)或變量轉(zhuǎn)換
F—+—>t
兩兩比較:SNK任兩個(gè)對(duì)比
LSD一對(duì)或幾對(duì)比較
Dunnet 實(shí)驗(yàn)與對(duì)照組比較
t——>FF=t
2(2)方差比較
兩個(gè)方差:F檢驗(yàn)(正態(tài))
多個(gè)方差:Bartlett(正態(tài))
Levene檢驗(yàn)
假設(shè)檢驗(yàn)注意事項(xiàng)
計(jì)數(shù)資料
一、描述性分析
頻率或嚴(yán)重程度——率
比重或構(gòu)成——構(gòu)成比
一指標(biāo)為另一指標(biāo)的若干倍或百分比——相對(duì)比
應(yīng)用注意:不能以比代率、可比性、樣本率不能直接對(duì)比
率或構(gòu)成比比較:
1.若某因素內(nèi)部構(gòu)成不同并且影響比較,進(jìn)行標(biāo)化
二、統(tǒng)計(jì)推斷
1.參數(shù)估計(jì)
二項(xiàng)分布率的估計(jì):查表或正態(tài)法
泊松分布均數(shù)估計(jì):查表或正態(tài)法
2.假設(shè)檢驗(yàn)
單個(gè)樣本率:直接法或二項(xiàng)分布U檢驗(yàn)泊松分布U檢驗(yàn)(率很小)兩樣本率的比較:四格表?2檢驗(yàn)(校正)
二項(xiàng)分布U檢驗(yàn)(n大、np>5,n(1-p)>5)
泊松分布U檢驗(yàn)((率很小)
精確概率法
多個(gè)率或構(gòu)成比比較:?2檢驗(yàn)(理論數(shù)不能小于1或小于的理論數(shù)
不能多于5分1)
兩兩比較:
任兩個(gè)對(duì)比、實(shí)驗(yàn)與對(duì)照組比較
等級(jí)資料:-----效應(yīng)比較
秩和檢驗(yàn)
兩變量關(guān)系:
1.定量(計(jì)量資料)正態(tài)pearson相關(guān) 回歸
非正態(tài)秩相關(guān)
2.無(wú)序分類定性
3.有序分類定性?2檢驗(yàn)和列聯(lián)相關(guān)系數(shù)
(1)單向有序分組有序、指標(biāo)無(wú)序卡方檢驗(yàn)分組無(wú)序、指標(biāo)有序秩和檢驗(yàn)
(2)雙向有序
屬性相同屬性不同Kappa檢驗(yàn) 線性趨勢(shì)秩相關(guān)