第一篇:運用統(tǒng)計軟件stata進行數(shù)據(jù)分析的基本步驟和思想
運用統(tǒng)計軟件stata進行數(shù)據(jù)分析的基本步驟和思想
經(jīng)過陶四海老師對stata統(tǒng)計軟件運用的教導,我對stata這個十分簡便實用的統(tǒng)計軟件有了初步入門的認識,并且通過對stata軟件的學習與思考運用,加深了我對于統(tǒng)計學的概念及思想的認識。
統(tǒng)計學和統(tǒng)計軟件是相輔相成的,沒有統(tǒng)計學做統(tǒng)計基礎思想個思維方式,統(tǒng)計軟件對數(shù)據(jù)分析的運用將會是“盲人摸象”。而沒有統(tǒng)計軟件為大量的統(tǒng)計數(shù)據(jù)進行快速準確有意義的分析和處理,我們光掌握了統(tǒng)計思想和統(tǒng)計方法,也不能駕輕就熟的應對龐雜繁多的數(shù)據(jù),將會造成統(tǒng)計結果偶然的偏差,影響到統(tǒng)計結果的可靠性。
正如陶老師說的,當今社會快速的經(jīng)濟、社會、文化等的發(fā)展,勢必會需要大量的統(tǒng)計運用分析,而隨著統(tǒng)計運用的需求也會造就許多優(yōu)秀的統(tǒng)計軟件。國外的統(tǒng)計軟件發(fā)展是超過國內(nèi)甚多的,spss,sas和stata,都是國外的優(yōu)秀統(tǒng)計學家和軟件工程師認可的優(yōu)秀的統(tǒng)計軟件。
統(tǒng)計軟件重要的是統(tǒng)計思想來駕馭其迅速、高效,和其他的統(tǒng)計軟件相比,stata的優(yōu)點甚多。
運用stata進行統(tǒng)計數(shù)據(jù)的分析在步驟上和其他的統(tǒng)計軟件是相類似的,在得到了相關的數(shù)據(jù)之后,軟件運用者需要首先對數(shù)據(jù)進行的就是觀察分析。在stata讀取了數(shù)據(jù)之后,軟件用戶需要了解到數(shù)據(jù)的結構,數(shù)據(jù)的總體信息,如數(shù)據(jù)文件的路徑和名稱,大小規(guī)模,最后生成時間等等,軟件用戶需要對數(shù)據(jù)有個大概的認識,并對即將進行的統(tǒng)計數(shù)據(jù)分析思路進行有效的開展。
變量與變量的取值??梢杂胏odebook命令來知道具體變量的取值編碼,然后使用list命令來以更接近數(shù)據(jù)表格的形勢查看數(shù)據(jù)。
第二篇:Stata數(shù)據(jù)分析的基本思想和步驟2
簡述stata數(shù)據(jù)分析的基本思路和步驟
數(shù)據(jù)分析的過程包括數(shù)據(jù)收集、整理和分析。Stata是數(shù)據(jù)分析的主要工具,其功能全面,系統(tǒng)集成多種統(tǒng)計分析方法,有完善的數(shù)據(jù)定義,操作和管理功能并且能生成各種統(tǒng)計圖和統(tǒng)計圖表,功能非常強大。下面是一個簡單的stata分析流程。
1、首先要讀取與生成數(shù)據(jù)文件,按照研究目的對數(shù)據(jù)進行相應處理,如加標簽、數(shù)值變量與字符變量的轉換等。
2、其次要了解數(shù)據(jù)結構(describe)
包括數(shù)據(jù)庫和變量的基本信息,如樣本含量、變量個數(shù)、數(shù)據(jù)庫標簽、變量標簽、數(shù)據(jù)存儲格式等等。
3、描述數(shù)據(jù)(summarize)
了解數(shù)據(jù)的算數(shù)平均數(shù)、標準差、最小值和最大值,如有需要還何以進行詳細描述(summarizevar,detail)。
4、列表(tabulate):
對于一些類別變量可以列表顯示頻數(shù)、頻率、累計頻率。
5、繪制圖形
使用者可根據(jù)需要使用繪圖命令,生成直觀形象的圖形對數(shù)據(jù)進行描述。
6、統(tǒng)計描述結束后,就要進行統(tǒng)計推斷
包括求置信區(qū)間和假設檢驗,根據(jù)數(shù)據(jù)的特點和研究目的選擇相應的檢驗方法。單樣本t-檢驗、兩樣本t-檢驗、配對t-檢驗、方差分析、卡方檢驗、秩和檢驗等等。
7、相關分析和回歸分析以及進行模型擬合。
第三篇:利用統(tǒng)計軟件SPSS進行試卷質(zhì)量分析
分 類 號: 密 級: 學校代碼: 10638 學 號:
碩 士 學 科 論 文
利用統(tǒng)計軟件Spss進行試卷質(zhì)量分析
姓 名
敬曉萍
指 導 教 師 馮長煥 教授
培 養(yǎng) 單 位
數(shù)學與信息學院
學 科 專 業(yè)
教育統(tǒng)計與測評
研 究 方 向 數(shù)學教育
學 位 類 別
教育碩士
年 級 2010級
西華師范大學學位評定委員會
四川·南充
利用統(tǒng)計軟件Spss進行試卷質(zhì)量分析
摘 要
試卷分析是教學工作中的重要組成部分,同時也是每個教師必須完成的工作。通過對試卷進行分析,可以反饋學生學習結果和教師教學效果,幫助教師發(fā)現(xiàn)教學活動中的薄弱環(huán)節(jié),提高教學質(zhì)量。課程期末考試的試題應該如何命題,怎樣組卷?如何把握一份試卷的整體難度和分量,使考試成績及其成績的分布符合正態(tài),防止平均成績的大起大落,避免不及格率的過高過低,以適應大眾教育的需要等,這對穩(wěn)定學校正常的教學秩序,保證學生正常的學習心態(tài)和情緒,直至就業(yè)應聘是否順利等都會產(chǎn)生直接的影響。本文利用統(tǒng)計軟件Spss對試卷分析的各項指標進行了定量分析,介紹了操作方法,以便為廣大教師進行試卷分析提供一種模式參考,從而科學地進行試卷質(zhì)量分析,提高教學質(zhì)量和效率。
關鍵字:成績統(tǒng)計;試卷分析;難度;區(qū)分度;信度
考試是教育評價的有效辦法,隨著高職高專技能教學改革的深入開展,對教學評價的要求越來越客觀,對教學結果的分析越來越依賴于統(tǒng)計理論和方法。本文的目的是借助統(tǒng)計學軟件Spss,介紹對試卷質(zhì)量定量分析的方法。
一、考試試卷的統(tǒng)計分析[1]
(一)試卷難度的分析
所謂難度是指考試中試題或者試卷的難易程度,是考試題目對學生知識和能力水平適合程度的指標。
1.難度的計算
以往教師在考試中對試題難度的測定大部分是憑感覺。這種方法本身比較模糊,對有經(jīng)驗的教師也并不是非常有效。根據(jù)難度的概念,得到如下公式:
若第i題全部答對,則di=0;若第i題全部答錯,則di=1;當di=0.5,說明此題難度適中。
試卷難度:
試卷難度的測定建立在試題難度的基礎上,以試題難度為變量,以試題滿分值為權數(shù)的加權算數(shù)平均數(shù):
一般而言,試卷都是以100分為滿分,于是:
對于學校的常規(guī)考試,目的在于測量個體差異。當d=0或d=0.5時,即試題全部答對或答錯,該題便無法提供個體差異的信息。而只有當d=0.5時,題目才能做最大程度的區(qū)分度。但在實際工作中要使每題難度均達到0.5有一定的困難。
因此,一般要求試卷平均難度為0.5左右,各試題的難度控制在0.5±02之間。
2.難度的比較
按以上公式計算的試題及試卷難度,只能看出不同試題或不同試卷的難易程度,但卻不能分析題目或試卷之間的相對難度。如某試卷中,第一,第二,第三題的難度分別是0.3,0.4,0.5。從難度數(shù)據(jù)中可以看出,第一題相對較容易,第三題較難。但第二題與第一題的難度差和第三題與第二題的難度差是否相等?這卻不一定。原因是不同試題的難度位于不同的等距量表,因而不具有可比性。為解決試題及試卷之間難度的相互對比,需要將以上公式計算的難度,通過正態(tài)分布表,轉化為標準分。如:d=0.3,z=-1.88;d=0.4,z=-1.75;d=0.5,z= 0。顯然,第二題與第一題的難度差為0.13,第三題與第二題的難度差為1.75,難度差并不相等。
(二)試卷區(qū)分度的分析
區(qū)分度也叫鑒別力,就是通過一次考試將不同程度,不同能力的學生區(qū)分開來的重要指標。比如一道題目,水平高、能力好的同學都答對,而水平低、能力差的同學都答錯,那么這道題就有好的區(qū)分度。
計算公式:
1.試題的區(qū)分度:
式中:Hi為班級中高分組同學第i題的平均成績;Li為班級中低分組同學第i題的平均成績。(一般而言,高分組與低分組的同學人數(shù)是以班級同學人數(shù)10%-15%確定)
當高分組平均成績與低分組平均成績差距較大時,Gi較大,這時對試題的區(qū)分度評價就比較好。
2.試卷區(qū)分度
區(qū)分度的評價標準:
(三)常用指標簡介[2]
平均值:反映一組數(shù)據(jù)的總體情況。方差:反映一組數(shù)據(jù)的波動大小。
峰度:用來描述某變量所有取值分布形態(tài)趨勢程度的統(tǒng)計量,是與正態(tài)分布相比較的量。峰度為0表示其數(shù)據(jù)與正態(tài)分布的趨勢程度相同;峰度大于0表示比正態(tài)分布更加陡峭;峰度小于0表示比正態(tài)分布更加平坦。
偏度:用來描述數(shù)據(jù)的對稱性的統(tǒng)計量。偏度大于0表示正偏差數(shù)值較大;偏度小于0表示負偏差數(shù)值較大。而偏度的絕對值越大表示分布形態(tài)的偏差程度越大。
二、具體操作步驟[3] 1.原始數(shù)據(jù)錄入
下面我們以我校數(shù)學與信息學院《統(tǒng)計分析》期末考試試卷為例來說明各個指標的實現(xiàn)方法。
1.1試卷結構
本試卷(滿分100分)有兩個部分組成:客觀性試題與主觀性試題,其中客觀性試題共40分,占40%,主觀性試題共60分,占60%。具體情況見下表。
分值分布圖
注:q1是填空題、q2是選擇題、q3是判斷題、q4是簡答題、q5是問答題、q6是計算題。
1.2數(shù)據(jù)定義
圖1 變量定義窗口
圖2 試卷質(zhì)量分析數(shù)據(jù)窗口
在SPSS軟件中,點擊Variable View標簽,在Name標題下定義:學號、題號、總成績、平時成績,其中總成績定義為total,平時成績定義為daily,然后在相應的標簽名中進行注釋。在Type標題下定義各個項目的類型,其中學號定義為String類型、題號和平時成績定義為Numeric類型,其余選項使用默認即可。如圖1所示。
1.3數(shù)據(jù)錄入 點擊Data View標簽,將47份試卷按照各部分得分情況和他們的總成績、平
時成績輸入到相應的表格中。如圖2所示。
2.基本描述性統(tǒng)計分析
主要包括參加考試的學生總數(shù)、缺考人數(shù)、每個部分的最高分、最低分、極差、平均分、標準偏差(方差)等。
在試卷質(zhì)量分析數(shù)據(jù)中,運行菜單:Analyze→Descriptive Statistics→Descriptives,把除平時成績外的所有變量加入到Variables中,點擊Options選項對話框,選中Mean、Minimum、Maximum、Range、Std.deviation、Variance。點擊Continue,再點擊OK。運行后得到結果如下表所示。
描述性統(tǒng)計分析表
3.難度分析
試題難度是指測驗題目的難易程度,難度系數(shù)一般用字母P表示,且0≤P≤1。對是非題和論文型的題目,我們可以統(tǒng)一為P=M/W(M:全體學生某題的平均得分;W:某題規(guī)定的最高得分)。對于選擇題我們先計算得出難度系數(shù)P,然后再根據(jù)公式cp=(kp-1)/(k-1)(k為選項個數(shù))算出矯正難度系數(shù)cp。(單項選擇題學生可能隨機猜測,此公式能排除這種影響)試題難度系數(shù)與試題實際難易程度正好相反,越大表示能夠正確解答該題的學生越多試題越容易,而越小則試題越難。一般認為,難度適中更能客觀地反映出學生的學習效果情況,多數(shù)試題應分布在0.3~0.7之間,選拔性測試為0.5左右為宜,通常期末考試為目標參照性考試,可適當偏高,全卷平均難度以0.7左右為宜,0.6~0.8為正常。
根據(jù)上表,很容易得到各個部分的難度系數(shù),如下所示。
各個部分的難度系數(shù)
注:q2的難度系數(shù)為矯正難度系數(shù) 4.區(qū)分度分析
對于客觀題來說,使用等級相關分析,在此使用斯皮爾曼(Spearman)等級相關分析。對于主觀題來說,樣本數(shù)為47,大于30,可以看成非等間距測度的連續(xù)變量,在此采用皮爾遜(Pearson)相關分析對試題進行分析。
具體操作如下:Analyze→Correlate→Bivariate。在彈出對話框中選擇各個客觀題題號變量和總成績進入Variables,然后在Correlation Coefficients中單擊Spearman,完成后即可得到客觀題的區(qū)分度。主觀題的區(qū)分度分析方法同上,只需選擇主觀題和總成績進入,然后選擇Pearson即可。得到每個部分的區(qū)分度,見下圖:
各個部分的區(qū)分度
三、分析結果
(1)基本描述統(tǒng)計數(shù)據(jù)上來看,學生總數(shù)為47人,無人缺考,學生的的卷面總成績平均分為82.83分,最高分為99分,最低分為59分,分數(shù)極差為40分,標準差為10.538,標準差比較大,說明學生個體間存在較大的差異,主要影響因素是他們?nèi)雽W時學歷結構、上課聽講、作業(yè)完成、課后復習等。對一部分后進學生,在今后的教學過程中應當充分關注,努力調(diào)動他們的學習積極性,經(jīng)常鼓勵他們,從而達到提高學習成績的目的。(2)從難度上來看,第二題(0.983)、第三題(0.996)難度系數(shù)過大,說明此題出的太容易,建議此題不宜進入題庫,在修改后參加下一輪的遴選。(3)從區(qū)分度上來看,除了第二題、第三題區(qū)分度較低,其余都比較好,基本達到了考試要求。
四、成績考試的信度分析[4]
“考試信度對于任何一種有效考試來說都是必不可少的,只有信度高的考試才能使教師對學生的評價客觀、可靠,考試成績才能正確地反映被試者的程度”。[5]教育測量學、教育統(tǒng)計學在理論上為考試的科學化和現(xiàn)代化奠定了基礎,使得考試分析數(shù)量化,而SPSS統(tǒng)計軟件又使廣大教師使用計算機進行學業(yè)成績考試信度的定量分析成為可能。
(一)考試分數(shù)的信度系數(shù)
衡量一次考試的可靠性指標叫做信度,表明信度大小的量叫做信度系數(shù)。雖然教育測量和統(tǒng)計書上介紹計算考試分數(shù)的信度系數(shù)有多種方法,但因為學科或?qū)W業(yè)成績考試具有一般不進行前測和復測的特點,且試題多含有主觀題,因而Cronbach’s α系數(shù)是最適合學科考試的信度分析。因為Cronbach’s α系數(shù)不僅適合主觀題,也可以用于多項選擇題等客觀試題。
下面我們以我校外語學院語音考試題考試題為例介紹用Spss進行信度分析的步驟。
1.Cronbach’s Alpha系數(shù)的計算步驟
步驟1:選擇信度分析程序。在數(shù)據(jù)編輯窗口中單擊Analyze打開下拉菜單,選擇Reliability Analysis??程序,進入信度分析主對話框。
步驟2:選擇要進行分析的原始變量。在信度分析主對話框中選擇第1-5題共五個變量,單擊右向箭頭將其移入Items方框中。在Model的下拉菜單中選擇Alpha模型,即表示希望獲得Cronbach’s Alpha系數(shù)。在信度分析主對話框點擊Statistics按鈕,進入定義信度分析統(tǒng)計量對話框。
步驟3:在定義信度分析統(tǒng)計量對話框Descriptives for 中勾選Scale ifitem deleted復選項,表示要求在輸出結果中顯示刪除各個項目之后的系數(shù)變化情況。然后點擊Continue按鈕,回到信度分析主對話框,并點擊OK提交系統(tǒng)運行,出現(xiàn)運行結果。
2.信度系數(shù)輸出結果及說明
按照上述參數(shù)設置,Spss軟件在輸出信息觀察窗口輸出一個表格(表1)。該表報告了“語音聽力考試成績”各題的信度分析結果。表首為分析方法,意為選擇了Alpha模型。表中的第1欄為變量,是語音聽力考試的五道大題。第二欄為刪除該項目后試題的平均值。第三欄為刪除該項目后試題的方差。第四欄為該項目與試題總分的相關系數(shù),相關系數(shù)較低的項目往往是有問題的試題。例如表中第5題與試題的相關系數(shù)僅為.2854,說明該題應該修改或刪除。
最后一欄為刪除其中某個項目后考試題的Alpha系數(shù)變化情況,該欄在檢驗信度差的試題方面很有用。如果刪除某一道試題后的Alpha系數(shù)比試題的信度系數(shù)大,則可考慮將該題刪除。本例中刪除第5題后,信度系數(shù)將由原來的.7491提高到.7819,由此我們可以從提高信度系數(shù)的角度,確認該題應該修改或刪除。
Cronbach’s Ahlha系數(shù)介0-1之間,系數(shù)越高,說明試題的內(nèi)在一致性越強,測試的結果越可靠。通常自編考試的Cronbach’s Ahlha系數(shù)“要求0.60-0.80之間,而標準化考試則要求在0.90以上”。[6]本例的信度系數(shù)為.7491,因此我們可以得出信度較好的結論。
二、考試分數(shù)的正態(tài)分布檢驗
李筱菊認為考試“分數(shù)拉開距離,它們的分布才可能正態(tài)。分數(shù)分布正態(tài),說明它反映了人的能力分布實況,說明考試有信度?!盵7]因此,我們除了使用信度系數(shù)還可使用考試成績正態(tài)分布的數(shù)據(jù)及分布圖來測量和檢驗信度。
考試分數(shù)是否服從正態(tài)分布,可以用曲線圖來觀察,也可以計算偏態(tài)值和峰值的方法來確定。
1.正態(tài)分布圖表的制作方法
步驟1:在Spss數(shù)據(jù)編輯視窗,點擊Analyze命令,Descriptive Statistics在下拉菜單中選擇Frequencies?,打開頻數(shù)直方圖編輯對話框。
步驟2:在頻數(shù)分析主對話框中左邊變量列表中選擇第1-5題和總分共六個變量,點擊向右箭頭將其移入Variable::(變量)下白方框中,然后點擊Statistics ?按鈕,進入頻數(shù)分析數(shù)據(jù)編輯子對話框。選擇Display normal curve,表示同時顯示正態(tài)分布曲線。
步驟3:在頻數(shù)分析數(shù)據(jù)編輯子對話框中Distribution.中選擇Skewness和Kurtosis,表示要求計算正態(tài)值與峰值。點擊Continue返回頻數(shù)分析主對話框,單擊Options?按鈕,進入圖形選項對話框。
步驟4:在頻數(shù)分析圖形選項子對話框中Chart Type下選擇Histograms(單選項,表示要求輸出直方圖,并選擇With normal curve復選項,表示要求輸出的直方圖帶正態(tài)分布曲線。點擊Continue按鈕返回到主對話框,單擊Ok按鈕提交系統(tǒng)運用。
2.正態(tài)分布圖及解釋
按上述參數(shù)設置,Spss共在輸出信息觀察窗口輸出6幅圖形與7個表格(其中6個表格是6個變量的頻數(shù)分布表)。我們只以其中一幅圖形和描述統(tǒng)計表格為例介紹報告結果的含義及解釋。
考試分數(shù)是否服從正態(tài)分布,可以通過帶正態(tài)分布曲線直方圖來觀察。直方圖是以長方形面積表示頻數(shù)分布的一種圖形,它的長度和寬度均有意義,而且由于數(shù)據(jù)值具有連續(xù)性,所以各長方形須相連排列。圖中的頂點是平均成績。直方圖中的曲線稱分布曲線。正態(tài)分布曲線是中間高、兩邊低且左右對稱的曲線。曲線的最高峰,即頻數(shù)最多處,是曲線的中間位置。這一位置的分數(shù)正好是分數(shù)的平均值。由于帶正態(tài)分布曲線的次數(shù)直方圖具有以上特點,所以可以直觀地確定分數(shù)分布是否服從正態(tài)分布。
3.正態(tài)分布表及結果解釋
表2是該考試五道大題和總分共六個變量的偏態(tài)值和峰值描述統(tǒng)計表。表中第一行為變量名;第二行N Valid為參加考試的有效學生人數(shù);第三行為缺考人數(shù)(Missing);第四行為偏態(tài)值(Skewness);第五行是峰值(Kurtosis)。
偏態(tài)值和峰值為0時表示完全正態(tài),偏態(tài)值的正、負表示正、負偏態(tài)。峰值的正負表示峰的“高瘦”(分數(shù)集中)和“矮平”(分數(shù)分散)。
偏態(tài)值如表2第三行所示,本例中單詞聽寫、短文聽寫和聽對話簡答三題的偏態(tài)值均為負數(shù),是負偏態(tài),表示這三題分數(shù)分布偏向了右邊,也就是偏向了高分,得分高于平均分的人數(shù)超過50%。而聽句子簡答、短文聽力理解和總分三個變量的偏態(tài)值均為正數(shù),即正偏態(tài),表示分數(shù)分布偏向了左邊,也就是偏向了低分,得分低于平均分的人數(shù)超過了50%。
峰值如表2第四行所示,本例中單詞聽寫、聽對話簡答和總分的峰值為正數(shù)。表示峰比理想正態(tài)分布的峰高尖,也就是分數(shù)過分集中在中分段。而短文聽寫、聽句子簡答和短文聽力理解三個變量的峰值為負數(shù)。表示這三個變量的峰比理想正態(tài)分布峰矮平,也就是分數(shù)過分散開。
表2 偏態(tài)值及峰值描述統(tǒng)計表
“一般說一個考試偏態(tài)值和峰值能控制在±1之內(nèi),便算其分數(shù)基本符合正態(tài)分布”。[8]因此,我們可以得出結論:語音聽力部分考試的五道大題和總分基本符合正態(tài)分布,這份試題總體信度較好。
綜上所述,本文為不太熟悉數(shù)理統(tǒng)計的廣大教師介紹了用Spss軟件計算Cronbach’s Alpha系數(shù)和正態(tài)分布檢驗學業(yè)成績考試信度的方法,從而使我們可以較好地測量出考試成績是否正確反映了學生的學習程度,考試對教學的評價是否可靠。再用信度檢驗數(shù)據(jù)查找出影響信度的試題、修改提高試題質(zhì)量,這對發(fā)揮考試評價教學的作用和改進教學效果、提高教學質(zhì)量無疑是很有好處的。
參考文獻:
[1]樓裕勝.學生成績的統(tǒng)計分析[D].杭州:浙江金融職業(yè)學院,2007.[2]李良.巧用Excel和SPSS軟件分析考試成績[J].金華職業(yè)技術學院學報.2008年4月.第8卷第2期.[3] 王雪、鄧振偉、陳玲、田七.SPSS軟件在試卷質(zhì)量分析中的應用[N].讀與寫雜志.2009年3月.第6卷第3期.[4] 秦志強、賈真真.學業(yè)成績考試的信度分析[J].教育理論與實踐.2006年第26卷第7期.第4-6頁.[5]鄒申,楊任明.簡明英語測試教程[M].北京:高等教育出版社,2000.[6]宋兆鴻,劉世表,張才美,張國華,張頌增,彭成獎等.現(xiàn)代教育測量[M].北京:教育科學出版社,1986.[7][8]李筱菊.語言測試科學與藝術[M].長沙:湖南教育出版社,1997.