第一篇:引言評價學(xué)生學(xué)習(xí)狀況的目的是激勵優(yōu)秀學(xué)生努力學(xué)習(xí)取得更好的成績
引言評價學(xué)生學(xué)習(xí)狀況的目的是激勵優(yōu)秀學(xué)生努力學(xué)習(xí)取得更好的成績,同時鼓勵基礎(chǔ)相對薄弱的學(xué)生樹立信心,不斷進步。教育論文發(fā)表網(wǎng)分享。
然而,現(xiàn)行的評價方式單純的根據(jù)“絕對分數(shù)”評價學(xué)生的學(xué)習(xí)狀況,忽略了基礎(chǔ)條件的差異;只對基礎(chǔ)條件較好的學(xué)生起到促進作用,對基礎(chǔ)條件相對薄弱的學(xué)生很難起到鼓勵作用。
附件給出了612 名學(xué)生連續(xù)四個學(xué)期的綜合成績。
請根據(jù)附件數(shù)據(jù),對這些學(xué)生的整體情況進行分析說明;請根據(jù)附件數(shù)據(jù),采用兩種及以上方法,全面、客觀、合理的評價這些學(xué)生的學(xué)習(xí)狀況;試根據(jù)不同的評價方法,預(yù)測這些學(xué)生后兩個學(xué)期的學(xué)習(xí)情況。
.學(xué)生成績總體分析學(xué)生成績統(tǒng)計分布分析對各學(xué)生的原始成績進行描述統(tǒng)計分析[1,2,3],獲取學(xué)生總體數(shù)據(jù)分布信息,如表1 所示。
從分析結(jié)果可知學(xué)生共有612 人,四個學(xué)期的成績數(shù)據(jù)均沒有缺失。四個學(xué)期的平均成績均在73.5 分左右,中位數(shù)(成績排名處于第306 位學(xué)生的成績)均在75 分左右,且最高分沒有明顯變化,均約90 分。而最小值在第2、4 學(xué)期出現(xiàn)了0 分,導(dǎo)致第2、4 學(xué)期的極差變大為90 分。標準差表示學(xué)生成績分布頻率下降到一半時的成績寬度,均在10 分左右,說明四個學(xué)期的成績分布集中在68.5~78.5 分。從百分比可以看出50%以上的學(xué)生成績在約75 分以上。偏度值均為負值說明該分布為非正態(tài)分布并且偏度絕對值越來越大,說明偏離正態(tài)分布越嚴重,一方面表明評價體系難度減弱,另一方面還可能由于學(xué)生的整體水平的上升而導(dǎo)致的。峰度值均為正值,同時隨著學(xué)期的增長越來越大,說明其尾部越來越粗,表明學(xué)生在高成績部分分布數(shù)量增多。同時為了直觀的說明成績的偏態(tài)分布,對成績分布進行頻次分析,如圖1 中直方圖所示。其中實線表示正態(tài)分布曲線。中四個學(xué)期的成績頻次直方圖均明顯偏離正態(tài)分布曲線。
分別采用One-Sample K –S 檢驗法和箱式檢驗法檢驗成績分布是否為正態(tài)分布[4,5]。表2 中列出了One-Sample K –S 的檢驗結(jié)果。該表輸出了指定檢驗變量的正態(tài)參數(shù),包括平均數(shù)與標準差、極端差的最大絕對值、正值及負值、K-SZ 值、雙側(cè)檢驗的顯著性水平。由于漸進方法所檢驗的顯著性水平小于0.05,所以變量學(xué)期1~學(xué)期4 的成績并非來自正態(tài)分布的總體。箱式圖中方框內(nèi)的區(qū)域表示變量中間50%的觀測值,方框的上下邊線分別為上四分位數(shù)和下四分位數(shù)。方框中的橫線(粗黑橫線)為中位數(shù),方框之外的上下兩條細橫線稱為須線,是除了離群值和極值之外的最大值和最小值。從圖2 看出方框不居中而是偏上,進一步說明學(xué)期1~4 的成績符合負偏態(tài)分布。而且離群值的位于下須線之下,說明每學(xué)期都有部分學(xué)生成績偏離總體水平。為此成績偏低尤其是多個學(xué)期成績偏低的學(xué)生應(yīng)當引起更多的關(guān)注,例如其中學(xué)號為141 的學(xué)生在學(xué)期1、2 中成績均偏低,學(xué)號為222 的學(xué)生在第2、3 學(xué)期中成績偏低。
學(xué)生成績負偏態(tài)分布的合理性學(xué)生學(xué)習(xí)成績正態(tài)分布被普遍認為是成績測量和評定的一條原則。如果一個班或一組學(xué)生的成績呈正態(tài)分布,往往被管理者和教師本人認可[6]。相反,如果呈現(xiàn)正偏態(tài)分布(低分的人相對很多)或者負偏態(tài)分布(高分的人數(shù)相對很多),管理者和教師本人往往會認為其中有問題。成績正態(tài)分布絕對化觀點排斥成績負偏態(tài)分布的合理性,對提高教學(xué)質(zhì)量是不利的。
因為教學(xué)是一種有計劃有目的的人為活動,在教學(xué)互動過程中師生的能動作用可以改變學(xué)生個體之間的差異狀態(tài)。例如,在一個班級中,原本落后的學(xué)生通過教學(xué)活動可能縮短與優(yōu)秀學(xué)生的差距,也可能趕上中間的學(xué)生甚至優(yōu)秀的學(xué)生。不能機械地要求考試一定要獲得一個正態(tài)分布的結(jié)果[7]。美國教學(xué)論專家布盧姆(B.S.Bloom)認為,能力傾向的個體差異與成績的差異沒有必然的聯(lián)系,能力差異只說明學(xué)生所需的學(xué)習(xí)時間量的差異[8]。布盧姆認為,學(xué)習(xí)時間能夠補償能力傾向的不足,這與我國俗語“勤能補拙”是一個意思。學(xué)生能力的正態(tài)分布并不必然導(dǎo)致成績的正態(tài)分布,道理就在于教師和學(xué)生的人為的能動作用改變了成績分布模型。
成績負偏態(tài)分布的合理性在于兩個前提條件:一是教學(xué)目標具有合理的難度;二是考核體系具有合理的難度。根據(jù)合理的教學(xué)目標設(shè)計的合理的考核體系是成績負偏態(tài)的合理前提。
成績評價模型統(tǒng)計評價模型為了激勵優(yōu)秀學(xué)生努力學(xué)習(xí)取得更好的成績,同時鼓勵基礎(chǔ)相對薄弱的學(xué)生樹立信心,不斷進步,有必要將負偏態(tài)分布的學(xué)生成績通過數(shù)學(xué)手段變換為正態(tài)分布,這樣使得學(xué)生之間成績的差距分布更為合理,原來成績偏低的學(xué)生經(jīng)過變換后將處于中等位置,這些人會得到適當?shù)墓膭?,改變了負偏態(tài)分布中大部分學(xué)生的成績集中分布在高分段的現(xiàn)象[9]。變換成正態(tài)分布后,還會對后續(xù)的聚類分析模型和標準化成績模型中的數(shù)據(jù)處理帶來極大的方便。
由于每個學(xué)期的評價體系存在一定的波動,例如考核中不可避免的難易程度的變化等因素會使各學(xué)期之間的同一學(xué)生成績?nèi)鄙僖欢ǖ谋容^性。例如某學(xué)生第一學(xué)期的成績?yōu)?2 分,排名103 位。而第二學(xué)期為85 分,但是考慮到總體情況,第二學(xué)期考核偏易,排名112 位,導(dǎo)致該學(xué)生排名比第一學(xué)期下滑。為了消除這些學(xué)期之間的差異,為此將正態(tài)分布再經(jīng)過變換為標準正態(tài)分布,使得同一學(xué)生在不同學(xué)期的成績具有更可靠的可比性。后續(xù)的聚類評價和成績標準化評價模型中均采用標準正態(tài)分布變換后的學(xué)生成績即“有效成績”進行處理。為原始成績變換后得到的的成績(由于篇幅有限成績列表均只列出部分成績)。為描述統(tǒng)計分析結(jié)果??梢钥闯鲎儞Q數(shù)據(jù)量沒有損失,但是偏度仍為負值,然而其絕對值很小。從頻次直方中可以看出基本符合正態(tài)分布。為了進一步驗證成績分布是否為正態(tài)分布,采用正態(tài)分布Q-Q 檢驗圖和無趨勢正態(tài)分布Q-Q 檢驗圖進行分析。
所示為四個學(xué)期的正態(tài)Q-Q 檢驗圖。從圖中可以看出實際觀測值與期望值為坐標的點幾乎全部落在趨勢線上。在無趨勢正態(tài)分布Q-Q,在中央橫線的一段,坐標點落在中央橫線附近,在中央橫線的兩端則有一定的偏離,但絕大部分偏離值均小于0.05。僅有個別點偏離較大??梢?,學(xué)期1~4 的成績呈現(xiàn)正態(tài)分布。
聚類評價子模型聚類分析將個體或?qū)ο蠓诸?,使得同一類中的對象之間的相似性比與其他類的對象的相似性更強。目的在于使類間對象的同質(zhì)性最大化和類與類間對象的異質(zhì)性最大化。聚類分析是將統(tǒng)計方法引入到分類學(xué)中產(chǎn)生的一個重要分枝。按成績對學(xué)生群體進行評估分類,是對學(xué)生因材施教、獎優(yōu)汰劣的重要依據(jù)也是在就業(yè)市場中衡量學(xué)生的砝碼[10 ,11]。用聚類分析法對學(xué)生成績進行評估,使分類結(jié)果更加客觀、全面。
由標準成績的定義可知,標準成績是以全體學(xué)生的每學(xué)期的平均成績?yōu)楸容^基準,以標準差為基本單位。標準成績的取值可正可負,若為正,這說明該學(xué)生該項的水平在總體水平之上,若為負,說明該學(xué)生該項的水平在總體水平之下。
標準分數(shù)是自由度為n ?1的t分布的隨機變量取i T 的下側(cè)概率值(為了與通常的百分制相比較,在定義時把下側(cè)的概率值擴大100 倍)。這樣可以直觀地反映一個學(xué)生在整體中成績的地位。例如,一個學(xué)生的得分為75,則說明有75%的學(xué)生的成績在他之下。若有名學(xué)生,這說明該學(xué)生在總體中的水平大約在612×25%?1=152名,所以標準成績是以該生在總體中的名次來制定。
根據(jù)上述模型得到的學(xué)生標準分成績?nèi)绫? 所示。此時標準分能反映出該學(xué)生的排名分布,排名只能表明該生在群體中所處的相對位置,但是不能表明該生實際的水平。例如,排名12,有效成績1.9,B 排名13 有效成績1.6。雖然排名相近但實際水平相差卻比較大。
對于每個學(xué)期的成績并且在表中計算出了四個學(xué)期的平均標準成績。平均標準成績能夠反映出學(xué)生4 個學(xué)期的總體情況,卻不表現(xiàn)出成績的動態(tài)變化情況。當某生僅某一學(xué)期年成績偏低或偏高時對平均成績影響較大。為了進一步反映學(xué)生成績的動態(tài)變化建立了動態(tài)分析模型。3.2 動態(tài)成績評價模型為了全面、客觀的評價學(xué)生的學(xué)習(xí)狀況,激勵優(yōu)秀的學(xué)生努力取得更好的成績,同時鼓勵基礎(chǔ)較薄弱的考生樹立信心,不斷進步,那么需要在考生每次考試的“絕對分數(shù)”基礎(chǔ)上,還要考慮基礎(chǔ)條件的差異[13 ,14]。也就是說不僅要考慮該考生這次的“絕對分數(shù)”,還要看他和上次相比,是進步了還是退步。兩方面都要考慮,最后的分數(shù)應(yīng)該是兩者的加權(quán)和。比如兩個人如果都考了80 分,而第一個人上次考了85 分,第二個人上次考了75 分,那么應(yīng)鼓勵第二個人,所以后者的最終分數(shù)要比前者高。具體方法可如下:
第i 個學(xué)生當學(xué)期(第j 學(xué)期)的綜合成績?yōu)樯弦粚W(xué)期成績?yōu)?,則本學(xué)期的動態(tài)成績?yōu)棣?ω× + ? × ? ×其中ω 為加權(quán)因子。此外還有種極端情況是上學(xué)期成績?yōu)?,即除數(shù)為0,此時只考慮絕對分數(shù)。如果本學(xué)期成績?yōu)?,那么也只考慮絕對分數(shù),不能出現(xiàn)負分數(shù)。加權(quán)因子越大,成績的變化對動態(tài)成績的影響越大。
與第一種方法類似,和以前的成績比較時,不是單純的考慮上一次的成績,而是前幾次成績的平均值,表示。
將4個學(xué)期原始成績經(jīng)過A模型運算得到,而采用B模型得到。其中ω = 0.9。
當因子過大時成績的變化引起的動態(tài)成績的變化會增大,因子過小又體現(xiàn)不出成績的動態(tài)變化的影響,因此加權(quán)因子的選取要合理。對綜合成績進行頻次分析可知,每個學(xué)生的成績采用方法A,B 評價得到的動態(tài)成績會有所不同,但是并不影響總體學(xué)生成績的分布狀態(tài)。
成績預(yù)測模型線性回歸預(yù)測模型通過 Speaman 等級相關(guān)系數(shù)顯著性檢驗分析得到表12,相關(guān)系數(shù)均大于0.5,說明不同學(xué)期之間的成績具有高相關(guān)度。表明可以進行線性回歸預(yù)測。
即采用前3 個學(xué)期的成績線性加權(quán)求和得到第4個學(xué)期成績的預(yù)測值,通過最小二乘擬合求解系數(shù)a,b, c, d。取j = 5,可以預(yù)測出第5 學(xué)期的成績,同理進而可預(yù)測出第6 學(xué)期的成績。表13 給出了最小二乘法求解得到的a,b, c, d 值及標準差。系數(shù)值依次遞減,說明第4 學(xué)期的成績受第3學(xué)期影響最大,隨時間差的增大,影響力減小。而圖8 中給出了采用前三學(xué)期原始成績預(yù)測的第四學(xué)期成績的殘差,可見大部分預(yù)測值與真實值之間的偏差小于10 分,對于成績較差的學(xué)生預(yù)測的偏差較大。給出了根據(jù)上述模型預(yù)測的第5 和第6 學(xué)期的學(xué)生成績,圖9 給出了第5、學(xué)期的頻次分布直方圖,仍然滿足負偏態(tài)分布。通過對這兩個學(xué)期的描述統(tǒng)計分析如表所示,相對于前4 個學(xué)期平均成績有所提高,并且標準差下降到8.4,表明更多的人集中在了平均分附近。偏度與第4 學(xué)期相近,是由于此學(xué)期對后兩個學(xué)期預(yù)測值的影響最大。
成績預(yù)測模型灰色模型法由于具有所需數(shù)據(jù)少、計算量小的優(yōu)點而得到了廣泛的應(yīng)用。部分信息已知、部分信息未知的系統(tǒng)稱為灰色系統(tǒng),灰色系統(tǒng)理論是企業(yè)界較實用的一種預(yù)測方法[15]?;疑到y(tǒng)理論把一切隨機過程看作是在一定范圍內(nèi)變化的、與時間有關(guān)的灰色過程,將離散的原始數(shù)據(jù)整理成具有規(guī)律性的生成數(shù)列,然后再進行研究。對灰色過程建立的模型稱為灰色模型,即GM[16]。GM(1,1)是最常用、最簡單的一種灰色模型,它是由一個只包含單變量的微分方程構(gòu)成的模型,是GM(1,N)的一個特例。
對原始成績經(jīng)過檢驗滿足一級精度,根據(jù)上述模型對第5,6 個學(xué)期進行預(yù)測并經(jīng)過動態(tài)成績評價模型評價得到表16 中的數(shù)據(jù),對于大部分成績的可靠性能夠接受,相對于前四個學(xué)期,成績分布仍比較穩(wěn)定。而對于學(xué)號為8 的學(xué)生成績出現(xiàn)了0 值,是因為其第3 學(xué)期成績?yōu)?5.9,而第4 學(xué)期成績16.5,變化很大,而GM(1,1)法基于一階微分方程預(yù)測因此得到0 值,而對611 號預(yù)測第6 學(xué)期的成績經(jīng)動態(tài)成績評價B 模型分析為100.97,超過了滿分,是因為在最小二乘法求解系數(shù)a,u 是用到了矩陣的逆運算,而對于近奇異的矩陣出現(xiàn)了解的不精確性。再經(jīng)過動態(tài)評價模型處理可能會超過滿分。
結(jié)論采用描述統(tǒng)計的方法對學(xué)生成績的總體分布分析時,發(fā)現(xiàn)成績分布為非正態(tài)分布,并且用One-Sample K –S 檢驗法和箱式圖檢驗法對其分布進行驗證,分析結(jié)果表明該分布滿足負偏態(tài)分布的特點,確定為負偏態(tài)分布,并且對學(xué)生成績呈現(xiàn)負偏態(tài)分布的合理性做了定性分析。
在建立評價模型過程中,分別建立了統(tǒng)計評價模型和動態(tài)成績評價模型對學(xué)生成績進行評價。在統(tǒng)計評價模型中,采用數(shù)學(xué)手段將負偏態(tài)分布變換為正態(tài)分布,并且用正態(tài)分布檢驗圖和無趨勢正態(tài)分布Q-Q 檢驗圖對其進行了驗證。為了消除每個學(xué)期評價考核體系的不穩(wěn)定性因素的影響,提出了“有效成績”的概念,即將正態(tài)分布歸一化為標準正態(tài)分布,得到每個學(xué)生各學(xué)期的“有效成績”。在此基礎(chǔ)上建立了兩種評價子模型:
1、聚類評價子模型,用此模型將612 名學(xué)生分成5 類。其中第一類19 人成績均偏低為重點關(guān)注對象,基礎(chǔ)較差,四個學(xué)期成績沒有大的進步甚至變差。對這些學(xué)生要鼓勵為主,同時應(yīng)積極引導(dǎo)可以采用個別輔導(dǎo)的辦法幫助提升成績。第二類學(xué)生95 人成績一直保持優(yōu)秀,對這些學(xué)生要適當?shù)莫剟?。? 類學(xué)生131 人集中在及格邊緣,從各學(xué)期的成績比較可知該類學(xué)生成績有明顯的進步,但是如不注意個人的努力成績會下滑而不及格。第4 類學(xué)生和第5 類學(xué)生人,成績比較穩(wěn)定,原始成績在70~80 之間,構(gòu)成了有效成績頻次分布的中心部分。他們成績的波動對總體成績的分布有很大的影響,代表著該群體的整體水平。
2、成績標準化子模型,得到每個學(xué)生各學(xué)期的標準分,此時標準分能反映出該學(xué)生的排名分布,排名只能表明該生在群體中所處的相對位置,但是不能表明該生實際的水平。而平均標準成績能夠反映出學(xué)生4 個學(xué)期的總體情況,卻不表現(xiàn)出成績的動態(tài)變化情況。為了進一步反映學(xué)生成績的動態(tài)變化建立了動態(tài)分析模型。考慮到學(xué)生成績隨學(xué)期的增減情況建立動態(tài)成績評價模型,并且針對每個學(xué)生分別采用兩種不同的表述方法獲得該生各學(xué)期的“動態(tài)成績”。但是動態(tài)成績依賴于權(quán)重因子,因子的賦予含有主觀意愿。
通過相關(guān)分析驗證了建立線性回歸預(yù)測模型的可行性,通過線性回歸模型預(yù)測了第和第6 學(xué)期每個學(xué)生的成績,并對成績的分布做了描述統(tǒng)計分析,結(jié)果表明與前四個學(xué)期具有類似的負偏態(tài)分布,各參數(shù)差異不大,證明了該模型的可靠性。此外還建立了成績預(yù)測模型,并對預(yù)測的成績進行了動態(tài)成績評價與分析??傊?,分析結(jié)果表明上述評價模型建立是合理的,可以考慮綜合運用以上模型能夠?qū)W(xué)生成績進行合理、客觀、全面和有效的地分析與預(yù)測。