第一篇:SAS復(fù)習(xí)資料
SAS復(fù)習(xí)資料 2013.6.20
說明:根據(jù)老師給的Html版整理,如有錯誤、遺漏敬請原諒,并及時指出,進(jìn)行改正。謝謝!
1.研究因子:對試驗指標(biāo)有影響的,在試驗中需要加以考察的條件。2.小機率原理:概率很小的事件,在一次試驗中是不至于發(fā)生的。3.重復(fù):每個參試的品種或處理占有兩個或兩個以上的小區(qū)稱有重復(fù)。
4.局部控制:通過對小區(qū)的合理安排,把試驗誤差控制在一個局部的范圍內(nèi)。5.試驗指標(biāo):試驗中用來衡量試驗效果的量。
6.復(fù)因子試驗:包含兩個或兩個以上的因子的試驗。7.集團(tuán)(總體):根據(jù)研究目的確定的,凡符合指定條件的全部觀察對象。8.偶然誤差(機誤):由于機會不等所造成的偏差。9.可量資料:能夠以測量、稱量的方法表示的資料。10.正交互作用(正連應(yīng)):某些因子綜合起來的效果大于這些因子單獨作用的效果之和。1.進(jìn)行隨機區(qū)組的統(tǒng)計分析,需用何種方差分析?:雙方面分類的方差分析 2.進(jìn)行拉丁方的統(tǒng)計分析,需用何種方差分析?:三方面分類的方差分析 3.進(jìn)行雙方面分類的方差分析,總平方和分解為多少部份?:三部分 4.進(jìn)行三方面分類的方差分析,總平方和分解為多少部份?:四部分
5.兩因素(含交互作用)的方差分析,處理組合平方和應(yīng)分解為多少部份?:四部分 6.三因素(含一級交互作用)的方差分析,處理組合平方和應(yīng)分解為多少部份?:七部分 7.在幾種常用的試驗設(shè)計方法中,哪種精確度較高?:拉丁方 8.隨機區(qū)組設(shè)計的誤差自由度等于多少?:(m1)9.拉丁方設(shè)計的誤差自由度等于多少?:(n2)10.只有重復(fù)而末實行局部控制的試驗,應(yīng)采用何種方差分析?:單方面分類的方差分析 1.樣本標(biāo)準(zhǔn)差的功用?:反映樣本的變異程度
2.樣本平均數(shù)標(biāo)準(zhǔn)差(標(biāo)準(zhǔn)誤)的功用?:反映在同一個總體進(jìn)行抽樣,所得的樣本平均數(shù)間的差異,即抽樣誤差。
3.變異系數(shù)的功用?:用作兩類事物的變異程度作比較
4.樣本平均數(shù)的功用?:指示資料的中心位置,反映資料的一般質(zhì)量水平,作為代表值同其它資料比較
5.協(xié)方差分析的功用?:用處理前的數(shù)據(jù)(基數(shù))矯正處理后的數(shù)據(jù),提高分析的精確度。6.樣本均數(shù)差異顯著性測驗的功用?:在一定的概率保證下,判斷事物間有否本質(zhì)差異 7.總體均數(shù)區(qū)間估計的功用?:通過抽樣,由樣本的情況估計未知總體平均數(shù)的數(shù)值范圍 8.在試驗設(shè)計中,局部控制的作用?:減少試驗誤差
9.在試驗設(shè)計中,重復(fù)的作用?:減少試驗誤差,估計試驗誤差,擴大試驗的代表性 10.在試驗設(shè)計中,隨機排列的功用?:正確估計試驗誤差 1.何謂試驗指標(biāo)?:在試驗中用來衡量試驗效果的一個量
2.什么叫保護(hù)行?:防止試驗材料受外來因素和周邊環(huán)境影響作物行
3.某個復(fù)因子試驗的處理組合數(shù)應(yīng)如何計算?:等于有關(guān)因子的水平數(shù)乘積 4.在常用的試驗設(shè)計中,哪種設(shè)計方法的精確度最高?:拉丁方 5.在常用的試驗設(shè)計中,哪種設(shè)計方法的精確度最低?:間比法 6.試驗設(shè)計三大原則是什么?:重復(fù),局部控制,隨機排列
7.作改良對比法設(shè)計時,參試的品種或處理數(shù)一般不大于多少?:不受限制 8.作隨機區(qū)組設(shè)計時,參試的品種或處理數(shù)一般不大于多少?:不大于18 9.作配對法設(shè)計時,參試的品種或處理數(shù)一般不大于多少?:兩個
10.作拉丁方設(shè)計時,參試的品種或處理數(shù)一般不大于多少?:不大于8 1.某個因子的自由度等于多少?:等于該因子的水平數(shù)減1 2.某兩因子試驗中,其交互作用的自由度等于多少?:等于有關(guān)因子的自由度的乘積
3.一可量資料樣本均數(shù)與總體均數(shù)差異顯箸性進(jìn)行t檢驗時,其自由度為多少?:等于樣本含量數(shù)-1 4.正交表的總自由度等于多少?:等于參試的處理組合數(shù)-1 5.作回歸關(guān)系顯著性測驗時,回歸項的自由度等于多少?:等于自變量的個數(shù) 6.作簡單相關(guān)系數(shù)顯著性測驗時,DF等于多少?:等于N-2 7.2*2聯(lián)卡平方測驗時,DF等于多少?:1 8.兩個配對法設(shè)計的可量資料樣本均數(shù)差異顯箸性進(jìn)行t檢驗,其自由度為多少?:試驗資料的配對數(shù)-1 9.2*J聯(lián)卡平方測驗時,其自由度為多少?:J-1 10.作拉丁方設(shè)計時,參試的品種或處理數(shù)一般不大于多少?:2 1.SS:平方和 2.N(0,1):標(biāo)準(zhǔn)正態(tài)分布 3.μ:總體平均數(shù)
4.CLM:平均數(shù)的置信區(qū)間 5.∑X :總和
6.VIF:方差膨脹因子 7.MSE:誤差均方 8.DF :自由度 9.CV:變異系數(shù) 10.V:方差
1.欲進(jìn)行聚類統(tǒng)計分析,需調(diào)用SAS系統(tǒng)的何種過程?:Proc cluster 2.欲進(jìn)行回歸統(tǒng)計分析,需調(diào)用SAS系統(tǒng)的何種過程?:Proc reg 3.欲進(jìn)行方差統(tǒng)計分析,需調(diào)用SAS系統(tǒng)的何種過程?:Proc anova 4.欲進(jìn)行因子統(tǒng)計分析,需調(diào)用SAS系統(tǒng)的何種過程?:Proc factor 5.欲進(jìn)行典型相關(guān)統(tǒng)計分析,需調(diào)用SAS系統(tǒng)的何種過程?:Proc cancorr 6.欲進(jìn)行基本統(tǒng)計量統(tǒng)計分析,需調(diào)用SAS系統(tǒng)的何種過程?:Proc means 7.欲進(jìn)行主成分分析,需調(diào)用SAS系統(tǒng)的何種過程?:Proc princomp 8.欲進(jìn)行成組法T測驗,需調(diào)用SAS系統(tǒng)的何種過程?:Proc ttest 9.欲進(jìn)行正態(tài)分布檢驗,需調(diào)用SAS系統(tǒng)的何種過程?:Procunivariate 10.欲進(jìn)行作相關(guān)點式圖,需調(diào)用SAS系統(tǒng)的何種過程?:Proc plot 1.單因子隨機區(qū)組的方差分析模型(MODEL)是:Y=BLOCK T 2.單因子隨機區(qū)組協(xié)方差分析的模型是(MODEL):Y=BLOCK T X 3.三元線性回歸分析的模型是(MODEL):Y=X1 X2 X3 4.單方面分類的方差分析模型(MODEL)是:Y=T
5.兩個因子變量的反應(yīng)面分析的模型(MODEL)是:Y=X1 X2
6.單因子隨機區(qū)組的多元方差分析的模型(MODEL)是:X1 X2 X3 =BLOCK T 7.3*4 復(fù)因子試驗的方差分析模型(MODEL)是:Y=BLOCK A B A*B 8.拉丁方設(shè)計的方差分析模型(MODEL)是:Y=A B T 9.3*2*3復(fù)因子試驗的方差分析模型(MODEL)是:Y=BLOCK A B C A*B A*C B*C A*B*C 10.正交隨機區(qū)組(不考查交互作用)的統(tǒng)計分析模型(MODEL)是:Y=BLOCK A B C D 1.協(xié)方差分析的功用?:用處理前的數(shù)據(jù)(基數(shù))矯正處理后的數(shù)據(jù),提高分析的精確度 2.主成分分析的功用?:將個數(shù)眾多、相互有關(guān)聯(lián)的變量,轉(zhuǎn)化為少數(shù)幾個相互獨立的變量 3.聚類分析的功用?:把樣本或變量進(jìn)行分類分
4.典型相關(guān)系數(shù)的功用?:反映兩組不同性質(zhì)的變量之間的關(guān)系密切程度 5.樣本平均數(shù)的功用?:反映資料的一般質(zhì)量水平,指示資料的中心位置 6.樣本平均數(shù)標(biāo)準(zhǔn)差(標(biāo)準(zhǔn)誤)的功用?:估計抽樣誤差
7.在回歸分析中,殘差的作用:反映實測值與預(yù)測值之間的偏差程度 8.在試驗設(shè)計中,局部控制的作用?:減少試驗誤差 9.在試驗設(shè)計中,重復(fù)的作用?:估計試驗誤差
10.變異系數(shù)的功用:用于兩組資料的變異程度作比較
1.多重比較的方法有很多種,課本介紹了其中的三種: 第一種、最小顯著差數(shù)法(Least Significant difference---LSD法或t測驗法)第二種、Q測驗法(最高顯著差數(shù)法═Tukey測驗法)
第三種、新復(fù)極差法(Shortest Significant Range---SSR法或Duncan法)哪種測驗法的精確度較高?TUKEY法
2.不服從正態(tài)分布的數(shù)據(jù)不能直接作方差分析,必須進(jìn)行數(shù)據(jù)轉(zhuǎn)換,數(shù)據(jù)轉(zhuǎn)換常用的方法有:(1)、平方根代換(2)、對數(shù)代換(3)、反正弦代換
問如果數(shù)據(jù)為二項分布的百分率,即可數(shù)百分?jǐn)?shù),且大于70%或小于30%,應(yīng)采用何種代換?反正弦代換
3.計算步驟為:
第一步、將數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化; 第二步,求相關(guān)矩陣;
第三步,求相關(guān)矩陣的特征根、特征向量、各特征根的方差貢獻(xiàn)率和累計方差貢獻(xiàn)。第四步,根據(jù)特征根的累計方差貢獻(xiàn)率保留前幾個公共因子。
第五步,用前幾個特征根的平方根乘相應(yīng)的特征向量,構(gòu)成因子載荷陣; 第六步,求相關(guān)系數(shù)矩陣的逆陣;
第七步,用因子載荷陣與相關(guān)矩陣的逆陣相乘,得回歸系數(shù)陣; 第八步,用回歸系數(shù)與標(biāo)準(zhǔn)化數(shù)據(jù)相乘得因子得分值。問這是何種統(tǒng)計分析方法?因子分析
4.計算步驟為:
第一步,將數(shù)據(jù)進(jìn)行中心化; 第二步,求方差協(xié)方差矩陣; 第三步,求方差協(xié)方差矩陣的特征根、特征向量、各特征根的方差貢獻(xiàn)率和累計方差貢獻(xiàn)率。第四步,根據(jù)特征根的累計方差貢獻(xiàn)率保留前幾個主成分。
第五步,用中心化數(shù)據(jù)與前三個特征向量相乘,求得前三個主成分得分。
第六步,如果覺得有必要,用前三個特征根的平方根(即前幾個主成分的標(biāo)準(zhǔn)差,)除前幾個主成分得分值,得標(biāo)準(zhǔn)化主成分得分。第七步,如果有必要的話,利用這些標(biāo)準(zhǔn)化主成分得分作進(jìn)一步的分析。問這是何種統(tǒng)計分析方法?主成分分析
5.計算步驟為:
第一步,計算X、Y、X*Y項的各種平方和(X為基數(shù),Y為處理后的實測值;
第二步,進(jìn)行X與Y項的回歸關(guān)系顯著性測驗,若相關(guān)不顯著,則進(jìn)行一般的方差分析; 第三步,若相關(guān)顯著,則扣除回歸關(guān)系后,再進(jìn)行方差分析; 第四步,用回歸系數(shù)矯正處理后的數(shù)據(jù)測驗,再進(jìn)行多重比較。問這是何種統(tǒng)計分析方法?協(xié)方差分析
6.計算步驟為:
第一步,計算出k個類別的方差協(xié)方差矩陣的逆陣。
第二步,計算出各個訓(xùn)練樣本到這k個類別的馬氏距離,比較這k個距離,把訓(xùn)練樣本歸到距離最短的類中。
第三步,計算在第二步中判別錯誤的樣本數(shù)占總樣本數(shù)的百分率。第四步,如果還有新的待判樣本,計算各個新樣本到這k個類別的馬氏距離,比較k個距離,把各個新樣本歸到距離最短的類中,再計算在待判樣本中判別錯誤的樣本數(shù)占待判樣本總數(shù)的百分率。
問這是何種統(tǒng)計分析方法?判別分析
7.計算步驟為:
第一步,計算出Y的矯正數(shù)及各種平方和(Y為處理后的實測值)。第二步,列方差分析表并進(jìn)行F測驗。第三步,若F測驗顯著則進(jìn)行多重比較。第四步,寫出統(tǒng)計結(jié)論。
問這是何種統(tǒng)計分析方法?一元方差分析
8.計算步驟為:
第一步,按一定的原則選擇k個凝聚點;
第二步,將所有事例點歸到最靠近它的凝聚點所代表的類中,得到k個初始分類;
第三步,按最近距離的原則對初始分類進(jìn)行修改;反復(fù)進(jìn)行,直至分類合理為止。問這是何種統(tǒng)計分析方法?動態(tài)聚類
9.計算步驟為:
第一步,將原始數(shù)據(jù)進(jìn)行中心化,按研究目的分為兩組,記變量數(shù)(m1)較少的那組為X1,記變量數(shù)(m2)較多的那組為X2。
第二步,求X1和X2的方差協(xié)方差矩陣S11、S12和S22以及S12的轉(zhuǎn)置陣S21,并利用它們構(gòu)成非對稱的方陣。
第三步,求非對稱的方陣的特征根和對應(yīng)的特征向量。
第四步,將這些特征向量除以非對稱的方陣的特征根的平方根轉(zhuǎn)換為第一組的典型系數(shù)。第五步,利用兩個典型系數(shù)的關(guān)系式求出另一組的典型系數(shù)。第六步,將中心化數(shù)據(jù)和典型系數(shù)相乘得典型相關(guān)系數(shù)。問這是何種統(tǒng)計分析方法?典型相關(guān)分析 10.用SAS系統(tǒng)作數(shù)據(jù)分析,首要的問題是如何排列數(shù)據(jù),你熟悉SAS系統(tǒng)對各種統(tǒng)計分析方法的數(shù)據(jù)排列的要求嗎?問單因子試驗采用隨機區(qū)組設(shè)計,有四個試驗指標(biāo)時,數(shù)據(jù)應(yīng)排多少列?。6列
:平方和
乘積和
合并樣本百分?jǐn)?shù)
樣本標(biāo)準(zhǔn)差
樣本平均數(shù)標(biāo)準(zhǔn)差
兩樣本百分?jǐn)?shù)之差的總體標(biāo)準(zhǔn)差
兩樣本平均數(shù)之差的樣本標(biāo)準(zhǔn)差
總體標(biāo)準(zhǔn)差
樣本變異系數(shù)
樣本差數(shù)平均數(shù)標(biāo)準(zhǔn)差
可量資料大樣本均數(shù)與總體均數(shù)差異顯箸性測驗
可量資料兩大樣本均數(shù)差異顯箸性測驗 可數(shù)資料樣本百分?jǐn)?shù)與總體百分?jǐn)?shù)差異顯箸性測驗
可數(shù)資料兩大樣本百分?jǐn)?shù)差異顯箸性測驗
可量資料小樣本均數(shù)與總體均數(shù)差異顯箸性測驗
可量資料兩小樣本均數(shù)差異顯箸性測驗(配對法)
可量資料兩小樣本均數(shù)差異顯箸性測驗(成組法)
由可量資料大樣本對總體均數(shù)進(jìn)行估計
由可量資料小樣本對總體均數(shù)進(jìn)行估計
由可數(shù)資料大樣本百分?jǐn)?shù)對總體百分?jǐn)?shù)進(jìn)行估計
第二篇:SAS項目實驗報告策劃書
SAS項目實驗報告——
活
動
策
劃
金融一班:第五組 二零一二年十月三十日
目錄
一. 采訪對象:四川三陽汽車有限公司(市場部蔣俊紅經(jīng)理)..........3二. 采訪背景:...........................3
三. 采訪時間:...........................3
四、采訪地點:綿陽市科創(chuàng)園區(qū)創(chuàng)業(yè)大道中段242號............3五、采訪方式:此次活動采取座談形式,面對面采訪,并分時間段進(jìn)行采訪。..........3六、采訪目的:采訪該公司影響汽車銷售的因素,以及各種因素間的關(guān)系。.......3七、采訪前期準(zhǔn)備:..........................31、提前預(yù)約:用電話的形式與被采訪者保持聯(lián)系,最好提前一周預(yù)約好。..........32、采訪工具準(zhǔn)備:必須證件,器材。如照相機,錄音筆,采訪本,攝像機等。.........33、采訪交通工具:步行(后門左轉(zhuǎn)直走,過馬路即到達(dá)目的地)............34、采訪人員安排:......................3八、采訪內(nèi)容:...........................31、公司背景?............................32、公司客戶特征?....................33、公司汽車銷售狀況?..........................34、影響汽車銷售因素?..........................3九、采訪后期..........................3十、可行性分析及備注........................4活動策劃
一.采訪對象:四川三陽汽車有限公司(市場部蔣俊紅經(jīng)理)
二.采訪背景:
四川三陽汽車有限公司成立于1998年2月23日,是東風(fēng)——雪鐵龍授權(quán)集整車銷售、備件供應(yīng)、售后服務(wù)、信息反饋四位一體特約服務(wù)網(wǎng)點,能夠為廣大東風(fēng)雪鐵龍轎車客戶提供完備的售前、售中及售后服務(wù)。公司成立之初便本著一切為客戶著想的服務(wù)理念,力爭為客戶提供購車之外更多更周到的超值服務(wù)。公司成立了車友俱樂部對客戶的愛車提供保姆式服務(wù),亦是四川綿陽最大的東風(fēng)雪鐵龍汽車文化傳播中心。公司現(xiàn)有員工80余人,其中研究生以上學(xué)歷8人,大學(xué)以上40人,高級技師3人,中級以上技師22人,專業(yè)銷售人員12人。
三.采訪時間:
2012年10月26日
2012年11月2日
四、采訪地點:綿陽市科創(chuàng)園區(qū)創(chuàng)業(yè)大道中段242號
五、采訪方式:此次活動采取座談形式,面對面采訪,并分時間段進(jìn)行采訪。
六、采訪目的:采訪該公司影響汽車銷售的因素,以及各種因素間的關(guān)系。
七、采訪前期準(zhǔn)備:
1、提前預(yù)約:用電話的形式與被采訪者保持聯(lián)系,最好提前一周預(yù)約好。
2、采訪工具準(zhǔn)備:必須證件,器材。如照相機,錄音筆,采訪本,攝像機等。
3、采訪交通工具:步行(后門左轉(zhuǎn)直走,過馬路即到達(dá)目的地)
4、采訪人員安排:
八、采訪內(nèi)容:
1、公司背景?
2、公司客戶特征?
3、公司汽車銷售狀況?
4、影響汽車銷售因素?
九、采訪后期
整理收集到的資料,整理訪談問答記錄,完成書面表達(dá)報告,并傳給被采訪者進(jìn)行確認(rèn),保證修改無誤,成文。
十、可行性分析及備注
可行性分析:
1、由于現(xiàn)在大三本科生比較清閑,時間比較充足。
2、在該公司都熟人,故可行性較高,只要問題提法得當(dāng),善于取舍,此次采訪易于實行。
3、已在該公司做過一次試探性采訪。
4、采訪地近,基本為零成本采訪。
備注:
1、采訪時,以預(yù)備問題作為基本問題,也可即興追問。
2、采訪流程中小組成員以安全為重。
第三篇:常用sas語句總結(jié)
Engine(引擎)是一種訪問架構(gòu),SAS系統(tǒng)通過它迅速地對其它數(shù)據(jù)庫管理系統(tǒng)中文件進(jìn)行讀入和寫出。
1.LIBNAME語句
1.1解讀
定義 SAS 邏輯庫。具體地說,它可以
(1)向 SAS 標(biāo)識 SAS 邏輯庫
(2)將引擎與邏輯庫關(guān)聯(lián)
(3)讓您指定邏輯庫的選項
(4)為邏輯庫指定邏輯庫引用名
通俗得講,LIBNAME語句把一個libref(庫標(biāo)記名)和一個目錄聯(lián)系起來,使用戶可以在SAS語句中使用庫標(biāo)記來指示這個目錄。提交該程序時自動引用該 SAS 邏輯庫 1.2 語句格式
1、LIBNAME libref
2、LIBNAME libref Clear;
3、LIBNAME libref |_ All_ List;三種格式反映了LIBNAME語句的三種用法 選項說明
LibrefEngineSas-Data-LibraryAccess=Readonly|TempClear_All_List
規(guī)定邏輯庫規(guī)定引擎規(guī)定主機系統(tǒng)下一個有效的物理地址規(guī)定邏輯庫為只讀或可修改屬性清除與庫標(biāo)記的聯(lián)系列出所有邏輯庫的屬性在Log窗口列出邏輯庫的屬性。2.length語句
SAS變量的基本類型有兩種:數(shù)值型和字符型。數(shù)值型變量在數(shù)據(jù)集中的存貯一般使用8個字節(jié)。SAS的字符型變量缺省的長度是8個英文字符,可以使用LENGTH語句指定變量長度,LENGTH語句一般應(yīng)出現(xiàn)在定義變量的Input語句之前,格式為: LENGTH 字符型變量名 $長度 例如:length name $20 ;
3.input 語句
3.1解讀
INPUT語句 用于向系統(tǒng)表明如何讀入每一條記錄。它的主要功能有:讀入由語句指定的數(shù)據(jù)列;為相應(yīng)的數(shù)據(jù)域定義變量名;確定變量的讀入模式(共有四種模式:column模式,formatted模式,list模式及named模式)。
input語句執(zhí)行后,SAS將讀取的數(shù)據(jù)暫時先保存在內(nèi)存緩沖區(qū),然后執(zhí)行后面的語句,后面的語句可以對暫存在內(nèi)存緩沖區(qū)中的變量值進(jìn)行修改,到最后才將整條數(shù)據(jù)寫入數(shù)據(jù)集,寫入數(shù)據(jù)集的數(shù)據(jù)就不能在當(dāng)前data步中再修改。
注意:INFILE語句用于確定一個包含原始數(shù)據(jù)的外部文件,必須在執(zhí)行INPUT語句前執(zhí)行,如果要在程序中直接嵌入數(shù)據(jù),就用CARDS語句代替INFILE語句。
3.2 語句格式(Column模式)
INPUT variable <$> start-column<-end-column><.decimals><@|@@>;
說明: variable 變量名
$ 跟在變量后面,表明這個變量是字符型變量 start-column 起始列號
end-column 結(jié)束列號,如果變量值只包含一列,則可省略
.decimals 如果輸入值中沒有包含一個隔開整數(shù)部分與小數(shù)部分的小數(shù)點,decimals用來顯性的指明小數(shù)部分 @ 單尾符 @@ 雙尾符
舉例說明:input name $ 1-10 pulse 11-13 waist 14-15 gender $ 16;
4.SET 語句
Set語句可以用來讀取單個數(shù)據(jù)集中的數(shù)據(jù),也可以用來讀取多個數(shù)據(jù)集中的數(shù)據(jù)拼接SAS新的數(shù)據(jù)集。程序為:
DATA 新數(shù)據(jù)集;
SET 輸入數(shù)據(jù)集1 輸入數(shù)據(jù)集2 ….; Run;如果不適用DROP=和KEEP=選項,在新的數(shù)據(jù)集中將包含所有舊數(shù)據(jù)集的變量。
5.DO 循環(huán)語句
語句一:
DO WHILE(expression);...more SAS statements...END;語句二:
DO UNTIL(expression);...more SAS statements...END;語句三:
DO index-variable=start
DO item-1<,…item-n>
DO over array-name;...more SAS statements...END;例如: data test;
input sc01-sc05;
array s sc01-sc05;
do over s;
s= s*100;
end;
cards;0.95 0.88 0.57 0.90 0.65;這個語句也是SAS比較特殊的循環(huán)結(jié)構(gòu),專用于數(shù)組,將數(shù)組的每一個元素訪問一遍。
6.IMPROT 語句
import過程可以讀取的數(shù)據(jù)有Access數(shù)據(jù)庫、Excel文件和帶分隔符的文件。
6.1語法格式
PROC IMPORT
DATAFILE=“filename” | TABLE=“tablename” OUT=
DATAFILE=“filename” 用來指定數(shù)據(jù)文件的位置,如果是Access則用TABLE=“tablename”指定需要讀取的數(shù)據(jù)表;
OUT= 指定輸出數(shù)據(jù)集的名稱;
DBMS=identifier 指定導(dǎo)入數(shù)據(jù)表的類型;幾個常用的DBMS選項如下
ACCESS 讀取MS ACCESS2000/2002數(shù)據(jù)
EXCEL 讀取Excel2000/2002數(shù)據(jù)
CSV 讀取逗號分隔的文件
DLM 讀取分隔符文件,需要用DELIMITER=指明具體的分隔符
TAB 讀取Tab分隔的文件
REPLACE選項替換原來已經(jīng)存在的數(shù)據(jù)集,缺省情況下是不替換,并在LOG窗口中予以提示;
6.2 proc import讀取帶分隔符的文件 語法格式: PROC IMPORT DATAFILE= OUT= DBMS= REPLACE;(Data source statements:)DATAROW=n;DELIMITER=;GETNAMES=YES|NO;說明:
DBMS= 需要指定DLM,逗號分隔文件可省略; DATAROW=n;指定從數(shù)據(jù)文件的第幾行開始讀取,該選項缺省情況下,如果getnames=yes則從第二行開始讀取,getnames=no從第一行開始讀?。?DELIMITER=;指定分隔符;
GETNAMES=;告訴SAS是否將數(shù)據(jù)文件的第一行作為變量讀取,該選項缺省為yes。
如果第一行是變量名,而該選項為no則會將列為數(shù)值型的第一行讀取為缺失值。
當(dāng)指定getnames=no時,對于DLM文件,則SAS自動將變量命名為VAR1, VAR2,...;對于Excel文件,則SAS自動命名變量為F1, F2, … 舉例:
proc import datafile=“C:My Documentsmyfilesdelimiter.txt”
out=mydata
dbms=dlm
replace;
delimiter='&';
getnames=yes;run;6.3 proc import讀取Excel文件 語法格式: PROC IMPORT DATAFILE= OUT= DBMS= REPLACE;(Data source statements:)SHEET=;GETNAMES= YES|NO;注:讀取Excel時,可以不指定DBMS=選項。舉例:
proc import datafile=“c:clinic filesdrug1.xls”
out=drug1;
sheet='lab';
getnames=yes;run;6.4 proc import讀取數(shù)據(jù)庫表(如Access)語法格式: PROC IMPORT TABLE= OUT= DBMS= REPLACE;(Data source Statements:)DATABASE= PWD= UID= WGDB= 說明:
DATABASE= 指明數(shù)據(jù)庫存放的路徑及名字 UID= 數(shù)據(jù)庫用戶名 PWD= 密碼 WGDB= 工作組名稱 舉例:
proc import table=“customers”
out=sasuser.cust
dbms=access97;
uid=“userid”;
pwd=“mypassword”;
database=“c:myfileseast.mdb”;
wgdb=“c:winntsystem32security.mdb”;run;通常情況下,proc import是可以不掌握的,通過視窗操作可能更方便,特不過用proc import能夠更精細(xì)的控制。在寫import過程的時候,要特別注意分號的位置,從最開始的語法格式那里可以看出,proc import后面的一般選項是連在一起寫的,中間用空格隔開,最后才以分號結(jié)尾;而數(shù)據(jù)源選項則每一項都要以分號結(jié)束。這些地方往往容易出錯。
7.CARDS語句
用于直接輸入數(shù)據(jù),標(biāo)志著數(shù)據(jù)塊的開始。格式如下:
CARDS;
數(shù)據(jù)塊
;
8.SORT和BY語句
SORT語句將指定的數(shù)據(jù)集按指定變量排序。使用BY語句可以使生成的數(shù)據(jù)集按照某個變量排序,但輸入數(shù)據(jù)集必須預(yù)先按該變量排序。使用PROC SORT語句可以進(jìn)行排序,一般形式為:
PROC SORT DATA=數(shù)據(jù)集 OUT=排序后的數(shù)據(jù)集; BY 變量; RUN;
e.g.Proc sort date=stockreturn;
by firm date;run;
9.宏
在宏變量前加&來引用宏變量的值。
用一個百分號(%)加宏名稱就可以調(diào)用該宏。%macro 宏變量名:定義宏變量
%DO
:條件處理至一個匹配的%END出現(xiàn) %If-%Then /%Else :有條件執(zhí)行宏
10.MERGE語句
用MERGE語句合并SAS數(shù)據(jù)集。但是,輸入數(shù)據(jù)集必須預(yù)先按該BY變量排序。語句一般形式為: 式為:
DATA 新數(shù)據(jù)集 ;
MERGE 輸入數(shù)據(jù)集1 輸入數(shù)據(jù)集2 … ; BY 變量; RUN;
e.g.下圖展示合并數(shù)據(jù)集A、B 的結(jié)果:
Data gooddata;Merge stockreturn sample(in=a);By firm;If a=1;Run;注意:這里merge語句使用了兩個選項,當(dāng)一個SAS數(shù)據(jù)步同時讀入多個SAS數(shù)據(jù)集時,可以使用IN=選項來確定本觀測來自哪個數(shù)據(jù)集,in=選項的一般形式是:SAS-data-set(IN=variable)。其中,variable是一個臨時的數(shù)值型變量; Variable=0 表示觀測不是來自本數(shù)據(jù)集; Variable=1表示觀測是來自本數(shù)據(jù)集;
在這里使用IN選項的目的就是把所有來自數(shù)據(jù)集sample的觀測輸出到新數(shù)據(jù)集gooddata中。
11.REG語句
REG過程用來進(jìn)行回歸分析。
在MODEL語句中有許多選項,其中的幾個選項如下:
CLM
回歸估計值0.95置信區(qū)間的上界和下界。CLI
因變量預(yù)報值的0.95置信區(qū)間。
P
由輸入數(shù)據(jù)和回歸方程計算預(yù)報值。輸出觀測序號,ID變量(需事先規(guī)定ID語句),實際值,預(yù)報值和殘差。如果已規(guī)定了CLM、CLI或R,選項P就不需要了。
R
要求殘差分析,輸出包括選項P的一切內(nèi)容外,還有其它一些分析
12.MEANS語句
MEANS對指定的數(shù)值變量進(jìn)行簡單的統(tǒng)計描述。13.OPTIONS語句
?
OPTIONS語句臨時改變SAS系統(tǒng)的選項設(shè)置。?
改變后的選項設(shè)置在以后的SAS會話或作業(yè)中保持有效,直到再次改變它們。
?
改變SAS系統(tǒng)選項可以用OPTIONS語句,或用顯示管理命令OPTIONS菜單。
語句格式:
OPTIONS option-1 <...option-n>;其中:
option規(guī)定要改變的SAS系統(tǒng)選項。
第四篇:SAS數(shù)據(jù)輸入總結(jié)
SAS學(xué)習(xí)總結(jié)
一、SAS的數(shù)據(jù)錄入
(1)直接輸入
data first;
input name $ salary;
datalines;a 12b 34c 56d 78
;
run;
注意:datalines的位置以及數(shù)據(jù)錄入后的分號
(2)借助infile可讀入文本格式為dat、txt、csv
A.最簡單的形式
data first;
infile 'c:userslichaodesktopsasdatatoadjump.dat';
input Toadname $ Jump1 Jump2 Jump3 Jump4;
run;
proc print data=work.first;
run;
B.有空格的情況,需要數(shù)一下
data second;
infile 'c:userslichaodesktopsasdataonionring.dat';
input Name $ 1-19 Jump1 22-24 Jump2 25-28 Jump3 30-31 Jump4 33-34 Jump5 37 Jump6 40;
run;
proc print data=work.second;
run;
C.格式重復(fù)的情況
data third;
infile 'c:userslichaodesktopsasdataexercise.dat';
input Num1 Num2 Num3 @@;
run;
proc print data=work.third;
run;
注意:@@的用法
D.其他的格式
Ⅰ.輸出特定的行
data icecream;
infile 'c:userslichaodesktopsasdataicecreamsales2.dat' firstobs=3 obs=5;
input Flavor $ 1-9 Location Boxessold;
run;
proc print data=icecream;
run;
注意:firstobs和obs的位置不要改變,而且兩者可以單獨使用
Ⅱ.有缺失值
data class;
infile 'c:userslichaodesktopsasdataallscores.dat' missover;
run;
proc print data=class;
run;
注意:在有缺失值的情況下,如果輸出有錯誤的話就用missover
Ⅲ.非正常的輸入:
data third;
infile 'c:userslichaodesktopsasdatapumpkin.dat';
input Name $16.num 3.type $2.date $11.(num1 num2 num3 num4 num5)(4.1);run;
proc print data=third;
run;
注意:16.和3.、4.1等的表示方法,都是表示寬度,相比較數(shù)列數(shù)的方法更有效;輸入格式相同的話可以加括號把格式寫在后面的括號里。
Ⅳ.日期的輸入:
按照數(shù)值處理,根據(jù)情況,使用MMDDYYw.或者 DDMMYYw.(3)import 錄入其他格式的文件(可導(dǎo)入的格式非常多)
proc import datafile='c:userslichaodesktopsasdatasecond.xls' dbms=xls out=mydata replace;sheet=“sheet1$”;
range=“a1:b3”;
run;
proc print data=mydata;
run;
注意:sheet表示單元表的名字,range表示導(dǎo)入的數(shù)據(jù)范圍
input name $ test1 test2 test3 test4 test5;
第五篇:SAS基礎(chǔ)語法總結(jié)
一、DATA語句
DATA語句的作用是表明數(shù)據(jù)步的開始并給出數(shù)據(jù)集 的名稱。
DATA語句的格式為:
DATA 數(shù)據(jù)集的名稱;
數(shù)據(jù)集的名稱必須以英文字母開始,最長不超過8個字符。
二、CARDS語句
CARDS語句的作用是與“;”呼應(yīng),標(biāo)志數(shù)據(jù)行的開始與結(jié)束。
CARDS語句的格式為:
CARDS;數(shù)據(jù)行;如果使用CARS語句,在CARDS的后面必須緊跟數(shù)據(jù)行,并且在一個數(shù)據(jù)步中最多只能使用一個CARDS語句。
三、INPUT 語句
INPUT語句的作用是描述輸入記錄中的數(shù)據(jù),并把輸入值賦給相應(yīng)的變量。INPUT語句的格式為:
INPUT 數(shù)據(jù)的變量名、順序及類型;
用INPUT語句是為了讀取外部文件的數(shù)據(jù)或跟在CARDS語句后面的數(shù)據(jù)。
SAS默認(rèn)用INPUT語句讀取的是數(shù)值類型變量的值。若在變量后加’$’,則該變量為字符串類型變量。
為從一行讀入多個觀測值,應(yīng)使用行保持符’@@’限制度數(shù)指針,使其保持在這一行上讀數(shù),知道數(shù)據(jù)讀完為止。
例如:
Input x y@@;
Cards;
8
;
四、INFILE語句
Infile語句的作用是指明外部數(shù)據(jù)文件的名稱,并從這個外部數(shù)據(jù)文件中讀取數(shù)據(jù)。
INFILE語句的格式為: INFILE ‘外部數(shù)據(jù)文件名’;
例如,在D盤上有一個名稱為xiao.txt的數(shù)據(jù)文件,其中數(shù)據(jù)排列為:
A 3.16 B 2.9 B 5.8 B 3 A 4.9 A 4.17 用 INFILE語句讀取數(shù)據(jù)的代碼為:
Data ex;Infile ‘D:xiao.txt’;Input z$ x@@;Proc print;
Run;
五、SET語句
SET語句的作用是按照指定的條件從指定的數(shù)據(jù)集中讀取數(shù)據(jù)機那里新的數(shù)據(jù)集獲獎兩個數(shù)據(jù)集中的觀測值縱向連接建立新的數(shù)據(jù)集。
SET語句的格式為:
SET 數(shù)據(jù)集名表;例如,從數(shù)據(jù)集EX中讀取數(shù)據(jù)建立新的數(shù)據(jù)集EX1,可編輯語句:
DATA EX1;SET EX;將兩個數(shù)據(jù)集D1和D2中的觀測值縱向連接建立新的數(shù)據(jù)集D3,可編輯語句:
DATA D3;SET D1 D2;
六、MERGE語句
MERGE語句的作用是將兩個數(shù)據(jù)集中的各個觀測值橫向合并建立新的數(shù)據(jù)集。
MERGE語句的格式為:
MERGE 數(shù)據(jù)集名表;例如,將數(shù)據(jù)集D1與D2中的觀測值橫向合并建立新的數(shù)據(jù)集D3,可編輯語句:
DATA D3;MERGE D1 D2;
RUN;
七、DROP語句
DROP語句的作用是指定不寫到數(shù)據(jù)集中的變量。DROP語句的格式為:
DROP 變量名表;如果在DATA步中有DROP語句,那么DROP語句中一出現(xiàn)的變量的觀測值被刪除,未出現(xiàn)的變量的觀測值仍保留在新的數(shù)據(jù)集中。
八、KEEP語句
KEEP語句的作用是指定要寫到數(shù)據(jù)集中的變量。KEEP語句的格式為:
KEEP 變量名表;如果在DATA步4中有KEEP語句,那么KEEP語句中未出現(xiàn)的變量的觀測值被刪除,已出現(xiàn)的變量的觀測值被保留在西你的數(shù)據(jù)集中。
九、IF語句
IF語句的作用是使SAS繼續(xù)處理符合IF條件規(guī)定的觀測值,因而所得到的數(shù)據(jù)集是原數(shù)據(jù)集的子集。IF語句的格式為:
IF 條件表達(dá)式;如果表達(dá)式的值為真,SAS處理當(dāng)前的觀測值,執(zhí)行DADA步中的語句,如果表達(dá)式的值是假,SAS馬上返回到DATA步的開始,不處理當(dāng)前的觀測值,不執(zhí)行DADA步中的語句。
十、PROC語句
PROC語句的作用是指定需要調(diào)用的過程以及該過程的若干選擇項。PROC語句的格式為:
PROC SAS的過程名;例如,調(diào)用print過程,打印數(shù)據(jù)集ex的內(nèi)容:
PROC print data=ex;這里的data=數(shù)據(jù)集名,用來指定本過程所要處理的數(shù)據(jù)集名,如缺省則處理最新建立的數(shù)據(jù)集。在PROC步中,還必須確認(rèn)一些最基本的信息,包括:(1)處理的數(shù)據(jù)集名,格式為data=數(shù)據(jù)集名;(2)所涉及的變量名,格式為 var 變量名;(3)分組處理的標(biāo)志,格式為 by 組變量名;
十一、CLASS語句
class語句的作用是在分析的過程中定義分類變量,再按分類變量的值分組進(jìn)行數(shù)據(jù)分析。
Class語句的格式為:
CLASS 變量名;CLASS語句對數(shù)據(jù)分析所起的作用類似于by語句,但是它們打印輸出的格式不相同,并且by語句要求先對變量排序后才能使用。
十二、FREQ語句
freq語句的作用是規(guī)定一個變量,以它的值作為數(shù)據(jù)集中觀測值出現(xiàn)的頻數(shù)。
FREQ語句的格式為:
FREQ 變量;假定某觀測值的FREQ變量的值為n,在分析時,改數(shù)據(jù)集中這個觀測值出現(xiàn)的頻數(shù)便是n。
若n<1,則觀測值不參加分析
若n不是整數(shù),則自動取整。觀測值的總數(shù)等于FREQ變量的和。
常用的SAS過程步
一、print過程
print過程可以打印一個SAS數(shù)據(jù)集中的全體或部分觀測值,還可以打印數(shù) 值變量的綜合或部分和。
print過程中經(jīng)常使用的語句有:
proc print [選擇項];
var 變量表;by 變量表;sum 變量表;在proc print 語句中可能出現(xiàn)的選擇項有
data=數(shù)據(jù)集名,如果省略這一選擇,則打印最新建立的數(shù)據(jù)集中的數(shù)據(jù)。
sum語句被用來求變量表中諸變量的總和。
二、sort過程
SORT過程將SAS數(shù)據(jù)集中的觀測值按一個或多個變量的值進(jìn)行排序,以便 其他的SAS過程利用by語句對這些觀測值進(jìn)行分組處理,排序后的觀測值存放在一個新的SAS數(shù)據(jù)集中或者代替原來的數(shù)據(jù)集。在SORT過程中經(jīng)常使用的語句有:
proc sort [選擇項];
by 變量表;在proc sort語句中可能出現(xiàn)的選擇項有:
data=數(shù)據(jù)集名,用來說明要排序的數(shù)據(jù)集名,如果省略這一選擇,則指定最新建立的數(shù)據(jù)集。
out=數(shù)據(jù)集名,用來說明要輸出的數(shù)據(jù)集名,如果省略這一選擇,則原來的數(shù)據(jù)集被輸出的數(shù)據(jù)集替換。sort過程默認(rèn)按升序排列,若要按降序排列,在對應(yīng)變量前增加選擇項descending。
三、FORMAT過程
format過程可以對字符或數(shù)值變量定義一個所需要的輸出格式,使data步以及含有format的語句的過程步中的變量都受到這一輸出格式的限制。
通過proc FORMAT過程所定義的格式包括:(1)將輸出值轉(zhuǎn)換成不同的值、數(shù)值可以變成字符,字符可以變成另外的字符。(2)使輸出值保留一定的小數(shù)位,否則輸出值將有8個小數(shù)位。FORMAT過程由下列語句控制:
PROC FORMAT;
VALUE 格式名 格式的定義;為便于識別,格式名通常是原變量名加fmt
如果原變量是字符串,則應(yīng)當(dāng)在格式名前加字符串符號。后面的過程中,如果涉及到某變量的輸出格式,必須有語句:
FORMAT 變量名 格式名
四、standard過程
standtard過程按給定的平均值和標(biāo)準(zhǔn)差對SAS數(shù)據(jù)集中的部分或全體變量進(jìn)行“標(biāo)準(zhǔn)化”變換,并形成新的數(shù)據(jù)集。
在standard過程中經(jīng)常使用的語句有:
proc standard [選擇項];
var 變量表;freq 變量表;by 變量表;在proc standard語句中可能出現(xiàn)的選擇項有:
data=數(shù)據(jù)集名,用來說明要“標(biāo)準(zhǔn)化”變換的數(shù)據(jù)集名,如果省略這一選擇,則指定最新建立的數(shù)據(jù)集。
out=數(shù)據(jù)集名,用來說明含有“標(biāo)準(zhǔn)化”變量的新數(shù)據(jù)集名,如果忽略這一選擇,SAS將按內(nèi)部程式給出新的數(shù)據(jù)集名。
此過程將打印輸出每個“標(biāo)準(zhǔn)化”變量的輸入頻數(shù)、平均值及標(biāo)準(zhǔn)差。
五、TRANSPOSE過程
transpose過程將一個數(shù)據(jù)集進(jìn)行轉(zhuǎn)置,使行變?yōu)榱卸凶優(yōu)樾?,也就是使原?shù)據(jù)集中樣品的觀測值變換成新數(shù)據(jù)集中變量的觀測值,而原數(shù)據(jù)集中變量的觀測值則變成新數(shù)據(jù)集中樣品的觀測值。transpose過程的格式為:
proc transpose [選擇項];var 變量表;by 變量表;在proc transpose語句中可以出現(xiàn)的選擇項有:
(1)data=數(shù)據(jù)集名,用來說明要轉(zhuǎn)置的數(shù)據(jù)集名;如果忽略這一選擇,則指定最新建立的數(shù)據(jù)集。
(2)out=數(shù)據(jù)集名,用來說明轉(zhuǎn)置所建立的心數(shù)據(jù)集名,如果省略這一選擇,SAS將按內(nèi)部程式給出新的數(shù)據(jù)集名。
(3)prefix=字母(指定一個新前綴,用來構(gòu)成新變量名)
(4)name=字母(為含有輸入數(shù)據(jù)集中被轉(zhuǎn)置的變量名的輸出數(shù)據(jù)集中的變量命名,如果省略這一選擇,SAS將按內(nèi)部程式指定)。
在var語句中應(yīng)列出要被轉(zhuǎn)置的變量名,否則原數(shù)據(jù)集中未在其他語句中列出的所有數(shù)值型變量都將被轉(zhuǎn)置,字符型變量必須在var語句中列出才能被轉(zhuǎn)置,未被轉(zhuǎn)置的變量不進(jìn)入新的數(shù)據(jù)集,除非它們已經(jīng)被列入copy或by語句。
by語句使輸入數(shù)據(jù)集分組轉(zhuǎn)置,分組變量被包括在輸出數(shù)據(jù)集中。