第一篇:傳統(tǒng)信息檢索與現(xiàn)代信息檢索的區(qū)別和聯(lián)系[精選]
目錄
傳統(tǒng)信息檢索與現(xiàn)代信息檢索的區(qū)別與聯(lián)系............................................2 【引言】:...............................................................................................2
一、傳統(tǒng)信息檢索.................................................................................2
二、現(xiàn)代信息檢索.................................................................................2
三、傳統(tǒng)信息檢索和現(xiàn)代信息檢索的異同...........................................3
四、國(guó)內(nèi)外研究現(xiàn)狀..............................................................................3
五、信息檢索的發(fā)展趨勢(shì)......................................................................6 傳統(tǒng)信息檢索與現(xiàn)代信息檢索的區(qū)別與聯(lián)系
【摘要】: 信息檢索的發(fā)展是隨著科學(xué)技術(shù)的進(jìn)步而發(fā)展的。人類已經(jīng) 進(jìn)行了四次信息技術(shù)革命,目前正 在進(jìn)行第五次信息技術(shù)革命。信息技術(shù)的革命使得信息檢索也不斷地得到改進(jìn),信息檢索技術(shù)主要有四個(gè)階段:初始階段、手工檢索 階段、計(jì)算機(jī)檢索階段、網(wǎng)絡(luò)檢索 時(shí)代。信息檢索手段分傳統(tǒng)信息檢索和現(xiàn)代信息檢索。傳統(tǒng)信息檢索是指手工信息檢索,現(xiàn)代信息檢索包括計(jì)算機(jī)信息檢索和網(wǎng)絡(luò)信息檢索。
【關(guān)鍵詞】: 網(wǎng)絡(luò)信息檢索 傳統(tǒng)信息檢索 信息技術(shù)革命 比較研究 計(jì)算機(jī)檢索 手工檢索 網(wǎng)絡(luò)檢索 信息檢索技術(shù) 檢索手段 文獻(xiàn)信息
【引言】:
一、傳統(tǒng)信息檢索
傳統(tǒng)信息檢索-手工檢索是利用各種專門用于檢索的印刷出版物,即常說的檢索工具來查找所需要信息的手段。其檢索方法主要有以下幾種:(1)直接檢索:這是人們最常用的一種查找信息的方法,如去圖書館查閱各種圖書、期刊及其他資料,找到需要的信息,需花大量的時(shí)間和精力,在過去文獻(xiàn)較少時(shí),還能達(dá)到目的,而在信息大量產(chǎn)生的年代里猶如大海撈針。
(2)間接檢索:就是利用各種檢索工具獲取線索,再根據(jù)線索查找原始文獻(xiàn)信息的方法。也就是手工檢索。間接檢索還分為:1追溯放:通過已知文獻(xiàn)所賦的參考文獻(xiàn)“由一變十,由十變百“地進(jìn)行追溯查找有關(guān)信息還可以利用各種”引文索引”等工具進(jìn)行追溯檢索。2.工具法:利用各種檢索工具進(jìn)行查找文獻(xiàn),是文獻(xiàn)檢索最常用的方法。
二、現(xiàn)代信息檢索
現(xiàn)代信息檢索是指計(jì)算機(jī)及網(wǎng)絡(luò)信息檢索。計(jì)算機(jī)檢索是以計(jì)算機(jī)為基礎(chǔ)的信息存儲(chǔ)檢索。它是在手工檢索、機(jī)械檢索及光電檢索基礎(chǔ)上演變過來的,且在不斷地發(fā)展。(1)計(jì)算機(jī)單機(jī)檢索:是計(jì)算機(jī)檢索的初形式。隨著計(jì)算機(jī)存儲(chǔ)介質(zhì)的發(fā)展變化,也在發(fā)生不斷變化。目前主要有三種方式:計(jì)算機(jī)磁盤檢索,計(jì)算機(jī)磁帶檢索和計(jì)算機(jī)光盤檢索。
(2)網(wǎng)絡(luò)檢索:計(jì)算機(jī)網(wǎng)絡(luò)檢索是近幾年來發(fā)展起來的,目前它主要有三種形式:圖書館的局域網(wǎng)絡(luò)的檢索,聯(lián)機(jī)檢索系統(tǒng)的檢索和internet網(wǎng)上檢索。
隨著計(jì)算機(jī)技術(shù)的普及、通訊及網(wǎng)絡(luò)技術(shù)的發(fā)展,現(xiàn)代信息檢索技術(shù)已不再是圖書館情報(bào)專業(yè)人員的專長(zhǎng),而是人人都應(yīng)掌握的基本技能。
三、傳統(tǒng)信息檢索和現(xiàn)代信息檢索的異同
(1)檢索語言:檢索語言就是檢索信息時(shí)所使用的信息詞匯,在檢索語言上,手工檢索與計(jì)算機(jī)檢索基本相同,不同的是計(jì)算機(jī)檢索可以使用較多的自然語言,internet網(wǎng)上檢索一般使用自然語言。
(2)檢索概念的組配:手工檢索主要是以人腦進(jìn)行檢索概念的組配,而計(jì)算機(jī)檢索則是利用布爾邏輯、位置邏輯等邏輯運(yùn)算符進(jìn)行概念組配,internet網(wǎng)上檢索概念組配方式尚不成熟。其中計(jì)算機(jī)檢索的概念組配最為嚴(yán)謹(jǐn),手工概念組配的檢索組配最靈活。
(3)檢索途徑:檢索途徑也就是檢索入口,是根據(jù)信息的某種特征所進(jìn)行的檢索,手工檢索與計(jì)算機(jī)檢索的基本檢索途徑是相同的,如著作、分類、主題等。但計(jì)算機(jī)檢索的檢索途徑要更加廣泛和靈活,可以從年代、題目、文章、語種等途徑進(jìn)行檢索,并能進(jìn)行多途徑同時(shí)檢索。
(4)檢索工具的特點(diǎn):傳統(tǒng)檢索:
1、檢索范圍窄
2、檢索速度慢
3、檢索效率差
4、檢索入口少
5、用戶負(fù)擔(dān)大
6、工具內(nèi)容更新速度慢
7、工具體積龐大
8、信息密度低?,F(xiàn)代信息檢:
1、檢索范圍廣
2、檢索速度快
3、檢索效率高
4、一種檢索輸入、多種檢索輸出
5、檢索人性化
6、更新速度快
7、檢索界面簡(jiǎn)潔
8、信息密度大。
四、國(guó)內(nèi)外研究現(xiàn)狀
21世紀(jì)是信息大爆炸的時(shí)代,海量的信息在滿足人們工作、生活和研究需求的同 時(shí),也給人們檢索和利用信息帶來了空前的挑戰(zhàn),快速、準(zhǔn)確、有效地檢索到所需要信息已成為每一個(gè)信息檢索者的迫切愿望。滿足用戶的最大需求不僅要求提高信息檢索系統(tǒng)的易用性和信息檢索技術(shù),還應(yīng)充分分析和了解用戶的信息檢索特點(diǎn),發(fā)現(xiàn)影響用戶利用網(wǎng)絡(luò)信息行為的障礙,有針對(duì)性地為用戶提供幫助。
(1)中國(guó)研究現(xiàn)狀
(1-1)研究主題
國(guó)內(nèi)信息檢索研究主要集中在用戶檢索行為特征、基于認(rèn)知信念的用戶信息檢索研究、網(wǎng)絡(luò)環(huán)境對(duì)信息檢索的影響研究、國(guó)內(nèi)外信息檢索研究述評(píng)、特定情境下的信息檢索以及利用特定數(shù)據(jù)庫的信息行為研究等方面,呈現(xiàn)出研究主題涉及范圍廣、分布分散、深度不夠的特點(diǎn)。此外,圖1顯示,近10年中聚焦消費(fèi)者群體、學(xué)生群體、科研人員、網(wǎng)絡(luò)用戶和旅游群體等5類用戶研究的文獻(xiàn)就有57篇。雖然也涉及醫(yī)學(xué)用戶、老年用戶信息檢索特征的研究,但主題研究論文僅一兩篇,不占研究的主流地位。因此,就研究主題分布而言,國(guó)內(nèi)在上述5類用戶研究方面具有一定的深度和規(guī)模,其他主題研究明顯還不夠深入,有待進(jìn)一步加強(qiáng).(1-1-1)關(guān)于消費(fèi)者群體的研究 在網(wǎng)絡(luò)環(huán)境下,為應(yīng)對(duì)鋪天蓋地的商品廣告和網(wǎng)絡(luò)商店,消費(fèi)者必須要有一定的檢索技能,才能查找到自己 需要的商品,并甄別和選擇出價(jià)格合理的商品。基于消費(fèi)者信息需求的多樣性和檢索行為的多元化,選擇消費(fèi)者群體檢索行為特征作為切入點(diǎn)的論文較多,共有15篇。其中研究的重點(diǎn)集中在電子商務(wù)交易過程中的信息行為、消費(fèi)者搜索特定商品的策略和行為等方面,如乳制品、房地產(chǎn)、非處方藥品信息的搜索特點(diǎn)。在消費(fèi)用戶信息檢索特點(diǎn)研究中,研究者比較注重調(diào)查研究。例如,唐亮通過調(diào)查統(tǒng)計(jì),在研究消費(fèi)者網(wǎng)絡(luò)信息搜尋行為及其影響因素的基礎(chǔ)上,探討了風(fēng)險(xiǎn)性感知、復(fù)雜性感知、重要性感知、產(chǎn)品知識(shí)、網(wǎng)絡(luò)使用能力、市場(chǎng)敏感度等因素對(duì)
消費(fèi)者信息需求感知的影響,同時(shí)對(duì)影響消費(fèi)者選擇搜索引擎和門戶網(wǎng)站的因素進(jìn)行探討。因此,這類研究論文不僅對(duì)豐富消費(fèi)者網(wǎng)絡(luò)信息搜尋行為的理論有一定的參考價(jià)值,而且對(duì)于企業(yè)根據(jù)消費(fèi)者獲取信息的特點(diǎn)調(diào)整產(chǎn)品的宣傳策略也有一定的借鑒意義。
(1-1-2)關(guān)于學(xué)生群體的研究
高校中大學(xué)生和研究生是檢索利用各類信息資源的主體。據(jù)統(tǒng)計(jì),大學(xué)生群體信息檢索的研究論文有11篇,研究生群體的有1篇,由此可以看出,大學(xué)生群體信息檢索無疑是信息檢索研究的重點(diǎn)。學(xué)生群體研究主要針對(duì)本科及以上學(xué)歷的學(xué)生。研究者主要通過問卷調(diào)查和統(tǒng)計(jì)的方法,分析高校本科生在網(wǎng)絡(luò)環(huán)境下的信息檢索,其中包括信息檢索技能、策略、動(dòng)機(jī)和信息素養(yǎng)等對(duì)信息檢索的影響并提出相關(guān)建議。例如石德萬等通過實(shí)證分析得出“學(xué)生查詢互聯(lián)網(wǎng)信息時(shí),主要是通過搜索引擎查找相關(guān)的網(wǎng)站,然后再進(jìn)入網(wǎng)站查找所需信息,其次是根據(jù)已有的知識(shí)和經(jīng)驗(yàn)訪問已知的網(wǎng)站查找信息”,對(duì)圖書館如何應(yīng)對(duì)讀者的信息搜索習(xí)慣提出了加強(qiáng)文獻(xiàn)檢索課檢索技巧培訓(xùn)、建設(shè)信息導(dǎo)航,提高高校圖書館的網(wǎng)絡(luò)信息服務(wù)能力,優(yōu)化本科生網(wǎng)絡(luò)信息檢索 教育等方面的建議。此外,不少論文通過調(diào)查和研究發(fā)現(xiàn)影響高校學(xué)生網(wǎng)絡(luò)信息檢索的主要因素有基本特征因素如性別、專業(yè)、年級(jí)、上網(wǎng)頻次;網(wǎng)絡(luò)環(huán)境因素如對(duì)網(wǎng)絡(luò)信息與非網(wǎng)絡(luò)信息的認(rèn)知比較、網(wǎng)費(fèi)、對(duì)網(wǎng)絡(luò)的 熟悉程度與檢索技巧、用戶培訓(xùn)、上網(wǎng)時(shí)間與地點(diǎn)等。
(1-1-3)關(guān)于科研人員的研究
科研用戶一般包括大學(xué)的科研工作者、教師、各個(gè)科研機(jī)構(gòu)的研究人員以及博、碩士研究生等。這一群體在利用網(wǎng)絡(luò)數(shù)據(jù)庫時(shí)一般具有較強(qiáng)的目的性,即根據(jù)科研項(xiàng)目的主題檢索科技信息,他們對(duì)網(wǎng)絡(luò)數(shù)據(jù)庫的查準(zhǔn)率有較高的要求。由于科研人員的特殊性,即科研工作創(chuàng)新迫使他們需要不斷地進(jìn)行探索,進(jìn)而導(dǎo)致信息需求的“不確定”
。因此,在研究過程中,他們一方面處于長(zhǎng)期存在信息需求的狀態(tài),另一方面,需求信息具有一定的模糊性。研究論文針對(duì)用戶信息需求的特點(diǎn),結(jié)合網(wǎng)絡(luò)信息檢索實(shí)踐,從認(rèn)知行為學(xué)和心理學(xué)的角度探索了科研人員利用web2.0以及各類網(wǎng)上數(shù)據(jù)庫的檢索行為。例如胡昌平等通過論述科研人員克服信息查詢障礙,借助圖書館工作人員優(yōu)化檢索過程和改善檢索結(jié)果,揭示了網(wǎng)絡(luò)環(huán)境下高校科研人員的一些重要的檢索行為特征,為提高科
研人員以項(xiàng)目為中心的信息利用水平提供了借鑒。因此科研用戶檢索行為研究不僅對(duì)改善網(wǎng)絡(luò)信息資源的組織方法、導(dǎo)航系統(tǒng)、標(biāo)識(shí)系統(tǒng),而且對(duì)優(yōu)化搜索引擎也有著很強(qiáng)的現(xiàn)實(shí)指導(dǎo)意義
(2)國(guó)外研究現(xiàn)狀
(2-1)研究方法
國(guó)內(nèi)關(guān)于信息檢索研究主要采用定性和定量相結(jié)合的方法,最常用的是通過問卷調(diào)查或者是在線調(diào)查采集數(shù)據(jù)。采集有代表性的樣本是獲得正確調(diào)查數(shù)據(jù)的重要保證,同時(shí)能夠保證得出結(jié)論的正確性和研究結(jié)果應(yīng)用于實(shí)踐的可行性。例如劉磊等調(diào)查的學(xué)校有南京大學(xué)(綜合類院校代表)、南京理工大學(xué)(工科類院校代表)京師范大學(xué)(人文類高校代表)、南京農(nóng)業(yè)大學(xué)(農(nóng)林類高校代表)等,涉及的學(xué)科專業(yè)有法律、國(guó)際貿(mào)易、英語、漢語言文學(xué)、歷史、生物、園藝、環(huán)境保護(hù)、農(nóng)學(xué)、醫(yī)藥、化工、車輛工程、電子信息等學(xué)科專業(yè)。該項(xiàng)調(diào)查內(nèi)容豐富,調(diào)查對(duì)象覆蓋面寬,有很強(qiáng)的代表性。但有些論文針對(duì)醫(yī)務(wù)人員信息檢索所做的調(diào)查,只選取某一個(gè)醫(yī)院的部分人員作為調(diào)查對(duì)象,由于樣本太小,難免產(chǎn)生片面性結(jié)論的弊端。
(2-2)研究主題
在國(guó)外近2800篇的論文中,研究領(lǐng)域較廣,涉及到檢索行為模型研究、不同職業(yè)人群的檢索行為研究、檢索任務(wù)對(duì)檢索行為的影響研究、搜索引擎對(duì)檢索行為的影響研究等。其主要的主題內(nèi)容分布如下。
(2-2-1)對(duì)不同職業(yè)用戶群信息檢索的研究
國(guó)外檢索行為的研究中,用戶群的信息檢索研究是一重要研究領(lǐng)域。在醫(yī)生、護(hù)士、工程師、教師、管理人員、學(xué)生群體等研究中,醫(yī)務(wù)人員和學(xué)生檢索行為則又是其研究的重點(diǎn)。國(guó)外關(guān)于學(xué)生群體的研究較為精細(xì),不僅根據(jù)大、中、小學(xué)生不同年齡和學(xué)習(xí)特點(diǎn)展開了信息檢索研究,而且根據(jù)不同年齡段學(xué)生的信息需求、檢索技能、檢索策略制定、選擇檢索工具的特點(diǎn)以及學(xué)校用戶教育在方法和內(nèi)容等方面的銜接展開了研究。
由于醫(yī)務(wù)人員信息量較大,因此他們對(duì)信息檢索的依賴性較大。哈倫大學(xué)的經(jīng)過研究,發(fā)現(xiàn)醫(yī)務(wù)人員信息檢索研究主要涉及3個(gè)主題。一是醫(yī)生信息需求的頻率和類型研究;二是醫(yī)生信息需求的內(nèi)容研究,包含信息資源利用模式、信息檢索耗費(fèi)時(shí)間、信息檢索壁壘與信息檢索技巧;三是信息資源研究,包括利用資源的數(shù)量、信息來源比較、信息資源利用排名、印刷型與電子資源利用比較、PDA的利用、電子數(shù)據(jù)庫和網(wǎng)絡(luò)利用研究等。
(2-2-2)對(duì)不同學(xué)科用戶群信息檢索的研究
學(xué)科的差異性必然帶來信息需求和檢索行為的迥異。該類文獻(xiàn)研究主要聚焦在不同學(xué)科研究人員的檢索方法、信息源以及面臨的障礙等。例如,S.Nii Bekoe Tackie和Musah Adams在對(duì)VRA.工程師的研究調(diào)查中,發(fā)現(xiàn)工程師們需要相對(duì)簡(jiǎn)潔、詳細(xì)且實(shí)用的信息,他們檢索的動(dòng)機(jī)受所需解決問題的類型的影響,從而更傾向于通過同事間的交流獲得信息。因此,他建議擴(kuò)大圖書館的信息交流空間,提高檢索質(zhì)量來吸引工程技術(shù)人員利用圖書館。BradleyM.Hemminger等人通過網(wǎng)上調(diào)查,研究網(wǎng)絡(luò)環(huán)境對(duì)信息檢索的影響,發(fā)現(xiàn)越來越多的人對(duì)網(wǎng)絡(luò)資源的依賴性較大,利用圖書館的人日趨減少。這些研究成果提示圖書館,應(yīng)對(duì)網(wǎng)絡(luò)環(huán)境,必須充分運(yùn)用營(yíng)銷手段努力推銷自己,延伸和拓展服務(wù)手段,更大范圍地覆蓋研究人員的信息需求。
五、信息檢索的發(fā)展趨勢(shì)
隨著網(wǎng)絡(luò)的飛速發(fā)展,網(wǎng)上資源也日新月異,呈爆炸性增長(zhǎng)趨勢(shì)。面對(duì)如此浩瀚多樣的信息資源,計(jì)算機(jī)技術(shù),通信技術(shù),信息檢索存儲(chǔ)技術(shù)的快速發(fā)展,手工檢索的“手翻、眼看、大腦判斷”的檢索方式已經(jīng)很難適應(yīng)當(dāng)今信息的發(fā)展速度,因此,信息檢索開始從手工檢索過渡到計(jì)算機(jī)檢索。
信息檢索,是以科學(xué)的方法,利用檢索工具和檢索系統(tǒng),從有序的信息集合中檢索出所需的信息的一種檢索方式,是人類為了合理的分發(fā)情報(bào)和充分的利用情報(bào)而采取的一種重要的交流方式,于是乎,信息檢索已經(jīng)成為現(xiàn)代社會(huì)信息化和個(gè)匯總應(yīng)用關(guān)系的關(guān)鍵。
在這個(gè)高速發(fā)展的信息時(shí)代,信息就是商品、信息就是財(cái)富、信息就是資源、信息就是機(jī)會(huì),人人都渴望及時(shí)獲得有用的信息,如果說信息是人來賴以生存、發(fā)展的本能,那么信息檢索就是每個(gè)人必須具備的一種基本技能。因此,信息檢索在這個(gè)時(shí)代起著舉足輕重的作用:1.信息檢索是讀書治學(xué)的基本功。無論是在學(xué)習(xí)還是在工作期間,都需要進(jìn)行各種信息檢索的培養(yǎng)和訓(xùn)練;2.信息檢索是科學(xué)研究的組成部分??茖W(xué)研究首先是從課題調(diào)研掌握資料起步的,信息檢索有助于掌握本課題的進(jìn)展動(dòng)態(tài),開拓思路,避免重復(fù)勞動(dòng),把研究水平提到新的高度;3.信息檢索是科學(xué)決策的先導(dǎo)。信息化時(shí)代的經(jīng)濟(jì)管理、政治控制、藝術(shù)創(chuàng)造乃至心理狀態(tài)的演變等,均受到各種社會(huì)信息的影響。適時(shí)掌握相關(guān)信息才能實(shí)現(xiàn)有效的管理。
目前,信息檢索已經(jīng)發(fā)展到網(wǎng)絡(luò)化和智能化的階段。信息檢索的對(duì)象從相對(duì)封閉、穩(wěn)定一致、由獨(dú)立數(shù)據(jù)庫集中管理的信息內(nèi)容擴(kuò)展到開放、動(dòng)態(tài)、更新快、分布廣泛、管理松散的網(wǎng)絡(luò)內(nèi)容。因此,在未來的時(shí)代信息檢索必將出現(xiàn)信息智能化、個(gè)性化、專業(yè)化、多樣化的檢索引擎。
智能搜索引擎是結(jié)合了人工智能技術(shù)的新一代收索引擎,它使因特網(wǎng)信息檢索從基于關(guān)鍵詞檢索提高到基于知識(shí)或概念檢索,并對(duì)知識(shí)有一定的理解及處理能力,能夠?qū)崿F(xiàn)分詞技術(shù)、同意詞技術(shù)、概念搜索、短語識(shí)別及機(jī)器翻譯等技術(shù)。智能檢索是基于自然語言的檢索形式,機(jī)器根據(jù)用戶所提供的以自然語言表述的檢索要求進(jìn)行分析,而后形成檢索策略進(jìn)行搜索。用戶所需要做的僅僅是告訴計(jì)算機(jī)想做什么,至于怎樣實(shí)現(xiàn)則無須人工干預(yù),這意味著用戶將徹底從繁瑣的規(guī)則中解脫出來。在檢索服務(wù)方面,提高檢索質(zhì)量需求最基本的一點(diǎn)就是判定用戶是在尋找快速的回應(yīng)還是精確地檢索結(jié)果并分析查詢中隱含的“意義范圍”,即詞語在不同領(lǐng)域的含義。個(gè)性化信息檢索是指能夠?yàn)榫哂胁煌畔⑿枨蟮挠脩籼峁﹤€(gè)性化檢索結(jié)果的技術(shù)。即對(duì)不同用戶提供的同一種查詢?cè)~語也能按照不同的用戶需求而生成不同的檢索結(jié)果。從實(shí)現(xiàn)原理上看,目前的個(gè)性化信息檢索的方法主要有三種,分別為基于文本內(nèi)容分析的方法、基于點(diǎn)擊流量的方法和基于超鏈接分析的方法?;谖谋緝?nèi)容分析的方法通過獲取用戶的查詢歷史和訪問網(wǎng)頁等文本信息,甚至有時(shí)還能結(jié)合用戶主動(dòng)提交的,反應(yīng)自身興趣的關(guān)鍵詞來得到個(gè)性化檢索結(jié)果。而基于點(diǎn)擊流量的分析方法則使用了一些間接反映用戶個(gè)性化需求信息的方法,往往能更有效地提供個(gè)性化檢索的服務(wù)。再如基于超鏈接的個(gè)性化檢索方法,它主要利用修改網(wǎng)頁的標(biāo)準(zhǔn)PageRank值來反映用戶的個(gè)性化信息需求。
面對(duì)這樣一個(gè)新知識(shí)、新技術(shù)不斷涌現(xiàn)、只是新陳代謝頻繁的世界,想要一勞永逸的獲得知識(shí)是不現(xiàn)實(shí)的,我們只有終身學(xué)習(xí)、不斷獲取、更新知識(shí),才能不被社會(huì)所淘汰。要有效、快速的獲得和利用最新的信息,就必須掌握信息檢索的技能。
【參考文獻(xiàn)】:1.周文榮:網(wǎng)上數(shù)據(jù)庫檢索[j]情報(bào)科學(xué);2001年08期
2.黃如花;網(wǎng)上專利信息的檢索[J];情報(bào)科學(xué);2001年03期 3.曾民族;網(wǎng)絡(luò)信息檢索現(xiàn)狀和性能評(píng)價(jià)[J];情報(bào)學(xué)報(bào);1997年
第二篇:現(xiàn)代信息檢索論文
期末課程論文
論文標(biāo)題:課程名稱:信息檢索技術(shù)課程編號(hào):學(xué)生姓名:尹江津?qū)W生學(xué)號(hào):所在學(xué)院:計(jì)算機(jī)科學(xué)與工程學(xué)院學(xué)習(xí)專業(yè):計(jì)算機(jī)科學(xué)與技術(shù)課程教師:
文本分類及相關(guān)技術(shù)研究
1220500 1100310230
王
沖
2013年7月2 日
文本分類及相關(guān)技術(shù)研究
信息檢索(Information Retrieval,IR)是研究信息的表示、存儲(chǔ)、組織和獲取的一門學(xué)科,其目標(biāo)是為用戶快速、準(zhǔn)確地提供其所需的信息。信息檢索起源于20世紀(jì)50年代,在60年代取得了關(guān)鍵性進(jìn)展,其中最著名的是GerardSalton開發(fā)的SMART系統(tǒng)以及Cym Cleverdon提出的Cranfield評(píng)價(jià)方法,SMART系統(tǒng)和Cranfield評(píng)價(jià)方法有力地推動(dòng)了信息檢索的發(fā)展。在70年代和80年代,多種關(guān)于文檔檢索的模型被提出,文本檢索會(huì)議(TREC)于1992年開始舉辦,該會(huì)議推動(dòng)了大規(guī)模文檔集合環(huán)境下的信息檢索技術(shù)的發(fā)展。隨著互聯(lián)網(wǎng)上信息的迅速增加,為了進(jìn)一步提高用戶信息檢索的質(zhì)量和效率,網(wǎng)絡(luò)上出現(xiàn)了更高效地信息索工具——搜索引擎(Google,Yahoo,Bing,百度等),搜索引擎為用戶在互聯(lián)網(wǎng)這個(gè)分布式環(huán)境下檢索需要的信息提供了極大的方便。
文本分類是一個(gè)監(jiān)督學(xué)習(xí)過程,它根據(jù)一個(gè)類信息已知的訓(xùn)練文檔集合,訓(xùn)練出文本特征和文本類別間的關(guān)系模型,然后通過這個(gè)學(xué)習(xí)得到的模型對(duì)待分類文本進(jìn)行分類。文本分類技術(shù)是處理和組織文本數(shù)據(jù)的重要手段,同時(shí)也是信息檢索的重要基礎(chǔ),把大量的文本信息按主題層次進(jìn)行組織可以極大地簡(jiǎn)化信息檢索的過程,按照類別對(duì)文檔進(jìn)行檢索或?qū)z索結(jié)果進(jìn)行分類,都可以提高檢索的查準(zhǔn)率。由于文本分類技術(shù)可以對(duì)大量的文本進(jìn)行分類,文本分類在信息檢索、自然語言處理、垃圾信息過濾、Web挖掘等領(lǐng)域得到了廣泛應(yīng)用。
一、文本分類概述 1.文本分類的一般過程
數(shù)據(jù)分類是數(shù)據(jù)分析的一種重要形式,數(shù)據(jù)分類通常用兩個(gè)步驟:學(xué)習(xí)和分類。在學(xué)習(xí)步,分類算法利用訓(xùn)練數(shù)據(jù)來構(gòu)建分類器,訓(xùn)練數(shù)據(jù)有多個(gè)元組以及與元素關(guān)聯(lián)的類標(biāo)簽構(gòu)成。元組X被表示為n維的屬性向量,每一個(gè)元組屬于一個(gè)或多個(gè)事先定義好的類別,類別由類標(biāo)號(hào)屬性(class label attribute)決定,類標(biāo)號(hào)屬性由離散、無序值構(gòu)成。由于每一個(gè)訓(xùn)練元組的類標(biāo)號(hào)已知,因此,學(xué)習(xí)步是一個(gè)監(jiān)督學(xué)習(xí)過程。學(xué)習(xí)步可以看作是學(xué)習(xí)映身函數(shù),函數(shù),對(duì)于給定的元組Z該函數(shù)可以預(yù)測(cè)與X關(guān)聯(lián)的類別標(biāo)號(hào)。文本是數(shù)據(jù)的一種具體形式,也是語言的實(shí)際運(yùn)用形態(tài),文本在人們生常生活中無處不在,任何有具體一定含義的文字都可以統(tǒng)稱為文本。文本分類系統(tǒng)的任務(wù)是:在給定的分類體系下,根據(jù)文本的內(nèi)容自動(dòng)地對(duì)待分類文本進(jìn)行分類,確定待分類文本的類別。其數(shù)學(xué)公式表示如下:
其中,A為類信息未知文本的集合,B為分類體系中類別信息的集合文本分類一般包括以下5個(gè)過程:文本預(yù)處理、文本表示、特征降維、分類器的選取與訓(xùn)練以及分類結(jié)果的評(píng)價(jià)。
文本分類系統(tǒng)的主要功能模塊為:
(1)文本預(yù)處理:為了使文檔的格式滿足分類器的輸入要求,首先需要對(duì)原始語料進(jìn)行處理,將其格
式進(jìn)行規(guī)范化,;
(2)文本表示:將文本分解為基本處理單元,用數(shù)學(xué)模型來表示;(3)特征降維:降低特征空間的維數(shù),提高分類器的效率和準(zhǔn)確率;(4)分類器:選擇合適的分類器并用訓(xùn)練數(shù)據(jù)集進(jìn)行訓(xùn)練;(5)性能評(píng)價(jià):選擇對(duì)分類器的性能進(jìn)行評(píng)估的性能評(píng)價(jià)標(biāo)準(zhǔn)。
2.文本預(yù)處理·
自動(dòng)文本分類的第一步是文本預(yù)處理。通常情況下,各種不同類型的文檔的來自不同的領(lǐng)域,從而文檔的存儲(chǔ)形式各異,并且計(jì)算機(jī)處理的文本不僅包含文字內(nèi)容,還包含有功能性標(biāo)簽等不規(guī)范符號(hào),文本分類模型不能直接對(duì)原始文檔進(jìn)行處理。必須對(duì)原始文本進(jìn)行預(yù)處理,去除其中的噪聲,規(guī)范化其形式,從而使文本滿足分類模型的輸入要求。文本預(yù)處理是影響文本分類準(zhǔn)確度的關(guān)鍵因素,文本預(yù)處理的主要任務(wù)是從原始文本提取主要內(nèi)容并對(duì)其格式進(jìn)行規(guī)范化,一般包括以下幾個(gè)步驟:去除文檔中的格式標(biāo)記、過濾非法字符、字母大小寫轉(zhuǎn)換、去除停用詞和稀有詞、詞干化處理。
3.文本表示
文本本身不能被直接用來分類,為了使文本能夠輸入到計(jì)算機(jī)中進(jìn)行處理,首先應(yīng)將原始文本轉(zhuǎn)換為數(shù)學(xué)模型,然后用計(jì)算機(jī)對(duì)數(shù)學(xué)模型進(jìn)行處理。在實(shí)際應(yīng)用中,將原始文本轉(zhuǎn)為文本向量和詞頻矩陣后,這些數(shù)學(xué)模型非常龐大,計(jì)算機(jī)處理時(shí)需要花費(fèi)大量的時(shí)間,為了提高處理效率,一般都假設(shè)詞語與詞語之間相互獨(dú)立,詞語在文本中的位置被忽略,文檔被表示為不同特征項(xiàng)的集合。這種方法被稱為“樸素(Naive)”的方法或“詞袋“模型。文本表示模型主要有布爾模型、向量空間模型以及統(tǒng)計(jì)語言模型,雖然這三種模型采用不同的方法來表示文檔,這三種模型都采用了“詞袋”模型的思想。
4.信息增益
信息增益是指某特征項(xiàng)在文本中出現(xiàn)前后的信息熵之差,在機(jī)器學(xué)習(xí)領(lǐng)域中,經(jīng)常用信息增益來衡量某個(gè)特征項(xiàng)的重要性。對(duì)于詞語t和文檔類別C,通過統(tǒng)計(jì)C中出現(xiàn)和不出現(xiàn)t的文檔數(shù)來衡量t對(duì)C的信息增益。特征項(xiàng)t的信息增益用如下公式計(jì)算:
其中,Pr(Ci)表示在文本集合中屬于白類的文本出現(xiàn)的概率,Pr(t)表示文本集合中包含特征項(xiàng)t的文本在文本集合中的出現(xiàn)概率,Pr(Ci|t)表示在文本中包含詞語f的條件下文本屬于類Ci的條件概率,Pr(t)表示文本集合不包含特征項(xiàng)t的文本在文本集合中的出現(xiàn)概率,Pr(Ci|t)表示在文本中不包含詞語t的條件下文本屬于類Ci的條件概率,m是類別總數(shù)。根據(jù)公式計(jì)算出各個(gè)特征項(xiàng)的信息增益后,除去增益值小于指定閩值的特征項(xiàng),剩余的即為選中的特征;或按特征項(xiàng)的信息增益從大到小排序,刪除信息增益很小的單詞。
二、文本分類方法 1.Naive Bayes方法
Naive Bayes分類方法(以下簡(jiǎn)稱NB法)是一種簡(jiǎn)單而又非常有效的分類方法。NB法的一個(gè)前提假設(shè)是:在給定的文檔類語境下,文檔屬性是相互獨(dú)立的。假設(shè)面為一任意文檔,它屬于文檔類C={cl,C2,.,Ck)中的某一類cj。根據(jù)NB分類法有:
對(duì)文檔反進(jìn)行分類,就是按計(jì)算所有文檔類在給定di情況下的概率,概率值最大的那個(gè)類就是di所在的類,即:
可知,對(duì)于給定分類背景和測(cè)試文檔,用NB法分類的關(guān)鍵就是計(jì)算P(Cj)和P(di|cj)。計(jì)算P(cj)和尸(硝lcj)的過程就是建立分類模型(或者說學(xué)習(xí))的過程。根據(jù).P(dj|ci)計(jì)算方式的不同,可以將Naive Bayes方法分為最大似然模型(Maximum Likelihood Model)、多項(xiàng)式模型(Multinomial Model)、泊松模型(PoisonModel)等[ELM03]。
2.使用最大熵模型進(jìn)行中文文本分類
最大熵模型是一種在廣泛應(yīng)用于自然語言處理中的概率估計(jì)方法,它可以綜合觀察到的各種相關(guān)或冪相美的概率知識(shí),對(duì)許多問題的處理結(jié)果都到這或超過了其他方法的最好結(jié)果。但是,將最大熵模型應(yīng)用在文本分類中的研究卻非常少,本章使用最大熵模型進(jìn)行了中文文本分類的研究。通過實(shí)驗(yàn),比較和分析了不目的中文文本特證生成方法,以及使用平滑技術(shù)的情況下,基于最大熵模型的分類器的分類性能;將其和Bayes、KNN、SVM三葶爭(zhēng)典墨的文本分類器進(jìn)行了比較;使用Bagging來提高最大熵模型的分類穩(wěn)定性。
1).最大熵模型
最大熵模型是用來進(jìn)行概率估計(jì)的。假設(shè)a是某個(gè)事件,b是事件a發(fā)生的環(huán)境(或稱上下文),我們想知道a和b的聯(lián)合概率,記為p(a,b)。更一般地,設(shè)所有可能發(fā)生的事件組成集合為A,所有環(huán)境組成的集合為B,我們想知道,對(duì)于任意給定的aA,bB,概率p(a,b)是多少?
我們抱這個(gè)問題放到自然語言處理的領(lǐng)域來討論,對(duì)于文本分類問題,一個(gè)文檔分到某個(gè)類別可以看成一個(gè)事件,文檔中出現(xiàn)的詞可以看成這個(gè)事件的發(fā)生環(huán)境,我們想知道包含詞b的文檔屬于某一類a的概率。很容易想到的方法是通過訓(xùn)練語料進(jìn)行統(tǒng)計(jì)。給定一個(gè)訓(xùn)練集,定義A={a1,a2,A,am)是文檔所屬類別集,B={bl,b2,A,bm}是文檔的特征詞集,num(ai,bj)為疆練集中二元組(ai,bj)出現(xiàn)的次數(shù),那么我們可以使用如下公式進(jìn)行概率估計(jì):
這個(gè)方法有個(gè)很大的問題,即“稀疏事件”(sparse evidence)問題,即便是很大的訓(xùn)練文本,很多
二元縫組(ai,bj)仍然沒有出現(xiàn),武斷的認(rèn)為它的概率為0顯然是不可取的。最大熵模型是這樣來解決稀疏事件問題的,它使未知事件的概率分布總是盡可能均勻,即傾向予得到最大熵。例如一個(gè)軍事、政治和科技的三類文本分類題,我們得知出現(xiàn)“飛秘”這個(gè)詞的、80%的文檔屬于軍事類別,對(duì)于“飛機(jī)”這個(gè)詞在蒺飽兩類中的分布未知。根據(jù)最大熵原則,如果給定一個(gè)包含“飛機(jī)”這個(gè)詞文檔,那么認(rèn)為文檔以0.8的概率屬于軍事類別,分別以0.1的概率屬于其它兩類;如果文檔中不包含“飛機(jī)”這個(gè)詞,那么認(rèn)為文檔分別以相同的、1/3的概率屬于每一個(gè)類。即,在符合已知約束條件下,使未知事件盡可能均勻。具體來說,根據(jù)Shannon的定義,熵的計(jì)算公式如下:
那么,求解滿足最大熵原則的概率分布公式如下:
三、總結(jié)與展望
文本分類技術(shù)是組織和處理文本數(shù)據(jù)的重要手段,其主要任務(wù)是如何在給定的分類體系下,根據(jù)文本的內(nèi)容自動(dòng)地確定與文本關(guān)聯(lián)的類別。文本分類可以有效解決大量文本信息歸類的問題,并且是信息檢索、Web挖掘、內(nèi)容信息過濾等研究的重要基礎(chǔ)。主題模型是概率模型,由于主題模型可以捕獲潛在的語義結(jié)構(gòu)信息,主題模型在文本分類、信息抽取、觀點(diǎn)挖掘等文本挖掘任務(wù)中的應(yīng)用得到了較深入的研究。
本文對(duì)文本分類進(jìn)行了研究,介紹了文本分類的一般過程與關(guān)鍵技術(shù),主要包括:文本預(yù)處理、文本表示、性能評(píng)價(jià)指標(biāo),同時(shí)還對(duì)主題模型PLSA、LDA、sLDA和iTopicModel的構(gòu)建方法和參數(shù)估計(jì)方法進(jìn)行了介紹。針對(duì)已有的監(jiān)督主題模型與基于機(jī)器學(xué)習(xí)的文本分類算法假設(shè)文檔之間相互獨(dú)立、不能有效利用文檔間的關(guān)聯(lián)關(guān)系的問題,提出了監(jiān)督關(guān)聯(lián)主題模型SRTM和關(guān)聯(lián)文本分類算法TC.iTM。為了利用利用文檔間的關(guān)聯(lián)關(guān)系來提高監(jiān)督主題模型的預(yù)測(cè)準(zhǔn)確度,我們基于iTopicModel提出了監(jiān)督關(guān)聯(lián)主題模型SRTM,將文檔間的關(guān)聯(lián)關(guān)系、文檔的文本信息、文檔的標(biāo)號(hào)進(jìn)行統(tǒng)一建模,首先用古典線性回歸模型對(duì)文檔標(biāo)號(hào)進(jìn)行建模,給出SRTM的聯(lián)合概率分布,通過EM算法最大化聯(lián)合概率分布的對(duì)數(shù)似然對(duì)SRTM的參數(shù)進(jìn)行估計(jì),然后用Fold.In[54]方法對(duì)訓(xùn)練數(shù)據(jù)以外文檔的標(biāo)號(hào)進(jìn)行預(yù)測(cè)。最后我們用廣義線性模型對(duì)文檔標(biāo)號(hào)進(jìn)行建模,對(duì)SRTM進(jìn)行擴(kuò)展,使SRTM可以處理多種類型的文檔標(biāo)號(hào)。Cora研究論文分類數(shù)據(jù)集和電影評(píng)論數(shù)據(jù)集上的實(shí)驗(yàn)表明,在文檔網(wǎng)絡(luò)中,SRTM的預(yù)測(cè)結(jié)果要優(yōu)于現(xiàn)有的監(jiān)督主題模型。
參考文獻(xiàn): [學(xué)位論文] 姜英杰,2010鄭州大學(xué):計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)
[學(xué)位論文] 劉欣,2010重慶大學(xué):計(jì)算機(jī)科技與技術(shù)
[學(xué)位論文] 陳樹清,2010南京理工大學(xué):計(jì)算機(jī)應(yīng)用技術(shù)
第三篇:信息檢索
實(shí)驗(yàn)三 訪問校園網(wǎng)
班級(jí):11級(jí)信管本(2)班
學(xué)號(hào):1142152237
姓名:張恒
實(shí)驗(yàn)名稱:訪問校園網(wǎng) 實(shí)驗(yàn)?zāi)康呐c要求:
熟悉校園網(wǎng)以及圖書館提供的信息資源 實(shí)驗(yàn)步驟:
1、進(jìn)入新華學(xué)院校園網(wǎng)首頁,網(wǎng)址是wow.axhu.cn或者004km.cnKI中國(guó)知網(wǎng),超星數(shù)字圖書館以及外文數(shù)據(jù)庫中EBSCO和Springer Link。(1)萬方數(shù)據(jù)庫
萬方數(shù)據(jù)庫是由萬方數(shù)據(jù)公司開發(fā)的,涵蓋期刊、會(huì)議紀(jì)要、論文、學(xué)術(shù)成果、學(xué)術(shù)會(huì)議論文的大型網(wǎng)絡(luò)數(shù)據(jù)庫;也是和中國(guó)知網(wǎng)齊名的中國(guó)專業(yè)的學(xué)術(shù)數(shù)據(jù)庫。其開發(fā)公司——萬方數(shù)據(jù)股份有限公司是國(guó)內(nèi)第一家以信息服務(wù)為核心的股份制高新技術(shù)企業(yè),是在互聯(lián)網(wǎng)領(lǐng)域,集信息資源產(chǎn)品、信息增值服務(wù)和信息處理方案為一體的綜合信息服務(wù)商。
(2)CNKI中國(guó)知網(wǎng)
中國(guó)知網(wǎng),是國(guó)家知識(shí)基礎(chǔ)設(shè)施(National Knowledge Infrastructure,NKI)的概念,由世界銀行于1998年提出。CNKI工程是以實(shí)現(xiàn)全社會(huì)知識(shí)資源傳播共享與增值利用為目標(biāo)的信息化建設(shè)項(xiàng)目,由清華大學(xué)、清華同方發(fā)起,始建于1999年6月。在黨和國(guó)家領(lǐng)導(dǎo)以及教育部、中宣部、科技部、新聞出版總署、國(guó)家版權(quán)局、國(guó)家計(jì)委的大力支持下,在全國(guó)學(xué)術(shù)界、教育界、出版界、圖書情報(bào)界等社會(huì)各界的密切配合和清華大學(xué)的直接領(lǐng)導(dǎo)下,CNKI工程集團(tuán)經(jīng)過多年努力,采用自主開發(fā)并具有國(guó)際領(lǐng)先水平的數(shù)字圖書館技術(shù),建成了世界上全文信息量規(guī)模最大的“CNKI數(shù)字圖書館”,并正式啟動(dòng)建設(shè)《中國(guó)知識(shí)資源總庫》及CNKI網(wǎng)格資源共享平臺(tái),通過產(chǎn)業(yè)化運(yùn)作,為全社會(huì)知識(shí)資源高效共享提供最豐富的知識(shí)信息資源和最有效的知識(shí)傳播與數(shù)字化學(xué)習(xí)的平臺(tái)。
(3)超星數(shù)字圖書館
為目前世界最大的中文在線數(shù)字圖書館,提供大量的電子圖書資源提供閱讀,其中包括文學(xué)、經(jīng)濟(jì)、計(jì)算機(jī)等五十余大類,數(shù)百萬冊(cè)電子圖書,500 萬 2 篇論文,全文總量 10億余頁,數(shù)據(jù)總量1000000GB,大量免費(fèi)電子圖書,超8萬的學(xué)術(shù)視頻,擁有超過35萬授權(quán)作者,5300位名師,一千萬注冊(cè)用戶并且每天仍在不斷的增加與更新。為目前世界最大的中文在線數(shù)字圖書館
(4)EBSCO
EBSCO Industries,Inc.是一家從事多元化產(chǎn)業(yè)經(jīng)營(yíng)的跨國(guó)公司。主要產(chǎn)業(yè)有文獻(xiàn)信息產(chǎn)品和服務(wù)(電子期刊與數(shù)據(jù)庫、文獻(xiàn)代訂服務(wù)等,參見以下EBSCO Information Services)、漁具(世界最大的魚餌生產(chǎn)商)、地產(chǎn)與酒店等。由Elton B.Stephens于1944年建立(公司名稱即為E.B.Stephens COmpany的縮寫)。EBSCO總部位于美國(guó)阿拉巴馬州伯明翰市。
(4)Springer Link
SpringerLink是全球最大的在線科學(xué)、技術(shù)和醫(yī)學(xué)(STM)領(lǐng)域?qū)W術(shù)資源平臺(tái)。憑借彈性的訂閱模式、可靠的網(wǎng)路基礎(chǔ)、以及便捷的管理系統(tǒng),SpringerLink已成為各家圖書館最受歡迎的產(chǎn)品。Springer是科學(xué)出版界的領(lǐng)導(dǎo)者,一直憑著其卓越表現(xiàn)而享有美譽(yù)。Springer已經(jīng)出版超過150位諾貝爾獎(jiǎng)得主的著作。
4、仔細(xì)查看圖書館首頁中的檢索框,介紹什么是讀秀學(xué)術(shù)搜索,用關(guān)鍵字“信息檢索”,搜索書名為“信息檢索”的相關(guān)記錄,摘取至少一條記錄,并且從搜索結(jié)果中,查看我校圖書館館藏的有關(guān)“信息檢索”的圖書,如果沒有而同學(xué)們又想看,怎么辦?
讀秀學(xué)術(shù)搜索:讀秀”是由海量全文數(shù)據(jù)及資料基本信息組成的超大型數(shù)據(jù)庫。其以370萬種中文圖書、10億頁全文資料為基礎(chǔ),為用戶提供深入內(nèi)容的章節(jié)和全文檢索,部分文獻(xiàn)的原文試讀,以及高效查找、獲取各種類型學(xué)術(shù)文獻(xiàn)資料的一站式檢索,周到的參考咨詢服務(wù),是一個(gè)真正意義上的學(xué)術(shù)搜索引擎及文獻(xiàn)資料服務(wù)平臺(tái)。
信息檢索記錄:
我校圖書館館藏:
如果沒有的圖書可以通過圖書薦購方式想圖書館推薦。
5、用自己的讀者證號(hào)進(jìn)入我校圖書館書刊檢索,采取不同的檢索方式(書名檢索、作者檢索、目錄檢索等等)檢索 “管理信息系統(tǒng)
于本海
高等教育出版社”這本書,并截圖表明結(jié)果
書名檢索
作者檢索
6、了解中圖法的目錄分類。
《中圖法》即中國(guó)圖書分類辦法,就廣義而言,包括《中國(guó)人民大學(xué)圖書館圖書分類法》、《中國(guó)科學(xué)院圖第五版書分類法》、《中國(guó)圖書館圖書分類法》、臺(tái)灣賴永祥仿十進(jìn)分類法(所謂“中國(guó)圖書分類法”)、《國(guó)際圖書集成分類法》。就狹義而言,《中圖法》是《中國(guó)圖書館圖書分類法》的簡(jiǎn)稱,是我國(guó)目前通用的類分圖書的工具,讀者掌握了這部分類法的有關(guān)知識(shí),便能迅速、有效地查尋全國(guó)各圖書館的館藏。分類法基本結(jié)構(gòu)
(1)基本部類:如中圖法分五大類部:馬列毛鄧;哲學(xué);社會(huì)科學(xué);自然科學(xué);綜合性圖書。
(2)基本大類:構(gòu)成分類表的第一級(jí)類目。中圖法為22個(gè)基本大類。(3)簡(jiǎn)表:由基本大類與由其直接展開的一、二類目所形成的類目表。如:(4)詳表:由簡(jiǎn)表展開的各種不同登記的類目所組成的類目表,是文獻(xiàn)分類的真正依據(jù)。實(shí)驗(yàn)結(jié)果與結(jié)論:
通過這次實(shí)驗(yàn)我熟悉了校園網(wǎng)以及圖書館提供的信息資源。
成績(jī)?cè)u(píng)定:
實(shí)驗(yàn)日期:2013年9月27日
指導(dǎo)教師簽名:孟翠翠
第四篇:信息檢索
《信息檢索與利用》課程上機(jī)大作業(yè)
注意事項(xiàng)
? 所有通過文獻(xiàn)數(shù)據(jù)庫檢索的題目必須通過圖書館主頁電子資源入口進(jìn)入,否則很多資源沒有使用權(quán)。圖書館地址lib.nuaa.edu.cn ? 下載作業(yè)題、提交作業(yè)網(wǎng)站地址為QQ群:310530458 ? 按步驟完成每個(gè)練習(xí)題,作業(yè)于5月18日前提交 ? 作業(yè)文件名按照“學(xué)號(hào)-姓名” ? 上機(jī)時(shí)間:4.13、4.27、5.11 ? 上機(jī)地點(diǎn):圖書館五樓培訓(xùn)教室
一、指出下列文獻(xiàn)的類型:(每題1.5分,共15分)
1.范克新.社會(huì)學(xué)定量方法.南京:南京大學(xué)出版社,2004:102-103.期刊論文
2.Gomathi, S.Sankara;Bhagyaveni, M.A.Simulation of scalability and congestion control of broadband intelligent networks.Information Technology Journal v 7, n 2 , 2008, p 306-312 期刊論文
3.H.Baker.Three-dimensional modelling.In Proc of 5th Intl.Conf.on Artificial Intelligence, pages 649–655, 1977.期刊論文
4.Stone, P.J.,Dunphy, D.C., Smith.The General Inquirer: A computer approach to Content Analysis in behavioral sciences.Cambridge, MA:MIT.Press.1966.專著
5.Dong,Jiaxiang, Rule-based planning for automated endodontic treatment:From dental radiography, three-dimensional computer modeling to tool selection and path control , Ph.D.OLUMBIA UNIVERSITY , 2003,295p.學(xué)位論文
6.Franck, Raymond E , Lewis, Ira, Udis, Bernard.Impact of Export Control and Technology Transfer Regimes: International Perspectives;NAVAL POSTGRADUATE SCHOOL MONTEREY CA GRADUATE SCHOOL OF BUSINESS AND PUBLIC POLICY.ADA568332, NPS-AM-12-001 Mar 2001, 46p 學(xué)位論文
7.中繼節(jié)點(diǎn)模擬器及測(cè)試方法:日本,CN103036605A[P].2013-04-10 技術(shù)標(biāo)準(zhǔn)
8.SNS百度百科[EB/OL].[2013-3-7].http://baike.baidu.com/view/8258.htm 電子文獻(xiàn)
9.寧永強(qiáng),秦莉,劉云,李特,孫艷芳,劉光裕,崔錦江,彭彪,張巖.中國(guó)科學(xué)院長(zhǎng)春光學(xué)精密機(jī)械與物理研究所.半導(dǎo)體電泵浦集成微腔激光器[Z].項(xiàng)目立項(xiàng)編號(hào):.鑒定單位:.鑒定日期:2007-09-04 報(bào)告
10.柯賢能.基于創(chuàng)新過程的技術(shù)競(jìng)爭(zhēng)情報(bào)分析方法框架構(gòu)建,[D].北京:中國(guó)科學(xué)院,2007 報(bào)告
二.查找圖書《平凡的世界》、《Model-Based Reasoning in Science and Technology》,總結(jié)查詢圖書全文信息的方法。(共15分)
步驟: 1.先登陸我校圖書館館藏書目查詢系統(tǒng),檢索有無館藏,如有寫出索書號(hào);(3分)
答:I247/8322-A 2.中文圖書,進(jìn)入讀秀中文搜索,選擇圖書,進(jìn)行檢索,查看館藏信息及電子圖書信息,嘗試圖書下載和閱讀,并拷貝正文內(nèi)任意一頁。(3分)答:
第一
章
一九七五年二三月間,一個(gè)平平常常的日子,細(xì)蒙蒙的雨絲夾著一星半點(diǎn)的雪花,正紛紛淋淋地向大地飄灑著。時(shí)令已快到驚蟄,雪當(dāng)然再不會(huì)存留,往往還沒等落地,就已經(jīng)消失得無蹤無影了。黃土高原嚴(yán)寒而漫長(zhǎng)的冬天看來就要過去,但那真正溫暖的春天還遠(yuǎn)遠(yuǎn)沒有到來。
在這樣雨雪交加的日子里,如果沒有什么緊要事,人們寧愿一整天足不出戶。因此,縣城的大街小巷倒也比平時(shí)少了許多嘈雜。街巷背陰的地方,冬天殘留的積雪和冰溜子正在雨點(diǎn)的敲擊下蝕化,石板街上到處都漫流著骯臟的污水。風(fēng)依然是寒冷的??帐幨幍慕值郎?,有時(shí)會(huì)偶爾走過來一個(gè)鄉(xiāng)下人,破氈帽護(hù)著腦門,胳膊上挽一筐子土豆或蘿卜,有氣無力地呼喚著買主。唉,城市在這樣的日子里完全喪失了生氣,變得沒有一點(diǎn)可愛之處了。
只有在半山腰縣立高中的大院壩里,此刻卻自有一番熱鬧景象。午飯鈴聲剛剛響過,從一排排高低錯(cuò)落的石窯洞里,就跑出來了一群一伙的男男女女。他們把碗筷敲得震天價(jià)響,踏泥帶水、叫叫嚷嚷地跑過院壩,向南面總務(wù)處那一排窯洞的墻根下蜂擁而去。偌大一個(gè)院子,霎時(shí)就被這紛亂的人群踩踏成路遙著,路遙全集:平凡的世界
第一部
長(zhǎng)篇小說,廣州出版社,2002年07月第1版,第3頁
3.外文圖書利用springer數(shù)據(jù)庫查找有無電子圖書,如有下載1個(gè)章節(jié),并拷貝正文內(nèi)任意一頁。(3分)
Abstract Model-based reasoning requires not only inferences about what is happening, but also evaluations of the desirability of what is happening.Emotions are a key part of such assessments, but sometimes they can lead people astray, as in motivated inference when people believe what fits with their desires.In contrast to motivated inference, fear-driven inference generates beliefs that people do not want to be true.Although paradoxical, this kind of inference is common in many domains, including romantic relationships, health, parenting, politics, and economics.This paper proposes that fear-driven inference results from gut overreactions, in which a feeling that something is wrong is erroneously taken as evidence that something really is wrong.We discuss psychological and neural mechanisms by which gut overreactions can lead to fear-driven inference, and show how a computer model of emotional coherence can explain both fear-driven
and motivated inference.4.利用國(guó)家圖書館(http://004km.cn/),看看能不能閱讀全文。(3分)
6.總結(jié)查詢圖書信息的方法,哪些查詢方法可以獲得圖書的全文?
三.任選以下課題,檢索課題的相關(guān)中文文獻(xiàn)。選擇三個(gè)檢索系統(tǒng),要求寫出檢索系統(tǒng)、檢索式、至少保存五條密切相關(guān)的檢索結(jié)果(含文摘)。(15分)1.火災(zāi)早期預(yù)警系統(tǒng)研究
技術(shù)要點(diǎn):該項(xiàng)目通過自動(dòng)監(jiān)控(特征氣體和圖像識(shí)別)和人工復(fù)檢相結(jié)合的消防預(yù)警系統(tǒng).2.航空發(fā)動(dòng)機(jī)故障診斷的融合技術(shù)研究 技術(shù)要點(diǎn):該項(xiàng)目將信息融合技術(shù)應(yīng)用在航空發(fā)動(dòng)機(jī)傳感器故障診斷和部件故障診斷中,研究與開發(fā)相應(yīng)的并行融合、串行融合和交叉融合的計(jì)算軟件。
3.自選題,可以選擇現(xiàn)在正在進(jìn)行或準(zhǔn)備申請(qǐng)的課題,及感興趣的課題。
步驟:
1.判斷文獻(xiàn)的類型,選擇合適的檢索工具。(3分)
2.選擇檢索詞。(3分)
3.設(shè)定時(shí)間、字段、構(gòu)建檢索式,開始檢索。(6分)
4.檢索結(jié)果選擇,保留如下格式。(3分)
檢索結(jié)果格式如下所示:
[1]王位,陸亞林,楊卓如.三維快速成型打印機(jī)成型材料[J].鑄造技術(shù),2012,01:103-106.摘要:三維快速成型打印技術(shù)作為新興技術(shù),具有很大潛力。簡(jiǎn)述了三維快速成型打印技術(shù)的發(fā)展和現(xiàn)狀,描述了三維打印技術(shù)的成型原理,材料的選擇后處理過程,并提出了展望。
四、利用網(wǎng)絡(luò)免費(fèi)資源《HighWire出版社電子期刊》,搜索近2013年以來有關(guān)“互動(dòng)問答平臺(tái)(questions & answer(Q & A)platform)”方面的論文,寫出檢索式,保留3條密切相關(guān)文獻(xiàn)(可免費(fèi)下載全文)的題名和摘要文摘。(10分)
五、搜索圖片中服飾的相關(guān)信息。(8分)
1.2.3.4.PRIMITIVE 衛(wèi)衣 Toms平底鞋
VALENTINO 迷彩手提包 Alice + Olivia 長(zhǎng)裙
六、搜索你所在學(xué)院研究生2013年的學(xué)位論文。寫出檢索結(jié)果,保留5條文獻(xiàn)(參考文獻(xiàn)格式)。(7分)
步驟:
1.判斷文獻(xiàn)的類型,選擇合適的檢索工具。(3分)2.設(shè)定時(shí)間、刊名、構(gòu)造檢索等,開始檢索。(3分)3.保存檢索結(jié)果。格式如下所示:(3分)
[1]王位,陸亞林,楊卓如.三維快速成型打印機(jī)成型材料[J].鑄造技術(shù),2012,01:103-106.七.利用EI檢索有關(guān)三維設(shè)計(jì)系統(tǒng)的外文文獻(xiàn)。(10分)
步驟:
1.登錄《EI village》。(2分)
2.選擇檢索字段Subject/Titlel/Abstract,分別檢索three dimensional,3D,“three dimensional”,結(jié)果有何區(qū)別?(2分)3.選擇檢索字段Subject/Titlel/Abstract,分別檢索 “design system”和“design systems”結(jié)果有何區(qū)別?(2分)
4.選擇你認(rèn)為最準(zhǔn)確的三維和設(shè)計(jì)系統(tǒng)的寫法,邏輯組配后檢索,得到文獻(xiàn)列表。保存一條相關(guān)文獻(xiàn)的題錄信息(參考文獻(xiàn)格式)(4分)
八.查找論文Ultrathin Mesoporous NiCo2O4 Nanosheets Supported on Ni Foam as Advanced electrodes for Supercapacitors是否被SCI數(shù)據(jù)庫收錄,如被收錄,查找該論文的入藏號(hào)、引用次數(shù)以及該期刊的2013年影響因子。(10分)
保留的題錄信息的格式如下: 1.標(biāo)題: Origin of the low piezoelectric coefficient of metal core 0.3Pb(Zn1/3Nb2/3)O-3-0.7Pb(Zr,Ti)O-3 piezoelectric fibers
作者: Luo, J(Luo, Jun);Qiu, JH(Qiu, Jinhao);Zhu, KJ(Zhu, Kongjun);Ji, HL(Ji, Hongli);Liang, DK(Liang, Dakai)
來源出版物: JOURNAL OF ALLOYS AND COMPOUNDS 卷: 581 頁: 468-471 DOI: 10.1016/j.jallcom.2013.06.152 出版年: DEC 25 2013 入藏號(hào): WOS:***
被引頻次:0 ISSN: 0925-8388
期刊影響因子IF:2.390(2013年)
步驟:
1.登錄《ISI Web of Science》,選擇Web of ScienceTM核心合集,選擇更多設(shè)置,只在“Science Citation Index Expanded(SCI-EXPANDED)--1998年至今”前方打勾。2.選擇檢索字段題名字段,輸入題名進(jìn)行檢索。3.檢索到文獻(xiàn)后,復(fù)制保留檢索結(jié)果。
4.點(diǎn)擊題名,查看文獻(xiàn)詳細(xì)信息,查找該論文的入藏號(hào)、被引用次數(shù)以及該期刊的影響因子(影響因子,點(diǎn)擊后方可查看到)。
第五篇:信息檢索
信息檢索
中文期刊
[1]任芳芳.石油化工企業(yè)安全文化綜合評(píng)價(jià)研究[D].東北大學(xué): ,2008.[2]匡蕾.煤礦企業(yè)安全文化建設(shè)與評(píng)價(jià)指標(biāo)體系研究[D].遼寧工程技術(shù)大學(xué): ,2009.[3]劉芳.施工企業(yè)安全文化評(píng)價(jià)研究[D].哈爾濱工業(yè)大學(xué): ,2010.[4]石玉威.中國(guó)大學(xué)生文化安全教育體系構(gòu)建研究[D].長(zhǎng)春工業(yè)大學(xué): ,2010.[5]張曉梅.我國(guó)文化安全存在的問題及對(duì)策研究[D].東北林業(yè)大學(xué): ,2011.學(xué)位論文
[1]陳榮芳.勝華化工安全文化構(gòu)建研究[D].中國(guó)石油大學(xué): ,2011.[2]李曉利.基于小波神經(jīng)網(wǎng)絡(luò)的化工安全評(píng)價(jià)研究[D].太原理工大學(xué): ,2007.[3]李媛.基于道化學(xué)公司安全評(píng)價(jià)標(biāo)準(zhǔn)的化工安全評(píng)價(jià)計(jì)算機(jī)輔助系統(tǒng)的研究[D].北京化工大學(xué): ,2004.[1]匡蕾.煤礦企業(yè)安全文化建設(shè)與評(píng)價(jià)指標(biāo)體系研究[D].遼寧工程技術(shù)大學(xué): ,2009.[2]劉芳.施工企業(yè)安全文化評(píng)價(jià)研究[D].哈爾濱工業(yè)大學(xué): ,2010.會(huì)議論文
[1]田曉青.企業(yè)醫(yī)院安全文化建設(shè)的幾點(diǎn)思考[A].李建中,梁留科.創(chuàng)新發(fā)展——河南省第五屆學(xué)術(shù)年會(huì)論文選集[C].創(chuàng)新發(fā)展——河南省第五屆學(xué)術(shù)年會(huì)論文選集:中國(guó)科學(xué)技術(shù)出版社,2009-09.[2]陳新華.企業(yè)安全文化建設(shè)探索[A]..2009’中國(guó)金屬學(xué)會(huì)冶金安全年會(huì)論文集[C].2009’中國(guó)金屬學(xué)會(huì)冶金安全年會(huì)論文集:,.[3]朱斌.企業(yè)安全文化[A]..2009’中國(guó)金屬學(xué)會(huì)冶金安全年會(huì)論文集[C].2009’中國(guó)金屬學(xué)會(huì)冶金安全年會(huì)論文集:,.[4]羅春光.弘揚(yáng)企業(yè)安全文化,提升安全管理水平[A]..2009’中國(guó)金屬學(xué)會(huì)冶金安全年會(huì)論文集[C].2009’中國(guó)金屬學(xué)會(huì)冶金安全年會(huì)論文集:,.[1]王家凱.構(gòu)建企業(yè)親情安全文化之我見[A]..2009’中國(guó)金屬學(xué)會(huì)冶金安全年會(huì)論文集[C].2009’中國(guó)金屬學(xué)會(huì)冶金安全年會(huì)論文集:,.[1]張建國(guó),.以人為本 打造安全文化[J].供電企業(yè)管理,2009,(5).