欧美色欧美亚洲高清在线观看,国产特黄特色a级在线视频,国产一区视频一区欧美,亚洲成a 人在线观看中文

  1. <ul id="fwlom"></ul>

    <object id="fwlom"></object>

    <span id="fwlom"></span><dfn id="fwlom"></dfn>

      <object id="fwlom"></object>

      現(xiàn)代信息檢索題目及

      時間:2019-05-14 21:46:30下載本文作者:會員上傳
      簡介:寫寫幫文庫小編為你整理了多篇相關(guān)的《現(xiàn)代信息檢索題目及》,但愿對你工作學(xué)習(xí)有幫助,當(dāng)然你在寫寫幫文庫還可以找到更多《現(xiàn)代信息檢索題目及》。

      第一篇:現(xiàn)代信息檢索題目及

      《現(xiàn)代信息查詢與利用 》參考題目

      一、每一位同學(xué)從以下題中選擇一題來做,也可以自擬題目: 城市下崗工人工作生活狀況

      促進(jìn)城鄉(xiāng)義務(wù)教育均衡發(fā)展問題

      大型賽事對城市發(fā)展的影響

      大學(xué)畢業(yè)生當(dāng)村官

      大學(xué)生創(chuàng)業(yè)現(xiàn)狀、問題與對策

      大學(xué)生就業(yè)問題研究綜述

      “80后”與“90后”大學(xué)生比較研究

      低碳經(jīng)濟(jì)研究綜述

      電子商務(wù)發(fā)展研究綜述

      發(fā)展低碳經(jīng)濟(jì)的現(xiàn)狀與對策

      發(fā)展旅游業(yè)對當(dāng)?shù)厣鷳B(tài)環(huán)境的影響

      房地產(chǎn)市場研究綜述

      在校大學(xué)生創(chuàng)業(yè)問題

      網(wǎng)絡(luò)對大學(xué)生的影響問題

      教育應(yīng)注重人格培訓(xùn)還是技能培訓(xùn)

      大學(xué)生談戀愛問題

      構(gòu)建和諧社會背景下的醫(yī)療衛(wèi)生問題

      關(guān)于城市化研究綜述

      關(guān)注弱勢群體生活保障問題

      國內(nèi)外高等教育研究綜述

      節(jié)能減排問題

      經(jīng)濟(jì)國際金融危機(jī)后民營企業(yè)經(jīng)營狀況

      經(jīng)濟(jì)與環(huán)境協(xié)調(diào)研究綜述

      科學(xué)發(fā)展觀與大學(xué)生活規(guī)劃

      老年人家庭贍養(yǎng)問題及對策

      旅游文化開發(fā)基礎(chǔ)研究

      農(nóng)村勞動力轉(zhuǎn)型問題

      農(nóng)村留守兒童生活狀況研究

      農(nóng)村人口的就業(yè)方式、就業(yè)觀念變化調(diào)查調(diào)研

      農(nóng)村社會保障制度建設(shè)研究

      農(nóng)村社會弱勢群體的權(quán)利保護(hù)問題

      農(nóng)村社會養(yǎng)老保險研究綜述

      農(nóng)村義務(wù)教育實(shí)施情況研究

      農(nóng)民工返鄉(xiāng)創(chuàng)業(yè)問題

      全球變暖問題

      社會保障問題

      四川旅游環(huán)境研究綜述

      特色農(nóng)業(yè)現(xiàn)代化道路調(diào)研

      圖書館建筑研究進(jìn)展綜述

      我國信息生態(tài)問題研究綜述

      我國遠(yuǎn)程教育在農(nóng)村中的發(fā)展問題 新農(nóng)村建設(shè)背景下的農(nóng)村鄉(xiāng)風(fēng)文明建設(shè) 新形勢下糧食安全問題 醫(yī)療制度改革問題

      金融危機(jī)對我國財政政策的影響綜述區(qū)域經(jīng)濟(jì)發(fā)展研究綜述

      新農(nóng)村建設(shè)中的公共事業(yè)管理研究綜述農(nóng)村留守兒童心理問題研究綜述碳匯交易在我國的發(fā)展現(xiàn)狀及對策基于分形理論的地方文化產(chǎn)業(yè)發(fā)展研究高校處罰法的立法現(xiàn)狀與未來發(fā)展公民道德危機(jī)問題研究紀(jì)錄片創(chuàng)作的故事化綿陽的旅游市場研究綜述

      數(shù)字圖書館的知識產(chǎn)權(quán)問題研究綜述知識傳播動力學(xué)研究綜述企業(yè)戰(zhàn)略信息系統(tǒng)研究綜述知識傳播動力學(xué)研究綜述

      分布式知識管理系統(tǒng)的開發(fā)和應(yīng)用研究綜述流媒體技術(shù)研究綜述軟系統(tǒng)方法研究綜述

      高校信息化體系建構(gòu)研究綜述智能代理技術(shù)研究綜述

      網(wǎng)絡(luò)信息的挖掘技術(shù)研究綜述異構(gòu)信息集成模型研究綜述網(wǎng)絡(luò)不良信息過濾研究

      信息向量與信息接發(fā)失真研究綜述信息技術(shù)對組織的影響研究綜述信息資源開發(fā)技術(shù)研究綜述三維可視化系統(tǒng)研究綜述信息污染研究綜述信息系統(tǒng)實(shí)證研究綜述

      版權(quán)保護(hù)與信息資源共享研究綜述網(wǎng)絡(luò)虛擬財產(chǎn)的法律屬性研究農(nóng)村宅基地使用權(quán)流轉(zhuǎn)法律問題互聯(lián)網(wǎng)發(fā)展的法治問題

      公民啟動違憲審查的法律困境公民言論自由的法律限制

      大眾傳媒對大學(xué)生學(xué)習(xí)的影響消費(fèi)者知情權(quán)的保障研究我國品牌發(fā)展的問題與對策廣告新聞化的媒介行為分析研究

      二、要求按以下格式及內(nèi)容要求撰寫“《現(xiàn)代信息查詢與利用》綜合報告”:

      《現(xiàn)代信息查詢與利用》綜合報告模板

      學(xué)科專業(yè)學(xué)號姓名成績

      課題:

      一.研究主題分析 1. 需求分析:

      (列舉出課題需要的文獻(xiàn)信息為全面性文獻(xiàn)資料/專深性文獻(xiàn)資料;查找的文獻(xiàn)資料的文獻(xiàn)類型;文獻(xiàn)加工深度;文獻(xiàn)的時間范圍;文獻(xiàn)的作者、文獻(xiàn)的質(zhì)量;語種范圍)2. 關(guān)鍵詞分析:

      (根據(jù)課題題目提取出檢索關(guān)鍵詞,并且擴(kuò)展出相關(guān)的等同詞與下位詞)3. 背景知識:

      (通過文獻(xiàn)資料匯集書寫300字左右的課題的背景材料,可包括課題描述的事物發(fā)展歷程、種類、現(xiàn)狀,國內(nèi)外研究的重點(diǎn)機(jī)構(gòu)、項(xiàng)目、代表人物和已經(jīng)取得的學(xué)術(shù)成果等)4. 擬解決的問題:

      (通過思維分析活動和了解課題背景知識對課題進(jìn)行主題分析,提出需要解決的問題)二.信息檢索與收集 1.檢索方法:

      (文獻(xiàn)檢索過程中可能需要使用的檢索方法,例如常規(guī)法、追溯法、訪談法、二次檢索法、綜合法等)2.檢索工具:

      (查找文獻(xiàn)的工具;文獻(xiàn)檢索過程中使用到的中文數(shù)據(jù)庫;中文搜索引擎;紙質(zhì)書籍、報紙、期刊等。要求使用的檢索工具不少于3個)3.檢索主題詞:檢索表達(dá)式

      (文獻(xiàn)檢索過程中使用的檢索詞,檢索技術(shù)的應(yīng)用)4.檢索過程:

      (根據(jù)提取的主題檢索詞,依次使用不同的檢索工具,運(yùn)用構(gòu)建相匹配的檢索表達(dá)式并且使

      用適合的檢索方法,分別獲取檢索結(jié)果)

      三、檢索結(jié)果的篩選與評價

      1、依據(jù)檢索目標(biāo),對檢索獲得的相關(guān)結(jié)果文獻(xiàn)進(jìn)行選擇,并記錄下其中6篇重要文獻(xiàn)的外表特征分別是:(1)【題名】 【作者】【作者單位】 【刊名】【關(guān)鍵詞】

      【摘要】(此處指的是原文的摘要)

      得到了下列的重要文獻(xiàn)(包括追溯法檢索與引文檢索法獲取的文獻(xiàn))的外表特征及摘要是:

      2、依據(jù)檢索結(jié)果,從文獻(xiàn)的相關(guān)性、可靠性、適用性、新穎性等幾個方面來評價一下

      四、檢索結(jié)果的比較與歸納

      (通過閱讀分析,對5篇文獻(xiàn)從研究的目的、提出研究的問題、研究方法、研究的結(jié)論、文獻(xiàn)的創(chuàng)新點(diǎn)、該文獻(xiàn)與你的關(guān)系等方面進(jìn)行比較與歸納分析,寫出針對該題目,在以后的寫作中將重點(diǎn)研究的內(nèi)容與方法,或提出自己研究的方向與重點(diǎn)。)

      五、檢索結(jié)果的應(yīng)用與組織(綜述寫作)

      按照課題要求,根據(jù)分析整理出的5篇文獻(xiàn)資料,選擇一種綜述類型撰寫課題的綜述。要求字?jǐn)?shù)1000字左右,格式要完整:(1)題目:(2)引言:(3)正文:(4)結(jié)論:(5)參考文獻(xiàn):(按照標(biāo)準(zhǔn)的參考文獻(xiàn)標(biāo)注格式書寫,并在綜述中標(biāo)注出來)

      六、我的信息素養(yǎng)(選做其中一題)

      1、對照本課程的信息素養(yǎng)評價指標(biāo),根據(jù)課程學(xué)習(xí)的心得體會,寫下自我信息素養(yǎng)提高的總結(jié),200字。

      2、打開,以實(shí)名制形式做一份問卷調(diào)查。

      作業(yè)形式:打印稿

      作業(yè)上交時間:6月20日

      地點(diǎn):新區(qū)圖書館三樓技術(shù)部(3-12)電話:6089229

      溫馨提示:綜合報告中所提及的概念在課堂上、書本上都有講過,如果不記得,可網(wǎng)絡(luò)自助查詢,此過程不必寫入報告。

      第二篇:現(xiàn)代信息檢索論文

      期末課程論文

      論文標(biāo)題:課程名稱:信息檢索技術(shù)課程編號:學(xué)生姓名:尹江津?qū)W生學(xué)號:所在學(xué)院:計(jì)算機(jī)科學(xué)與工程學(xué)院學(xué)習(xí)專業(yè):計(jì)算機(jī)科學(xué)與技術(shù)課程教師:

      文本分類及相關(guān)技術(shù)研究

      1220500 1100310230

      2013年7月2 日

      文本分類及相關(guān)技術(shù)研究

      信息檢索(Information Retrieval,IR)是研究信息的表示、存儲、組織和獲取的一門學(xué)科,其目標(biāo)是為用戶快速、準(zhǔn)確地提供其所需的信息。信息檢索起源于20世紀(jì)50年代,在60年代取得了關(guān)鍵性進(jìn)展,其中最著名的是GerardSalton開發(fā)的SMART系統(tǒng)以及Cym Cleverdon提出的Cranfield評價方法,SMART系統(tǒng)和Cranfield評價方法有力地推動了信息檢索的發(fā)展。在70年代和80年代,多種關(guān)于文檔檢索的模型被提出,文本檢索會議(TREC)于1992年開始舉辦,該會議推動了大規(guī)模文檔集合環(huán)境下的信息檢索技術(shù)的發(fā)展。隨著互聯(lián)網(wǎng)上信息的迅速增加,為了進(jìn)一步提高用戶信息檢索的質(zhì)量和效率,網(wǎng)絡(luò)上出現(xiàn)了更高效地信息索工具——搜索引擎(Google,Yahoo,Bing,百度等),搜索引擎為用戶在互聯(lián)網(wǎng)這個分布式環(huán)境下檢索需要的信息提供了極大的方便。

      文本分類是一個監(jiān)督學(xué)習(xí)過程,它根據(jù)一個類信息已知的訓(xùn)練文檔集合,訓(xùn)練出文本特征和文本類別間的關(guān)系模型,然后通過這個學(xué)習(xí)得到的模型對待分類文本進(jìn)行分類。文本分類技術(shù)是處理和組織文本數(shù)據(jù)的重要手段,同時也是信息檢索的重要基礎(chǔ),把大量的文本信息按主題層次進(jìn)行組織可以極大地簡化信息檢索的過程,按照類別對文檔進(jìn)行檢索或?qū)z索結(jié)果進(jìn)行分類,都可以提高檢索的查準(zhǔn)率。由于文本分類技術(shù)可以對大量的文本進(jìn)行分類,文本分類在信息檢索、自然語言處理、垃圾信息過濾、Web挖掘等領(lǐng)域得到了廣泛應(yīng)用。

      一、文本分類概述 1.文本分類的一般過程

      數(shù)據(jù)分類是數(shù)據(jù)分析的一種重要形式,數(shù)據(jù)分類通常用兩個步驟:學(xué)習(xí)和分類。在學(xué)習(xí)步,分類算法利用訓(xùn)練數(shù)據(jù)來構(gòu)建分類器,訓(xùn)練數(shù)據(jù)有多個元組以及與元素關(guān)聯(lián)的類標(biāo)簽構(gòu)成。元組X被表示為n維的屬性向量,每一個元組屬于一個或多個事先定義好的類別,類別由類標(biāo)號屬性(class label attribute)決定,類標(biāo)號屬性由離散、無序值構(gòu)成。由于每一個訓(xùn)練元組的類標(biāo)號已知,因此,學(xué)習(xí)步是一個監(jiān)督學(xué)習(xí)過程。學(xué)習(xí)步可以看作是學(xué)習(xí)映身函數(shù),函數(shù),對于給定的元組Z該函數(shù)可以預(yù)測與X關(guān)聯(lián)的類別標(biāo)號。文本是數(shù)據(jù)的一種具體形式,也是語言的實(shí)際運(yùn)用形態(tài),文本在人們生常生活中無處不在,任何有具體一定含義的文字都可以統(tǒng)稱為文本。文本分類系統(tǒng)的任務(wù)是:在給定的分類體系下,根據(jù)文本的內(nèi)容自動地對待分類文本進(jìn)行分類,確定待分類文本的類別。其數(shù)學(xué)公式表示如下:

      其中,A為類信息未知文本的集合,B為分類體系中類別信息的集合文本分類一般包括以下5個過程:文本預(yù)處理、文本表示、特征降維、分類器的選取與訓(xùn)練以及分類結(jié)果的評價。

      文本分類系統(tǒng)的主要功能模塊為:

      (1)文本預(yù)處理:為了使文檔的格式滿足分類器的輸入要求,首先需要對原始語料進(jìn)行處理,將其格

      式進(jìn)行規(guī)范化,;

      (2)文本表示:將文本分解為基本處理單元,用數(shù)學(xué)模型來表示;(3)特征降維:降低特征空間的維數(shù),提高分類器的效率和準(zhǔn)確率;(4)分類器:選擇合適的分類器并用訓(xùn)練數(shù)據(jù)集進(jìn)行訓(xùn)練;(5)性能評價:選擇對分類器的性能進(jìn)行評估的性能評價標(biāo)準(zhǔn)。

      2.文本預(yù)處理·

      自動文本分類的第一步是文本預(yù)處理。通常情況下,各種不同類型的文檔的來自不同的領(lǐng)域,從而文檔的存儲形式各異,并且計(jì)算機(jī)處理的文本不僅包含文字內(nèi)容,還包含有功能性標(biāo)簽等不規(guī)范符號,文本分類模型不能直接對原始文檔進(jìn)行處理。必須對原始文本進(jìn)行預(yù)處理,去除其中的噪聲,規(guī)范化其形式,從而使文本滿足分類模型的輸入要求。文本預(yù)處理是影響文本分類準(zhǔn)確度的關(guān)鍵因素,文本預(yù)處理的主要任務(wù)是從原始文本提取主要內(nèi)容并對其格式進(jìn)行規(guī)范化,一般包括以下幾個步驟:去除文檔中的格式標(biāo)記、過濾非法字符、字母大小寫轉(zhuǎn)換、去除停用詞和稀有詞、詞干化處理。

      3.文本表示

      文本本身不能被直接用來分類,為了使文本能夠輸入到計(jì)算機(jī)中進(jìn)行處理,首先應(yīng)將原始文本轉(zhuǎn)換為數(shù)學(xué)模型,然后用計(jì)算機(jī)對數(shù)學(xué)模型進(jìn)行處理。在實(shí)際應(yīng)用中,將原始文本轉(zhuǎn)為文本向量和詞頻矩陣后,這些數(shù)學(xué)模型非常龐大,計(jì)算機(jī)處理時需要花費(fèi)大量的時間,為了提高處理效率,一般都假設(shè)詞語與詞語之間相互獨(dú)立,詞語在文本中的位置被忽略,文檔被表示為不同特征項(xiàng)的集合。這種方法被稱為“樸素(Naive)”的方法或“詞袋“模型。文本表示模型主要有布爾模型、向量空間模型以及統(tǒng)計(jì)語言模型,雖然這三種模型采用不同的方法來表示文檔,這三種模型都采用了“詞袋”模型的思想。

      4.信息增益

      信息增益是指某特征項(xiàng)在文本中出現(xiàn)前后的信息熵之差,在機(jī)器學(xué)習(xí)領(lǐng)域中,經(jīng)常用信息增益來衡量某個特征項(xiàng)的重要性。對于詞語t和文檔類別C,通過統(tǒng)計(jì)C中出現(xiàn)和不出現(xiàn)t的文檔數(shù)來衡量t對C的信息增益。特征項(xiàng)t的信息增益用如下公式計(jì)算:

      其中,Pr(Ci)表示在文本集合中屬于白類的文本出現(xiàn)的概率,Pr(t)表示文本集合中包含特征項(xiàng)t的文本在文本集合中的出現(xiàn)概率,Pr(Ci|t)表示在文本中包含詞語f的條件下文本屬于類Ci的條件概率,Pr(t)表示文本集合不包含特征項(xiàng)t的文本在文本集合中的出現(xiàn)概率,Pr(Ci|t)表示在文本中不包含詞語t的條件下文本屬于類Ci的條件概率,m是類別總數(shù)。根據(jù)公式計(jì)算出各個特征項(xiàng)的信息增益后,除去增益值小于指定閩值的特征項(xiàng),剩余的即為選中的特征;或按特征項(xiàng)的信息增益從大到小排序,刪除信息增益很小的單詞。

      二、文本分類方法 1.Naive Bayes方法

      Naive Bayes分類方法(以下簡稱NB法)是一種簡單而又非常有效的分類方法。NB法的一個前提假設(shè)是:在給定的文檔類語境下,文檔屬性是相互獨(dú)立的。假設(shè)面為一任意文檔,它屬于文檔類C={cl,C2,.,Ck)中的某一類cj。根據(jù)NB分類法有:

      對文檔反進(jìn)行分類,就是按計(jì)算所有文檔類在給定di情況下的概率,概率值最大的那個類就是di所在的類,即:

      可知,對于給定分類背景和測試文檔,用NB法分類的關(guān)鍵就是計(jì)算P(Cj)和P(di|cj)。計(jì)算P(cj)和尸(硝lcj)的過程就是建立分類模型(或者說學(xué)習(xí))的過程。根據(jù).P(dj|ci)計(jì)算方式的不同,可以將Naive Bayes方法分為最大似然模型(Maximum Likelihood Model)、多項(xiàng)式模型(Multinomial Model)、泊松模型(PoisonModel)等[ELM03]。

      2.使用最大熵模型進(jìn)行中文文本分類

      最大熵模型是一種在廣泛應(yīng)用于自然語言處理中的概率估計(jì)方法,它可以綜合觀察到的各種相關(guān)或冪相美的概率知識,對許多問題的處理結(jié)果都到這或超過了其他方法的最好結(jié)果。但是,將最大熵模型應(yīng)用在文本分類中的研究卻非常少,本章使用最大熵模型進(jìn)行了中文文本分類的研究。通過實(shí)驗(yàn),比較和分析了不目的中文文本特證生成方法,以及使用平滑技術(shù)的情況下,基于最大熵模型的分類器的分類性能;將其和Bayes、KNN、SVM三葶爭典墨的文本分類器進(jìn)行了比較;使用Bagging來提高最大熵模型的分類穩(wěn)定性。

      1).最大熵模型

      最大熵模型是用來進(jìn)行概率估計(jì)的。假設(shè)a是某個事件,b是事件a發(fā)生的環(huán)境(或稱上下文),我們想知道a和b的聯(lián)合概率,記為p(a,b)。更一般地,設(shè)所有可能發(fā)生的事件組成集合為A,所有環(huán)境組成的集合為B,我們想知道,對于任意給定的aA,bB,概率p(a,b)是多少?

      我們抱這個問題放到自然語言處理的領(lǐng)域來討論,對于文本分類問題,一個文檔分到某個類別可以看成一個事件,文檔中出現(xiàn)的詞可以看成這個事件的發(fā)生環(huán)境,我們想知道包含詞b的文檔屬于某一類a的概率。很容易想到的方法是通過訓(xùn)練語料進(jìn)行統(tǒng)計(jì)。給定一個訓(xùn)練集,定義A={a1,a2,A,am)是文檔所屬類別集,B={bl,b2,A,bm}是文檔的特征詞集,num(ai,bj)為疆練集中二元組(ai,bj)出現(xiàn)的次數(shù),那么我們可以使用如下公式進(jìn)行概率估計(jì):

      這個方法有個很大的問題,即“稀疏事件”(sparse evidence)問題,即便是很大的訓(xùn)練文本,很多

      二元縫組(ai,bj)仍然沒有出現(xiàn),武斷的認(rèn)為它的概率為0顯然是不可取的。最大熵模型是這樣來解決稀疏事件問題的,它使未知事件的概率分布總是盡可能均勻,即傾向予得到最大熵。例如一個軍事、政治和科技的三類文本分類題,我們得知出現(xiàn)“飛秘”這個詞的、80%的文檔屬于軍事類別,對于“飛機(jī)”這個詞在蒺飽兩類中的分布未知。根據(jù)最大熵原則,如果給定一個包含“飛機(jī)”這個詞文檔,那么認(rèn)為文檔以0.8的概率屬于軍事類別,分別以0.1的概率屬于其它兩類;如果文檔中不包含“飛機(jī)”這個詞,那么認(rèn)為文檔分別以相同的、1/3的概率屬于每一個類。即,在符合已知約束條件下,使未知事件盡可能均勻。具體來說,根據(jù)Shannon的定義,熵的計(jì)算公式如下:

      那么,求解滿足最大熵原則的概率分布公式如下:

      三、總結(jié)與展望

      文本分類技術(shù)是組織和處理文本數(shù)據(jù)的重要手段,其主要任務(wù)是如何在給定的分類體系下,根據(jù)文本的內(nèi)容自動地確定與文本關(guān)聯(lián)的類別。文本分類可以有效解決大量文本信息歸類的問題,并且是信息檢索、Web挖掘、內(nèi)容信息過濾等研究的重要基礎(chǔ)。主題模型是概率模型,由于主題模型可以捕獲潛在的語義結(jié)構(gòu)信息,主題模型在文本分類、信息抽取、觀點(diǎn)挖掘等文本挖掘任務(wù)中的應(yīng)用得到了較深入的研究。

      本文對文本分類進(jìn)行了研究,介紹了文本分類的一般過程與關(guān)鍵技術(shù),主要包括:文本預(yù)處理、文本表示、性能評價指標(biāo),同時還對主題模型PLSA、LDA、sLDA和iTopicModel的構(gòu)建方法和參數(shù)估計(jì)方法進(jìn)行了介紹。針對已有的監(jiān)督主題模型與基于機(jī)器學(xué)習(xí)的文本分類算法假設(shè)文檔之間相互獨(dú)立、不能有效利用文檔間的關(guān)聯(lián)關(guān)系的問題,提出了監(jiān)督關(guān)聯(lián)主題模型SRTM和關(guān)聯(lián)文本分類算法TC.iTM。為了利用利用文檔間的關(guān)聯(lián)關(guān)系來提高監(jiān)督主題模型的預(yù)測準(zhǔn)確度,我們基于iTopicModel提出了監(jiān)督關(guān)聯(lián)主題模型SRTM,將文檔間的關(guān)聯(lián)關(guān)系、文檔的文本信息、文檔的標(biāo)號進(jìn)行統(tǒng)一建模,首先用古典線性回歸模型對文檔標(biāo)號進(jìn)行建模,給出SRTM的聯(lián)合概率分布,通過EM算法最大化聯(lián)合概率分布的對數(shù)似然對SRTM的參數(shù)進(jìn)行估計(jì),然后用Fold.In[54]方法對訓(xùn)練數(shù)據(jù)以外文檔的標(biāo)號進(jìn)行預(yù)測。最后我們用廣義線性模型對文檔標(biāo)號進(jìn)行建模,對SRTM進(jìn)行擴(kuò)展,使SRTM可以處理多種類型的文檔標(biāo)號。Cora研究論文分類數(shù)據(jù)集和電影評論數(shù)據(jù)集上的實(shí)驗(yàn)表明,在文檔網(wǎng)絡(luò)中,SRTM的預(yù)測結(jié)果要優(yōu)于現(xiàn)有的監(jiān)督主題模型。

      參考文獻(xiàn): [學(xué)位論文] 姜英杰,2010鄭州大學(xué):計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)

      [學(xué)位論文] 劉欣,2010重慶大學(xué):計(jì)算機(jī)科技與技術(shù)

      [學(xué)位論文] 陳樹清,2010南京理工大學(xué):計(jì)算機(jī)應(yīng)用技術(shù)

      第三篇:信息檢索題目及答案

      注意:

      1、通讀教材,根據(jù)頁碼提示完成下列題目。

      2、最后一次上機(jī)課在線測試,范圍不超出如下題目。

      第一章

      一、單選

      1、報道范圍主要為能源方面的科技報告為(D)。

      A、AD

      B、PB

      C、NASA

      D、DOE{第7頁}

      2、(C)是出版周期最短的定期連續(xù)出版物。

      A、圖書

      B、期刊

      C、報紙

      D、學(xué)位論文{第6頁}

      3、(A)是高校或科研機(jī)構(gòu)的畢業(yè)生為獲取學(xué)位而撰寫的。

      A、學(xué)位論文

      B、科技報告

      C、會議文獻(xiàn)

      D、檔案文獻(xiàn){第6頁}

      4、了解各個國家政治、經(jīng)濟(jì)、科技發(fā)展政策的重要信息源是(B)

      A、科技報告

      B、政府出版物

      C、標(biāo)準(zhǔn)文獻(xiàn)

      D、檔案文獻(xiàn){第8頁}

      5、年鑒屬于下列哪一類別(D)

      A、零次信息

      B、一次信息

      C、二次信息

      D、三次信息{第7頁}

      6、下列哪種文獻(xiàn)屬于一次文獻(xiàn)(A)。

      A、圖書

      B、百科全書

      C、綜述

      D、文摘 {第4頁}

      7、下列文獻(xiàn)中屬于一次信息的是(A)

      A、專利說明書

      B、百科全書

      C、目錄

      D、綜述{第4頁}

      8、以下各項(xiàng)屬于二次信息的是(A)

      A、索引

      B、期刊

      C、學(xué)位論文

      D、百科全書{第4頁}

      二、多選

      9、二次信息主要包括(CD)等。

      A、手冊

      B、年鑒

      C、目錄

      D、題錄{第4頁}

      10、信息的屬性包括(ABCD)

      A、客觀性

      B、時效性

      C、傳遞性

      D、共享性{第3頁}

      11、信息素質(zhì)的內(nèi)涵主要包括(ABC)。

      A、信息意識素質(zhì)

      B、信息能力素質(zhì)

      C、信息道德素質(zhì)

      D、信息職業(yè)素質(zhì){第9頁}

      12、以下類型的信息屬于三次信息的是(BC)。

      A、目錄

      B、詞典

      C、百科全書

      D、科技報告{第4頁}

      三、判斷

      13、檔案文獻(xiàn)具有原始性特點(diǎn),客觀真實(shí)地反映了歷史。(正確){第8頁}

      14、年鑒和百科全書屬于二次信息。{第4頁}錯

      15、圖書一般不能反映最新的信息,時效性差,相比之下,期刊出版發(fā)行速度快,內(nèi)容新穎。(正確){第6頁}

      16、文獻(xiàn)信息源是各種信息源中檢索與利用的主體。(正確){第3頁}

      17、一次信息也稱為第一手資料,如書目和索引。(錯){第4頁}

      18、語言信息源,即零次信息,也就是指非正式的、口頭交換的信息。(正確){第4頁}

      19、知識被包含于信息,是信息的組成部分。(正確){第2頁} 20、專利說明書屬于二次信息的范疇。(錯){第4頁} 第二章

      一、單選

      21、(D)是指未檢出的相關(guān)信息量與檢索系統(tǒng)中實(shí)際與課題相關(guān)的信息總量的比率。

      A、查全率

      B、查準(zhǔn)率

      C、誤檢率 D、漏檢率{第43頁}

      22、《四級英語閱讀與完型填空》這本圖書在中圖法體系中的分類號可能是(D)。

      A、G636.33 B、G216.2 C、I247.4 D、H319{第21頁}

      23、布爾邏輯表達(dá)式:在職人員NOT(中年AND教師)的檢索結(jié)果是(A)

      A、檢索出除了中年教師以外的在職人員的數(shù)據(jù)

      B、中年教師的數(shù)據(jù)

      C、中年和教師的數(shù)據(jù)

      D、在職人員的數(shù)據(jù){第34-35頁}

      24、布爾邏輯檢索中檢索符號“OR”的主要作用在于(B)。

      A、提高查準(zhǔn)率

      B、提高查全率

      C、排除不必要信息

      D、減少文獻(xiàn)輸出量{第35頁}

      25、根據(jù)一定的需要,將特定范圍內(nèi)的某些文獻(xiàn)中的有關(guān)知識單元或款目按照一定的方法編排,并指明出處,為用戶提供文獻(xiàn)線索的一種檢索工具是(C)。

      A、目錄

      B、題錄

      C、索引

      D、文摘{第30頁}

      26、將存儲于數(shù)據(jù)庫中的整本書、整篇文章中的任意內(nèi)容查找出來的檢索是(A)

      A、全文檢索

      B、文獻(xiàn)檢索

      C、超文本檢索

      D、超媒體檢索{第14頁}

      27、截詞檢索中,“?”和“*”的主要區(qū)別在于(A)。

      A、字符數(shù)量的不同

      B、字符位置的不同

      C、字符大小寫的不同

      D、字符縮寫的不同{第36頁}

      28、盡管不同的檢索系統(tǒng)對截詞符的定義不盡相同,一般而言,多數(shù)用(C)表示無限限檢索。

      A、+ B、| C、* D、?{第36頁}

      29、盡管不同的檢索系統(tǒng)對截詞符的定義不盡相同,一般而言,多數(shù)用(A)表示有限檢索。

      A、?

      B、| C、* D、-{第36頁} 30、利用截詞技術(shù)檢索“?ake”,以下檢索結(jié)果正確的是(D)

      A、stake B、snake C、slake D、take{第36頁}

      31、利用圖書末尾所附參考文獻(xiàn)進(jìn)行檢索的方法是(D)。

      A、順查法

      B、倒查法

      C、抽查法

      D、追溯法{第15頁}

      32、位置運(yùn)算符號(W)和(N)的主要區(qū)別在于(C)。

      A、檢索詞之間間隔的字符數(shù)量的差異

      B、檢索詞是否出現(xiàn)在同一字段中

      C、檢索詞出現(xiàn)的位置是否可以顛倒

      D、檢索詞是否出現(xiàn)在同一文獻(xiàn)中{第37-38頁}

      33、我國最早的分類法是(B)

      A、《中經(jīng)新簿》

      B、《七略》

      C、《四庫全書總目》

      D、《隋書經(jīng)籍志》{第19頁}

      34、要查找吳敬璉所發(fā)表的文章,首選途徑為(C)。

      A、題名途徑

      B、號碼途徑

      C、責(zé)任者途徑

      D、以上都行{第16頁}

      二、多選

      35、布爾邏輯檢索的運(yùn)算符號包括(ABC)。

      A、and B、or C、not D、add{第34-35頁}

      36、布爾邏輯運(yùn)算符號“非”的作用在于(ABCD)。

      A、增加限制條件

      B、排除檢索結(jié)果

      C、縮小文獻(xiàn)范圍

      D、提高查準(zhǔn)率{第35頁}

      37、布爾邏輯運(yùn)算符號“與”的作用在于(ABCD)。

      A、增加限制條件

      B、縮小檢索范圍

      C、提高檢索的專指性

      D、提高查準(zhǔn)率{第34頁}

      38、常用的位置檢索符號包括(ABCD)。

      A、(W)

      B、(nW)C、(N)D、(nN){第37-38頁}

      39、常用的信息檢索方法有以下幾種(ABCD)

      A、常規(guī)法

      B、追溯法

      C、循環(huán)法

      D、瀏覽法{第15頁} 40、截詞檢索中,常用的截詞符號有(CD)。

      A、+ B、-C、* D、?{第36頁}

      41、描述信息外表特征的信息檢索語言包括(ABD)。

      A、題名

      B、著者

      C、出版者

      D、號碼{第16-17頁}

      42、如果檢索結(jié)果太多,查準(zhǔn)率很低,需要調(diào)整檢索范圍,此時調(diào)整檢索策略的方法有(AD)等。

      A、用邏輯“與”或者邏輯“非”增加限制概念

      B、用邏輯“或”或截詞增加同族概念

      C、使用截詞檢索

      D、用二次檢索增加限制條件{第41頁}

      43、使用截詞檢索的作用在于(ACD)。

      A、擴(kuò)大檢索范圍

      B、排除檢索結(jié)果

      C、防止漏檢

      D、提高查全率{第36頁}

      44、使用邏輯“或”是為了(AC)。

      A、提高查全率

      B、提高查準(zhǔn)率

      C、擴(kuò)大檢索范圍

      D、縮小檢索范圍{第34頁}

      45、網(wǎng)絡(luò)檢索系統(tǒng)的特點(diǎn)是(ABC)。

      A、資料豐富

      B、檢索方便

      C、費(fèi)用低廉

      D、不受時空限制{第28頁}

      46、文獻(xiàn)信息檢索工具主要有以下幾種類型(ABCD)。

      A、目錄

      B、題錄

      C、索引

      D、文摘{第30頁}

      47、下列哪種方法可以提高檢索的查全率(ABCD)。

      A、降低檢索詞的專指度

      B、取消“and”/“not”等過嚴(yán)的限制符

      C、增加檢索年限,減少語種、文獻(xiàn)類型的限制,擴(kuò)大檢索詞出現(xiàn)的可檢字段范圍

      D、改精確檢索為模糊檢索{第41頁}

      48、下列哪種方法可以提高檢索的查準(zhǔn)率(ABCD)。

      A、加強(qiáng)檢索詞的專指度

      B、用“and”/“not”等限制或排除某些概念

      C、從年代、語種和文獻(xiàn)類型上進(jìn)行限制

      D、將檢索詞限定在一定的字段中{第41頁}

      49、信息檢索系統(tǒng)的類型包括(AB)。

      A、手工檢索系統(tǒng)

      B、計(jì)算機(jī)檢索系統(tǒng)

      C、文字檢索系統(tǒng)

      D、符號檢索系統(tǒng){第27-28頁} 50、信息檢索效果評價的指標(biāo)有(ABCD)。

      A、查全率

      B、漏檢率

      C、查準(zhǔn)率

      D、誤檢率{第42-43頁}

      51、影響檢索效果的因素主要來自兩個方面(CD)。

      A、查全率

      B、查準(zhǔn)率

      C、檢索系統(tǒng)本身

      D、檢索人員的檢索水平{第43頁}

      52、在計(jì)算機(jī)信息檢索系統(tǒng)中,常用的檢索技術(shù)有(ABCD)。

      A、布爾邏輯檢索

      B、截詞檢索

      C、位置檢索

      D、限制檢索{第32-38頁}

      53、在下面的分類號中,(CD)是中國圖書館圖書分類號。

      A、22.27 B、TB324 C、G252.7 D、R329.2{第20頁}

      54、在限制檢索中,檢索詞與檢索字段的關(guān)系用限制符表示,以下屬于常見限制符的有(ABCD)。

      A、包含

      B、大于

      C、等于

      D、介于{第33頁}

      三、判斷

      55、《中圖法》的標(biāo)識符號是漢語拼音字母與阿拉伯?dāng)?shù)字相結(jié)合的混合制號碼。(正確){第20頁}

      56、不論信息檢索的方法是否相同,信息檢索的原理都是一樣的。(正確){第11頁}

      57、查全率和漏檢率是一對互逆的檢索指標(biāo)。(正確){第42頁}

      58、截詞檢索技術(shù)可以有效防止漏檢。(正確){第36頁}

      59、使用循環(huán)法檢索能獲得較高的查全率和查準(zhǔn)率。(正確){第15頁} 60、數(shù)據(jù)事實(shí)檢索工具屬于二次信息的范疇。(錯){第13頁} 61、數(shù)據(jù)信息檢索是一種非確定性檢索,不能直接提供用戶所需要的確切的數(shù)據(jù)。(錯){第13頁} 62、文獻(xiàn)信息檢索是一種相關(guān)性檢索而非確定性檢索。(正確){第13頁} 63、信息檢索語言是一種人工語言。(正確){第17頁}

      第三章

      一、單選

      64、Adobe Reader可以閱讀(D)格式文件。

      A、VIP B、TXT C、HTML D、PDF{上機(jī)試一下!} 65、ISBN是(B)的縮寫。

      A、國際標(biāo)準(zhǔn)刊號

      B、國際標(biāo)準(zhǔn)書號

      C、連續(xù)出版物代碼

      D、國內(nèi)統(tǒng)一刊號{第45頁} 66、超星數(shù)字圖書館可以為我們提供(A)

      A、圖書的原文

      B、專利文獻(xiàn)的原文

      C、科技報告的原文

      D、學(xué)位論文的原文{上機(jī)試一下!} 67、瀏覽超星數(shù)字圖書館,應(yīng)首先安裝(D)。

      A、Apabi Reader B、Adobe Reader C、CAJ View D、SSReader{上機(jī)試一下!} 68、下列不屬于圖書特點(diǎn)的是(D)

      A、內(nèi)容全面可靠

      B、出版周期長

      C、內(nèi)容更新慢

      D、信息較新穎{第45頁}

      二、多選

      69、圖書全文信息的獲取可以通過(ABCD)等渠道

      A、從網(wǎng)上購買圖書

      B、從圖書館借書

      C、通過電子圖書數(shù)據(jù)庫下載圖書全文

      D、通過搜索引擎查找免費(fèi)的電子書全文{上機(jī)試一下!} 70、下列數(shù)據(jù)庫可以查找電子書的是(ABCD)

      A、書生之家數(shù)字圖書館

      B、超星數(shù)字圖書館

      C、CNKI期刊全文數(shù)據(jù)庫

      D、SPINGERLINK{上機(jī)試一下!} 71、下列網(wǎng)站可以在線買印刷型圖書的有(ABD)

      A、004km.cn/cm/)、國家科學(xué)數(shù)字圖書館的圖書情報學(xué)科信息門戶(http://004km.cn/)等屬于專業(yè)型網(wǎng)絡(luò)導(dǎo)航。{第213頁}正確 192、URL是Uniform / Universal Resource Locator,中文名稱為統(tǒng)一資源定位符,也被稱為網(wǎng)頁地址,俗稱網(wǎng)址,是Internet上標(biāo)準(zhǔn)的資源地址。{第203頁}正確

      193、百度檢索結(jié)果標(biāo)題左邊的【DOC】標(biāo)志表示該結(jié)果不是網(wǎng)頁,而是一個WORD文檔。{第200頁}正確

      194、并不是所有的網(wǎng)絡(luò)信息資源都需要下載,通過網(wǎng)頁直接瀏覽是我們從Internet上獲取信息的主要方式。{第214頁}正確

      195、并不是所有的網(wǎng)上資源都有明確的下載鏈接,對于一些沒有明確下載鏈接的資源,下載的時候需要一些特殊的方法和技巧。{第214頁}正確

      196、多數(shù)搜索引擎對支持對以DO C、XLS、PPT、RTF、PDF為后綴名的文件進(jìn)行檢索。{第200頁}正確

      197、多數(shù)搜索引擎是通過在檢索詞之間使用空格或加號來實(shí)現(xiàn)布爾邏輯“并且”功能的。{第198頁}正確

      198、多數(shù)搜索引擎支持特定文件類型檢索,百度支持所有的文件類型。{第200頁}錯 199、共享程度高、獲取成本較低是網(wǎng)絡(luò)信息資源的特點(diǎn)之一。{第178頁}正確 200、宏觀有序、微觀無序是網(wǎng)絡(luò)信息資源的特點(diǎn)之一。{第177頁}錯

      201、考慮到搜索引擎的商業(yè)模式,檢索相關(guān)度并不是檢索結(jié)果排序的唯一指標(biāo)。{第186頁}正確 202、快照是搜索引擎對搜集到的網(wǎng)頁中文本信息的本地備份。{第197頁}正確

      203、使用搜索引擎檢索有關(guān)《天龍八部》這部武俠小說方面的內(nèi)容,但是不希望有關(guān)《天龍八部》電視劇方面的信息出現(xiàn)??梢杂萌缦聶z索表達(dá)式:天龍八部 –電視劇{第199頁}正確 204、搜索引擎把索引信息存儲在索引器中。{第185頁}錯

      205、搜索引擎的檢索策略是指利用搜索引擎進(jìn)行信息檢索的全面規(guī)劃,主要涉及分析檢索需求、選擇搜索引擎及其具體功能、確定檢索式、修正檢索式等問題。{第206頁}正確

      206、搜索引擎檢索結(jié)果頁面每個檢索結(jié)果中出現(xiàn)的日期實(shí)際上是網(wǎng)頁的創(chuàng)建時間。{第197頁}錯 207、搜索引擎檢索器的主要功能是抓取信息。{第186頁}錯

      208、所謂“主+輔+限定”結(jié)構(gòu)檢索式是指由主題詞、輔助詞、語法限定組成的檢索式。{第206頁}正確

      209、網(wǎng)絡(luò)導(dǎo)航是根據(jù)具體用戶的需要,對Internet上信息資源進(jìn)行搜集、分類,形成相對科學(xué)、系統(tǒng)、動態(tài)更新的網(wǎng)絡(luò)資源組織體系,并通過一個門戶以超鏈接的形式為用戶使用網(wǎng)絡(luò)信息資源提供指引。{第209頁}正確

      210、相對于搜索引擎首頁的簡單檢索而言,高級檢索界面提供更為豐富的檢索功能,相對高級檢索語法而言,高級檢索界面提供可視化的功能選項(xiàng),不用記復(fù)雜的檢索語法規(guī)則,因此對用戶尤其是入門用戶來說,通過搜索引擎的高級檢索界面檢索是提高檢索效率的合適選擇。{第204頁}正確

      211、由于缺乏統(tǒng)一的管理控制,來源不同的網(wǎng)絡(luò)信息資源質(zhì)量參差不齊,價值差別較大{第178頁}正確

      212、在Internet中,很多有價值的信息資源并非以普通的網(wǎng)頁的形式存在,而是以文件形式存在,文件的格式也多種多樣。{第200頁}正確

      213、在百度搜索時,使用filetype語法,增加檢索條件,縮小了結(jié)果范圍,提高了查準(zhǔn)率。{第200頁}正確

      214、在百度搜索時,使用intitle增加檢索條件,擴(kuò)大了結(jié)果范圍,提高了查全率。{第201頁}錯

      215、在百度搜索時,使用site語法增加檢索條件,縮小了結(jié)果范圍,提高了查準(zhǔn)率。{第202頁}正確

      216、在百度搜索時,使用減號增加檢索條件,縮小了結(jié)果范圍,提高了查準(zhǔn)率。{第199頁}正確

      217、在百度搜索時,使用空格增加檢索條件,縮小了結(jié)果范圍,提高了查準(zhǔn)率。{第198頁}正確

      218、在百度搜索時,使用豎線增加檢索條件,縮小了結(jié)果范圍,提高了查準(zhǔn)率。{第199頁}錯

      219、在百度搜索時,使用雙引號對檢索條件進(jìn)行限定,縮小了結(jié)果范圍,提高了查全率。{第199頁}錯

      220、專門查詢機(jī)票信息的檢索系統(tǒng)是垂直搜索引擎。{第187頁}正確

      221、作為在搜索引擎檢索框輸入的文字和符號,檢索式并沒有一個固定的格式,但考慮到檢索的效率,在分析檢索需求的的基礎(chǔ)上,有意識的使用“主+輔+限定”結(jié)構(gòu)檢索式能取得較好的檢索效果。{第206頁}正確

      第四篇:現(xiàn)代信息檢索學(xué)習(xí)報告

      76993082.doc

      (圖與內(nèi)容無關(guān))

      Modern Information Retrieval 現(xiàn)代信息檢索學(xué)習(xí)報告

      姓名:

      班級:

      學(xué)號: 教師:

      76993082.doc

      一,我的感想

      在報這課程時,對這門課程并不了解,只是簡單的認(rèn)為信息檢索就是翻翻書找找文獻(xiàn)等是單純的查找。但是經(jīng)過這一學(xué)期的課程,我發(fā)現(xiàn)每一條信息,每一篇文章都是系統(tǒng)的歸類,劃分范圍類型,而檢索的途徑也很多種,如有作者途徑檢索、分類途徑檢索等,檢索式更是分類齊全繁多。

      有很多收獲,感覺很充實(shí),發(fā)現(xiàn)我們的生活中時時刻刻都在檢索信息.在老師的指引下,我們對檢索工具一步一步地熟悉和應(yīng)用,對于檢索的方法,我覺得不管是在哪個網(wǎng)站檢索,最重要的還是關(guān)鍵詞的選擇。關(guān)鍵詞選的“關(guān)鍵”,不僅可以提高檢索速度,而且大大提高了檢索結(jié)果的質(zhì)量,可以很容易找到自己需要的資料,總之要縮小范圍。

      二,學(xué)習(xí)收獲

      信息檢索課是無意間報名的,如不是一個偶然的事件,要不是我找錯教室,也許我就會錯過了一個真正的學(xué)習(xí)的機(jī)會。根據(jù)CNNIC最新統(tǒng)計(jì)調(diào)查顯示,在互聯(lián)網(wǎng)應(yīng)用中,信息檢索已經(jīng)排在了第二位,成為僅次于電子郵件的互聯(lián)網(wǎng)應(yīng)用。搜索網(wǎng)站可以幫助我們快速便捷地在互聯(lián)網(wǎng)中進(jìn)行信息的檢索、查詢。信息檢索對我們來說并不陌生,在這個信息泛濫的年代,很難想象如果一夜之間如果沒有了Internet將對我們的生活產(chǎn)生怎樣的影響。

      以前我在網(wǎng)上找資料基本上處于一種盲目的狀態(tài)。在百度里輸入

      76993082.doc

      關(guān)鍵詞,不少檢索出來的東西,基本上用處不大,或者并沒有什么依據(jù),只是網(wǎng)友自己的解答。本學(xué)期上了信息檢索課,我學(xué)習(xí)到了檢索的一些知識,并且也由此及彼地把這些知識應(yīng)用到信息的檢索中。在學(xué)習(xí)階段,通過上信息檢索課我對信息檢索的認(rèn)識又上升到了一個新的高度。

      我覺得信息檢索可以應(yīng)用在我們每個課程中,自己可以給自己覺得有意義的課題,進(jìn)行一個追蹤或者資料的查詢,可以把自己學(xué)到的知識鞏固,并且可以深化自己隨著方面的理解。例如在我們的一堂《企業(yè)財務(wù)管理》課程,老師布臵了一個作業(yè),一個企業(yè)并購案例分析,香港巨商李嘉誠之子,李澤楷,盈科數(shù)碼動力主席與新加坡總理李光耀之子,李顯揚(yáng),新加坡電信行政爭奪香港電訊的收購權(quán)。在分析這道題時,就涉及到信息的檢索,首先要看看這三家公司的經(jīng)營情況,還要檢索當(dāng)時參與收購的財團(tuán),還有收購的獲勝方,收購價格,最終收購后的經(jīng)營狀況等等。最后通過自己查到的這些資料分析為什么盈科數(shù)碼動力會獲勝,但是經(jīng)營確是賠本的。

      通過學(xué)習(xí)以后發(fā)現(xiàn),信息檢索的策略也是非常重要的,我原來誤以為一個好的檢索策略只能提高查準(zhǔn)率,大不了我多查幾篇資料,現(xiàn)在發(fā)現(xiàn)它還能提高你的查全率,而且對于你從較高層次上把握課題的研究方向、發(fā)展脈絡(luò)是極有幫助的。

      附:常用搜索網(wǎng)站信息和基本檢索技巧

      一,八大搜索網(wǎng)站簡單介紹

      1、“Google”是功能強(qiáng)大,易用性最強(qiáng)的搜索網(wǎng)站,搜索速度快而且提供了最豐富的高級搜索功能。

      Google(http://004km.cn.yahoo.com)支持網(wǎng)頁、網(wǎng)站搜索,搜索速度快而且準(zhǔn)確性比較高。

      4、“網(wǎng)易”網(wǎng)站搜索非常出色,但缺少提示,網(wǎng)易搜索的操作界面不太方便,在使用的過程中也缺少提示。

      網(wǎng)易搜索(http://search.163.com)支持網(wǎng)頁、網(wǎng)站搜索,網(wǎng)頁搜索使用的是百度的搜索技術(shù),除了分頁方式以外,其他的返回結(jié)果都與百度一樣,但推薦的站點(diǎn)比較少。

      5、“搜狐”曾是IE默認(rèn)的中文搜索網(wǎng)站,網(wǎng)站搜索值得推薦,但重復(fù)現(xiàn)象較多搜狐的搜索結(jié)果中沒有標(biāo)出關(guān)鍵字,查閱起來非常不便。

      搜狐(http://search.soho.com)支持網(wǎng)頁、網(wǎng)站搜索,在國內(nèi)享有很高的聲譽(yù),曾經(jīng)一度是微軟IE瀏覽器使用的默認(rèn)中文搜索網(wǎng)站,在IE瀏覽器地址欄直接輸入關(guān)鍵字即可進(jìn)行搜索。

      6、“慧聰”是出色的 行業(yè)搜索網(wǎng)站,但缺少高級搜索功能,死鏈率也不低,而且搜索結(jié)果中重復(fù)的網(wǎng)站較多。

      長期以來,國內(nèi)的搜索技術(shù)提供廠商很少,百度作為先驅(qū)者,占據(jù)了大部分份額。到了2002年,國內(nèi)搜索市場中出現(xiàn)了一匹黑馬,那就是慧聰搜索(http://004km.cn)是國家“九五”重點(diǎn)科技攻關(guān)項(xiàng)目“中文編碼和分布式中英文信息發(fā)現(xiàn)”的研究成果。天網(wǎng)搜索的FTP服務(wù)器文件搜索功能非常強(qiáng)大,而且還為用戶整理了一份龐大的熱門搜索關(guān)鍵字目錄,方便用戶瀏覽和下載所需的文件。二,信息檢索技巧

      1、選擇恰當(dāng)?shù)年P(guān)鍵字

      互聯(lián)網(wǎng)上流傳的所有搜索技巧都是在如何確定關(guān)鍵字上做文章,選擇一個好的關(guān)鍵字是搜索成功的關(guān)鍵。關(guān)鍵字代表著我們要搜索資料的特征,如果您找不

      76993082.doc

      到所需的信息,大部分情況是因?yàn)樵陉P(guān)鍵字的選擇方向上發(fā)生了偏移。找出關(guān)鍵字可不是一件簡單的事情:首先您需要知道或者估計(jì)出目標(biāo)網(wǎng)頁內(nèi)包含的文字,在腦子里形成一個比較清晰概念,再從中提煉出此類信息最具代表性的關(guān)鍵字。盡量不要選擇常用詞匯進(jìn)行搜索,但可以同時使用多個關(guān)鍵字并加入與、或、非等多種邏輯關(guān)系進(jìn)行搜索,這樣才能避免返回?zé)o關(guān)的搜索結(jié)果。

      a.避免輸入及邏輯關(guān)系錯誤 首先我們要避免輸入的關(guān)鍵字中有錯別字,以及其他錯誤的操作。不同的搜索網(wǎng)站往往都有各自的特點(diǎn),在某些搜索網(wǎng)站上,您可以使用“Where can I find software?”這樣的自然語言進(jìn)行搜索;但在某些搜索網(wǎng)站上,您甚至不能成功地使用單個漢字作為關(guān)鍵字進(jìn)行搜索。另外,在使用多關(guān)鍵字通過與、或、非邏輯關(guān)系進(jìn)行搜索時,不同的搜索網(wǎng)站所采用的邏輯關(guān)系表示符號也可能有所不同。所以我們有必要針對不同的搜索網(wǎng)站選擇不同的關(guān)鍵字,并在首次使用一個搜索網(wǎng)站時,花一點(diǎn)時間閱讀搜索網(wǎng)站的幫助文檔,這是非常有必要的。

      b.使用多關(guān)個鍵字來提高 檢準(zhǔn)率 對于大部分的搜索任務(wù)來說,一般都能夠通過搜索網(wǎng)站找到需要的網(wǎng)頁,但是如果不細(xì)心選擇關(guān)鍵字,搜索網(wǎng)站可能會返回很多并不是您需要的結(jié)果。此時,如果您將另外一個跟搜索目標(biāo)相關(guān)的關(guān)鍵字加在一起搜索,返回的結(jié)果就會少很多,也更加準(zhǔn)確。因此,很多時候我們需要使用多個關(guān)鍵字查詢的方法來提高搜索準(zhǔn)確率。但需要注意的是,搜索網(wǎng)站對關(guān)鍵字的個數(shù)可能會有限制。另一方面,也要注意搜索內(nèi)容之間的邏輯關(guān)系是否合理。

      2.句子檢索法可有效提高文本檢準(zhǔn)率

      在使用搜索網(wǎng)站時,不少人經(jīng)常被“關(guān)鍵字”這個名稱所限,而忘了關(guān)鍵字可以是一個字、一個詞,甚至一句話。例如在搜索小說、文章等文本內(nèi)容時,最簡單的方法,是用文本的標(biāo)題搜索,但最高效的方法,則是用文中的一句話來搜索,可以讓您的搜索效率提高不少。3.文件檢索法 利于快速查找文件目標(biāo)

      如果您的搜索目標(biāo)是一個文件,如一個公司Logo的圖像文件,或者一個設(shè)備驅(qū)動程序的壓縮包,您除了可以用公司的名稱或者設(shè)備的名稱進(jìn)行搜索外,還可以從文件的名稱入手。例如,當(dāng)您在搜索設(shè)備驅(qū)動程序時,如果選擇設(shè)備的品牌、型號為關(guān)鍵字時,搜索網(wǎng)站會返回許多無關(guān)的信息,這時,如果在這些關(guān)鍵字的后面再加上ZIP或RAR等常見壓縮文件擴(kuò)展名,您會有意外的收獲。4。“拋磚引玉”法利于快速查找相關(guān)信息 如果您有一個非常喜歡的專業(yè)網(wǎng)站,并希望從互聯(lián)網(wǎng)上找到更多同類的網(wǎng)站,這時怎么選擇關(guān)鍵字最有效呢?或許搜索這個網(wǎng)站的內(nèi)容類型會找到一些不錯的站點(diǎn),例如使用“軍事網(wǎng)站”、“醫(yī)學(xué)站點(diǎn)”做關(guān)鍵字,但很多時候這種搜索方法也可能一無所得。實(shí)際上最有效的方法是拋磚引玉,用您最喜歡的網(wǎng)站的站點(diǎn)地址作為關(guān)鍵字。因?yàn)殒溄拥侥莻€站點(diǎn)的往往是同類站點(diǎn),用這種方法您肯定能夠找到一些相關(guān)的網(wǎng)站。

      5.中西結(jié)合檢索法可以很好地完成某些搜索任務(wù)

      在使用搜索網(wǎng)站時,靈活地結(jié)合中文和英文可以很好地完成某些搜索任務(wù)。您除了可以將要翻譯成中文的英文詞匯用作關(guān)鍵字,并指定搜索網(wǎng)站只返回中文網(wǎng)頁的結(jié)果,嘗試將搜索網(wǎng)站當(dāng)成翻譯機(jī)器來使用;還可以將中文詞匯的一部分翻譯成英文,例如您正想將“土豆燒牛肉”翻譯成英文,只要您知道土豆的英文,您就可以輸入關(guān)鍵字 “土豆燒牛肉 potato”,從互聯(lián)網(wǎng)上找到含有土豆燒牛肉

      76993082.doc 的英文網(wǎng)頁。

      三,信息檢索的應(yīng)用

      本學(xué)期選修了現(xiàn)代信息檢索課程,覺得很有用,雖然在一開始對于這門課程,到底能夠?qū)W下什么,到底可以應(yīng)用多少產(chǎn)生過質(zhì)疑。覺得現(xiàn)代信息檢索,名字叫得聽高級,到底學(xué)什么不了解,但在這門課程學(xué)完后我有了理解?!翱焖俦憬莸卣业阶约核枰男畔ⅰ笔沁@門課程的要求,那怎么才能應(yīng)用與我所學(xué)的旅游管理專業(yè)上呢?

      隨著互聯(lián)網(wǎng)技術(shù)的廣泛應(yīng)用,旅游業(yè)的網(wǎng)上營銷是近期行業(yè)內(nèi)探討的熱門話題,而其中一個重要的推廣手段——搜索引擎,在企業(yè)中發(fā)揮的作用也漸漸突顯出來。對搜索引擎以及旅游行業(yè)專業(yè)人士—— “去哪兒”旅游搜索引擎的了解,綜觀搜索引擎對推動在線旅游業(yè)發(fā)展方面所創(chuàng)造的價值,可以讓旅游業(yè)界人士對運(yùn)用搜索引擎來最大化收益有個更清晰的理解。

      通過對“去哪兒”旅游搜索引擎的了解,可以看整個在線旅游行業(yè)的現(xiàn)狀,細(xì)致分析了消費(fèi)者利用網(wǎng)絡(luò)查找及預(yù)訂相關(guān)旅游服務(wù)的情況,不但有利于完善和豐富旅游搜索引擎自身的發(fā)展,對旅游運(yùn)營商——航空公司、酒店及旅游代理商了解搜索引擎的及消費(fèi)者購買流程更是大有裨益。

      “去哪兒”的調(diào)查發(fā)現(xiàn),使用網(wǎng)上預(yù)訂的旅客都是旅游???,進(jìn)行網(wǎng)上預(yù)訂的消費(fèi)者是熱衷旅游的人士,26%稱在過去一年中他們至少度假4次;雖然中國的網(wǎng)絡(luò)用戶主要是在中國境內(nèi)旅行,越來越多的中國人計(jì)劃出國旅行,將近40%的人希望下一次旅行時能夠走出國 6

      76993082.doc

      門。

      對于網(wǎng)上旅行者特征的調(diào)查,“去哪兒”的報告顯示,這部分消費(fèi)者是屬于吸引力很強(qiáng)的人群,73%使用信用卡,22%擁有并駕駛小汽車,88%擁有大學(xué)學(xué)歷。

      而對他們的預(yù)訂方式的調(diào)查發(fā)現(xiàn),更多的人愿意使用互聯(lián)網(wǎng)預(yù)訂旅行?!叭ツ膬骸钡膱蟾骘@示,一半以上的互聯(lián)網(wǎng)用戶曾經(jīng)在某個地方在網(wǎng)上購買機(jī)票,略低于一半的人曾在網(wǎng)上預(yù)訂酒店。

      從市場應(yīng)用角度來講,航空旅游行業(yè)對搜索引擎的依賴性是比較強(qiáng)的。我們可以從用戶的反饋看到,凡是在網(wǎng)上有旅行預(yù)訂經(jīng)歷的用戶,有97%的人都會通過搜索引擎來尋找旅游產(chǎn)品。這也給航空公司、旅行代理,還有酒店一個很強(qiáng)烈的信號——利用搜索引擎來傳達(dá)他們的相關(guān)信息,是企業(yè)推廣的有效手段之一。”

      關(guān)于信息檢索的應(yīng)用有部分摘抄自2007的一個騰訊新聞網(wǎng)的《關(guān)于旅游業(yè)與搜索引擎的發(fā)展關(guān)系》,其中還有介紹Google的旅游搜索引擎,但由于Google2010年3月推出中國內(nèi)地,轉(zhuǎn)至香港,就不做介紹分析。

      以上為我對現(xiàn)代信息檢索的感想,學(xué)習(xí)收獲,和現(xiàn)代信息檢索在游業(yè)方面應(yīng)用的看法,可能不是太全面,或者太狹隘,望何老師見諒和指導(dǎo)。

      2011年12月5日星期一

      第五篇:信息檢索資料題目整理版

      選擇題:(10*2'=20')

      1、用__A__檢索2004年中國經(jīng)濟(jì)領(lǐng)域的統(tǒng)計(jì)數(shù)據(jù)、政策、會議、新理論。A 《中國經(jīng)濟(jì)年鑒》 B 《中國統(tǒng)計(jì)年鑒》

      C 《中國大百科全書》經(jīng)濟(jì)卷 D 《經(jīng)濟(jì)管理大辭典》

      2、用__C__檢索金融統(tǒng)計(jì)數(shù)據(jù)、中國宏觀經(jīng)濟(jì)月度分析報告、食品行業(yè)報告《2003年奶業(yè)形勢分析》

      A 《中國人民大學(xué)報刊全文數(shù)據(jù)庫》 B 維普《中文科技期刊數(shù)據(jù)庫》 C 國研網(wǎng)

      D CNKI或者萬方數(shù)據(jù)庫的會議論文數(shù)據(jù)庫

      3、檢索2004年經(jīng)濟(jì)方面的信息資料應(yīng)該用2005年出版的年鑒.4、已知參考文獻(xiàn):徐經(jīng)長等,國際會計(jì)學(xué),北京:中國人民大學(xué)出版社,1999。要找原文,使用_ D_檢索《國際會計(jì)學(xué)》的收藏情況。A、維普《中文科技期刊數(shù)據(jù)庫》 B、中國人民大學(xué)報刊全文數(shù)據(jù)庫 C、國務(wù)院發(fā)展研究中心信息網(wǎng) D、圖書館的館藏查詢

      5、用__C_檢索世界范圍的專利摘要比較方便 A、美國專利商標(biāo)局?jǐn)?shù)據(jù)庫 B、日本專利局?jǐn)?shù)據(jù)庫

      C、歐洲專利局esp@cenet數(shù)據(jù)庫

      D、世界知識產(chǎn)權(quán)組織//ipdl.wipo.int/PCT電子公報

      6、用_A_檢索α—呋喃甲醇羧酸酯的合成,含有碳元素和氫元素的化合物的英文綜合學(xué)術(shù)性文獻(xiàn)。

      A、外文EBSCO數(shù)據(jù)庫

      B、外文農(nóng)業(yè)類CAB文獻(xiàn)數(shù)據(jù)庫 C、外文農(nóng)業(yè)類AGRICOIA數(shù)據(jù)庫 D、外文食品科技文摘數(shù)據(jù)庫FSTA

      7、綜合性檢索工具

      維普《中文科技期刊數(shù)據(jù)庫》、CNKI的《中國期刊全文數(shù)據(jù)庫》、萬方《中國數(shù)字化期刊群》

      8、專利信息檢索工具

      使用最廣收費(fèi)專利數(shù)據(jù)庫:thomson scientific公司derwent系列專利數(shù)據(jù)庫 免費(fèi)專利數(shù)據(jù)庫:歐洲專利局、美國專利商標(biāo)局、IBM專利數(shù)據(jù)庫

      9、綜合性檢索工具 歐洲專利局、《DELPHION知識產(chǎn)權(quán)信息網(wǎng)數(shù)據(jù)庫》、thomson scientific公司derwent系列專利數(shù)據(jù)庫

      10、單一檢索工具包括專利公報、專利索引、各國專利局的專利數(shù)據(jù)庫 中國國家知識產(chǎn)權(quán)局、美國專利商標(biāo)局網(wǎng)站專利數(shù)據(jù)庫

      11、商標(biāo)檢索工具:中國知識產(chǎn)權(quán)網(wǎng)、中國商標(biāo)網(wǎng)(提供商標(biāo)近似查詢、商標(biāo)綜合查詢、商標(biāo)狀態(tài)查詢)、美國專利商標(biāo)局(提供商標(biāo)電子查詢系統(tǒng))、國際商標(biāo)協(xié)會

      判斷題:(10*2'=20')

      邏輯“與”:用and、“*”或者空格表示。邏輯“或”:用or、“+”或逗號表示。

      邏輯“非”:用not或減號表示。A not B表示包含A同時不包含B。

      名詞解釋:(4*5“=20)信息是自然界、人類社會以及思維活動中普遍存在的現(xiàn)象,是一切事物自身存在方式以及他們之間相互關(guān)系、相互作用等運(yùn)動狀態(tài)的表達(dá)。文獻(xiàn):記錄有知識的一切載體。

      情報是“在特定時間、特定狀態(tài)下對特定的人提供的有用知識”,基本屬性是知識性、傳遞性和效用性。

      主題“是一組具有共性事物的總稱,用以表達(dá)文獻(xiàn)所論述和研究的具體對象和問題”,即文獻(xiàn)的“中心內(nèi)容”。

      主題途徑是采用反映文獻(xiàn)主題概念的檢索詞作為檢索入口的一種檢索途徑,也是最常用、最重要的檢索途徑。

      關(guān)鍵詞是半規(guī)范化的詞匯。主題詞比較規(guī)范,一般有專用的詞表,主要用于一些外文數(shù)據(jù)庫和中文圖書數(shù)據(jù)庫,很少用于中文期刊和學(xué)位論文數(shù)據(jù)庫。

      規(guī)范詞匯是從待檢數(shù)據(jù)庫的敘詞表或主題詞表中選取的規(guī)范化的、能表達(dá)文獻(xiàn)中心內(nèi)容的詞或詞組。

      詞表是數(shù)據(jù)庫和檢索者必須共同遵循使用的檢索語言。自由詞匯是論文主題中新技術(shù)、新學(xué)科中新產(chǎn)生尚未被主題詞表收錄的名詞術(shù)語或在敘詞表中找不到的詞。

      信息檢索系統(tǒng)是為滿足一定信息需求而建立的一整套對信息進(jìn)行收集、加工、存儲和檢索的完整系統(tǒng)。包括兩個子系統(tǒng):存儲子系統(tǒng)和檢索子系統(tǒng)。聯(lián)機(jī)檢索:利用與檢索系統(tǒng)或信息中心主機(jī)的連接,在中央處理機(jī)控制下查詢系統(tǒng)內(nèi)的數(shù)據(jù)庫,并能夠與系統(tǒng)實(shí)時對話,隨時調(diào)整檢索策略。文檔是存儲在計(jì)算機(jī)上一組相關(guān)記錄的集合,具有完整的內(nèi)容和邏輯結(jié)構(gòu)。大型的檢索系統(tǒng)往往有多個文檔。

      網(wǎng)絡(luò)信息是指利用網(wǎng)絡(luò)檢索軟件或搜索引擎查詢到的在互聯(lián)網(wǎng)上發(fā)布的信息資源,這也是一種廣義的聯(lián)機(jī)檢索的信息。

      分類途徑就是人們常說的分類號檢索。這種檢索是根據(jù)信息內(nèi)容的學(xué)科分類來進(jìn)行的。分類法按照種類,可以分為網(wǎng)絡(luò)信息分類法、圖書/資料分類法、專利分類法、標(biāo)準(zhǔn)分類法。真正具有系統(tǒng)性的分類途徑主要有圖書期刊分類法和專利文獻(xiàn)分類法的途徑。檢索工具是人們用來存儲、報道和查找各類信息的工具。

      數(shù)據(jù)庫是在計(jì)算機(jī)存儲設(shè)備上按一定方式存儲的相互關(guān)聯(lián)的數(shù)據(jù)集合。

      記錄是檢索系統(tǒng)或數(shù)據(jù)庫中信息的基本存儲單元,記錄中的字段,是檢索的基本元素。功能性類目是按發(fā)明的技術(shù)功能進(jìn)行分類,即按發(fā)明的內(nèi)在特點(diǎn)與性質(zhì)進(jìn)行分類,而不按其用途分類。

      應(yīng)用性類目:應(yīng)用性分類法是把物或方法限定于特定使用領(lǐng)域的分類法。引擎是Internet上的一種網(wǎng)站,它的主要任務(wù)是在Internet上主動搜索Web服務(wù)器信息并將其自動索引,其索引的內(nèi)容存儲于可供查詢的大型數(shù)據(jù)庫中。一個搜索引擎由搜索器、索引器、檢索器和用戶接口4個部分組成。典型的搜索引擎:google,百度,搜狐,新浪。

      簡答題:(6*5'=30')

      1、信息、文獻(xiàn)和情報之間的關(guān)系。

      信息、情報和文獻(xiàn)之間的關(guān)系表現(xiàn)為信息包含情報,文獻(xiàn)是記錄有知識的載體。當(dāng)文獻(xiàn)中記錄的知識傳遞給用戶,并為用戶所利用時,就轉(zhuǎn)化為情報;情報雖大多數(shù)來自文獻(xiàn),但也有可能來自口頭和實(shí)物。所以情報與文獻(xiàn)存在交叉關(guān)系,它們可以相互轉(zhuǎn)化。特定的知識和情報,對于既不認(rèn)識又不能理解它們的人來說,只不過是一種信息。

      2、按出版的形式和內(nèi)容不同,可以把信息分為幾類。

      按出版形式和內(nèi)容的不同,可將信息分為圖書、期刊、報紙和特種信息。圖書是指50頁以上的以出版方式單本刊印的出版物,包括專著,匯編本,多卷本,叢書等。期刊是一種以印刷形式和其他形式逐次刊行的,通常有數(shù)字和年月順序編號,并打算無限期地連續(xù)出版下去的出版物。報紙是以刊物新聞和評論為主的出版周期較短的定期連續(xù)性出版物。專利信息是專利制度的產(chǎn)物,廣義上是指所有與專利有關(guān)的資料,包括專利申請書、專利說明書、專利分類表、專利公報、專利文摘、專利證書等。狹義上的專利信息僅指專利說明書。

      3、有一位學(xué)生擬定的中文研究課題為“法國文藝復(fù)興時期文學(xué)作品淺析”。要求查詢國內(nèi)中文檢索工具。如何具體分析課題? 答:1.學(xué)科屬性、專業(yè)范圍屬于社會科學(xué),具體屬于外國文學(xué),還涉及外語等多學(xué)科。2.是文獻(xiàn)類檢索結(jié)合事實(shí)數(shù)據(jù)類檢索。事實(shí)數(shù)據(jù)類檢索包括查詢”文藝復(fù)興“這個概念;文藝復(fù)興時期有多長;在該期間法國誕生了那些重要的有影響的作品;可以從百科全書、文學(xué)辭典等參考工具書中查到。文獻(xiàn)類檢索就是查詢是否有前人撰寫的法國文藝復(fù)興時期文學(xué)作品淺析的期刊論文、學(xué)位論文、專著或者網(wǎng)頁。3.考慮課題的特殊要求,補(bǔ)充檢索標(biāo)識:文學(xué)家、F.拉伯雷、小說、《巨人傳》。

      4、CNKI專業(yè)檢索示例:要求檢索錢偉長在清華大學(xué)或上海大學(xué)時發(fā)表的文章。答案:作者=錢偉長and(單位=清華大學(xué)or單位=上海大學(xué))。

      5、CNKI專業(yè)檢索示例:檢索錢偉長1980年以前在清華大學(xué)期間發(fā)表的題名或摘要中都包含“物理”的文章。

      答案:作者=錢偉長and單位=清華大學(xué)and(題名=物理or摘要=物理)and年<1980。

      6、檢索哈爾濱工業(yè)大學(xué)的羅守靖發(fā)表有關(guān)“半固態(tài)成形的應(yīng)用”方面的中文期刊文章。答案:關(guān)鍵詞=半固態(tài)成形應(yīng)用and作者=羅守靖。

      7、課題“甲殼質(zhì)纖維及保健針織品”需要檢索中文信息,如何擬定檢索式保證查全率。答案:中文的參考檢索式:(甲殼質(zhì)or甲殼素or甲殼胺or殼聚糖or殼多糖or幾丁質(zhì)or幾丁糖or幾丁酶or氨基葡糖or葡糖胺or葡萄糖胺)and棉。

      外文國際聯(lián)機(jī)檢索檢索式:(chitin or chitosan or rn=1398-61-4 or rn=9001-06-3 or rn=9012-76-4)(s)(fiber or fiber)and cotton and(spinn or blend)

      8、試分析分類途徑的優(yōu)缺點(diǎn):

      分類途徑的優(yōu)點(diǎn):1.具有族性檢索的功能,查全率較高。2.按照人們認(rèn)識事物的習(xí)慣,一學(xué)科分類為基礎(chǔ),容易被人們接受和應(yīng)用。缺點(diǎn):1.不適用于特性檢索,查準(zhǔn)率相對的較主題詞低。2.不能適應(yīng)學(xué)科發(fā)展中的變化,難以反映新學(xué)科和新名詞術(shù)語。3.人們認(rèn)識的不統(tǒng)一,往往造成分類不一致及排檢的錯誤,不易反映交叉學(xué)科。

      9、檢索“保土、之水、移民”課題,如何確定具體的檢索要點(diǎn)? 答:1.近代以來我國森林覆蓋率、區(qū)域覆蓋變化情況及其原因。2.近三百年來我國東西部人口變動情況。3.我國歷代移民概況。4.新中國成立以來中央領(lǐng)導(dǎo)人關(guān)于我國移民問題的講話。5.黃河、長江水是何時由清變渾的。

      10、搜索引擎的優(yōu)點(diǎn)和缺點(diǎn):

      優(yōu)點(diǎn):搜索引擎現(xiàn)在已經(jīng)成為網(wǎng)絡(luò)信息檢索最重要的指路標(biāo),幾乎達(dá)到了無所不搜的地步,正確使用搜索引擎,可以檢索到數(shù)據(jù)、圖書、期刊、學(xué)術(shù)論文、專利等各類信息的題錄或者部分原文,還能檢索文字、圖像、聲音、動畫等不同格式的文件。

      缺點(diǎn):

      1、質(zhì)量參差不齊,信息的分類加工欠規(guī)范,各搜索引擎在搜索指令的輸入格式與輸入內(nèi)容上存在差異并難以兼容,缺乏同性易用的檢索方法與技巧。

      2、沒有同統(tǒng)一的網(wǎng)絡(luò)信息分類標(biāo)準(zhǔn)。

      3、建立資源索引時針對性不強(qiáng),搜索速度慢,死鏈接過多,重復(fù)信息及無效信息過多。

      4、對資源不具有選擇和價值判斷的能力,排序結(jié)果不理想,難以搜索動態(tài)網(wǎng)頁,全差率下降。

      11、信息檢索和分析步驟:無論是采用印刷型檢索工具還是計(jì)算機(jī)數(shù)據(jù)庫進(jìn)行檢索,一般都要經(jīng)過以下檢索步驟:1.檢索準(zhǔn)備。2.選擇合適的檢索工具。3.選擇檢索途徑。4.擬定檢索式。5.實(shí)施檢索。6.篩選文獻(xiàn)。7.索取原文。8.定性定量分析。9.得出結(jié)論,形成情報。

      12、有哪些檢索途徑和方法 檢索途徑:一般來講,信息類型的著錄格式本身就是檢索途徑,可以分為以下4種:主題途徑、分類途徑、著者途徑和其他途徑。檢索時應(yīng)遵循“主題途徑為主,多種檢索途徑綜合應(yīng)用”的總原則。檢索方法:1.常規(guī)法:從時間上考慮有順查法、倒查法、時間抽樣法。2.引文法。3.交替法。

      13、什么是“信息檢索與分析利用”課程

      信息檢索與分析利用也稱為“信息檢索與利用”,包括文獻(xiàn)的“檢索”和“利用”兩部分內(nèi)容?!皺z索”部分介紹信息檢索的原理、方法和步驟。對文獻(xiàn)的”利用”而言,需要對檢索的文獻(xiàn)去粗取精,去偽存真,進(jìn)行統(tǒng)計(jì)分析,獲取情報,適應(yīng)市場競爭。

      14、有哪些數(shù)字圖書館信息檢索系統(tǒng)。

      答:

      1、美國國會圖書館

      2、中國國家圖書館

      3、上海數(shù)字圖書館

      4、其他數(shù)字圖書館

      綜合題:(1*10”=10')

      綜合分析治療乙型肝炎的中藥的信息,特別是中國專利,篩選其中最常用的中藥基礎(chǔ)方,并作評價。

      主要步驟:1.分析課題,課題提示時間范圍是查找最近10年的文獻(xiàn),如果沒有檢索到所需文獻(xiàn),最好能上溯多年不限。先查中文,后查外文。2.選擇檢索工具。3.確定檢索途徑,本課題可選用主題(關(guān)鍵詞)途徑為主,結(jié)合分類途徑。4.確定檢索詞。5.擬定檢索式(部分),實(shí)施檢索。6.篩選檢索結(jié)果,按照參考文獻(xiàn)格式列出篩選結(jié)果,如果文獻(xiàn)很多,可以使用文件管理軟件對文獻(xiàn)排序:圖書、期刊論文、學(xué)位論文、專利信息、網(wǎng)絡(luò)論文。7.索取原文。8.定量分析,專利格式統(tǒng)一,具有較高分析價值:a.統(tǒng)計(jì)授權(quán)專利的分布:空間上的分布、時間上的分布、授權(quán)專利申請人的行業(yè)分布、計(jì)算授權(quán)專利的技術(shù)成長率。b.統(tǒng)計(jì)全部專利所用的中藥。9.定性分析:包括尋找用藥規(guī)律、篩選藥方和評價專利。10.定性與定量分析相結(jié)合的專利評估。

      下載現(xiàn)代信息檢索題目及word格式文檔
      下載現(xiàn)代信息檢索題目及.doc
      將本文檔下載到自己電腦,方便修改和收藏,請勿使用迅雷等下載。
      點(diǎn)此處下載文檔

      文檔為doc格式


      聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻(xiàn)自行上傳,本網(wǎng)站不擁有所有權(quán),未作人工編輯處理,也不承擔(dān)相關(guān)法律責(zé)任。如果您發(fā)現(xiàn)有涉嫌版權(quán)的內(nèi)容,歡迎發(fā)送郵件至:645879355@qq.com 進(jìn)行舉報,并提供相關(guān)證據(jù),工作人員會在5個工作日內(nèi)聯(lián)系你,一經(jīng)查實(shí),本站將立刻刪除涉嫌侵權(quán)內(nèi)容。

      相關(guān)范文推薦

        信息檢索

        網(wǎng)絡(luò)資源與文獻(xiàn)檢索考試題 (計(jì)算機(jī)2010-1、2,通信2010-1、2) 一、根據(jù)課程介紹的數(shù)據(jù)庫完成以下填空(每空2分,共20分): 1、檢索策略的調(diào)整,既可以是( 檢索范圍 )的調(diào)整,也可以是檢索途......

        信息檢索

        1.答:這個號碼屬于山西太原;2.答;第一步,打開百度網(wǎng)頁輸入‘手機(jī)號碼歸屬地查詢',第二步,進(jìn)入號碼查詢網(wǎng)頁,輸入要查詢的號碼,然后點(diǎn)擊查詢,就會搜索出號碼歸屬地區(qū),該地的區(qū)號等等......

        信息檢索

        信息檢索 中文期刊 [1]任芳芳. 石油化工企業(yè)安全文化綜合評價研究[D]. 東北大學(xué): ,2008. [2]匡蕾. 煤礦企業(yè)安全文化建設(shè)與評價指標(biāo)體系研究[D]. 遼寧工程技術(shù)大學(xué): ,2009.......

        信息檢索

        實(shí)驗(yàn)三 訪問校園網(wǎng) 班級:11級信管本(2)班 學(xué)號:1142152237 姓名:張恒實(shí)驗(yàn)名稱:訪問校園網(wǎng) 實(shí)驗(yàn)?zāi)康呐c要求: 熟悉校園網(wǎng)以及圖書館提供的信息資源 實(shí)驗(yàn)步驟: 1、進(jìn)入新華學(xué)院校園網(wǎng)首......

        信息檢索

        《信息檢索與利用》課程上機(jī)大作業(yè) 注意事項(xiàng) ? 所有通過文獻(xiàn)數(shù)據(jù)庫檢索的題目必須通過圖書館主頁電子資源入口進(jìn)入,否則很多資源沒有使用權(quán)。圖書館地址lib.nuaa.edu.cn ? 下載......

        信息檢索[本站推薦]

        1論文題目:體育教育對大學(xué)生心理健康的影響 2選題背景:心理健康在現(xiàn)代充滿各種競爭和挑戰(zhàn)的社會中的重要性日益突出。目前中國大學(xué)生存在的心理問題呈增多趨勢,眾多誘因?qū)е麓?.....

        信息檢索

        當(dāng)代大學(xué)生價值觀研究 摘要 當(dāng)我們的大學(xué)校園送走叛逆80后一代時,也迎來了更加叛逆的90后一代,90后已經(jīng)成為了當(dāng)代大學(xué)的主流,作為改革開放以來中國高速發(fā)展的年代出身的一代,我......

        信息檢索

        一、通過圖書館主頁進(jìn)入CNKI檢索平臺的“中國期刊全文數(shù)據(jù)庫”系統(tǒng),完成下列各題。1.查出2006- 2010年發(fā)表的篇名中包含“食品”和“添加劑”兩詞的期刊論文,按相關(guān)度排列檢索......