第一篇:網(wǎng)絡(luò)信息檢索及其前沿技術(shù)的發(fā)展范文
目 錄
摘要......................................................................................................................................(1)1因特網(wǎng)信息檢索概述.............................................................................................(1)2因特網(wǎng)信息檢索的方法.......................................................................................(2)
2.1因特網(wǎng)信息檢索的一般方法........................................................................(2)
2.1.1網(wǎng)上漫游..................................................................................................(2)2.1.2順“鏈”瀏覽.........................................................................................(2)2.1.3 利用搜索引擎進(jìn)行信息檢索..........................................................(2)
3因特網(wǎng)信息檢索的特點(diǎn).....................................................................................(3)
3.1超文本檢索..........................................................................................................(3)
4網(wǎng)絡(luò)信息檢索遇到的挑戰(zhàn)..................................................................................(3)5網(wǎng)絡(luò)信息檢索的前沿發(fā)展技術(shù)及展望........................................................(4)
5.1智能化信息檢索.................................................................................................(5)5.2 可視化信息檢索.............................................................................................(6)5.3 一站式信息檢索.............................................................................................(7)5.4 個(gè)性化信息檢索.............................................................................................(7)
6致謝.......................................................................................................................................(8)
參 考 文 獻(xiàn)........................................................................................................................(9)
Abstract ···························································································································(10)
網(wǎng)絡(luò)信息檢索及其前沿技術(shù)的發(fā)展
作 者:1111 指導(dǎo)教師:11111
摘要:現(xiàn)代信息檢索技術(shù)經(jīng)歷了由低級(jí)到高級(jí)的發(fā)展過(guò)程。目前正朝著多元化的方向發(fā)展。本文主要從信息檢索的智能化、專(zhuān)業(yè)化、可視化、一站式及基于網(wǎng)格的5個(gè)方面來(lái)介紹現(xiàn)代信息檢索技術(shù)的發(fā)展趨勢(shì)。因?yàn)殡S著信息技術(shù)的發(fā)展和用戶(hù)檢索需求的變化,現(xiàn)代信息檢索技術(shù)在理念、人性化、智能化等方面發(fā)生了全面突破。本文探討了現(xiàn)代信息檢索技術(shù)發(fā)展趨勢(shì),從智能化、個(gè)性化、一站式、可視化四個(gè)方面進(jìn)行了分析,對(duì)檢索技術(shù)發(fā)展趨勢(shì)展開(kāi)了一定的探討。
關(guān)鍵詞:因特網(wǎng); 信息檢索; 前沿技術(shù) ;搜索引擎
1因特網(wǎng)信息檢索概述
因特網(wǎng)信息檢索是現(xiàn)代網(wǎng)絡(luò)技術(shù)帶來(lái)的必然課題,當(dāng)網(wǎng)絡(luò)成為信息世界中的一種無(wú)所不在的承載體,每一個(gè)檢索者都可以隨時(shí)隨地截取和輸送最新的各種信 ,面對(duì)這樣一個(gè)龐大無(wú)比、動(dòng)態(tài)變化的網(wǎng)絡(luò)信息 , 要想獲得某個(gè)用戶(hù)所需特定信息 , 必然還要依賴(lài)于因特網(wǎng)上的信息檢索。因特網(wǎng)信息檢索是由眾多站點(diǎn)、瀏覽器和搜索引擎及網(wǎng)絡(luò)支撐組成的三角結(jié)構(gòu)。其中的核心部分,不是眾多站點(diǎn),而是網(wǎng)絡(luò)瀏覽器和具有收集、檢索功能的搜索引擎。
眾多站點(diǎn)、網(wǎng)頁(yè)上的信息是因特網(wǎng)上信息的基本組成部分。在因特網(wǎng)發(fā)展初期,瀏覽器和簡(jiǎn)單的搜索引擎即可幫助人們檢索所需的文獻(xiàn)信息。瀏覽器 ,相當(dāng)于提供了一個(gè)信息總目次 ,提供讀者和用戶(hù)對(duì)一個(gè)又一個(gè)網(wǎng)站進(jìn)行直接地點(diǎn)擊、瀏 ,通過(guò)超文本鏈接 ,選擇自己所需的信息。瀏覽雖然方法簡(jiǎn)易、直接,但隨機(jī)性強(qiáng),耗時(shí)量大,對(duì)于搜索因特網(wǎng)上的信息來(lái)講時(shí)間和費(fèi)用較高,因此更科學(xué)的方法是要借助搜索引擎。搜索引擎是因特網(wǎng)信息的網(wǎng)上檢索工,它可以幫助用戶(hù)快速搜索所需信息及其相關(guān)信息。搜索引擎是因特網(wǎng)上設(shè)立的一種特殊類(lèi)型的站點(diǎn),通過(guò)用戶(hù)輸入所需信息的關(guān)鍵詞, 經(jīng)由檢索服務(wù)器處理內(nèi)部數(shù)據(jù)庫(kù),找到相關(guān)資料并整理后送出,通過(guò)網(wǎng)絡(luò)傳給用戶(hù)使用的主機(jī),即可以通過(guò)下圖所示的簡(jiǎn)單流程圖來(lái)表示。這是就其檢索功能而言,對(duì)因特網(wǎng)上的信息檢索來(lái)說(shuō),它也離不開(kāi)數(shù)據(jù)庫(kù)的支持,而因
第1頁(yè)(共10頁(yè))特網(wǎng)上數(shù)據(jù)庫(kù)的收集、整理,是搜索引擎具備的另外一部分功能。
2因特網(wǎng)信息檢索的方法
2.1因特網(wǎng)信息檢索的一般方法
如果用戶(hù)要在因特網(wǎng)上獲取信息,就必須能夠找到提供信息的服務(wù)器。所以,首先以找到服務(wù)器在網(wǎng)上的地址(URL)為目標(biāo) , 然后通過(guò)該地址去訪問(wèn)服務(wù)器提供的信息,它的檢索方法一般來(lái)說(shuō)有以下幾種。2.1.1網(wǎng)上漫游
這是在因特網(wǎng)上發(fā)現(xiàn)、檢索信息的原始方法。即在日常的網(wǎng)絡(luò)閱讀、漫游過(guò)程中,意外發(fā)現(xiàn)一些有用信息。這種方式的目的性不是很強(qiáng) , 其不可預(yù)見(jiàn)性、偶然性使檢索過(guò)程具有某種探索寶藏的意味,也許會(huì)充滿(mǎn)樂(lè)趣 , 但也可能一無(wú)所獲。2.1.2順“鏈”瀏覽
指用戶(hù)在閱讀超文本文檔時(shí), 利用文檔中的鏈接從一個(gè)網(wǎng)頁(yè)轉(zhuǎn)向另一個(gè)相關(guān)網(wǎng)頁(yè)。有些類(lèi)似于傳統(tǒng)文獻(xiàn)檢索中的“追溯檢索” , 即根據(jù)文獻(xiàn)后所附的參考文獻(xiàn)目錄去追溯相關(guān)文獻(xiàn),一輪一輪地不斷擴(kuò)大檢索范圍。這種方式可以在很短的時(shí)間內(nèi)獲得大量相關(guān)信息 , 但也可能在“順鏈檢索”中偏離了檢索目標(biāo),或迷失于網(wǎng)絡(luò)信息空間中 , 而且找到合適的檢索起點(diǎn)也并不容易。
通過(guò)網(wǎng)絡(luò)資源指南(res ource guide)來(lái)查找信息為了對(duì)因特網(wǎng)這個(gè)無(wú)序的信息世界加以組織、管理 ,使大量有價(jià)值的信息納入一個(gè)有序的組織體系,專(zhuān)業(yè)人員做了許多努力和開(kāi)發(fā)。也就是基于專(zhuān)業(yè)人員對(duì)網(wǎng)絡(luò)信息資源的產(chǎn)生、傳遞與利用機(jī)制的廣泛了解和對(duì)網(wǎng)絡(luò)信息資源分布狀況的熟悉 , 以及對(duì)各種網(wǎng)絡(luò)信息資源的采集、組織、評(píng)價(jià)、過(guò)濾、控制、檢索等手段的全面把握而開(kāi)發(fā)出的可供瀏覽和檢索的網(wǎng)絡(luò)資源主題指南。綜合性的主題分類(lèi)樹(shù)體系的網(wǎng)絡(luò)資源指南 , 如 Y ahoo 等。而專(zhuān)業(yè)性的網(wǎng)絡(luò)資源指南就更多了 , 幾乎一學(xué)科專(zhuān)業(yè)、重要課題、研究領(lǐng)域的網(wǎng)絡(luò)資源指南都可在因特網(wǎng)上找到。
2.1.3 利用搜索引擎進(jìn)行信息檢索
它是較為常規(guī)普遍的網(wǎng)絡(luò)信息檢索方式。搜索引擎是提供給用戶(hù)進(jìn)行關(guān)鍵詞、詞組或自然語(yǔ)言的檢索工具。用戶(hù)提出檢索要求 , 搜索引擎代替用
第2頁(yè)(共10頁(yè))戶(hù)在數(shù)據(jù)庫(kù)中進(jìn)行檢索 ,并將檢索結(jié)果提供給用戶(hù)。它一般支持布爾檢索、詞組檢索等功能。利用搜索引擎進(jìn)行檢索的優(yōu)點(diǎn)是: 省時(shí)省力,簡(jiǎn)單方便,檢索速度快、范圍 ,能及時(shí)獲取新增信息。其缺點(diǎn)是:由于采用計(jì)算機(jī)軟件自動(dòng)進(jìn)行信息的加工、處理 , 且檢索軟件的智能化不是很高,造成檢索的準(zhǔn)確性不是很理想 ,與人們的檢索要求及對(duì)檢索效率的期望有一定的差距。目前在因特網(wǎng)上的搜索引擎層出不窮,比較有影響的英文搜索Y ahoo , AltaVista 等;比較有影響的中文搜索引擎有網(wǎng)易、搜狐、新浪等。
3因特網(wǎng)信息檢索的特點(diǎn)
檢索范圍大 ,因特網(wǎng)是一個(gè)全球性的網(wǎng)絡(luò) , 信息資源分布在世界各地的服務(wù)器上 , 可供檢索的資源包括大量的主頁(yè)、多種報(bào)紙、全文期刊、各種組織機(jī)構(gòu)發(fā)布的信息用戶(hù)新聞以及原始技術(shù)報(bào)告等。3.1超文本檢索
因特網(wǎng)檢索的結(jié)果是完全可以直接閱讀和利用的 Web頁(yè)面文獻(xiàn)全文。而且只需要簡(jiǎn)單地用鼠標(biāo)點(diǎn)擊 , 即可隨意瀏覽。在多媒體的超文本中 , 不但有文字、圖片 ,還可以有聲音、動(dòng)畫(huà)、影視等形式的信息內(nèi)容。界面友好 , Web信息檢索工具界面豐富友好 , 使用戶(hù)的檢索相當(dāng)方便 , 十分易于操作。Web 信息檢索途徑較多甚至還可按相關(guān)性程度對(duì)檢索結(jié)果進(jìn)行排序輸出。檢索時(shí) , 只需按一定規(guī)則輸入檢索式 , 在發(fā)出檢索命令后即可獲得檢索結(jié)果 , 通常檢索結(jié)果包括文獻(xiàn)頁(yè)面的題名、內(nèi)容簡(jiǎn)介、URL 地址等 ,并可據(jù)此獲得更詳細(xì)的超文本頁(yè)面。良好的反饋能力和快速響應(yīng)能力 , Web信息檢索工具通常采用全文單詞標(biāo)引的方式 ,將因特網(wǎng)上的文本頁(yè)面進(jìn)行全文單詞的自動(dòng)倒排,建立龐大的索引數(shù)據(jù)庫(kù)。這些Web信息檢索的索引數(shù)據(jù)庫(kù) , 常常 24 小時(shí)就更新,大量的基于全文的單詞倒排工作,通常是借助于有關(guān)的程序軟件自動(dòng)運(yùn)行的 ,因而具有良好的信息反饋功能和快速響應(yīng)功能。
4網(wǎng)絡(luò)信息檢索遇到的挑戰(zhàn)
網(wǎng)頁(yè)是因特網(wǎng)的最主要的組成部份,也是人們獲取網(wǎng)絡(luò)信息的最主要的來(lái)源,為了方便人們?cè)诖罅糠彪s的網(wǎng)頁(yè)中找尋自己需要的信息,這類(lèi)檢
第3頁(yè)(共10頁(yè))索工具發(fā)展的最快。一般認(rèn)為,基于網(wǎng)頁(yè)的信息檢索工具主要有網(wǎng)頁(yè)搜索引擎和網(wǎng)絡(luò)分類(lèi)目錄兩種。網(wǎng)頁(yè)搜索引擎是通過(guò)“網(wǎng)絡(luò)蜘蛛”等網(wǎng)頁(yè)自動(dòng)搜尋軟件搜索到網(wǎng)頁(yè),然后自動(dòng)給網(wǎng)頁(yè)上的某些或全部字符做上索引,形成目標(biāo)摘要格式文件以及網(wǎng)絡(luò)可訪問(wèn)的數(shù)據(jù)庫(kù),供人們檢索網(wǎng)絡(luò)信息的檢索工具。網(wǎng)絡(luò)目錄則是和搜索引擎完全不同,它不會(huì)將整個(gè)網(wǎng)絡(luò)中每個(gè)網(wǎng)站的所有頁(yè)面都放進(jìn)去,而是由專(zhuān)業(yè)人員謹(jǐn)慎地選擇網(wǎng)站的首頁(yè),將其放入相應(yīng)的類(lèi)目中。
網(wǎng)絡(luò)目錄的信息量要比搜索引擎少得多,再加上不同的網(wǎng)絡(luò)目錄分類(lèi)標(biāo)準(zhǔn)有些混亂,不便人們使用,因此雖然它標(biāo)引質(zhì)量比較高,利用它的人還是要比利用搜索引擎的人少的多。但是由于網(wǎng)絡(luò)信息的復(fù)雜性和網(wǎng)絡(luò)檢索技術(shù)的限制,這類(lèi)檢索工具也有著明顯的不足。(1)隨著網(wǎng)頁(yè)數(shù)量的迅猛增加,人工無(wú)法對(duì)其進(jìn)行有效的分類(lèi)、索引和利用。網(wǎng)絡(luò)用戶(hù)面對(duì)的是數(shù)量巨大的未組織信息,簡(jiǎn)單的關(guān)鍵詞搜索,返回的信息數(shù)量之大,讓用戶(hù)無(wú)法承受。(2)信息有用性評(píng)價(jià)困難。一些站點(diǎn)在網(wǎng)頁(yè)中大量重復(fù)某些關(guān)鍵字,使得容易被某些著名的搜索引擎選中,以期借此提高站點(diǎn)的地位,但事實(shí)上卻可能沒(méi)有提供任何對(duì)用戶(hù)有價(jià)值的信息。(3)網(wǎng)絡(luò)信息日新月異的變更,人們總是期望挑出最新的信息。然而網(wǎng)絡(luò)信息時(shí)刻變動(dòng),實(shí)時(shí)搜索幾乎不可能,就是剛剛瀏覽過(guò)的網(wǎng)頁(yè),也隨時(shí)都有更新、過(guò)期、刪除的可能。
5網(wǎng)絡(luò)信息檢索的前沿發(fā)展技術(shù)及展望
現(xiàn)代信息檢索技術(shù)經(jīng)歷了由低級(jí)到高級(jí)的發(fā)展過(guò)程。目前正朝著多元化的方向發(fā)展。主要從信息檢索的智能化、專(zhuān)業(yè)化、可視化、一站式及基于網(wǎng)格的5個(gè)方面來(lái)介紹現(xiàn)代信息檢索技術(shù)的發(fā)展趨勢(shì)。
隨著信息技術(shù)的發(fā)展和用戶(hù)檢索需求的變化,現(xiàn)代信息檢索技術(shù)在理念、人性化、智能化等方面發(fā)生了全面突破。本文探討了現(xiàn)代信息檢索技術(shù)發(fā)展趨勢(shì),從智能化、個(gè)性化、一站式、可視化四個(gè)方面進(jìn)行了分析,對(duì)檢索技術(shù)發(fā)展趨勢(shì)展開(kāi)了一定的探討。
信息檢索技術(shù)經(jīng)過(guò)先組式索引檢索、穿孔卡片檢索、縮微膠卷檢索、脫機(jī)批處理檢索發(fā)展到今天的聯(lián)機(jī)檢索、光盤(pán)檢索、網(wǎng)絡(luò)檢索等。其發(fā)展經(jīng)歷了由低級(jí)到高級(jí)的過(guò)程、傳統(tǒng)的線性檢索向超文本支持的非線性檢索
第4頁(yè)(共10頁(yè))發(fā)展。這主要依賴(lài)于信息技術(shù)的發(fā)展和信息用戶(hù)的信息檢索需求。這些始終是推動(dòng)現(xiàn)代信息檢索理論與技術(shù)發(fā)展的重要?jiǎng)恿?。那么,現(xiàn)代信息檢索技術(shù)的發(fā)展趨勢(shì)將來(lái)如何呢?而要對(duì)信息檢索技術(shù)的發(fā)展作出成功的預(yù)測(cè)是十分困難的。但是可以在廣泛調(diào)研、比較、分析的基礎(chǔ)上把握其某些發(fā)展動(dòng)態(tài),發(fā)現(xiàn)一些影響現(xiàn)代信息檢索技術(shù)發(fā)展的新變化、新技術(shù)、新理念。5.1智能化信息檢索
智能化信息檢索是人們把人工智能與信息檢索技術(shù)結(jié)合起來(lái)應(yīng)用于信息存取領(lǐng)域的成果。近年來(lái)Internet上不斷涌現(xiàn)的人工智能產(chǎn)品。比如智能搜索引擎、智能瀏覽器、智能代理、知識(shí)共享智能體等。都將大大提高信息存取系統(tǒng)的智能化程度。智能化信息檢索是當(dāng)今信息檢索技術(shù)研究的熱點(diǎn)問(wèn)題之一。也是未來(lái)信息檢索主要的發(fā)展方向。智能化信息檢索是基于自然語(yǔ)言的檢索形式.機(jī)器根據(jù)用戶(hù)所提供的自然語(yǔ)言表述的檢索要求進(jìn)行分析,而后形成檢索策略進(jìn)行搜索,它能夠代替或輔助用戶(hù)完成諸如選詞、選庫(kù)、構(gòu)造檢索式。甚至在數(shù)據(jù)庫(kù)中進(jìn)行自動(dòng)推理查找等功能;系統(tǒng)對(duì)知識(shí)庫(kù)檢索推理的結(jié)果??梢允褂脩?hù)得到能夠直接加以利用的信息,它是建立在一個(gè)或多個(gè)專(zhuān)家系統(tǒng)基礎(chǔ)上的信息存取系統(tǒng)。用戶(hù)所需要做的僅僅是告訴計(jì)算機(jī)想做什么,至于怎樣實(shí)現(xiàn)則無(wú)須人工干預(yù).這意味著用戶(hù)將徹底從繁瑣的規(guī)則中解脫出來(lái)。它是人工智能與檢索技術(shù)的有機(jī)結(jié)合。檢索工具智能化的內(nèi)涵在于檢索工具具有學(xué)習(xí)、分析、辨別和推理的能力。IBM的最新研究的檢索系統(tǒng)Piquant能夠基于對(duì)問(wèn)題回答來(lái)完成用戶(hù)的檢索要求。Piquant能分析文章的語(yǔ)義結(jié)構(gòu),并揭示其沒(méi)有顯示的表現(xiàn)出來(lái)的知識(shí)。IBM研究人員演示了在Pinquant中提問(wèn)“誰(shuí)是加拿大總理?”,系統(tǒng)準(zhǔn)確地找到了回答這個(gè)問(wèn)題的文章,雖然在這篇文章中沒(méi)有顯示的提到我們提問(wèn)中的單詞。
提高信息檢索的智能化是信息檢索所致力于實(shí)現(xiàn)的一個(gè)重要特征,它包含2個(gè)方面的含義:一是用戶(hù)檢索需求理解的智能化。比如AskJeeve,AnswerBus(http://004km.cnprehensive breakthrough occurred.This article discusses the trend of the development of modern information retrieval technology, intelligent, personalized, one-stop, visualize, four aspects has carried on the analysis of the retrieval technology development trend is discussed.Key words: the Internet;Information retrieval;Cutting-edge technology;The search engine
第9頁(yè)(共10頁(yè))
第二篇:網(wǎng)絡(luò)信息檢索及其局限性(本站推薦)
【關(guān)鍵詞】 網(wǎng)絡(luò)信息 信息檢索 搜索引擎網(wǎng)絡(luò)信息檢索簡(jiǎn)介
隨著信息技術(shù)的飛速發(fā)展,信息已成為全社會(huì)的重要資源,對(duì)信息的占有程度及信息處理水平的先進(jìn)程度已成為衡量一個(gè)國(guó)家或地區(qū)現(xiàn)代化程度的重要標(biāo)志,而網(wǎng)絡(luò)上豐富的信息在更大程度上改變了人們的工作和生活的方式。Internet是當(dāng)今世界上規(guī)模最大、覆蓋面最廣、信息資源最豐富、發(fā)展最為迅速的信息網(wǎng)絡(luò),基于Internet的網(wǎng)絡(luò)信息檢索的研究,無(wú)論對(duì)研究人員還是一般用戶(hù)來(lái)說(shuō),都有著很強(qiáng)的現(xiàn)實(shí)性和實(shí)用性。
1.1 信息檢索概念
信息檢索是指將信息按一定的方式組織和存儲(chǔ)起來(lái),并根據(jù)信息用戶(hù)的信息需求查找所需信息的過(guò)程和技術(shù)。人們獲取信息源的方式主要有:①傳統(tǒng)的信息檢索方法,通過(guò)人工查詢(xún)?cè)趫D書(shū)館等提供文獻(xiàn)的機(jī)構(gòu)進(jìn)行文獻(xiàn)的查詢(xún)和獲取活動(dòng);②聯(lián)機(jī)信息檢索相對(duì)于前者來(lái)說(shuō)具有實(shí)時(shí)性、完整性、共享性、廣泛性等優(yōu)點(diǎn);③網(wǎng)絡(luò)信息檢索是指通過(guò)網(wǎng)絡(luò)信息檢索工具檢索存在于Internet信息空間中各種類(lèi)型的網(wǎng)絡(luò)信息資源。
1.2 網(wǎng)絡(luò)信息檢索的原理
網(wǎng)絡(luò)信息檢索工具是網(wǎng)絡(luò)信息檢索技術(shù)的實(shí)物體現(xiàn)。目前,常用的網(wǎng)絡(luò)信息檢索模型有布爾邏輯模型、模糊邏輯模型和概率模型等幾種方式。
① 布爾邏輯模型 這是一種簡(jiǎn)單而常用的嚴(yán)格匹配模型。用戶(hù)可以根據(jù)檢索項(xiàng)在文檔中的布爾邏輯關(guān)系提交查詢(xún),搜索工具根據(jù)事先建立的倒排文檔結(jié)構(gòu)確定查詢(xún)結(jié)果。標(biāo)準(zhǔn)的布爾邏輯模型為二元邏輯,所搜索的文檔要么與查詢(xún)相關(guān),要么與查詢(xún)無(wú)關(guān)。利用這種模型進(jìn)行查詢(xún),其查詢(xún)結(jié)果一般沒(méi)有按照內(nèi)容的相關(guān)特性排序。
② 模糊邏輯模型 它在查詢(xún)結(jié)果處理中引進(jìn)了模糊邏輯比較,并且按照相關(guān)的優(yōu)先次序排列查詢(xún)結(jié)果,這樣就可以克服布爾邏輯模型信息查詢(xún)結(jié)果的無(wú)序性。
③ 概率模型 它是基于貝葉斯概率原理而提出的,根據(jù)詞條、文檔間的內(nèi)在聯(lián)系,利用詞條間和詞條與文檔間的概率相依性來(lái)進(jìn)行信息檢索。2 搜索引擎
搜索引擎是目前使用最為頻繁的一種網(wǎng)絡(luò)信息檢索工具。與其他工具相比,它的檢全率和檢準(zhǔn)率都比較高,具有很強(qiáng)的使用價(jià)值和廣泛的應(yīng)用前景。
2.1 搜索引擎的工作原理
作為一種www站點(diǎn)資源和其它網(wǎng)絡(luò)資源進(jìn)行組織和檢索的檢索工具,搜索引擎的檢索機(jī)制一般包括數(shù)據(jù)采集和標(biāo)引機(jī)制、數(shù)據(jù)組織機(jī)制和用戶(hù)檢索機(jī)制,基本構(gòu)成如圖1所示。① 數(shù)據(jù)采集標(biāo)引機(jī)制按照一定規(guī)律和方式對(duì)網(wǎng)絡(luò)上www站點(diǎn)進(jìn)行搜索,并將搜索到的www頁(yè)面信息存入搜索引擎的臨時(shí)數(shù)據(jù)庫(kù)中。
② 數(shù)據(jù)組織據(jù)組織機(jī)制的主要功能是對(duì)www頁(yè)面信息進(jìn)行整理以形成規(guī)范的頁(yè)面索引,并建立相應(yīng)的索引數(shù)據(jù)庫(kù)。
③ 索引數(shù)據(jù)庫(kù)是用戶(hù)進(jìn)行檢索的基礎(chǔ),它的數(shù)據(jù)質(zhì)量直接影響到檢索效果,而搜索引擎的數(shù)據(jù)采集標(biāo)和標(biāo)引機(jī)制又是決定數(shù)據(jù)庫(kù)質(zhì)量的關(guān)鍵技術(shù)。
④ 用戶(hù)檢索機(jī)制幫助用戶(hù)以一定方式檢索引擎的索引數(shù)據(jù)庫(kù),以獲得符合用戶(hù)需要的www站點(diǎn)或頁(yè)面。
2.2 搜索引擎的分類(lèi)
按照用戶(hù)查找的途徑劃分,可將搜索引擎分為如下幾種: ① 基于關(guān)鍵詞的搜索引擎 主要通過(guò)使用自動(dòng)采集軟件來(lái)對(duì)網(wǎng)絡(luò)上的數(shù)據(jù)進(jìn)行采集標(biāo)引,建立成索引數(shù)據(jù)庫(kù)。它主要采用自動(dòng)搜索和標(biāo)引方式來(lái)建立和維護(hù)其索引數(shù)據(jù)庫(kù),供用戶(hù)查詢(xún)使用。
② 基于分類(lèi)目錄的搜索引擎 一般依賴(lài)于按照某種分類(lèi)標(biāo)準(zhǔn)進(jìn)行人工編排的分類(lèi)體系。
③ 聯(lián)合式搜索引擎 是基于關(guān)鍵詞的搜索引擎的另外一種表現(xiàn)形式,是后者與基于類(lèi)目的搜索引擎的一種結(jié)合。2.3 搜索引擎的功能
目前Internet上的搜索引擎種類(lèi)繁多,雖然各種搜索引擎都有自己的不同信息采集標(biāo)引機(jī)制,在其他一些方面各具特色,但其基本功能卻是相似的。
① 布爾邏輯檢索 這一功能使得用戶(hù)能使用AND、OR和NOT來(lái)進(jìn)行關(guān)鍵詞的搭配檢索。
② 模糊檢索 在用戶(hù)進(jìn)行檢索的過(guò)程中,系統(tǒng)會(huì)對(duì)跟用戶(hù)提供的關(guān)鍵詞相似的詞語(yǔ)進(jìn)行檢索,并返回包含關(guān)鍵詞或是這些相似詞的檢索結(jié)果。
③ 截詞檢索 這種檢索形式利用檢索詞的某一部分來(lái)進(jìn)行檢索。在搜索引擎中,用戶(hù)提供包含“?”或是“*”通配符的檢索項(xiàng)來(lái)進(jìn)行檢索。
④ 限定詞檢索 這種檢索加減號(hào)檢索,它用來(lái)規(guī)定檢索項(xiàng)中必須出現(xiàn)或是必須不出現(xiàn)某些關(guān)鍵詞。網(wǎng)絡(luò)信息檢索的局限 用戶(hù)在查找網(wǎng)絡(luò)信息資源時(shí),不可避免的用到網(wǎng)絡(luò)信息檢索工具。檢索工具的優(yōu)劣很大程度的影響了用戶(hù)的檢索效率。雖然網(wǎng)絡(luò)信息檢索工具在最近幾年有了長(zhǎng)足的發(fā)展,但是到現(xiàn)在網(wǎng)絡(luò)信息檢索仍然存在著這樣或是那樣的局限。
3.1 文本信息檢索的局限
① 網(wǎng)絡(luò)信息標(biāo)引的準(zhǔn)確度不夠 檢索工具對(duì)網(wǎng)絡(luò)信息資源的標(biāo)引一般都存在著柵引準(zhǔn)確度不夠的問(wèn)題,檢索工具經(jīng)常會(huì)在返回大量垃圾信息的同時(shí)丟失有用信息。當(dāng)用戶(hù)要進(jìn)行特定的文獻(xiàn)檢索時(shí),有時(shí)還會(huì)發(fā)現(xiàn)現(xiàn)存的檢索工具無(wú)濟(jì)于事,檢索出來(lái)的數(shù)據(jù)完全被無(wú)用信息所覆蓋。如想要通過(guò)搜索引擎查詢(xún)清朝雍正年間李衛(wèi)任浙江巡撫的資料,你只能夠查到大量《李衛(wèi)當(dāng)官》之類(lèi)無(wú)用信息。
② 搜索引擎的查全率不高 由于互聯(lián)網(wǎng)上的信息資源以爆炸性的速度不斷增長(zhǎng),搜索引擎采集數(shù)據(jù)的速度遠(yuǎn)遠(yuǎn)落后于信息資源的增長(zhǎng)速度。單個(gè)搜索引擎的數(shù)據(jù)庫(kù)所收集的Web頁(yè)面大大不足,就是所有的搜索引擎所儲(chǔ)存的數(shù)據(jù)也只占全球Web頁(yè)面的50%強(qiáng)。由于這方面的原因,搜索引擎的檢全率會(huì)無(wú)可避免的被降低。
③ 搜索引擎的查準(zhǔn)率不高 一是返回的信息過(guò)多,這是現(xiàn)有搜索引擎檢索信息的普遍現(xiàn)象;二是返回重復(fù)的信息,搜索引擎的檢索結(jié)果中還經(jīng)常重復(fù)出現(xiàn)同一信息源的不同部分,甚至出現(xiàn)不同信息源的相同內(nèi)容信息。
④ 查詢(xún)方式有限 目前大多數(shù)搜索引擎的查詢(xún)方法比較單一,一般只提供分類(lèi)查詢(xún)方式和關(guān)鍵詞查詢(xún)方式。這樣,一方面檢索時(shí)不能從文獻(xiàn)的多個(gè)方面對(duì)檢索提問(wèn)進(jìn)行限制,只能就某一關(guān)鍵詞或概念進(jìn)行籠統(tǒng)的檢索;另一方面,由于查詢(xún)結(jié)果完全依賴(lài)于用戶(hù)所給出的關(guān)鍵詞,而大多數(shù)用戶(hù)對(duì)他們檢索的領(lǐng)域或索引數(shù)據(jù)庫(kù)的關(guān)鍵詞不太了解,因此使最后的查詢(xún)結(jié)果相關(guān)性很差,往往是輸入一個(gè)檢索式,得到一大堆網(wǎng)址,但其中大部分是冗余信息。
⑤ 檢索對(duì)象的數(shù)據(jù)結(jié)構(gòu)單一 由于現(xiàn)在大多數(shù)網(wǎng)站使用的是傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)對(duì)信息進(jìn)行組織和存儲(chǔ),因此其使用的搜索引擎也是基于關(guān)系數(shù)據(jù)庫(kù)的,這種傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)非常擅長(zhǎng)處理結(jié)構(gòu)化的數(shù)據(jù),但其對(duì)于非結(jié)構(gòu)化的數(shù)據(jù)的處理能力則很弱。
⑥ 交互性不夠 當(dāng)前的搜索引擎與用戶(hù)的交互性不夠,與用戶(hù)間缺乏足夠的協(xié)作,不了解用戶(hù)的情況,不記錄用戶(hù)提交的查詢(xún)?nèi)蝿?wù),不能處理用戶(hù)的反饋信息,因而不能與用戶(hù)進(jìn)行足夠好的交互以提高檢索效率。3.2 多媒體信息檢索的局限
到現(xiàn)在為止,雖然單獨(dú)針對(duì)圖像、視頻、聲音等媒體的檢索技術(shù)已經(jīng)出現(xiàn),但還沒(méi)有任何搜索引擎能夠充分解決多媒體信息的檢索,其主要表現(xiàn)在以下幾個(gè)方面:
① 檢索效果不夠理想 目前,幾乎所有的多媒體搜索引擎在多媒體信息的查準(zhǔn)率方面都不能達(dá)到令人滿(mǎn)意的程度,用戶(hù)將在返回的幾百個(gè)甚至上千個(gè)圖像中篩選需要的那一幅。這是很費(fèi)時(shí)和令人難以忍受的,而且有時(shí)你所用的搜索引擎根本檢不出你想要的東西。歸其原因,一方面是在于查詢(xún)方式的單一,另一方面在于對(duì)圖像的標(biāo)引深度不夠,這就要求完善圖像檢索和索引機(jī)制。
② 用戶(hù)查詢(xún)接口單一 理想的多媒體檢索系統(tǒng)中,人是主動(dòng)的,用戶(hù)的查詢(xún)接口能提供豐富的交互能力,且直觀易用,使用戶(hù)能夠在主動(dòng)交互過(guò)程中通過(guò)調(diào)整檢索參數(shù),表達(dá)對(duì)圖像的語(yǔ)義感知,最終獲取滿(mǎn)意的結(jié)果。這就涉及到如何把用戶(hù)的提問(wèn)轉(zhuǎn)換為可以執(zhí)行檢索的特征矢量、交互方式的設(shè)計(jì),如何獲取用戶(hù)的內(nèi)容感知等問(wèn)題。目前的多媒體搜索引擎用戶(hù)查詢(xún)接口比較單一,大多只提供描述查詢(xún)接口,即關(guān)鍵詞提問(wèn)框。
③ 圖像特征信息的表示與檢索不夠完善 基于內(nèi)容的圖像檢索,實(shí)質(zhì)上就是進(jìn)行圖像特征相似度的比較,但目前這一技術(shù)還存在許多問(wèn)題。
④ 信息的自動(dòng)加工與人工標(biāo)引不夠 目前文本搜索引擎在這方面的發(fā)展正日趨完善,而多媒體搜索引擎的研究剛剛起步,尤其是圖像信息的加工,圖像不同于文本,文本自身就能說(shuō)明要講的內(nèi)容,而圖像內(nèi)容卻需要加入人的理解和描述,人工干預(yù)雖能提高查準(zhǔn)率,但一方面能被人工標(biāo)引的是極其有限的;另一方面由于人工標(biāo)引勞動(dòng)強(qiáng)度大而限制了檢索的范圍,如何對(duì)圖像信息進(jìn)行快速標(biāo)引和準(zhǔn)確分類(lèi)是急待解決的主要問(wèn)題。
另外,目前基于內(nèi)容的檢索技術(shù)多應(yīng)用于對(duì)靜態(tài)圖像的檢索,對(duì)動(dòng)態(tài)圖像的檢索還沒(méi)有多少行之有效的方法。但隨著寬帶網(wǎng)絡(luò)的逐步實(shí)現(xiàn),動(dòng)態(tài)多媒體信息在網(wǎng)絡(luò)中將會(huì)越來(lái)越多。參考文獻(xiàn)】
張杰.淺論網(wǎng)絡(luò)信息檢索.江西圖書(shū)館學(xué)刊,2002年增刊.董慧.網(wǎng)絡(luò)信息資源開(kāi)發(fā)與利用.武漢:武漢大學(xué)出版社,2001.盧小賓.信息檢索.北京:科學(xué)出版社,2003.李勇先,鄭文良.人工智能在網(wǎng)絡(luò)信息檢索中的應(yīng)用.圖書(shū)館建設(shè),2003(4),4:81~83.焦玉英,符紹宏,何紹華.信息檢索.武漢:武漢大學(xué)出版社,2001.
第三篇:網(wǎng)絡(luò)信息檢索實(shí)驗(yàn)報(bào)告
網(wǎng)絡(luò)信息檢索的應(yīng)用和發(fā)展趨勢(shì)
09軟件1 W班09144136張?jiān)?/p>
摘要:隨著信息時(shí)代的到來(lái),網(wǎng)上信息資源的數(shù)量、種類(lèi)不斷增加,電子信息資源日益豐富,互聯(lián)網(wǎng)技術(shù)也日新月異、層出不窮,人們通過(guò)網(wǎng)絡(luò)能夠獲取大量所需信息,如何在信息的海洋中快捷、準(zhǔn)確地找出所需信息,網(wǎng)絡(luò)搜索引擎就像圖書(shū)館目錄能指引讀者迅速找到所需圖書(shū)一樣,為人們?cè)诰W(wǎng)絡(luò)信息海洋中導(dǎo)航。而面對(duì)日益豐富的電子信息資源,如何有效的利用網(wǎng)絡(luò)資源查找自己需要的信息,并對(duì)其進(jìn)行熟練、靈活、有效地運(yùn)用,已經(jīng)被越來(lái)越多的人重視。
關(guān)鍵字:搜索引擎 信息檢索 網(wǎng)絡(luò) 發(fā)展趨勢(shì)
隨著信息技術(shù)的飛速發(fā)展,因特網(wǎng)已經(jīng)繼報(bào)紙、期刊、廣播、電視等,成為當(dāng)代信息存儲(chǔ)與傳播的主要媒介之一。因特網(wǎng)有著極其豐富的信息資源,但是浩如煙海的信息資源往往讓信息使用者眼花繚亂。人們總是不能在最短的時(shí)間內(nèi)找到自己需要的最有用的資源。因此,我們需要通過(guò)信息檢索來(lái)解決這個(gè)問(wèn)題。信息檢索是指信息按一定的方式組織起來(lái),并根據(jù)信息用戶(hù)的需要找出有關(guān)的信息的過(guò)程和技術(shù)。信息檢索分為兩種,即廣義信息檢索和狹義信息檢索。狹義的信息檢索就是信息檢索過(guò)程的后半部分,即從信息集合中找出所需要的信息的過(guò)程,也就是我們常說(shuō)的信息查尋。本文主要研究的就是狹義的信息檢索中出現(xiàn)的問(wèn)題及解決策略。
一、搜索引擎及其基本原理
搜索引擎是Internet上具有查詢(xún)功能的網(wǎng)頁(yè)的統(tǒng)稱(chēng),是獲取知識(shí)信息的工具。隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,搜索技術(shù)逐漸完善,搜索引擎已廣為人們使用。任何搜索引擎的設(shè)計(jì),均有其特定的數(shù)據(jù)庫(kù)索引范圍、獨(dú)特的功能和使用方法,以及預(yù)期的用戶(hù)群指向。它是一些網(wǎng)絡(luò)服務(wù)商為網(wǎng)絡(luò)用戶(hù)提供的檢索站點(diǎn),它收集了網(wǎng)上的各種資源,然后根據(jù)一種固定的規(guī)律進(jìn)行分類(lèi),提供給用戶(hù)進(jìn)行檢索。
搜索引擎的自動(dòng)信息搜集功能分兩種。一種是定期搜索,即每隔一段時(shí)間進(jìn)行搜索,搜索引擎主動(dòng)派出“蜘蛛”程序,對(duì)一定IP地址范圍內(nèi)的互聯(lián)網(wǎng)站進(jìn)行檢索,一旦發(fā)現(xiàn)新的網(wǎng)站,它會(huì)自動(dòng)提取網(wǎng)站的信息和網(wǎng)址加入自己的數(shù)據(jù)庫(kù)。當(dāng)用戶(hù)以關(guān)鍵詞查找信息時(shí),搜索引擎會(huì)在數(shù)據(jù)庫(kù)中進(jìn)行搜尋,如果找到與用戶(hù)要求內(nèi)容相符的網(wǎng)站,便采用特殊的算法,通常根據(jù)網(wǎng)頁(yè)中關(guān)鍵詞的匹配程度,出現(xiàn)的位置、頻次,鏈接質(zhì)量等計(jì)算出各網(wǎng)頁(yè)的相關(guān)度及排名等級(jí),然后根據(jù)關(guān)聯(lián)度高低,按順序?qū)⑦@些網(wǎng)頁(yè)鏈接返回給用戶(hù)。
二、網(wǎng)絡(luò)信息檢索技巧
3.1加強(qiáng)對(duì)因特網(wǎng)的管理
從以上問(wèn)題,我們可以看出,因特網(wǎng)存在著問(wèn)題,很大一部分是因?yàn)榫W(wǎng)絡(luò)監(jiān)管的不利造成的。因此,國(guó)家要加強(qiáng)宏觀政策調(diào)控,并制定相應(yīng)的法律法規(guī)政策,以法律條文的形式強(qiáng)制性規(guī)范網(wǎng)絡(luò),從而維持因特網(wǎng)秩序,保護(hù)網(wǎng)絡(luò)環(huán)境。同時(shí)我們也應(yīng)該加強(qiáng)公民的思想道德教育,將以德治網(wǎng)和以法治網(wǎng)有機(jī)地結(jié)合在一起,不斷促進(jìn)網(wǎng)絡(luò)安全的發(fā)展,進(jìn)一步減少網(wǎng)絡(luò)詐騙等事件的發(fā)生。
3.2選擇合適的搜索引擎及關(guān)鍵詞
因?yàn)槊總€(gè)用戶(hù)的需求不同,所以在選擇搜索引擎時(shí)要綜合考慮自己的需求,不能盲目地選擇。如前文所說(shuō),搜索引擎分為關(guān)鍵詞搜索引擎和目錄搜索引擎。而信息檢索最基本的要求就是選擇合適的關(guān)鍵詞,尤其是在使用關(guān)鍵詞搜索引擎的時(shí)候。如果輸入的關(guān)鍵詞和用戶(hù)所需要的準(zhǔn)確信息聯(lián)系不大,則用戶(hù)很難迅速地找到自己需要的信息。所以這需要用戶(hù)選擇 富有特色的、合適的關(guān)鍵詞,不能使用太過(guò)寬泛的詞,盡量接近自己需要的信息,同時(shí)也應(yīng)盡量避免拼寫(xiě)錯(cuò)誤等低級(jí)錯(cuò)誤。
3.3提高使用者檢索專(zhuān)業(yè)水平及選擇適合的數(shù)據(jù)庫(kù)
要提高使用者的檢索專(zhuān)業(yè)水平,就要對(duì)使用者進(jìn)行相關(guān)信息檢索的專(zhuān)業(yè)培訓(xùn)。培訓(xùn)的目的主要在于讓使用者跳出傳統(tǒng)的檢索思維范疇,熟悉并能熟練運(yùn)用新的檢索技術(shù),不斷滿(mǎn)足使用者日益增長(zhǎng)的信息檢索需要。同時(shí)使用者對(duì)于檢索的范圍等要有一個(gè)大概的了解,如果搜索出來(lái)的結(jié)果較多,則要適當(dāng)減小范圍;如果檢索結(jié)果很少,則適當(dāng)增大范圍,對(duì)自己的檢索策略做出及時(shí)調(diào)整。另外,根據(jù)檢索的內(nèi)容的范疇來(lái)選擇合適的數(shù)據(jù)庫(kù)是很重要的環(huán)節(jié)。而現(xiàn)有的數(shù)據(jù)庫(kù)種類(lèi)繁多,這也需要用戶(hù)進(jìn)行合適的選擇,并迅速地找到主題分類(lèi)目錄,進(jìn)而更準(zhǔn)確地進(jìn)行檢索。
三、在實(shí)踐中充分利用豐富的網(wǎng)絡(luò)信息資源
搜索前,首先要分析一下自己的搜索需求,然后再選擇關(guān)鍵字。在搜索過(guò)程中,關(guān)鍵字的選擇充滿(mǎn)著反復(fù)性,在搜索的過(guò)程中,切不可急躁,應(yīng)該不斷的篩選,分析所選擇的關(guān)鍵字,直到找到滿(mǎn)意的關(guān)鍵字為止。在搜索收錄網(wǎng)站時(shí),只要網(wǎng)站本身沒(méi)有違反有關(guān)的規(guī)則,一般都能登錄成功。如果搜索都能做到這樣,搜索效率會(huì)不斷的提高,網(wǎng)絡(luò)信息資源會(huì)得到更多和更好的利用。此外,在登錄搜索引擎時(shí),我們一般不用考慮網(wǎng)站的分類(lèi)問(wèn)題,而登錄目錄索引時(shí)則必須將網(wǎng)站放在一個(gè)最合適的目錄,就是要分門(mén)別類(lèi)地存放在相應(yīng)的目錄中,用戶(hù)在查詢(xún)信息時(shí),可選擇關(guān)鍵詞搜索,也可按分類(lèi)目錄逐層查找。目前,搜索引擎與目錄索引有相互融合滲透的趨勢(shì)。原來(lái)一些純粹的全文搜索引擎現(xiàn)在也提供目錄搜索??傊?,在網(wǎng)絡(luò)信息資源檢索的過(guò)程中,要耐心、細(xì)致、多角度思考,不忽略每一個(gè)檢索點(diǎn),只有這樣,才能圓滿(mǎn)完成檢索任務(wù)。
四、網(wǎng)絡(luò)信息檢索的發(fā)展趨勢(shì)
(1)信息檢索的多樣化。其具體趨勢(shì)表現(xiàn)為:網(wǎng)絡(luò)檢索信息的形態(tài)多種多樣;多媒體信息檢索變得普遍;網(wǎng)上檢索工具向其他服務(wù)范疇擴(kuò)展,以各種形式滿(mǎn)足大眾的信息需要。
(2)信息檢索的智能化。智能化信息檢索是當(dāng)今信息檢索技術(shù)研究的熱點(diǎn)問(wèn)題之一,也是未來(lái)信息檢索主要的發(fā)展方向。可以使用戶(hù)得到能夠直接加以利用的信息,它是建立在一個(gè)或多個(gè)專(zhuān)家系統(tǒng)基礎(chǔ)上的信息檢索系統(tǒng)。
(3)信息檢索的專(zhuān)業(yè)化。專(zhuān)業(yè)化信息檢索是指面向某一特定專(zhuān)業(yè)或?qū)W科領(lǐng)域,提供高質(zhì)量的專(zhuān)業(yè)信息的檢索??梢蕴岣邫z索速度,和信息專(zhuān)指度,加大檢索深度、力度,從而提高全=面和準(zhǔn)確。
參考文獻(xiàn):
[1]鄢百其等,網(wǎng)絡(luò)信息檢索技巧及析疑[J].武漢科技大學(xué)學(xué)報(bào)(社會(huì)科
學(xué)版),2008,10(2).[2]李秀芹,葛永亮.略論網(wǎng)絡(luò)信息檢索[J].科技信息,2007(15):325.[3]黃如花,張春蕾.網(wǎng)絡(luò)信息檢索的發(fā)展趨勢(shì)[J].圖書(shū)情報(bào)知識(shí),2002(4):48-50.[4]楊海濤.網(wǎng)絡(luò)信息檢索的困境及發(fā)展趨勢(shì)[J].科技情報(bào)開(kāi)發(fā)與經(jīng)濟(jì),2008(11):13-14.
第四篇:網(wǎng)絡(luò)信息檢索論文
網(wǎng)絡(luò)時(shí)代新特征
——讀《理解媒介:論人的延伸》有感
由于沒(méi)讀《世界是平的》,所以談?wù)勛x《理解媒介:論人的延伸》對(duì)網(wǎng)絡(luò)時(shí)代新特征的理解。加拿大傳播學(xué)巨匠麥克盧漢的著作《理解媒介》中闡述的主要觀點(diǎn)是:“媒介是人的延伸,思維的延伸。人類(lèi)的思維交流從面對(duì)面,到了電話,到了網(wǎng)絡(luò),不斷將世界拉近?!?的確,媒介的變化和改進(jìn)深深地影響著人類(lèi)社會(huì)的方方面面,甚至影響到社會(huì)的變革。麥克盧漢在1964年預(yù)言:隨著電子媒介的發(fā)展,世界日益成為一個(gè)地球村。他認(rèn)為人類(lèi)社會(huì)的發(fā)展經(jīng)歷了一個(gè)部落化——非部落化——重新部落化的過(guò)程,最終整個(gè)世界成為一個(gè)新的“地球村”。在原始社會(huì),口語(yǔ)是主要的傳播媒介,由于聽(tīng)力有限,人們必須生活在小空間的部落群體之中,相互保持近距離的密切關(guān)系。文字和印刷媒介產(chǎn)生之后,人咧可以分散到廣闊的地域,部落神會(huì)便發(fā)生了解體。電子媒介的普及再次改變了這種狀況,談們的床不速度和實(shí)時(shí)性再次將遙遠(yuǎn)的世界拉得很近,人與人的距離大大“縮小”,于是重新“部落化”,形成“地球村”。在電子媒介剛出現(xiàn)時(shí),大多數(shù)人并不相信他的這一預(yù)言,但事實(shí)是新媒介正逐漸將這一預(yù)言實(shí)現(xiàn)。電子化的、通過(guò)電線、光纖、無(wú)線電等技術(shù)傳送信息的網(wǎng)絡(luò)使得任何種類(lèi)的信息都可以突破時(shí)空的限制自由的傳送。
當(dāng)今,互聯(lián)網(wǎng)的浪潮正以難以想象的速度和不可阻擋的勢(shì)頭席卷全球。我覺(jué)得甚至可以這樣理解,第三次科技革命就是信息傳播媒介的革命,網(wǎng)絡(luò)計(jì)算機(jī)技術(shù)改變最深刻的就是傳播和人們交流信息的方式。一方面,從傳統(tǒng)的印刷技術(shù)到現(xiàn)代的數(shù)字化的通訊技術(shù)和通訊網(wǎng)絡(luò),信息傳播的方式突飛猛進(jìn);另一方面,信息傳播方式的革命正在改變經(jīng)濟(jì)增長(zhǎng)方式以及世界經(jīng)濟(jì)格局,是企業(yè)進(jìn)入數(shù)字經(jīng)濟(jì)時(shí)代。信息傳播方式的革命促使人類(lèi)的一切都可以虛擬化。逐漸出現(xiàn)的虛擬辦公、虛擬企業(yè)、虛擬學(xué)校、虛擬圖書(shū)館、虛擬商城等,將改變?nèi)祟?lèi)經(jīng)濟(jì)與社會(huì)活動(dòng)方式。甚至可以說(shuō),這種革命會(huì)影響到政治、文化等更生層次的領(lǐng)域。
麥克盧漢還認(rèn)為,這種變化不僅僅是社會(huì)整體層面的變化,更是其組成單位——人的個(gè)體的變化。麥克盧漢說(shuō)印刷媒介時(shí)代的人是割裂的、殘缺不全的人,他認(rèn)為是印刷文字的語(yǔ)法把人類(lèi)分裂為相互獨(dú)立的自私自利的派別,分裂為種和民族,分裂為情感的派別。他也相信,電子傳播中網(wǎng)絡(luò)那種統(tǒng)一的力量又可能使人類(lèi)重新回到整合統(tǒng)一的狀態(tài)。我覺(jué)得這種觀點(diǎn)很有深度,也很有遠(yuǎn)見(jiàn)。
在互聯(lián)網(wǎng)上,世界正在變成一個(gè)沒(méi)有時(shí)差,沒(méi)有距離的整體,變成一個(gè)超越傳統(tǒng)是空的“網(wǎng)絡(luò)時(shí)空”。在網(wǎng)絡(luò)時(shí)空中,人們可以更多的利用網(wǎng)絡(luò)娛樂(lè),包括收聽(tīng)、下載音樂(lè),觀看電影,人們可以利用網(wǎng)絡(luò)購(gòu)物,訂票,訂酒店等等,網(wǎng)絡(luò)承擔(dān)起人類(lèi)娛樂(lè)、休閑新載體的任務(wù)。另外,在網(wǎng)絡(luò)時(shí)空中,人們還可以通過(guò)虛擬圖書(shū)館、博物館、藝術(shù)館等來(lái)收集需要的信息,在網(wǎng)絡(luò)上學(xué)習(xí),工作。
非常佩服麥克盧漢在40多年前就能做出這樣的預(yù)言,正是互聯(lián)網(wǎng)這種麥克盧漢所預(yù)言的新媒介深刻的改變著世界,在經(jīng)濟(jì)全球化的進(jìn)程中,世界不斷在變小,有人說(shuō)互聯(lián)網(wǎng)既是新媒介也是新市場(chǎng),我們需要通過(guò)互聯(lián)網(wǎng)來(lái)了解網(wǎng)絡(luò)時(shí)代的新特征,更好的利用互聯(lián)網(wǎng)。
第五篇:關(guān)于網(wǎng)絡(luò)信息檢索論文
信息檢索是指信息按一定的方式組織起來(lái),并根據(jù)信息用戶(hù)的需要找出有關(guān)的信息的過(guò)程和技術(shù)。下面小編為大家搜索整理了關(guān)于網(wǎng)絡(luò)信息檢索論文,希望對(duì)大家有所幫助。
淺談網(wǎng)絡(luò)信息檢索的現(xiàn)狀及其發(fā)展趨勢(shì)
【摘要】隨著計(jì)算機(jī)技術(shù)及網(wǎng)絡(luò)技術(shù)的發(fā)展,網(wǎng)絡(luò)信息檢索顯得越發(fā)重要。本文主要綜述了網(wǎng)絡(luò)信息檢索的全文數(shù)據(jù)庫(kù)、搜索引擎、互聯(lián)網(wǎng)“超鏈接”等現(xiàn)行檢索模式及它的智能化、一站式化、可視化等發(fā)展趨勢(shì)。
【關(guān)鍵詞】網(wǎng)絡(luò)信息檢索;現(xiàn)狀;發(fā)展趨勢(shì)
1、信息檢索概述
信息檢索(Information Retrieval)是指將信息按照一定的方式組織和存儲(chǔ)起來(lái),并能根據(jù)信息用戶(hù)的需要指出其中相關(guān)信息的過(guò)程,因此它的全稱(chēng)叫“信息存儲(chǔ)與檢索”。
隨著互聯(lián)網(wǎng)的發(fā)展,人類(lèi)社會(huì)的信息化、網(wǎng)絡(luò)化進(jìn)程大大加快。當(dāng)今出現(xiàn)的一系列新型檢索模式,包括網(wǎng)絡(luò)信息規(guī)范控制標(biāo)準(zhǔn)等為網(wǎng)絡(luò)檢索技術(shù)的未來(lái)展現(xiàn)了新希望,與之相適應(yīng)的信息檢索的交流平臺(tái)也迅速轉(zhuǎn)移到以WWW為核心的網(wǎng)絡(luò)應(yīng)用環(huán)境中,信息檢索步入網(wǎng)絡(luò)化時(shí)代,網(wǎng)絡(luò)信息檢索已基本取代了手工檢索。
2、網(wǎng)絡(luò)信息檢索的現(xiàn)狀
對(duì)大多數(shù)讀者而言,檢索并不意味著發(fā)現(xiàn),而是獲得。人們希望不僅僅是提供寬泛的檢索結(jié)果,而應(yīng)該是計(jì)算機(jī)能試圖理解用戶(hù)提問(wèn)的意圖,并對(duì)檢索結(jié)果進(jìn)行適當(dāng)?shù)姆诸?lèi)和排序。但是,現(xiàn)有的搜索引擎大多是基于簡(jiǎn)單的關(guān)鍵詞匹配,不能真正理解用戶(hù)的檢索意圖;各個(gè)搜索引擎的信息搜集和索引建立有很大的不同,每個(gè)搜索引擎平均只能涉及到整個(gè)網(wǎng)上資源的30%~50%,而其中真正有用的信息也只占很小的比例,這就意味著使用任何一個(gè)搜索引擎都只能檢索到網(wǎng)絡(luò)中的部分資源。目前網(wǎng)絡(luò)檢索面臨一系列的挑戰(zhàn),網(wǎng)絡(luò)信息量迅猛增加,人工已經(jīng)無(wú)法對(duì)它們進(jìn)行有效的分類(lèi)、索引和利用;簡(jiǎn)單的關(guān)鍵詞搜索,返回的信息量過(guò)大,已經(jīng)讓用戶(hù)無(wú)法承擔(dān);網(wǎng)絡(luò)信息組織的無(wú)序性;信息有用性評(píng)價(jià)困難;網(wǎng)絡(luò)信息日新月異的更變;信息媒體的多樣化;帶寬等其它因素的制約,這些都給因特網(wǎng)信息的獲取造成了極大的阻礙。這樣就造成了要求智能化、專(zhuān)業(yè)化、多元化、多媒體化的網(wǎng)絡(luò)信息檢索工具出現(xiàn)的呼聲越來(lái)越高,并且有更多的人參與到其中來(lái)。如此種種,給當(dāng)今的網(wǎng)絡(luò)信息檢索研究帶來(lái)了發(fā)展機(jī)遇,也給了它無(wú)限的發(fā)展空間。
3、網(wǎng)絡(luò)信息檢索的現(xiàn)行模式
3.1 網(wǎng)絡(luò)全文數(shù)據(jù)庫(kù)檢索
網(wǎng)絡(luò)全文數(shù)據(jù)庫(kù)是以全文數(shù)據(jù)為數(shù)據(jù)庫(kù)對(duì)象,并在網(wǎng)上提供全文檢索服務(wù)的數(shù)據(jù)庫(kù)。按數(shù)據(jù)庫(kù)的生產(chǎn)機(jī)構(gòu)分類(lèi),可分為出版商全文期刊數(shù)據(jù)庫(kù)和生產(chǎn)商全文期刊數(shù)據(jù)庫(kù)。前者主要是那些期刊出版單位在其出版的印刷期刊基礎(chǔ)上建立的網(wǎng)絡(luò)電子期刊全文數(shù)據(jù)庫(kù)。而后者則是由數(shù)據(jù)庫(kù)生產(chǎn)商根據(jù)一定的主題或一定的收錄范圍整合一定數(shù)量的期刊出版物而產(chǎn)生的全文數(shù)據(jù)庫(kù)。國(guó)內(nèi)全文數(shù)據(jù)庫(kù)主要有中國(guó)學(xué)術(shù)期刊全文數(shù)據(jù)庫(kù)。
3.2 網(wǎng)絡(luò)搜索引擎檢索
搜索引擎是一個(gè)專(zhuān)門(mén)的系統(tǒng),它可以對(duì)互聯(lián)網(wǎng)信息資源進(jìn)行搜索整理和分類(lèi),并將其儲(chǔ)存在網(wǎng)絡(luò)數(shù)據(jù)庫(kù)中供用戶(hù)查詢(xún)。搜索引擎包括搜集信息、分類(lèi)和用戶(hù)查詢(xún)等三大部分。目前流行的搜索引擎有兩大類(lèi):關(guān)鍵詞全文檢索式搜索引擎和分類(lèi)目錄式搜索引擎。
關(guān)鍵詞全文檢索式搜索引擎主要利用其內(nèi)部的搜索機(jī)器人和蜘蛛程序,自動(dòng)搜索來(lái)自互聯(lián)網(wǎng)上的各種內(nèi)容,在每一個(gè)關(guān)鍵詞和所有相關(guān)的網(wǎng)頁(yè)之間按照網(wǎng)頁(yè)相關(guān)性原理建立一個(gè)對(duì)應(yīng)關(guān)系,儲(chǔ)存在其網(wǎng)絡(luò)服務(wù)器的數(shù)據(jù)庫(kù)中。用戶(hù)只要輸入關(guān)鍵詞就可以找到符合該關(guān)鍵詞特征的所有被索引的網(wǎng)頁(yè),搜索結(jié)果以超鏈接的方式列表,搜索結(jié)果有簡(jiǎn)單介紹,用戶(hù)點(diǎn)擊相應(yīng)的鏈接就可以進(jìn)入相應(yīng)的網(wǎng)絡(luò)資源網(wǎng)站,從而找到所需信息。用這種方式搜索到的結(jié)果通常數(shù)以百萬(wàn)計(jì),但是相關(guān)性越高的信息,在搜索結(jié)果列表中的位置越靠前。分類(lèi)目錄式搜索引擎將互聯(lián)網(wǎng)信息按照一定的標(biāo)準(zhǔn)進(jìn)行收集和分類(lèi),并編入相應(yīng)目錄,以層級(jí)和逐次分項(xiàng)的方式管理目錄,查找信息可以按照分類(lèi)目錄一層層進(jìn)入,最終找到所要的信息。
3.3 互聯(lián)網(wǎng)“超鏈接”搜索
Web信息以超文本鏈接方式組織,基本組織單元是信息節(jié)點(diǎn)而不是字符串,信息節(jié)點(diǎn)之間通過(guò)鏈接進(jìn)行聯(lián)系。超鏈接是網(wǎng)頁(yè)必不可少的一個(gè)元素,同一主題或相關(guān)的信息因超鏈接構(gòu)成了信息網(wǎng)。超文本信息檢索技術(shù),以超文本信息節(jié)點(diǎn)之間的多種鏈接關(guān)系為基礎(chǔ),根據(jù)思維聯(lián)想或查找信息的需要,通過(guò)鏈接從一個(gè)信息節(jié)點(diǎn)轉(zhuǎn)到另一個(gè)信息節(jié)點(diǎn)。
4、網(wǎng)絡(luò)信息檢索的未來(lái)發(fā)展趨勢(shì)
網(wǎng)絡(luò)技術(shù)的發(fā)展,給網(wǎng)絡(luò)信息檢索及信息的網(wǎng)絡(luò)化帶來(lái)的極大的便利,進(jìn)一步推動(dòng)了網(wǎng)絡(luò)信息檢索理論和技術(shù)的快速發(fā)展。怎樣為網(wǎng)絡(luò)用戶(hù)提供高質(zhì)量、高效率的檢索方式是網(wǎng)絡(luò)信息檢索研究者的努力方向。信息檢索的對(duì)象已從傳統(tǒng)的文本信息擴(kuò)展到如今開(kāi)放、動(dòng)態(tài)、分布廣泛的多媒體信息。那么,網(wǎng)絡(luò)信息檢索的發(fā)展趨勢(shì)如何呢?
4.1 智能化信息檢索
智能化信息檢索是基于自然語(yǔ)言處理的檢索形式。檢索工具是對(duì)用戶(hù)提供的以自然語(yǔ)言表達(dá)的檢索要求進(jìn)行分析,從而形成檢索策略進(jìn)行檢索。檢索工具智能化的內(nèi)涵在于檢索工具具有學(xué)習(xí)、分析、辨別和推理的能力。近年來(lái),因特網(wǎng)上不斷涌現(xiàn)的人工智能產(chǎn)品,如智能搜索引擎、智能瀏覽器、智能代理等,它們將提高網(wǎng)絡(luò)信息檢索的智能化程度,促進(jìn)智能信息檢索的發(fā)展。
網(wǎng)絡(luò)中的智能代理通常是一個(gè)專(zhuān)家系統(tǒng)、一個(gè)過(guò)程、一個(gè)模塊或一個(gè)求解單元。智能代理可以獲得用戶(hù)的信息需求,自動(dòng)檢索信息和推送檢索結(jié)果信息。多智能代理系統(tǒng)還具有信息發(fā)現(xiàn)、信息篩選、信息推送和信息導(dǎo)航功能,可滿(mǎn)足專(zhuān)業(yè)研究人員的特定需求,實(shí)現(xiàn)網(wǎng)絡(luò)信息檢索與服務(wù)的智能化。
4.2 一站式信息檢索
一站式(One Stop)信息檢索是指用戶(hù)通過(guò)一個(gè)檢索工具能滿(mǎn)足自己所有的信息檢索需求。一站式信息檢索將是網(wǎng)絡(luò)信息檢索服務(wù)的一種發(fā)展模式。一站式檢索服務(wù)是人性化服務(wù)的重要體現(xiàn),它將大量節(jié)約用戶(hù)的檢索時(shí)間。全球最大的搜索引擎Google正在朝著一站式服務(wù)的方向發(fā)展。2004年12月,Google宣布與紐約公共圖書(shū)館和包括哈佛大學(xué)圖書(shū)館在內(nèi)的4個(gè)主要圖書(shū)館合作,將這些圖書(shū)館的大約1500萬(wàn)冊(cè)藏書(shū)掃描進(jìn)自己的數(shù)據(jù)主庫(kù)以提供網(wǎng)絡(luò)用戶(hù)檢索。目前,Google已經(jīng)為其用戶(hù)提供了某種程度上的一站式的檢索服務(wù)了。而其他越來(lái)越多的檢索服務(wù)提供商將向一站式檢索方向發(fā)展。
4.3 可視化
可視化指的是運(yùn)用計(jì)算機(jī)圖形學(xué)和圖像處理技術(shù),將數(shù)據(jù)轉(zhuǎn)換為圖形或圖像在屏幕上顯示出來(lái),并進(jìn)行交互處理的理論、方法和技術(shù)。據(jù)統(tǒng)計(jì),獲取信息有70%~80%靠視覺(jué),20%靠聽(tīng)覺(jué),10%靠觸覺(jué)。用圖像取代文字幫助人們檢索的優(yōu)點(diǎn)在于:圖像的表達(dá)更生動(dòng)、結(jié)束語(yǔ)形象、準(zhǔn)確,效率更高,具有交互性、多維性、可視性等特點(diǎn),可以大大加快檢索速度,使時(shí)刻都在產(chǎn)生的海量數(shù)據(jù)得到有效利用。
4.4 商業(yè)化
目前網(wǎng)絡(luò)信息檢索系統(tǒng)已成為新的投資熱點(diǎn),網(wǎng)絡(luò)信息檢索系統(tǒng)不再僅僅是一種檢索工具,而且是一種商業(yè)產(chǎn)品。2001年10月,全球最大的中文搜索引擎提供商百度聯(lián)合新浪等多家中文門(mén)戶(hù)網(wǎng)站,共同推廣“搜索引擎競(jìng)價(jià)排名”全新網(wǎng)絡(luò)商業(yè)服務(wù)模式。網(wǎng)絡(luò)信息檢索的商業(yè)化還體現(xiàn)在聯(lián)機(jī)和光盤(pán)檢索逐漸進(jìn)入網(wǎng)絡(luò)環(huán)境。由于目前網(wǎng)絡(luò)信息檢索的檢準(zhǔn)率低,聯(lián)網(wǎng)的收費(fèi)聯(lián)機(jī)和光盤(pán)檢索依舊受到青睞,如世界著名的聯(lián)機(jī)信息系統(tǒng)DIALOG、OCLC、EBSCO、Silverplatter,國(guó)內(nèi)的萬(wàn)方數(shù)據(jù)資源系統(tǒng)、中國(guó)學(xué)術(shù)期刊光盤(pán)、重慶維普公司系列光盤(pán)等都紛紛在網(wǎng)上設(shè)立自己的網(wǎng)絡(luò)檢索入口。許多著名科技期刊的上網(wǎng)豐富了網(wǎng)絡(luò)資源,它們大多數(shù)都是在提供印刷版的同時(shí)提供期刊的網(wǎng)上服務(wù),包括收費(fèi)檢索。
5、小結(jié)
在的網(wǎng)絡(luò)信息資源中尋找自己所需要的信息資源是一件極具挑戰(zhàn)性的工作。為此,許多信息專(zhuān)家正在積極地研究探索,并且取得了不少成果。我們相信隨著科學(xué)技術(shù)的進(jìn)步,網(wǎng)絡(luò)信息檢索發(fā)展會(huì)越來(lái)越快,人們所利用的檢索工具和手段的更替會(huì)更加頻繁。
參考文獻(xiàn)
[1]黃靜.網(wǎng)絡(luò)信息檢索發(fā)展方向展望[J].Journal of Library and Information Sciences in Agriculture,2008(1):15-19.[2]霍小梅,王小蘭.網(wǎng)絡(luò)信息檢索的現(xiàn)狀及發(fā)展趨勢(shì)[J].圖書(shū)館論壇,2004(4):180-182.[3]戴莉.網(wǎng)絡(luò)信息檢索的發(fā)展趨勢(shì)[J].情報(bào)探索,2005(2):52-54.[4]徐謙.網(wǎng)絡(luò)信息檢索的智能化趨勢(shì)[J].圖書(shū)館理論與實(shí)踐,2006(2):63-65.[5]謝新洲.網(wǎng)絡(luò)信息檢索技術(shù)與案例[M].北京:北京圖書(shū)館出版社,2005:9.[6]易向軍.網(wǎng)絡(luò)信息檢索現(xiàn)狀及未來(lái)[J].合肥學(xué)院學(xué)報(bào),2007(7):90-92.