第一篇:網(wǎng)絡(luò)信息檢索及其局限性(本站推薦)
【關(guān)鍵詞】 網(wǎng)絡(luò)信息 信息檢索 搜索引擎網(wǎng)絡(luò)信息檢索簡介
隨著信息技術(shù)的飛速發(fā)展,信息已成為全社會的重要資源,對信息的占有程度及信息處理水平的先進程度已成為衡量一個國家或地區(qū)現(xiàn)代化程度的重要標志,而網(wǎng)絡(luò)上豐富的信息在更大程度上改變了人們的工作和生活的方式。Internet是當(dāng)今世界上規(guī)模最大、覆蓋面最廣、信息資源最豐富、發(fā)展最為迅速的信息網(wǎng)絡(luò),基于Internet的網(wǎng)絡(luò)信息檢索的研究,無論對研究人員還是一般用戶來說,都有著很強的現(xiàn)實性和實用性。
1.1 信息檢索概念
信息檢索是指將信息按一定的方式組織和存儲起來,并根據(jù)信息用戶的信息需求查找所需信息的過程和技術(shù)。人們獲取信息源的方式主要有:①傳統(tǒng)的信息檢索方法,通過人工查詢在圖書館等提供文獻的機構(gòu)進行文獻的查詢和獲取活動;②聯(lián)機信息檢索相對于前者來說具有實時性、完整性、共享性、廣泛性等優(yōu)點;③網(wǎng)絡(luò)信息檢索是指通過網(wǎng)絡(luò)信息檢索工具檢索存在于Internet信息空間中各種類型的網(wǎng)絡(luò)信息資源。
1.2 網(wǎng)絡(luò)信息檢索的原理
網(wǎng)絡(luò)信息檢索工具是網(wǎng)絡(luò)信息檢索技術(shù)的實物體現(xiàn)。目前,常用的網(wǎng)絡(luò)信息檢索模型有布爾邏輯模型、模糊邏輯模型和概率模型等幾種方式。
① 布爾邏輯模型 這是一種簡單而常用的嚴格匹配模型。用戶可以根據(jù)檢索項在文檔中的布爾邏輯關(guān)系提交查詢,搜索工具根據(jù)事先建立的倒排文檔結(jié)構(gòu)確定查詢結(jié)果。標準的布爾邏輯模型為二元邏輯,所搜索的文檔要么與查詢相關(guān),要么與查詢無關(guān)。利用這種模型進行查詢,其查詢結(jié)果一般沒有按照內(nèi)容的相關(guān)特性排序。
② 模糊邏輯模型 它在查詢結(jié)果處理中引進了模糊邏輯比較,并且按照相關(guān)的優(yōu)先次序排列查詢結(jié)果,這樣就可以克服布爾邏輯模型信息查詢結(jié)果的無序性。
③ 概率模型 它是基于貝葉斯概率原理而提出的,根據(jù)詞條、文檔間的內(nèi)在聯(lián)系,利用詞條間和詞條與文檔間的概率相依性來進行信息檢索。2 搜索引擎
搜索引擎是目前使用最為頻繁的一種網(wǎng)絡(luò)信息檢索工具。與其他工具相比,它的檢全率和檢準率都比較高,具有很強的使用價值和廣泛的應(yīng)用前景。
2.1 搜索引擎的工作原理
作為一種www站點資源和其它網(wǎng)絡(luò)資源進行組織和檢索的檢索工具,搜索引擎的檢索機制一般包括數(shù)據(jù)采集和標引機制、數(shù)據(jù)組織機制和用戶檢索機制,基本構(gòu)成如圖1所示。① 數(shù)據(jù)采集標引機制按照一定規(guī)律和方式對網(wǎng)絡(luò)上www站點進行搜索,并將搜索到的www頁面信息存入搜索引擎的臨時數(shù)據(jù)庫中。
② 數(shù)據(jù)組織據(jù)組織機制的主要功能是對www頁面信息進行整理以形成規(guī)范的頁面索引,并建立相應(yīng)的索引數(shù)據(jù)庫。
③ 索引數(shù)據(jù)庫是用戶進行檢索的基礎(chǔ),它的數(shù)據(jù)質(zhì)量直接影響到檢索效果,而搜索引擎的數(shù)據(jù)采集標和標引機制又是決定數(shù)據(jù)庫質(zhì)量的關(guān)鍵技術(shù)。
④ 用戶檢索機制幫助用戶以一定方式檢索引擎的索引數(shù)據(jù)庫,以獲得符合用戶需要的www站點或頁面。
2.2 搜索引擎的分類
按照用戶查找的途徑劃分,可將搜索引擎分為如下幾種: ① 基于關(guān)鍵詞的搜索引擎 主要通過使用自動采集軟件來對網(wǎng)絡(luò)上的數(shù)據(jù)進行采集標引,建立成索引數(shù)據(jù)庫。它主要采用自動搜索和標引方式來建立和維護其索引數(shù)據(jù)庫,供用戶查詢使用。
② 基于分類目錄的搜索引擎 一般依賴于按照某種分類標準進行人工編排的分類體系。
③ 聯(lián)合式搜索引擎 是基于關(guān)鍵詞的搜索引擎的另外一種表現(xiàn)形式,是后者與基于類目的搜索引擎的一種結(jié)合。2.3 搜索引擎的功能
目前Internet上的搜索引擎種類繁多,雖然各種搜索引擎都有自己的不同信息采集標引機制,在其他一些方面各具特色,但其基本功能卻是相似的。
① 布爾邏輯檢索 這一功能使得用戶能使用AND、OR和NOT來進行關(guān)鍵詞的搭配檢索。
② 模糊檢索 在用戶進行檢索的過程中,系統(tǒng)會對跟用戶提供的關(guān)鍵詞相似的詞語進行檢索,并返回包含關(guān)鍵詞或是這些相似詞的檢索結(jié)果。
③ 截詞檢索 這種檢索形式利用檢索詞的某一部分來進行檢索。在搜索引擎中,用戶提供包含“?”或是“*”通配符的檢索項來進行檢索。
④ 限定詞檢索 這種檢索加減號檢索,它用來規(guī)定檢索項中必須出現(xiàn)或是必須不出現(xiàn)某些關(guān)鍵詞。網(wǎng)絡(luò)信息檢索的局限 用戶在查找網(wǎng)絡(luò)信息資源時,不可避免的用到網(wǎng)絡(luò)信息檢索工具。檢索工具的優(yōu)劣很大程度的影響了用戶的檢索效率。雖然網(wǎng)絡(luò)信息檢索工具在最近幾年有了長足的發(fā)展,但是到現(xiàn)在網(wǎng)絡(luò)信息檢索仍然存在著這樣或是那樣的局限。
3.1 文本信息檢索的局限
① 網(wǎng)絡(luò)信息標引的準確度不夠 檢索工具對網(wǎng)絡(luò)信息資源的標引一般都存在著柵引準確度不夠的問題,檢索工具經(jīng)常會在返回大量垃圾信息的同時丟失有用信息。當(dāng)用戶要進行特定的文獻檢索時,有時還會發(fā)現(xiàn)現(xiàn)存的檢索工具無濟于事,檢索出來的數(shù)據(jù)完全被無用信息所覆蓋。如想要通過搜索引擎查詢清朝雍正年間李衛(wèi)任浙江巡撫的資料,你只能夠查到大量《李衛(wèi)當(dāng)官》之類無用信息。
② 搜索引擎的查全率不高 由于互聯(lián)網(wǎng)上的信息資源以爆炸性的速度不斷增長,搜索引擎采集數(shù)據(jù)的速度遠遠落后于信息資源的增長速度。單個搜索引擎的數(shù)據(jù)庫所收集的Web頁面大大不足,就是所有的搜索引擎所儲存的數(shù)據(jù)也只占全球Web頁面的50%強。由于這方面的原因,搜索引擎的檢全率會無可避免的被降低。
③ 搜索引擎的查準率不高 一是返回的信息過多,這是現(xiàn)有搜索引擎檢索信息的普遍現(xiàn)象;二是返回重復(fù)的信息,搜索引擎的檢索結(jié)果中還經(jīng)常重復(fù)出現(xiàn)同一信息源的不同部分,甚至出現(xiàn)不同信息源的相同內(nèi)容信息。
④ 查詢方式有限 目前大多數(shù)搜索引擎的查詢方法比較單一,一般只提供分類查詢方式和關(guān)鍵詞查詢方式。這樣,一方面檢索時不能從文獻的多個方面對檢索提問進行限制,只能就某一關(guān)鍵詞或概念進行籠統(tǒng)的檢索;另一方面,由于查詢結(jié)果完全依賴于用戶所給出的關(guān)鍵詞,而大多數(shù)用戶對他們檢索的領(lǐng)域或索引數(shù)據(jù)庫的關(guān)鍵詞不太了解,因此使最后的查詢結(jié)果相關(guān)性很差,往往是輸入一個檢索式,得到一大堆網(wǎng)址,但其中大部分是冗余信息。
⑤ 檢索對象的數(shù)據(jù)結(jié)構(gòu)單一 由于現(xiàn)在大多數(shù)網(wǎng)站使用的是傳統(tǒng)的關(guān)系數(shù)據(jù)庫對信息進行組織和存儲,因此其使用的搜索引擎也是基于關(guān)系數(shù)據(jù)庫的,這種傳統(tǒng)的關(guān)系數(shù)據(jù)庫非常擅長處理結(jié)構(gòu)化的數(shù)據(jù),但其對于非結(jié)構(gòu)化的數(shù)據(jù)的處理能力則很弱。
⑥ 交互性不夠 當(dāng)前的搜索引擎與用戶的交互性不夠,與用戶間缺乏足夠的協(xié)作,不了解用戶的情況,不記錄用戶提交的查詢?nèi)蝿?wù),不能處理用戶的反饋信息,因而不能與用戶進行足夠好的交互以提高檢索效率。3.2 多媒體信息檢索的局限
到現(xiàn)在為止,雖然單獨針對圖像、視頻、聲音等媒體的檢索技術(shù)已經(jīng)出現(xiàn),但還沒有任何搜索引擎能夠充分解決多媒體信息的檢索,其主要表現(xiàn)在以下幾個方面:
① 檢索效果不夠理想 目前,幾乎所有的多媒體搜索引擎在多媒體信息的查準率方面都不能達到令人滿意的程度,用戶將在返回的幾百個甚至上千個圖像中篩選需要的那一幅。這是很費時和令人難以忍受的,而且有時你所用的搜索引擎根本檢不出你想要的東西。歸其原因,一方面是在于查詢方式的單一,另一方面在于對圖像的標引深度不夠,這就要求完善圖像檢索和索引機制。
② 用戶查詢接口單一 理想的多媒體檢索系統(tǒng)中,人是主動的,用戶的查詢接口能提供豐富的交互能力,且直觀易用,使用戶能夠在主動交互過程中通過調(diào)整檢索參數(shù),表達對圖像的語義感知,最終獲取滿意的結(jié)果。這就涉及到如何把用戶的提問轉(zhuǎn)換為可以執(zhí)行檢索的特征矢量、交互方式的設(shè)計,如何獲取用戶的內(nèi)容感知等問題。目前的多媒體搜索引擎用戶查詢接口比較單一,大多只提供描述查詢接口,即關(guān)鍵詞提問框。
③ 圖像特征信息的表示與檢索不夠完善 基于內(nèi)容的圖像檢索,實質(zhì)上就是進行圖像特征相似度的比較,但目前這一技術(shù)還存在許多問題。
④ 信息的自動加工與人工標引不夠 目前文本搜索引擎在這方面的發(fā)展正日趨完善,而多媒體搜索引擎的研究剛剛起步,尤其是圖像信息的加工,圖像不同于文本,文本自身就能說明要講的內(nèi)容,而圖像內(nèi)容卻需要加入人的理解和描述,人工干預(yù)雖能提高查準率,但一方面能被人工標引的是極其有限的;另一方面由于人工標引勞動強度大而限制了檢索的范圍,如何對圖像信息進行快速標引和準確分類是急待解決的主要問題。
另外,目前基于內(nèi)容的檢索技術(shù)多應(yīng)用于對靜態(tài)圖像的檢索,對動態(tài)圖像的檢索還沒有多少行之有效的方法。但隨著寬帶網(wǎng)絡(luò)的逐步實現(xiàn),動態(tài)多媒體信息在網(wǎng)絡(luò)中將會越來越多。參考文獻】
張杰.淺論網(wǎng)絡(luò)信息檢索.江西圖書館學(xué)刊,2002年增刊.董慧.網(wǎng)絡(luò)信息資源開發(fā)與利用.武漢:武漢大學(xué)出版社,2001.盧小賓.信息檢索.北京:科學(xué)出版社,2003.李勇先,鄭文良.人工智能在網(wǎng)絡(luò)信息檢索中的應(yīng)用.圖書館建設(shè),2003(4),4:81~83.焦玉英,符紹宏,何紹華.信息檢索.武漢:武漢大學(xué)出版社,2001.
第二篇:網(wǎng)絡(luò)信息檢索及其局限性__論文(DOC)
現(xiàn)代網(wǎng)絡(luò)信息檢索未來的發(fā)展趨勢 姓名: 學(xué)號: 班級:
摘要: 隨著信息技術(shù)的飛速發(fā)展,信息已成為全社會的重要資源,對信息的占有程度及信息處理水平的先進程度已成為衡量一個國家或地區(qū)現(xiàn)代化程度的重要標志,而網(wǎng)絡(luò)上豐富的信息在更大程度上改變了人們的工作和生活的方式。【關(guān)鍵詞】
網(wǎng)絡(luò)信息 信息檢索 搜索引擎 資源共享
網(wǎng)絡(luò)信息檢索簡介
隨著信息化工程的整體推進, Internet是當(dāng)今世界上規(guī)模最大、覆蓋面最廣、信息資源最豐富、發(fā)展最為迅速的信息網(wǎng)絡(luò),基于Internet的網(wǎng)絡(luò)信息檢索的研究,無論對研究人員還是一般用戶來說,都有著很強的現(xiàn)實性和實用性。
1.1 信息檢索概念
信息檢索是指將信息按一定的方式組織和存儲起來,并根據(jù)信息用戶的信息需求查找所需信息的過程和技術(shù)。人們獲取信息源的方式主要有:①傳統(tǒng)的信息檢索方法,通過人工查詢在圖書館等提供文獻的機構(gòu)進行文獻的查詢和獲取活動;②聯(lián)機信息檢索相對于前者來說具有實時性、完整性、共享性、廣泛性等優(yōu)點;③網(wǎng)絡(luò)信息檢索是指通過網(wǎng)絡(luò)信息檢索工具檢索存在于Internet信息空間中各種類型的網(wǎng)絡(luò)信息資源。
1.2 網(wǎng)絡(luò)信息檢索的原理
網(wǎng)絡(luò)信息檢索工具是網(wǎng)絡(luò)信息檢索技術(shù)的實物體現(xiàn)。目前,常用的網(wǎng)絡(luò)信息檢索模型有布爾邏輯模型、模糊邏輯模型和概率模型等幾種方式。
① 布爾邏輯模型
這是一種簡單而常用的嚴格匹配模型。用戶可以根據(jù)檢索項在文檔中的布爾邏輯關(guān)系提交查詢,搜索工具根據(jù)事先建立的倒排文檔結(jié)構(gòu)確定查詢結(jié)果。標準的布爾邏輯模型為二元邏輯,所搜索的文檔要么與查詢相關(guān),要么與查詢無關(guān)。利用這種模型進行查詢,其查詢結(jié)果一般沒有按照內(nèi)容的相關(guān)特性排序。
第三篇:網(wǎng)絡(luò)信息檢索實驗報告
網(wǎng)絡(luò)信息檢索的應(yīng)用和發(fā)展趨勢
09軟件1 W班09144136張越
摘要:隨著信息時代的到來,網(wǎng)上信息資源的數(shù)量、種類不斷增加,電子信息資源日益豐富,互聯(lián)網(wǎng)技術(shù)也日新月異、層出不窮,人們通過網(wǎng)絡(luò)能夠獲取大量所需信息,如何在信息的海洋中快捷、準確地找出所需信息,網(wǎng)絡(luò)搜索引擎就像圖書館目錄能指引讀者迅速找到所需圖書一樣,為人們在網(wǎng)絡(luò)信息海洋中導(dǎo)航。而面對日益豐富的電子信息資源,如何有效的利用網(wǎng)絡(luò)資源查找自己需要的信息,并對其進行熟練、靈活、有效地運用,已經(jīng)被越來越多的人重視。
關(guān)鍵字:搜索引擎 信息檢索 網(wǎng)絡(luò) 發(fā)展趨勢
隨著信息技術(shù)的飛速發(fā)展,因特網(wǎng)已經(jīng)繼報紙、期刊、廣播、電視等,成為當(dāng)代信息存儲與傳播的主要媒介之一。因特網(wǎng)有著極其豐富的信息資源,但是浩如煙海的信息資源往往讓信息使用者眼花繚亂。人們總是不能在最短的時間內(nèi)找到自己需要的最有用的資源。因此,我們需要通過信息檢索來解決這個問題。信息檢索是指信息按一定的方式組織起來,并根據(jù)信息用戶的需要找出有關(guān)的信息的過程和技術(shù)。信息檢索分為兩種,即廣義信息檢索和狹義信息檢索。狹義的信息檢索就是信息檢索過程的后半部分,即從信息集合中找出所需要的信息的過程,也就是我們常說的信息查尋。本文主要研究的就是狹義的信息檢索中出現(xiàn)的問題及解決策略。
一、搜索引擎及其基本原理
搜索引擎是Internet上具有查詢功能的網(wǎng)頁的統(tǒng)稱,是獲取知識信息的工具。隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,搜索技術(shù)逐漸完善,搜索引擎已廣為人們使用。任何搜索引擎的設(shè)計,均有其特定的數(shù)據(jù)庫索引范圍、獨特的功能和使用方法,以及預(yù)期的用戶群指向。它是一些網(wǎng)絡(luò)服務(wù)商為網(wǎng)絡(luò)用戶提供的檢索站點,它收集了網(wǎng)上的各種資源,然后根據(jù)一種固定的規(guī)律進行分類,提供給用戶進行檢索。
搜索引擎的自動信息搜集功能分兩種。一種是定期搜索,即每隔一段時間進行搜索,搜索引擎主動派出“蜘蛛”程序,對一定IP地址范圍內(nèi)的互聯(lián)網(wǎng)站進行檢索,一旦發(fā)現(xiàn)新的網(wǎng)站,它會自動提取網(wǎng)站的信息和網(wǎng)址加入自己的數(shù)據(jù)庫。當(dāng)用戶以關(guān)鍵詞查找信息時,搜索引擎會在數(shù)據(jù)庫中進行搜尋,如果找到與用戶要求內(nèi)容相符的網(wǎng)站,便采用特殊的算法,通常根據(jù)網(wǎng)頁中關(guān)鍵詞的匹配程度,出現(xiàn)的位置、頻次,鏈接質(zhì)量等計算出各網(wǎng)頁的相關(guān)度及排名等級,然后根據(jù)關(guān)聯(lián)度高低,按順序?qū)⑦@些網(wǎng)頁鏈接返回給用戶。
二、網(wǎng)絡(luò)信息檢索技巧
3.1加強對因特網(wǎng)的管理
從以上問題,我們可以看出,因特網(wǎng)存在著問題,很大一部分是因為網(wǎng)絡(luò)監(jiān)管的不利造成的。因此,國家要加強宏觀政策調(diào)控,并制定相應(yīng)的法律法規(guī)政策,以法律條文的形式強制性規(guī)范網(wǎng)絡(luò),從而維持因特網(wǎng)秩序,保護網(wǎng)絡(luò)環(huán)境。同時我們也應(yīng)該加強公民的思想道德教育,將以德治網(wǎng)和以法治網(wǎng)有機地結(jié)合在一起,不斷促進網(wǎng)絡(luò)安全的發(fā)展,進一步減少網(wǎng)絡(luò)詐騙等事件的發(fā)生。
3.2選擇合適的搜索引擎及關(guān)鍵詞
因為每個用戶的需求不同,所以在選擇搜索引擎時要綜合考慮自己的需求,不能盲目地選擇。如前文所說,搜索引擎分為關(guān)鍵詞搜索引擎和目錄搜索引擎。而信息檢索最基本的要求就是選擇合適的關(guān)鍵詞,尤其是在使用關(guān)鍵詞搜索引擎的時候。如果輸入的關(guān)鍵詞和用戶所需要的準確信息聯(lián)系不大,則用戶很難迅速地找到自己需要的信息。所以這需要用戶選擇 富有特色的、合適的關(guān)鍵詞,不能使用太過寬泛的詞,盡量接近自己需要的信息,同時也應(yīng)盡量避免拼寫錯誤等低級錯誤。
3.3提高使用者檢索專業(yè)水平及選擇適合的數(shù)據(jù)庫
要提高使用者的檢索專業(yè)水平,就要對使用者進行相關(guān)信息檢索的專業(yè)培訓(xùn)。培訓(xùn)的目的主要在于讓使用者跳出傳統(tǒng)的檢索思維范疇,熟悉并能熟練運用新的檢索技術(shù),不斷滿足使用者日益增長的信息檢索需要。同時使用者對于檢索的范圍等要有一個大概的了解,如果搜索出來的結(jié)果較多,則要適當(dāng)減小范圍;如果檢索結(jié)果很少,則適當(dāng)增大范圍,對自己的檢索策略做出及時調(diào)整。另外,根據(jù)檢索的內(nèi)容的范疇來選擇合適的數(shù)據(jù)庫是很重要的環(huán)節(jié)。而現(xiàn)有的數(shù)據(jù)庫種類繁多,這也需要用戶進行合適的選擇,并迅速地找到主題分類目錄,進而更準確地進行檢索。
三、在實踐中充分利用豐富的網(wǎng)絡(luò)信息資源
搜索前,首先要分析一下自己的搜索需求,然后再選擇關(guān)鍵字。在搜索過程中,關(guān)鍵字的選擇充滿著反復(fù)性,在搜索的過程中,切不可急躁,應(yīng)該不斷的篩選,分析所選擇的關(guān)鍵字,直到找到滿意的關(guān)鍵字為止。在搜索收錄網(wǎng)站時,只要網(wǎng)站本身沒有違反有關(guān)的規(guī)則,一般都能登錄成功。如果搜索都能做到這樣,搜索效率會不斷的提高,網(wǎng)絡(luò)信息資源會得到更多和更好的利用。此外,在登錄搜索引擎時,我們一般不用考慮網(wǎng)站的分類問題,而登錄目錄索引時則必須將網(wǎng)站放在一個最合適的目錄,就是要分門別類地存放在相應(yīng)的目錄中,用戶在查詢信息時,可選擇關(guān)鍵詞搜索,也可按分類目錄逐層查找。目前,搜索引擎與目錄索引有相互融合滲透的趨勢。原來一些純粹的全文搜索引擎現(xiàn)在也提供目錄搜索??傊诰W(wǎng)絡(luò)信息資源檢索的過程中,要耐心、細致、多角度思考,不忽略每一個檢索點,只有這樣,才能圓滿完成檢索任務(wù)。
四、網(wǎng)絡(luò)信息檢索的發(fā)展趨勢
(1)信息檢索的多樣化。其具體趨勢表現(xiàn)為:網(wǎng)絡(luò)檢索信息的形態(tài)多種多樣;多媒體信息檢索變得普遍;網(wǎng)上檢索工具向其他服務(wù)范疇擴展,以各種形式滿足大眾的信息需要。
(2)信息檢索的智能化。智能化信息檢索是當(dāng)今信息檢索技術(shù)研究的熱點問題之一,也是未來信息檢索主要的發(fā)展方向。可以使用戶得到能夠直接加以利用的信息,它是建立在一個或多個專家系統(tǒng)基礎(chǔ)上的信息檢索系統(tǒng)。
(3)信息檢索的專業(yè)化。專業(yè)化信息檢索是指面向某一特定專業(yè)或?qū)W科領(lǐng)域,提供高質(zhì)量的專業(yè)信息的檢索。可以提高檢索速度,和信息專指度,加大檢索深度、力度,從而提高全=面和準確。
參考文獻:
[1]鄢百其等,網(wǎng)絡(luò)信息檢索技巧及析疑[J].武漢科技大學(xué)學(xué)報(社會科
學(xué)版),2008,10(2).[2]李秀芹,葛永亮.略論網(wǎng)絡(luò)信息檢索[J].科技信息,2007(15):325.[3]黃如花,張春蕾.網(wǎng)絡(luò)信息檢索的發(fā)展趨勢[J].圖書情報知識,2002(4):48-50.[4]楊海濤.網(wǎng)絡(luò)信息檢索的困境及發(fā)展趨勢[J].科技情報開發(fā)與經(jīng)濟,2008(11):13-14.
第四篇:網(wǎng)絡(luò)信息檢索論文
網(wǎng)絡(luò)時代新特征
——讀《理解媒介:論人的延伸》有感
由于沒讀《世界是平的》,所以談?wù)勛x《理解媒介:論人的延伸》對網(wǎng)絡(luò)時代新特征的理解。加拿大傳播學(xué)巨匠麥克盧漢的著作《理解媒介》中闡述的主要觀點是:“媒介是人的延伸,思維的延伸。人類的思維交流從面對面,到了電話,到了網(wǎng)絡(luò),不斷將世界拉近?!?的確,媒介的變化和改進深深地影響著人類社會的方方面面,甚至影響到社會的變革。麥克盧漢在1964年預(yù)言:隨著電子媒介的發(fā)展,世界日益成為一個地球村。他認為人類社會的發(fā)展經(jīng)歷了一個部落化——非部落化——重新部落化的過程,最終整個世界成為一個新的“地球村”。在原始社會,口語是主要的傳播媒介,由于聽力有限,人們必須生活在小空間的部落群體之中,相互保持近距離的密切關(guān)系。文字和印刷媒介產(chǎn)生之后,人咧可以分散到廣闊的地域,部落神會便發(fā)生了解體。電子媒介的普及再次改變了這種狀況,談們的床不速度和實時性再次將遙遠的世界拉得很近,人與人的距離大大“縮小”,于是重新“部落化”,形成“地球村”。在電子媒介剛出現(xiàn)時,大多數(shù)人并不相信他的這一預(yù)言,但事實是新媒介正逐漸將這一預(yù)言實現(xiàn)。電子化的、通過電線、光纖、無線電等技術(shù)傳送信息的網(wǎng)絡(luò)使得任何種類的信息都可以突破時空的限制自由的傳送。
當(dāng)今,互聯(lián)網(wǎng)的浪潮正以難以想象的速度和不可阻擋的勢頭席卷全球。我覺得甚至可以這樣理解,第三次科技革命就是信息傳播媒介的革命,網(wǎng)絡(luò)計算機技術(shù)改變最深刻的就是傳播和人們交流信息的方式。一方面,從傳統(tǒng)的印刷技術(shù)到現(xiàn)代的數(shù)字化的通訊技術(shù)和通訊網(wǎng)絡(luò),信息傳播的方式突飛猛進;另一方面,信息傳播方式的革命正在改變經(jīng)濟增長方式以及世界經(jīng)濟格局,是企業(yè)進入數(shù)字經(jīng)濟時代。信息傳播方式的革命促使人類的一切都可以虛擬化。逐漸出現(xiàn)的虛擬辦公、虛擬企業(yè)、虛擬學(xué)校、虛擬圖書館、虛擬商城等,將改變?nèi)祟惤?jīng)濟與社會活動方式。甚至可以說,這種革命會影響到政治、文化等更生層次的領(lǐng)域。
麥克盧漢還認為,這種變化不僅僅是社會整體層面的變化,更是其組成單位——人的個體的變化。麥克盧漢說印刷媒介時代的人是割裂的、殘缺不全的人,他認為是印刷文字的語法把人類分裂為相互獨立的自私自利的派別,分裂為種和民族,分裂為情感的派別。他也相信,電子傳播中網(wǎng)絡(luò)那種統(tǒng)一的力量又可能使人類重新回到整合統(tǒng)一的狀態(tài)。我覺得這種觀點很有深度,也很有遠見。
在互聯(lián)網(wǎng)上,世界正在變成一個沒有時差,沒有距離的整體,變成一個超越傳統(tǒng)是空的“網(wǎng)絡(luò)時空”。在網(wǎng)絡(luò)時空中,人們可以更多的利用網(wǎng)絡(luò)娛樂,包括收聽、下載音樂,觀看電影,人們可以利用網(wǎng)絡(luò)購物,訂票,訂酒店等等,網(wǎng)絡(luò)承擔(dān)起人類娛樂、休閑新載體的任務(wù)。另外,在網(wǎng)絡(luò)時空中,人們還可以通過虛擬圖書館、博物館、藝術(shù)館等來收集需要的信息,在網(wǎng)絡(luò)上學(xué)習(xí),工作。
非常佩服麥克盧漢在40多年前就能做出這樣的預(yù)言,正是互聯(lián)網(wǎng)這種麥克盧漢所預(yù)言的新媒介深刻的改變著世界,在經(jīng)濟全球化的進程中,世界不斷在變小,有人說互聯(lián)網(wǎng)既是新媒介也是新市場,我們需要通過互聯(lián)網(wǎng)來了解網(wǎng)絡(luò)時代的新特征,更好的利用互聯(lián)網(wǎng)。
第五篇:關(guān)于網(wǎng)絡(luò)信息檢索論文
信息檢索是指信息按一定的方式組織起來,并根據(jù)信息用戶的需要找出有關(guān)的信息的過程和技術(shù)。下面小編為大家搜索整理了關(guān)于網(wǎng)絡(luò)信息檢索論文,希望對大家有所幫助。
淺談網(wǎng)絡(luò)信息檢索的現(xiàn)狀及其發(fā)展趨勢
【摘要】隨著計算機技術(shù)及網(wǎng)絡(luò)技術(shù)的發(fā)展,網(wǎng)絡(luò)信息檢索顯得越發(fā)重要。本文主要綜述了網(wǎng)絡(luò)信息檢索的全文數(shù)據(jù)庫、搜索引擎、互聯(lián)網(wǎng)“超鏈接”等現(xiàn)行檢索模式及它的智能化、一站式化、可視化等發(fā)展趨勢。
【關(guān)鍵詞】網(wǎng)絡(luò)信息檢索;現(xiàn)狀;發(fā)展趨勢
1、信息檢索概述
信息檢索(Information Retrieval)是指將信息按照一定的方式組織和存儲起來,并能根據(jù)信息用戶的需要指出其中相關(guān)信息的過程,因此它的全稱叫“信息存儲與檢索”。
隨著互聯(lián)網(wǎng)的發(fā)展,人類社會的信息化、網(wǎng)絡(luò)化進程大大加快。當(dāng)今出現(xiàn)的一系列新型檢索模式,包括網(wǎng)絡(luò)信息規(guī)范控制標準等為網(wǎng)絡(luò)檢索技術(shù)的未來展現(xiàn)了新希望,與之相適應(yīng)的信息檢索的交流平臺也迅速轉(zhuǎn)移到以WWW為核心的網(wǎng)絡(luò)應(yīng)用環(huán)境中,信息檢索步入網(wǎng)絡(luò)化時代,網(wǎng)絡(luò)信息檢索已基本取代了手工檢索。
2、網(wǎng)絡(luò)信息檢索的現(xiàn)狀
對大多數(shù)讀者而言,檢索并不意味著發(fā)現(xiàn),而是獲得。人們希望不僅僅是提供寬泛的檢索結(jié)果,而應(yīng)該是計算機能試圖理解用戶提問的意圖,并對檢索結(jié)果進行適當(dāng)?shù)姆诸惡团判?。但是,現(xiàn)有的搜索引擎大多是基于簡單的關(guān)鍵詞匹配,不能真正理解用戶的檢索意圖;各個搜索引擎的信息搜集和索引建立有很大的不同,每個搜索引擎平均只能涉及到整個網(wǎng)上資源的30%~50%,而其中真正有用的信息也只占很小的比例,這就意味著使用任何一個搜索引擎都只能檢索到網(wǎng)絡(luò)中的部分資源。目前網(wǎng)絡(luò)檢索面臨一系列的挑戰(zhàn),網(wǎng)絡(luò)信息量迅猛增加,人工已經(jīng)無法對它們進行有效的分類、索引和利用;簡單的關(guān)鍵詞搜索,返回的信息量過大,已經(jīng)讓用戶無法承擔(dān);網(wǎng)絡(luò)信息組織的無序性;信息有用性評價困難;網(wǎng)絡(luò)信息日新月異的更變;信息媒體的多樣化;帶寬等其它因素的制約,這些都給因特網(wǎng)信息的獲取造成了極大的阻礙。這樣就造成了要求智能化、專業(yè)化、多元化、多媒體化的網(wǎng)絡(luò)信息檢索工具出現(xiàn)的呼聲越來越高,并且有更多的人參與到其中來。如此種種,給當(dāng)今的網(wǎng)絡(luò)信息檢索研究帶來了發(fā)展機遇,也給了它無限的發(fā)展空間。
3、網(wǎng)絡(luò)信息檢索的現(xiàn)行模式
3.1 網(wǎng)絡(luò)全文數(shù)據(jù)庫檢索
網(wǎng)絡(luò)全文數(shù)據(jù)庫是以全文數(shù)據(jù)為數(shù)據(jù)庫對象,并在網(wǎng)上提供全文檢索服務(wù)的數(shù)據(jù)庫。按數(shù)據(jù)庫的生產(chǎn)機構(gòu)分類,可分為出版商全文期刊數(shù)據(jù)庫和生產(chǎn)商全文期刊數(shù)據(jù)庫。前者主要是那些期刊出版單位在其出版的印刷期刊基礎(chǔ)上建立的網(wǎng)絡(luò)電子期刊全文數(shù)據(jù)庫。而后者則是由數(shù)據(jù)庫生產(chǎn)商根據(jù)一定的主題或一定的收錄范圍整合一定數(shù)量的期刊出版物而產(chǎn)生的全文數(shù)據(jù)庫。國內(nèi)全文數(shù)據(jù)庫主要有中國學(xué)術(shù)期刊全文數(shù)據(jù)庫。
3.2 網(wǎng)絡(luò)搜索引擎檢索
搜索引擎是一個專門的系統(tǒng),它可以對互聯(lián)網(wǎng)信息資源進行搜索整理和分類,并將其儲存在網(wǎng)絡(luò)數(shù)據(jù)庫中供用戶查詢。搜索引擎包括搜集信息、分類和用戶查詢等三大部分。目前流行的搜索引擎有兩大類:關(guān)鍵詞全文檢索式搜索引擎和分類目錄式搜索引擎。
關(guān)鍵詞全文檢索式搜索引擎主要利用其內(nèi)部的搜索機器人和蜘蛛程序,自動搜索來自互聯(lián)網(wǎng)上的各種內(nèi)容,在每一個關(guān)鍵詞和所有相關(guān)的網(wǎng)頁之間按照網(wǎng)頁相關(guān)性原理建立一個對應(yīng)關(guān)系,儲存在其網(wǎng)絡(luò)服務(wù)器的數(shù)據(jù)庫中。用戶只要輸入關(guān)鍵詞就可以找到符合該關(guān)鍵詞特征的所有被索引的網(wǎng)頁,搜索結(jié)果以超鏈接的方式列表,搜索結(jié)果有簡單介紹,用戶點擊相應(yīng)的鏈接就可以進入相應(yīng)的網(wǎng)絡(luò)資源網(wǎng)站,從而找到所需信息。用這種方式搜索到的結(jié)果通常數(shù)以百萬計,但是相關(guān)性越高的信息,在搜索結(jié)果列表中的位置越靠前。分類目錄式搜索引擎將互聯(lián)網(wǎng)信息按照一定的標準進行收集和分類,并編入相應(yīng)目錄,以層級和逐次分項的方式管理目錄,查找信息可以按照分類目錄一層層進入,最終找到所要的信息。
3.3 互聯(lián)網(wǎng)“超鏈接”搜索
Web信息以超文本鏈接方式組織,基本組織單元是信息節(jié)點而不是字符串,信息節(jié)點之間通過鏈接進行聯(lián)系。超鏈接是網(wǎng)頁必不可少的一個元素,同一主題或相關(guān)的信息因超鏈接構(gòu)成了信息網(wǎng)。超文本信息檢索技術(shù),以超文本信息節(jié)點之間的多種鏈接關(guān)系為基礎(chǔ),根據(jù)思維聯(lián)想或查找信息的需要,通過鏈接從一個信息節(jié)點轉(zhuǎn)到另一個信息節(jié)點。
4、網(wǎng)絡(luò)信息檢索的未來發(fā)展趨勢
網(wǎng)絡(luò)技術(shù)的發(fā)展,給網(wǎng)絡(luò)信息檢索及信息的網(wǎng)絡(luò)化帶來的極大的便利,進一步推動了網(wǎng)絡(luò)信息檢索理論和技術(shù)的快速發(fā)展。怎樣為網(wǎng)絡(luò)用戶提供高質(zhì)量、高效率的檢索方式是網(wǎng)絡(luò)信息檢索研究者的努力方向。信息檢索的對象已從傳統(tǒng)的文本信息擴展到如今開放、動態(tài)、分布廣泛的多媒體信息。那么,網(wǎng)絡(luò)信息檢索的發(fā)展趨勢如何呢?
4.1 智能化信息檢索
智能化信息檢索是基于自然語言處理的檢索形式。檢索工具是對用戶提供的以自然語言表達的檢索要求進行分析,從而形成檢索策略進行檢索。檢索工具智能化的內(nèi)涵在于檢索工具具有學(xué)習(xí)、分析、辨別和推理的能力。近年來,因特網(wǎng)上不斷涌現(xiàn)的人工智能產(chǎn)品,如智能搜索引擎、智能瀏覽器、智能代理等,它們將提高網(wǎng)絡(luò)信息檢索的智能化程度,促進智能信息檢索的發(fā)展。
網(wǎng)絡(luò)中的智能代理通常是一個專家系統(tǒng)、一個過程、一個模塊或一個求解單元。智能代理可以獲得用戶的信息需求,自動檢索信息和推送檢索結(jié)果信息。多智能代理系統(tǒng)還具有信息發(fā)現(xiàn)、信息篩選、信息推送和信息導(dǎo)航功能,可滿足專業(yè)研究人員的特定需求,實現(xiàn)網(wǎng)絡(luò)信息檢索與服務(wù)的智能化。
4.2 一站式信息檢索
一站式(One Stop)信息檢索是指用戶通過一個檢索工具能滿足自己所有的信息檢索需求。一站式信息檢索將是網(wǎng)絡(luò)信息檢索服務(wù)的一種發(fā)展模式。一站式檢索服務(wù)是人性化服務(wù)的重要體現(xiàn),它將大量節(jié)約用戶的檢索時間。全球最大的搜索引擎Google正在朝著一站式服務(wù)的方向發(fā)展。2004年12月,Google宣布與紐約公共圖書館和包括哈佛大學(xué)圖書館在內(nèi)的4個主要圖書館合作,將這些圖書館的大約1500萬冊藏書掃描進自己的數(shù)據(jù)主庫以提供網(wǎng)絡(luò)用戶檢索。目前,Google已經(jīng)為其用戶提供了某種程度上的一站式的檢索服務(wù)了。而其他越來越多的檢索服務(wù)提供商將向一站式檢索方向發(fā)展。
4.3 可視化
可視化指的是運用計算機圖形學(xué)和圖像處理技術(shù),將數(shù)據(jù)轉(zhuǎn)換為圖形或圖像在屏幕上顯示出來,并進行交互處理的理論、方法和技術(shù)。據(jù)統(tǒng)計,獲取信息有70%~80%靠視覺,20%靠聽覺,10%靠觸覺。用圖像取代文字幫助人們檢索的優(yōu)點在于:圖像的表達更生動、結(jié)束語形象、準確,效率更高,具有交互性、多維性、可視性等特點,可以大大加快檢索速度,使時刻都在產(chǎn)生的海量數(shù)據(jù)得到有效利用。
4.4 商業(yè)化
目前網(wǎng)絡(luò)信息檢索系統(tǒng)已成為新的投資熱點,網(wǎng)絡(luò)信息檢索系統(tǒng)不再僅僅是一種檢索工具,而且是一種商業(yè)產(chǎn)品。2001年10月,全球最大的中文搜索引擎提供商百度聯(lián)合新浪等多家中文門戶網(wǎng)站,共同推廣“搜索引擎競價排名”全新網(wǎng)絡(luò)商業(yè)服務(wù)模式。網(wǎng)絡(luò)信息檢索的商業(yè)化還體現(xiàn)在聯(lián)機和光盤檢索逐漸進入網(wǎng)絡(luò)環(huán)境。由于目前網(wǎng)絡(luò)信息檢索的檢準率低,聯(lián)網(wǎng)的收費聯(lián)機和光盤檢索依舊受到青睞,如世界著名的聯(lián)機信息系統(tǒng)DIALOG、OCLC、EBSCO、Silverplatter,國內(nèi)的萬方數(shù)據(jù)資源系統(tǒng)、中國學(xué)術(shù)期刊光盤、重慶維普公司系列光盤等都紛紛在網(wǎng)上設(shè)立自己的網(wǎng)絡(luò)檢索入口。許多著名科技期刊的上網(wǎng)豐富了網(wǎng)絡(luò)資源,它們大多數(shù)都是在提供印刷版的同時提供期刊的網(wǎng)上服務(wù),包括收費檢索。
5、小結(jié)
在的網(wǎng)絡(luò)信息資源中尋找自己所需要的信息資源是一件極具挑戰(zhàn)性的工作。為此,許多信息專家正在積極地研究探索,并且取得了不少成果。我們相信隨著科學(xué)技術(shù)的進步,網(wǎng)絡(luò)信息檢索發(fā)展會越來越快,人們所利用的檢索工具和手段的更替會更加頻繁。
參考文獻
[1]黃靜.網(wǎng)絡(luò)信息檢索發(fā)展方向展望[J].Journal of Library and Information Sciences in Agriculture,2008(1):15-19.[2]霍小梅,王小蘭.網(wǎng)絡(luò)信息檢索的現(xiàn)狀及發(fā)展趨勢[J].圖書館論壇,2004(4):180-182.[3]戴莉.網(wǎng)絡(luò)信息檢索的發(fā)展趨勢[J].情報探索,2005(2):52-54.[4]徐謙.網(wǎng)絡(luò)信息檢索的智能化趨勢[J].圖書館理論與實踐,2006(2):63-65.[5]謝新洲.網(wǎng)絡(luò)信息檢索技術(shù)與案例[M].北京:北京圖書館出版社,2005:9.[6]易向軍.網(wǎng)絡(luò)信息檢索現(xiàn)狀及未來[J].合肥學(xué)院學(xué)報,2007(7):90-92.