第一篇:基于lucene的信息檢索系統(tǒng) 畢業(yè)論文
第三章 信息檢索系統(tǒng)及其關鍵技術
3.1 信息檢索系統(tǒng)簡介
信息檢索系統(tǒng)是利用信息檢索技術(如全文檢索等)幫助用戶查找特定信息的一種工具。它能夠對信息進行正確的表示、存儲和組織,同時還提供對于信息的訪問方式。在這里,信息的概念很寬泛,它可以是一篇文章,一段文本,一個網(wǎng)頁,一封郵件,一張照片,甚至是一些虛擬信息的集合。
3.2 信息檢索的過程
檢索的整個過程包括:構建文本庫,建立索引,進行檢索。1.構建文本庫
在開發(fā)檢索功能前,一個信息檢索系統(tǒng)需要做些準備工作。首先,必須構建一個文本數(shù)據(jù)庫。這個文本數(shù)據(jù)庫用來保存所有用戶可能檢索的信息。在這些信息的基礎上,確定檢索系統(tǒng)中的文本模型。文本模型是被系統(tǒng)所認可的一種信息格式,這種格式應當具有可識別、冗余度低等特點。當然,在系統(tǒng)的運作過程中,文本數(shù)據(jù)庫的信息可能會不斷地發(fā)生變化。
2.建立索引
有了文本模型后,就應該根據(jù)數(shù)據(jù)庫內的文本建立索引。索引可以大大提高信息檢索的速度。目前有多種索引的建立方式,采用哪種方式取決于信息檢索系統(tǒng)的規(guī)模。大型信息檢索系統(tǒng)(如百度、Google這樣的搜索引擎)均采用倒排的方式來建立索引。
3.進行搜索
在為文本建立索引之后,就可以開始對其進行搜索。通常由用戶提交一個檢索請求,該請求被分析,然后在索引中檢索并返回結果。
3.3 Lucene
Lucene是一個開源全文檢索工具包,它是apache軟件基金會jakarta項目組的一個子項目,是一個開放源代碼的全文檢索引擎工具包,即它不是一個完整的全文檢索引擎,而是一個全文檢索引擎的架構,提供了完整的查詢引擎和索引引擎,部分文本分析引擎(英文與德文兩種西方語言)。Lucene的目的是為軟件開發(fā)人員提供一個簡單易用的工具包,以方便的在目標系統(tǒng)中實現(xiàn)全文檢索的功能,或者是以此為基礎建立起完整的全文檢索引擎。3.3.1 Lucene結構分析
Lucene作為一個優(yōu)秀的全文檢索引擎,其結構具有強烈的面向對象特征。首先是定義了一個與平臺無關的索引文件格式,其次通過抽象將其核心組成部分設計為抽象類,具體的平臺實現(xiàn)部分設計為抽象類的實現(xiàn),此外與具體平臺相關的部分比如文件存儲也封裝為類,經(jīng)過層層的面向對象式的處理,最終達成了一個低耦合高效率,容易二次開發(fā)的檢索引擎。Lucene的結構和源碼組織結構如圖3.1所示:
查詢語句org.apache.lucene.queryPaser被索引文件查詢結果org.apache.lucene.search對org.apache.lucene.analysis外接口org.apache.lucene.index核心索引org.apache.lucene.store索引文件org.apache.lucene.documentorg.apache.lucene.store基礎結構封裝 圖3.1 Lucene結構和源碼組織結構
從圖中可以看出,Lucene由基礎結構封裝、索引核心、對外接口三大部分組成。其中直接操作索引文件的索引核心又是系統(tǒng)的重點。Lucene的將所有源碼分為了7個模塊(在java語言中以包即package來表示),各個模塊所屬的部分也如圖3.1所示。3.3.2 Lucene索引的建立
索引是信息檢索引擎工作的第一步,只有建立了索引才能進行信息檢索。Lucene用Document邏輯文件和Field域來組織各種數(shù)據(jù)源。Document向Lucene提供原始的要索引的文本內容,Lucene從Document中取出相關的數(shù)據(jù)源,并根據(jù)屬性配置進行相應的處理,建立索引。
索引過程如下:
(1)創(chuàng)建一個IndexWriter用來寫索引文件,它有幾個參數(shù),INDEX_DIR就是索引文件所存放的位置,Analyzer便是用來對文檔進行詞法分析和語言處理的。(2)創(chuàng)建一個Document代表我們要索引的文檔。
(3)將不同的Field加入到文檔中。我們知道,一篇文檔有多種信息,如題目,作者,修改時間,內容等,不同類型的信息用不同的Field來表示。(4)
IndexWriter調用函數(shù)addDocument將索引寫到索引文件夾中。
3.3.3 Lucene的搜索
Lucene建立了功能強大的索引機制為搜索服務,這是因為在檢索系統(tǒng)的使用中,用戶體驗最深的還是搜索部分。如果這一部分的性能無法達到用戶要求,那么軟件就沒有太大的意義。
搜索過程如下:
(1)IndexReader將磁盤上的索引信息讀入到內存,INDEX_DIR就是索引文件存放的位置。
(2)創(chuàng)建IndexSearcher準備進行搜索。
(3)創(chuàng)建Analyer用來對查詢語句進行詞法分析和語言處理。(4)創(chuàng)建QueryParser用來對查詢語句進行語法分析。
(5)QueryParser調用parser進行語法分析,形成查詢語法樹,放到Query中。(6)
IndexSearcher調用search對查詢語法樹Query進行搜索,得到查詢結果存放在TopScoreDocCollector。
3.3.4 中文分詞
中文分詞是處理中文信息的基礎與關鍵。由于Lucene自帶的分詞器對英文的分詞效果較好,但對中文的分詞效果并不如意。為了使檢索系統(tǒng)能更好的處理中文信息,本文采用了IKAnalyzer作為分詞器。IK Analyzer是一個開源的,基于java 語言開發(fā)的輕量級的中文分詞工具包。從2006年12月推出1.0 版開始,IKAnalyzer已經(jīng)推出了3個大版本。最初,它是以開源項目Luence 為應用主體的,結合詞典分詞和文法分析算法的中文分詞組件。新版本的IKAnalyzer 3.X 則發(fā)展為面向Java 的公用分詞組件,獨立于Lucene 項目,同時提供了對Lucene 的默認優(yōu)化實現(xiàn)。IKAnalyzer的特性:
? 采用了特有的“正向迭代最細粒度切分算法“,具有60 萬字/秒的高速處理能力。? 采用了多子處理器分析模式,支持:英文字母(IP 地址、Email、URL)、數(shù)字(日期,常用中文數(shù)量詞,羅馬數(shù)字,科學計數(shù)法),中文詞匯(姓名、地名處理)等分詞處理。
? 優(yōu)化的詞典存儲,更小的內存占用。支持用戶詞典擴展定義
? 針對Lucene 全文檢索優(yōu)化的查詢分析器IKQueryParser;采用歧義分析算法優(yōu)化查詢關鍵字的搜索排列組合,能極大的提高Lucene 檢索的命中率。
第四章 信息檢索系統(tǒng)的分析與設計
4.1 系統(tǒng)功能需求
隨著科技的發(fā)展,電腦的應用越來越普遍,人們的學習工作幾乎都不能離開電腦。而筆記本電腦由于其輕便和時尚性,受到人們普遍的喜愛。但是,在購買筆記本時,我們需要詳細地了解所買型號筆記本的外表及各種功能,為此我們往往要去各個商家挑選。為了方便,需要提供一個專門的筆記本電腦信息查詢系統(tǒng),能讓用戶輕松的獲取各種型號筆記本的詳細參數(shù)與外觀。該系統(tǒng)提供一個良好的用戶界面,用戶查詢時,系統(tǒng)能根據(jù)用戶查詢語句精確地給出查詢信息,能夠較好地理解用戶的查詢語句。
4.2 系統(tǒng)開發(fā)平臺設計
本系統(tǒng)采用的是Eclipse6.5+MySQL5.1+Tomcat5.5的開發(fā)環(huán)境。
? Eclipse是一個開放源代碼的、基于Java的可擴展開發(fā)平臺。在開發(fā)時搭配使用MyEclipse進行開發(fā)。MyEclipse企業(yè)級工作平臺是對Eclipse IDE的擴展,利用它可以在數(shù)據(jù)庫和J2EE的開發(fā)、發(fā)布,以及應用程序服務器的整合方面極大地提高工作效率。它是功能豐富的J2EE集成開發(fā)環(huán)境,包括了完備的編碼、調試、測試和發(fā)布功能,完整支持HTML CSS、Javascript、Struts、Spring、SQL、Hibernate和JSF。
? MySQL是最受歡迎的開源SQL數(shù)據(jù)庫管理系統(tǒng),它由MySQL AB開發(fā)、發(fā)布和支持。MySQL服務器支持關鍵任務、重負載生產(chǎn)系統(tǒng)的使用,也可以將它嵌入到一個大配置的軟件中。本文采用的是當前的穩(wěn)定版本5.1。
? Tomcat是一個免費的、開放源碼的、支持JSP和Servlet的web服務器。Tomcat是一個小型的輕量級應用服務器,在中、小型系統(tǒng)和并發(fā)訪問用戶不是很多的場合下被普遍使用,是開發(fā)和調試JSP程序的首選。它運行時占用的系統(tǒng)資源小,擴展性好,支持負載平衡與郵件服務等開發(fā)應用系統(tǒng)常用的功能。目前Tomcat5.5是較穩(wěn)定的版本,而且Eclipse也很好的支持該版本的集成,所以本文采用Tomcat5.5進行開發(fā)。此外,本系統(tǒng)所應用到的其它開源工具為:Struts1.2、Spring2.5、Hibernate3.1,網(wǎng)絡爬蟲Heritrix1.14.3,網(wǎng)頁解析工具HtmlParser2.0,全文檢索工具包Lucene3.0,中文分詞軟件IKAnalyzer3.0。
4.3 系統(tǒng)的組成結構
整個系統(tǒng)由三個部分組成:網(wǎng)頁采集分析模塊、索引與數(shù)據(jù)庫模塊、web搜索界面模塊。其中網(wǎng)頁采集與分析分別由開源工具網(wǎng)絡爬蟲Heritrix和網(wǎng)頁解析器HtmlParser完成;由Lucene完成索引系統(tǒng),并將索引與數(shù)據(jù)庫關聯(lián);web查詢界面基于SSH框架設計完成。模塊組成結構如圖4.1所示。
網(wǎng)頁抓取分析模塊索引與數(shù)據(jù)庫模塊InternetHeritrixWeb檢索模塊抓取的信息網(wǎng)頁Lucene建立索引HtmlParser文本格式信息返回查詢結果創(chuàng)建數(shù)據(jù)庫數(shù)據(jù)庫索引根據(jù)索引查找數(shù)據(jù)庫查詢索引基于SSH設計
圖4.1 系統(tǒng)模塊結構圖
4.4 網(wǎng)頁抓取分析模塊設計
4.4.1 站點選擇
從技術角度看,選擇網(wǎng)站的主要依據(jù)有:
(1)網(wǎng)站能夠被Heritrix爬蟲抓取。因為有的網(wǎng)站使用了反爬蟲技術,防止未經(jīng)授權的爬蟲對面頁進行抓取。
(2)網(wǎng)站的信息不是用javaScript動態(tài)生成的。這種動態(tài)生成的內容需要在瀏覽器中運行生成,是爬蟲無法獲取到的。
(3)網(wǎng)站的面頁結構不應該經(jīng)常變化,最好是使用一種模版動態(tài)生成的。這樣有利于在分析面頁時,使用較為簡單的方式從網(wǎng)頁中解析數(shù)據(jù)。
除了上述3點技術方面的因素,在選擇網(wǎng)站時,也應當盡量選擇那些訪問量較大、產(chǎn)品信息比較齊全的網(wǎng)站。這樣,有利于數(shù)據(jù)完整性。基于上述各因素的考慮,本文選擇太平洋電腦網(wǎng)(http://$ 例如蘋果Macbook Pro 15(MC373CH/A):
http://product.pconline.com.cn/notebook/apple/411413.html 產(chǎn)品詳細參數(shù)面頁URL的正則表達式為:
^http://product.pconline.com.cn/notebook/+[wd]+/d{5,6}_detail.html$ 例如蘋果Macbook Pro 15(MC373CH/A)詳細參數(shù): http://product.pconline.com.cn/notebook/apple/411413_detail.html 產(chǎn)品頁的產(chǎn)品圖片URL都是以.jpg結尾。
通過對網(wǎng)站URL分析,可以總結出我們要抓取的面頁URL的規(guī)律,只要抓取產(chǎn)品面頁和產(chǎn)品詳細信息面頁及產(chǎn)品圖片即可。因此,要擴展Heritrix來實現(xiàn)上述抓取策略。Heritrix有多個擴展點,本文選擇擴展FrontierScheduler來抓取特定的內容。FrontierScheduler是Heritrix的一個PostProcessor,它的作用是將Extractor中分析得出的鏈接加入到Frontier中,以待繼續(xù)處理。擴展代碼如下:
protected void schedule(CandidateURI caURI){
//取得URI字符串
String url = caURI.toString();try{
//URI選擇策略 //匹配 具體型號url Pattern pattern_model = Pattern.compile(MODEL_URL);Matcher matcher_model = pattern_model.matcher(url);//匹配 型號詳細參數(shù)url
}
} Pattern pattern_detail = Pattern.compile(DETAIL_URL);Matcher matcher_detail = pattern_detail.matcher(url);//URL是產(chǎn)品面頁/詳細參數(shù)面頁/jpg圖片/DNS if(//matcher_detail.find()||matcher_model.find()||url.endsWith(“.jpg”)
} e.printStackTrace();||url.indexOf(“dns:”)!=-1){
getController().getFrontier().schedule(caURI);return;}else{ }catch(Exception e){ }finally{ 4.4.3 網(wǎng)頁解析工具HtmlParser 對于抓取到的網(wǎng)頁,需要經(jīng)過解析,提取出需要的信息以便更好的建立索引和創(chuàng)建數(shù)據(jù)庫。本文Html解析器是HtmlParser,HtmlParser是一個開源的Java庫,它提供接口,支持線程和嵌套的解析Html文本。HtmlParser提供了兩種訪問Html結點的方法:Visitor模式和Filter模式,本文采用了Filter模式。Filter模式通過設置一定的過濾條件,對每個結點進行過濾,返回一個符合規(guī)則的節(jié)點列表。Org.htmlparser.filters包含所有已經(jīng)實現(xiàn)的Filter類型,定義了16種Filter。
例如要解析一個網(wǎng)頁中所有包含圖片的鏈接,分析可得該節(jié)點中具有鏈接標簽名”a”,并且它的字節(jié)點中還必須包含圖片標簽名”img”,則過濾器的定義為:
NodeFilter filter = new AndFilter(new TagNameFilter(“A”), New HasChildFilter(new TagNameFilter(“IMG”)))4.4.4 網(wǎng)頁信息結構化
在抓取到筆記本產(chǎn)品各種信息的Html文本后,需要用HtmlParser對Html文本解析,得到建立索引所需的各種信息。處理后的的文件如圖4.2所示。
圖4.2 處理后產(chǎn)品的信息格式
從圖中可以看出文件的格式如下:第一行是筆記本品牌(包括中文和英文名稱);第二行是筆記本具體型號;最后一行則是該筆記本的對應圖片文件名,圖片名是經(jīng)過Hash后的字符串;其余部分則是該筆記本的詳細參數(shù)。將所有筆記本產(chǎn)品的信息按上述格式存儲,以便建立索引。
4.5 數(shù)據(jù)庫與索引設計
4.5.1 數(shù)據(jù)庫設計
本文數(shù)據(jù)庫結構簡單,只有一個數(shù)據(jù)表來存儲筆記本產(chǎn)品的各種信息,數(shù)據(jù)庫各字段含義如表4.1所示。
表4.1 數(shù)據(jù)庫字段含義
字段名 Id name type content abstractcontent
字段含義 主鍵
品牌名稱,如”蘋果”
型號,如” ibook G4 M9627CH/A” 筆記本產(chǎn)品的詳細信息
詳細參數(shù)的摘要,供建立索引時使用
創(chuàng)建數(shù)據(jù)庫的SQL語句如下: create database searchdb;use searchdb;create table product(id
int AUTO_INCREMENT, name varchar(128), type varchar(128), content varchar(20000), abstractcontent varchar(512),);4.5.2 索引設計
在使用Lucene建立索引時,需要定義Lucene的Document格式。索引中的信息應當盡量少,只要能夠滿足用戶檢索要求就可以了。本文中,為Document構建了4個Field:
//當前產(chǎn)品在數(shù)據(jù)庫中的id
Field indentifier = new Field(“id”,id + “",Field.Store.YES, Field.Index.NOT_ANALYZED);//產(chǎn)品的品牌
Field name = new Field(”name“,product.getName(),Field.Store.YES, Field.Index.ANALYZED);//產(chǎn)品型號
Field type = new Field(”type“,product.getType(),Field.Store.YES, Field.Index.ANALYZED);//將筆記本產(chǎn)品的name、type、abstractcontent信息綜合起來,默認的檢索域 Field all = new Field(”all“,text,Field.Store.YES, Field.Index.ANALYZED);上述4中Filed中,前3個與數(shù)據(jù)庫的內容有直接的對應關系,而最后一個Filed則是將name、type這兩個Filed拼接起來并添加了abstractcontent來進行保存,為用戶提供一個檢索時的默認Filed。這種方式占用了索引空間,但卻避免了使用多域搜索帶來的性能損失,還可提高檢索的全面性。
4.6 web檢索模塊設計
web檢索模塊基于SSH設計實現(xiàn),由Struts作為控制器,Spring作為業(yè)務層,Hibernate作為數(shù)據(jù)持久層,結構如圖4.3所示。
控制器Struts業(yè)務層SpringSpringAOP持久層HibernateHibernateTemplaterequestActionServletActionFrom數(shù)據(jù)庫responseJSPActionSpringIocHibernateDAO圖4.3 基于SSH的web檢索模塊結構圖
從圖中可以看出,用戶的請求會發(fā)送給ActionServlet,用戶數(shù)據(jù)通過ActionForm Bean傳遞給Action,由Action類來通過Spring的IoC容器訪問Hibernate的DAO,DAO負責數(shù)據(jù)庫的交互,然后再返回JSP面頁將查詢結果進行顯示。
第五章 信息檢索系統(tǒng)的實現(xiàn)
5.1 網(wǎng)頁抓取的實現(xiàn)
在抓取任務開始前,需要對抓取的內容進行詳細地分析,確定種子,即開始抓取的網(wǎng)頁。本文中為了能盡量獲取全部的產(chǎn)品信息,直接將需要抓取的面頁(包括產(chǎn)品面頁、詳細參數(shù)面頁、圖片)的URL作為抓取的種子,這就需要找出所有產(chǎn)品的具體URL。在太平洋電腦網(wǎng)上提供了站內搜索功能,當輸入查詢某品牌的筆記本就能得到站內所有該品牌標記本的信息的面頁,當然面頁中也包含這些筆記本的產(chǎn)品面頁的URL,這就提供了抓取的種子。依次查詢各個品牌的筆記本,將查詢結果面頁保存到本地,然后用HtmlParser解析得到其中產(chǎn)品面頁的URl,寫入種子文件。
圖5.1 查詢結果面頁源代碼
從網(wǎng)頁源代碼中可以發(fā)現(xiàn)解析網(wǎng)頁時可以得到該品牌所有筆記本產(chǎn)品的產(chǎn)品面頁和詳細參數(shù)面頁的URL。其中產(chǎn)品詳細參數(shù)面頁URL的節(jié)點形如:
第二篇:目前信息檢索系統(tǒng)的優(yōu)缺點
目前信息檢索系統(tǒng)的優(yōu)缺點
摘要
目前,Internet上信息檢索的方式主要分為二種:即非WEB信息檢索方式和WEB信息檢索方式。這兩種檢索方式為人們及時準確地檢索網(wǎng)絡信息提供了極大的方便和可能,尤其WEB信息檢索工具中的搜索引擎,它已成為人們查詢網(wǎng)上信息最重要的檢索工具,幾乎成了網(wǎng)絡信息檢索工具的代稱,因而本文在論述網(wǎng)絡信息檢索工具時以搜索引擎為主要代表。然而目前網(wǎng)絡信息檢索又面臨一系列的挑戰(zhàn),如網(wǎng)絡信息量的迅猛增加,以至人工己經(jīng)無法對它們進行有效的分類、索引和利用;簡單的關鍵詞搜索;返回的信息量過大已經(jīng)讓用戶無法承擔;網(wǎng)絡信息組織的無序性;網(wǎng)絡信息日新月異的更變;信息媒體的多樣化等等,這些都給Internet信息的獲取和利用造成了極大的阻礙[1]。
引言
信息檢索系統(tǒng)的研究是伴隨著科學技術的發(fā)展和信息數(shù)量的俱增而興起的,是指信息用戶為處理解決各種問題而查找、識別、獲取相關的事實、數(shù)據(jù)、文獻的活動及過程,其主要研究范圍包括:信息檢索理論、信息檢索語義、信息檢索系統(tǒng)的構建和評價、信息檢索技術和方法等。
信息檢索的研究已經(jīng)有多年的歷史,20世紀中葉以前,信息的存儲和傳播主要以紙質介質為載體,信息檢索的研究主要圍繞文獻的獲取和控制展開,主要關注如何檢索和利用文獻中記載的信息。直到50年代,計算機被圖書館等部門廣泛用來存儲和管理文檔,信息檢索技術作為新的熱點被廣泛地研究。到了80年代,信息檢索領域在索引模型,文檔內容表示以及匹配策略等方面取得了許多突破性的研究成果,并且成功地開發(fā)了一些系統(tǒng)。例如Cornell大學的SMART系統(tǒng)和Massachusetts大學的INQUERY系統(tǒng)等。Web的出現(xiàn)為信息檢索提供了一個前所未有的實驗環(huán)境和應用情景,許多Web信息檢索系統(tǒng)應運而生,例如Yahoo!,Alta-vista等[2]。
目前信息檢索系統(tǒng)的優(yōu)缺點
1.評價標準
目前,得到普遍認同的檢索效果的評價標準主要有以下幾個:查全率、查準率、收錄范圍、輸出格式,其中以查全率和查準率最為重要[1]。綜合國內外關于搜索引擎評價及其方法的研究,筆者將搜索引擎評價的研究方法分為以下幾種。
(1)實驗方法
(2)調查方法
(3)數(shù)據(jù)分析法
(4)觀察法
(5)綜述和評論
綜合評價指標是指對搜索引擎各個方面進行考量時依據(jù)的參考標準,如
Carpineto等就提出了3個一級指標,分別為:檢索界面、檢索性能和檢索輸入。其中,檢索界面包括搜索引擎存在、主頁檢索框、結果頁面檢索框以及高級檢索界面等4個二級指標;檢索性能有7個二級指標:大小寫敏感度、詞干檢索、禁用詞、部分匹配、短語檢索、布爾邏輯檢索、全站檢索等;檢索輸出包括基于相關度的排序、標記檢索式、結果建議、無死鏈4個二級指標[3]。
2.按照信息搜集方法和服務提供方式的不同,搜索引擎系統(tǒng)可以分為三大類:
2.1目錄式搜索引擎:
以人工方式或半自動方式搜集信息,由編輯員查看信息之后,人工形成信息摘要,并將信息置于事先確定的分類框架中,提供目錄瀏覽服務和直接檢索服務。該類搜索引擎因為加入了人的智能,所以信息準確、導航質量高,缺點是需要人工介入、維護量大、信息量少、信息更新不及時。
這類搜索引擎的代表是:Yahoo、LookSmart、Open Directory、Go Guide等。
2.2機器人搜索引擎:
由一個稱為蜘蛛(Spider)的機器人程序以某種策略自動地在互聯(lián)網(wǎng)中搜集和發(fā)現(xiàn)信息,然后索引器為搜集到的信息建立索引,再由檢索器根據(jù)用戶的查詢輸入檢索索引庫并將查詢結果返回給用戶。服務方式是面向網(wǎng)頁的全文檢索服務。該類搜索引擎的優(yōu)點是搜索的信息空間大,更新及時,毋需人工干預,缺點是返回信息過多,有很多無關信息,用戶必須從結果中進行篩選。
這類搜索引擎的代表是:AltaVista,Northern Light,Excite,Infoseek,Inktomi,F(xiàn)AST/FastSearch,Lycos,Google,“天網(wǎng)”,悠游,OpenFind等。
2.3搜索引擎:這類搜索引擎沒有自己的數(shù)據(jù),而是將用戶的查詢請求同時向多個搜索引擎遞交,將返回的結果進行重復排除、重新排序等處理后,作為自己的結果返回給用戶。服務方式為面向網(wǎng)頁的全文檢索。這類搜索引擎的優(yōu)點是返回結果更多、更全,缺點是不能充分利用所使用搜索引擎的功能,用戶需要做更多的篩選。
這類搜索引擎的代表是WebCrawler,InfoMarket等[4]。
3.新一代的智能Web信息檢索系統(tǒng):
3.1移動agent技術
一般來說,所有用移動agent實現(xiàn)的系統(tǒng)都可以用傳統(tǒng)的分布式技術賴實現(xiàn)。那么為什么要選擇移動agent呢?這是因為移動agnet為解決分布式問題提供了一個統(tǒng)一的模式。它為分布計算帶來了更多的靈活性、高效性、可靠性和可伸縮性。移動agent已成為繼CORBA、DCOM后新一代分布處理技術。移動agent具有以下5個優(yōu)點:
(1)節(jié)約網(wǎng)絡帶寬和減少網(wǎng)絡延時;
(2)移動agent能夠使傳統(tǒng)的C/S計算模式下的計算任務更加動態(tài)均勻地分配;
(3)在分布式環(huán)境下,移動agent系統(tǒng)能實現(xiàn)較好的并行性即并行任務求解;
(4)基于移動agent的分布式系統(tǒng)具有較好的可理解性;
(5)異步移動計算能力。
3.2本體技術
本體的目標是捕獲相關領域的知識,提供對該領域知識的共同理解,確定該領域內共同認可的詞匯,并從不同層次的形式化模式上給出這些詞語和詞語間相互關系的明確定義。
本體的研究與應用主要包括3方面:(1)理論研究,主要研究概念及其分類和本體上的代數(shù)運算;(2)在信息系統(tǒng)中的應用研究,主要研究信息組織、信息檢索和異構信息系統(tǒng)互操作問題,(3)本體作為一種能在知識層提供知識共享和重用的工具在語義Web中的應用[4]。
3.個性化搜索引擎技術
當前,個性化搜索引擎技術主要表現(xiàn)在如下兩個方面:
(1)搜索引擎提供的搜索結果滿足用戶的個性化需求。由個性化搜索服務獲得的搜索結果更加準確,使不同用戶能夠得到各自需要的搜索結果,同時避免出現(xiàn)不相關的搜索結果。個性化搜索引擎技術通過分析用戶的搜索詞,跟蹤用戶的搜索行為和環(huán)境,結合用戶的需求變化和網(wǎng)絡信息的動態(tài)變化實時更新等資料進行信息檢索,從而為用戶提供更為個性化的、準確的、真正需求的搜索結果。
(2)個性化搜索引擎所提供的服務和功能具有優(yōu)勢和特色,與通用搜索引擎不同。由于各大搜索引擎為了獲得競爭優(yōu)勢,不斷推出新的特色服務和功能,因此出現(xiàn)了從核心搜索衍生出的各種其他服務,如桌面搜索、地圖搜索、生活搜索、RSS訂閱等服務。
目前不少搜索引擎都加入了個性化服務和功能,他們提出了各種技術和方法以實現(xiàn)個性化搜索服務。他們主要采用了基于規(guī)則的和基于信息、過濾的推薦技術。其中,基于信息過濾的技術又包括協(xié)作過濾和基于內容的過濾?;谝?guī)則的技術允許系統(tǒng)管理員根據(jù)用戶的動態(tài)和靜態(tài)屬性生成規(guī)則,規(guī)則決定了在不同情況下如何提供不同的務,一個規(guī)則本質上是一個if-then語句。該方法的優(yōu)點是簡單、直接,缺點是規(guī)則不能動態(tài)更新,質量難以保證,隨著規(guī)則數(shù)的增加,系統(tǒng)將更難管理。典型的系統(tǒng)有IBM的Webshere,BroadVision和ILOG等。
基于內容過濾的技術利用資源和用戶興趣的相似度進行信息過濾。該方法的優(yōu)點是簡單、高效,缺點是不能發(fā)現(xiàn)用戶新的興趣,并且難以區(qū)分資源內容的質量和風格。典型的系統(tǒng)有 Personal web Watcher,syskill&webert,CiteSeer,和Web personalizer等。
基于協(xié)作的過濾技術是利用用戶之間的相似度來進行信息過濾。該方法的優(yōu)點是能發(fā)現(xiàn)用戶新的興趣點,但缺點是當系統(tǒng)用戶和資源逐漸增多時,系統(tǒng)性能會逐漸降低;另外,在系統(tǒng)使用的初期,難以發(fā)現(xiàn)相似的用戶。典型的系統(tǒng)有Web watcher,Let’s Browse,GrouLens,F(xiàn)irefly和Siteseer等。
還有其它的一些提供個性化服務的信息搜索系統(tǒng)同時采用了基于內容和協(xié)作過濾兩種技術。如:webSIFT,F(xiàn)AB,Anatagonomy和Dynamicprofiler等,結合這兩種過濾技術可以克服協(xié)作過濾的稀疏性難題,使用用戶已瀏覽的內容來預測用戶對其它資源的評價,進而增加資源評價的密度,再利用這些評價進行協(xié)作過濾,從而改善協(xié)作過濾的效率[5]。
參考文獻
[1] 網(wǎng)絡信息檢索及其發(fā)展趨勢研究
[2] 基于結構化向量空間模型的中文信息檢索系統(tǒng)研究與實現(xiàn)
[3] 搜索引擎檢索功能的性能評價研究
[4] 基于本體的Web信息檢索系統(tǒng)及其關鍵技術研究
[5] 基于內容的個性化Web信息檢索系統(tǒng)的設計與實現(xiàn)
第三篇:lucene工作總結
Lucene工作總結
關鍵字: lucene總結
公司項目:portal中期刊文章內容作為大字段存儲在Oracle中,首頁有一個搜索功能:要求將所有包括搜索字段的文章的標題列出來(文章的內容存儲在Oracle的CLOB字段中),也就是要用Lucene實現(xiàn)對數(shù)據(jù)庫的大字段進行索引(索引通過計劃任務定時建立索引)和搜索。。
==================定時建立索引文件:===============
Main方法: Java代碼
1.package zxt.lucene.index;2.3.import java.util.Timer;4.public class IndexerServer { 5.6.7./** 8.* 定時調用建立索引任務 9.* @author wulihai 10.* @create 2009-06-02 11.*/ 12.public static void main(String[] args){ 13.String propFile = “directory.properties”;14.Config.setConfigFileName(propFile);15.Timer timer = new Timer();16.LuceneDBIndexerTask luceneTask=LuceneDBIndexerTask.getInstance();17.timer.scheduleAtFixedRate(luceneTask, 0,DataTypeUtil.toLong(Constant.CREATE_INDEX_SLEEP_TIME));18.} 19.20.}
定時調用建立索引任務: Java代碼
1.package zxt.lucene.index;2.3.import java.util.Timer;4.public class IndexerServer { 5.6.7./** 8.* 定時調用建立索引任務 9.* @author wulihai 10.* @create 2009-06-02 11.*/ 12.public static void main(String[] args){ 13.String propFile = “directory.properties”;14.Config.setConfigFileName(propFile);15.Timer timer = new Timer();16.LuceneDBIndexerTask luceneTask=LuceneDBIndexerTask.getInstance();17.timer.scheduleAtFixedRate(luceneTask, 0,DataTypeUtil.toLong(Constant.CREATE_INDEX_SLEEP_TIME));18.} 19.20.}
建立索引的核心實現(xiàn): Java代碼
1.package zxt.lucene.index;2.import java.io.BufferedReader;3.import java.io.File;4.import java.io.IOException;5.import java.io.StringWriter;6.import java.sql.Connection;7.import java.sql.DriverManager;8.import java.sql.ResultSet;9.import java.sql.SQLException;10.import java.sql.Statement;11.import java.text.SimpleDateFormat;12.import java.util.Arrays;13.import java.util.Date;14.import java.util.TimerTask;15.16.import oracle.sql.CLOB;17.18.import org.apache.lucene.analysis.standard.StandardAnalyzer;19.import org.apache.lucene.document.Document;20.import org.apache.lucene.document.Field;21.import org.apache.lucene.index.IndexWriter;22.23./** 24.* 建立索引的任務類 25.* @author wulihai 26.* @create 2009-06-02 27.*/ 28.public class LuceneDBIndexerTask extends TimerTask { 29.//缺省索引目錄
30.private static String DEFAULT_INDEX_DIR=“C:IndexDB”;31.//臨時索引目錄的父目錄
32.private File parentDir=null;33.//被搜索的索引文件
34.private static LuceneDBIndexerTask index=new LuceneDBIndexerTask();35.36.//構造方法
37.private LuceneDBIndexerTask(){ 38.String dirStr=Constant.INDEX_STORE_DIRECTORY;39.if(dirStr!=null&&!“".equals(dirStr)){ 40.this.parentDir=new File(dirStr);41.42.}else{ 43.this.parentDir=new File(DEFAULT_INDEX_DIR);44.} 45.46.if(!this.parentDir.exists()){ 47.this.parentDir.mkdir();48.} 49.} 50.51./** 52.* 單實例訪問接口 53.* @return 54.*/ 55.public static LuceneDBIndexerTask getInstance(){ 56.return index;57.} 58.59./** 60.* 鎖定目錄以及文件 61.* 只允許單線程訪問 62.* 63.*/ 64./*public synchronized void singleRunning(){ 65.if(flag==false){ 66.flag=true;67.run(parentDir);68.} 69.}*/ 70.71./** 72.* 為數(shù)據(jù)庫字段建立索引 73.*/ 74.public void run(){ 75.System.out.println(”====LuceneDBIndexerTask$run()===============“);76.77.System.out.println(”~~~開始建立索引文件~~~~~~~~~~~~~~~“);78.Connection conn=null;79.Statement stmt=null;80.ResultSet rs=null;81.try { 82.Class.forName(Constant.DB_DRIVER_STRING);83.conn = DriverManager.getConnection(Constant.DB_URI_STRING, Constant.DB_USERNAME, Constant.DB_PWD);84.stmt = conn.createStatement();85.rs = stmt.executeQuery(Constant.DB_QUERY_STRING);
86.File file=new File(parentDir+File.separator+new SimpleDateFormat(”yyyyMMddHHmmss“).format(new Date())+File.separator);87.if(!file.exists()){ 88.file.mkdir();89.} 90.IndexWriter writer = new IndexWriter(file,new StandardAnalyzer(), true);91.long startTime = new Date().getTime();92.while(rs.next()){ 93.Document doc = new Document();94.doc.add(new Field(”ARTICLEID“, rs.getString(”ARTICLEID“), Field.Store.YES,Field.Index.TOKENIZED));95.doc.add(new Field(”TITLE“, rs.getString(”TITLE“), Field.Store.YES,Field.Index.TOKENIZED));96.doc.add(new Field(”USERNAME“, rs.getString(”USERNAME“), Field.Store.YES,Field.Index.TOKENIZED));97.doc.add(new Field(”USERID“, rs.getString(”USERID“), Field.Store.YES,Field.Index.TOKENIZED));98.//對日期建立索引
99.String createdate=new SimpleDateFormat(”yyyy-MM-dd“).format(rs.getTimestamp(”CREATEDATE“));100.doc.add(new Field(”CREATEDATE“, createdate, Field.Store.YES,Field.Index.TOKENIZED));101.//對大字段建立索引
102.BufferedReader in=null;103.String content=”“;104.CLOB clob =(CLOB)rs.getClob(”CONTENT“);105.if(clob!= null){ 106.//得到一個讀入流
107.in=new BufferedReader(clob.getCharacterStream());108.StringWriter out=new StringWriter();109.int c;110.while((c=in.read())!=-1){ 111.out.write(c);112.} 113.content=out.toString();114.} 115.doc.add(new Field(”CONTENT“, content, Field.Store.YES, Field.Index.TOKENIZED));116.writer.addDocument(doc);117.} 118.writer.optimize();119.writer.close();120.121.//測試一下索引的時間
122.long endTime = new Date().getTime();123.System.out.println(”索引文件“+file.getPath()+”建立成功...“);124.System.out.println(”這花費了“ +(endTimestartTime)+ ” 毫秒!“);131.} else { 132.System.out.println(”0個結果!“);133.} 134.} 135.136.return results;137.138.} 139.140./** 141.* 確定搜索索引所在目錄目錄 142.*/ 143.private File getTargetDir(File dir){ 144.int length = dir.listFiles().length;145.File searchFile = null;146.147.// length=3的時候最多
148.// 同時搜索和同時建索引的時候會出現(xiàn)length=4 149.if(length >= 2){ 150.// 找到次最新建立的索引文件 151.String[] names = dir.list();152.Arrays.sort(names);153.searchFile = new File(dir + File.separator + names[length-2]);154.} 155.if(length == 1){ 156.File files[] = dir.listFiles();157.searchFile = files[0];158.} 159.if(length == 0){ 160.// 如果沒有索引文件則,建立第一個索引
161.// TestDBIndexer.getInstance().isInstanceRunning();162.// search();163.} 164.165.return searchFile;166.} 167.// 168.// public static void main(String[] args)throws Exception { 169.// new LuceneDBQuery().search(”納稅人“);170.// } 171.172.}
配置文件管理類: Java代碼
1.2.package com.liferay.portal.util;3.4.import java.io.IOException;5.6.import org.jdom.Document;7.import org.jdom.Element;8.import org.jdom.JDOMException;9.import org.jdom.input.SAXBuilder;10.11.public class LuceneDBQueryUtil { 12.13.public static String getIndexPath(){ 14.15.String filePath = ”zxt_index.xml“;16.String indexPath=”“;17.SAXBuilder builder = new SAXBuilder(false);18.try { 19.Document doc = builder.build(Thread.currentThread().getContextClassLoader().getResource(filePath));20.Element rootElement = doc.getRootElement();21.Element index=rootElement.getChild(”index“);22.indexPath=index.getText();23.System.out.println(indexPath);24.} catch(JDOMException e){ 25.e.printStackTrace();26.} catch(IOException e){ 27.e.printStackTrace();28.} 29.return indexPath;30.31.32.} 33.}
配置文件:zxt_index.xml Xml代碼
1. 2.
3.
第四篇:信息安全畢業(yè)論文
唐山工業(yè)職業(yè)技術學院畢業(yè)論文
唐山工業(yè)職業(yè)技術學院
畢 業(yè) 論 文
課題:__________________
學院:__________________
專業(yè):__________________
班級:__________________
學號:__________________
姓名:__________________
指導老師:______________
定稿日期:_______________
唐山工業(yè)職業(yè)技術學院畢業(yè)論文
信息安全論文
摘要: 隨著計算機技術和網(wǎng)絡技術的發(fā)展,網(wǎng)絡安全問題,在今天已經(jīng)成為網(wǎng)絡世界里最為人關注的問題之一,危害網(wǎng)絡安全的因素很多,他們主要依附于各種惡意軟件,其中病毒和木馬最為一般網(wǎng)民所熟悉。針對這些危害因素,網(wǎng)絡安全技術得以快速發(fā)展,這也大大提高了網(wǎng)絡的安全性。本文結合實際情況,首先介紹了信息安全的起源、然后具體分析了信息安全所面對的不通過方面的威脅,并且具體介紹了信息安全技術,最后也對以后的發(fā)展進行了一些期望,希望能夠在這安全方面做得更好,更加完善。
關鍵詞:網(wǎng)絡安全、信息安全技術、網(wǎng)絡威脅。
一、引言
信息安全起源于計算機安全。計算機安全就是計算機硬件的物理位置遠離外部威脅,同時確保計算機軟件正常、可靠地運行,隨著網(wǎng)絡技術不斷地發(fā)展,計算機安全的范圍也在不斷地擴大,其中涉及到數(shù)據(jù)的安全、對數(shù)據(jù)的隨機訪問限制和對未授權訪問的控制等問題。由此,單純的計算機安全開始向信息安全演進?;ヂ?lián)網(wǎng)的出現(xiàn)使得這種通信更加頻繁,由此而衍生出來的信息安全問題層出不窮。
近年來,百度收索引擎被惡意攻擊,致使服務器癱瘓;騰訊公司業(yè)務系統(tǒng)黑客入侵后得到權限,并被勒索百萬人民幣。2008年公安部網(wǎng)監(jiān)局調查了7起網(wǎng)絡木馬程序案件,每起案件的木馬銷售獲利均超過1000萬元,據(jù)有關方面統(tǒng)計,目前美國由于每年網(wǎng)絡信息安全問題而遭到的經(jīng)濟損失超過170億美元,德國、英國也均在數(shù)十億美元以上,日本、新加坡在這方面的問題也很嚴重。另一方面,病毒、流氓軟件的大肆泛濫又讓人們開始對殺毒軟件產(chǎn)生懷疑,殺毒軟件永遠落后于病毒的傳播,因此人們對不斷更新變種的病毒防不勝防。
二、信息安全定義
“信息安全”曾經(jīng)僅是學術界所關心的事情,就像“計算機”、“網(wǎng)絡”這些術語一樣,以前都是學術界從事具體研究的人員想了解其究竟解決相關問題。但是隨著互聯(lián)網(wǎng)的普及,信息安全已經(jīng)變得家喻戶曉,危及到信息安全的因素也越來越多,因此對它的重視程度也在逐漸提高。由于理解的形式不同,國內外對“信息安全”沒有統(tǒng)一的定義。
《中華人民共和過計算機信息系統(tǒng)安全保護條例》的定義:“保障計算機及其相關的和配套的設備、設施(網(wǎng)絡)的安全,運行環(huán)境的安全,保障信息安全,保障計算機功能的正常發(fā)揮,以維護計算機信息系統(tǒng)的安全”。國家信息安全重點實驗室的定義:“信息安全涉及到信息的機密性、完整性、可用性、可控性。綜合起來說,就是要保障電子信息的有效性”。國際標準化委員會的定義:“為數(shù)據(jù)處理系統(tǒng)而采取的技術的和管理的安全保護,保護計算機硬件、軟件、數(shù)據(jù)不因偶然的或惡意的原因而遭到破壞、更改、顯露”。
廣義的信息安全是指網(wǎng)絡系統(tǒng)的硬件、軟件及其系統(tǒng)中的信息受到保護。信息安全又以下幾個特性:
(1)保密性:保護數(shù)據(jù)不受非法截獲和未經(jīng)授權瀏覽。對于敏感數(shù)據(jù)的傳輸尤為重要,同時也是通信網(wǎng)絡中處理用戶的私人信息所必須的。存儲信息的機密性主要通過訪問控制來
唐山工業(yè)職業(yè)技術學院畢業(yè)論文
實現(xiàn),不同的用戶對不同的數(shù)據(jù)擁有不同的權限。
(2)完整性:能保障被傳輸、接收或存儲的數(shù)據(jù)是完整的和未被篡改的特性。對于保證重要數(shù)據(jù)的精確性尤為關鍵。除了數(shù)據(jù)本身不能破壞外,數(shù)據(jù)的完整性還要求數(shù)據(jù)的來源具有正確性和可信性。
(4)可控性:保證信息和信息系統(tǒng)的授權認證和監(jiān)控管理。可確保某個實體(人或系統(tǒng))的身份的真實性,也可確保執(zhí)政者對社會的執(zhí)法管理行為。
(4)可用性:盡管存在可能的突發(fā)事件如供電中斷、自然災害、事故或攻擊等,但用戶依然可得到或使用數(shù)據(jù),服務也處于正常運轉狀態(tài)。當然,數(shù)據(jù)不可用也可能是由軟件缺陷造成的,如微軟的Windows總是有缺陷被發(fā)現(xiàn)。(5)非否認性:能夠保證信息行為人不能否認其信息行為??煞乐箙⑴c某次通信交換的一方事后否認本次交換曾經(jīng)發(fā)生過。數(shù)據(jù)簽名技術是解決不可否認性的重要手段之一。總體來看,信息安全就是要保證信息的基本屬性不被破壞,信息按照發(fā)送方的意愿成功被接收方接收。
三、信息安全的體系結構
信息安全是一個完整、系統(tǒng)的概念,它既是一個理論問題,又是一個工程實踐問題。由于計算機網(wǎng)絡的開放性、復雜性和多樣性,使得網(wǎng)絡安全系統(tǒng)需要一個完整的、嚴謹?shù)捏w系結構來保證。1995年ISO頒布了ISO GB/T9487.2-1995標準,即五大類安全服務、八大種安全機制和相應的安全管理標準。
其中五大類安全服務包括認證服務、訪問控制服務、數(shù)據(jù)保密性服務、數(shù)據(jù)完整性服務和抗否認性服務。
(1)認證服務:提供對通信中對等實體和數(shù)據(jù)來源的認證。
(2)訪問控制服務:用來防止未授權用戶非法使用系統(tǒng)資源,包括用戶身份認證和用戶權限確認。
(4)數(shù)據(jù)保密性服務:為防止網(wǎng)絡個系統(tǒng)之間交換的數(shù)據(jù)被截獲或被非法存取而泄密,提供機密保護。同時,對有可能通過觀察信息流就能推導出信息的情況進行防范。(4)數(shù)據(jù)完整性服務:用于阻止非法實體對交換數(shù)據(jù)的修改、插入、刪除以及在數(shù)據(jù)交換過程中的數(shù)據(jù)丟失。
(5)抗否認性服務:用于防止發(fā)送方在發(fā)送數(shù)據(jù)后否認發(fā)送和接收方在接收到數(shù)據(jù)后否認受到或者偽造數(shù)據(jù)的行為。
八大種安全機制包括加密機制、數(shù)字簽名機制、訪問控制機制、數(shù)據(jù)完整性機制、認證機制、業(yè)務流填充機制、路由控制機制、公正機制。
四、影響網(wǎng)絡信息安全的因素分析
計算機通信網(wǎng)絡的安全涉及到多種學科,包括計算機科學、網(wǎng)絡技術、通信技術、密碼技術、信息安全技術、應用數(shù)學、數(shù)論、信息論等十數(shù)種,這些技術各司其職,保護網(wǎng)絡系統(tǒng)的硬件、軟件以及系統(tǒng)中的數(shù)據(jù)免遭各種因素的破壞、更改、泄露,保證系統(tǒng)連續(xù)可靠正常運行。
唐山工業(yè)職業(yè)技術學院畢業(yè)論文
4.1影響計算機通信網(wǎng)絡安全的客觀因素。
4.1.1網(wǎng)絡資源的共享性。
計算機網(wǎng)絡最主要的一個功能就是“資源共享”。無論你是在天涯海角,還是遠在天邊,只要有網(wǎng)絡,就能找到你所需要的信息。所以,資源共享的確為我們提供了很大的便利,但這為系統(tǒng)安全的攻擊者利用共享的資源進行破壞也提供了機會。
4.1.2網(wǎng)絡操作系統(tǒng)的漏洞。
操作系統(tǒng)漏洞是指計算機操作系統(tǒng)本身所存在的問題或技術缺陷。由于網(wǎng)絡協(xié)議實現(xiàn)的復雜性,決定了操作系統(tǒng)必然存在各種的缺陷和漏洞。
4.1.4網(wǎng)絡系統(tǒng)設計的缺陷。
網(wǎng)絡設計是指拓撲結構的設計和各種網(wǎng)絡設備的選擇等。網(wǎng)絡設備、網(wǎng)絡協(xié)議、網(wǎng)絡操作系統(tǒng)等都會直接帶來安全隱患。
4.1.4網(wǎng)絡的開放性。
網(wǎng)上的任何一個用戶很方便訪問互聯(lián)網(wǎng)上的信息資源,從而很容易獲取到一個企業(yè)、單位以及個人的信息。
4.1.5惡意攻擊。
惡意攻擊就是人們常見的黑客攻擊及網(wǎng)絡病毒.是最難防范的網(wǎng)絡安全威脅。隨著電腦教育的大眾化,這類攻擊也越來越多,影響越來越大。無論是DOS 攻擊還是DDOS 攻擊,簡單的看,都只是一種破壞網(wǎng)絡服務的黑客方式,雖然具體的實現(xiàn)方式千變萬化,但都有一個共同點,就是其根本目的是使受害主機或網(wǎng)絡無法及時接收并處理外界請求,或無法及時回應外界請求。具體表現(xiàn)方式有以下幾種:(1)制造大流量無用數(shù)據(jù),造成通往被攻擊主機的網(wǎng)絡擁塞,使被攻擊主機無法正常和外界通信。(2)利用被攻擊主機提供服務或傳輸協(xié)議上處理重復連接的缺陷,反復高頻的發(fā)出攻擊性的重復服務請求,使被攻擊主機無法及時處理其它正常的請求。(4)利用被攻擊主機所提供服務程序或傳輸協(xié)議的本身實現(xiàn)缺陷,反復發(fā)送畸形的攻擊數(shù)據(jù)引發(fā)系統(tǒng)錯誤而分配大量系統(tǒng)資源,使主機處于掛起狀態(tài)甚至死機。
DOS 攻擊幾乎是從互聯(lián)網(wǎng)絡的誕生以來,就伴隨著互聯(lián)網(wǎng)絡的發(fā)展而一直存在也不斷發(fā)展和升級。值得一提的是,要找DOS 的工具一點不難,黑客網(wǎng)絡社區(qū)都有共享黑客軟件的傳統(tǒng),并會在一起交流攻擊的心得經(jīng)驗,你可以很輕松的從Internet 上獲得這些工具。所以任何一個上網(wǎng)者都可能構成網(wǎng)絡安全的潛在威脅。DOS 攻擊給飛速發(fā)展的互聯(lián)網(wǎng)絡安全帶來重大的威脅。然而從某種程度上可以說,D0S 攻擊永遠不會消失而且從技術上目前沒有根本的解決辦法。
4.2影響計算機網(wǎng)絡通信安全的主觀因素。
主要是計算機系統(tǒng)網(wǎng)絡管理人員缺乏安全觀念和必備技術,如安全意識、防范意思等。
五、計算機網(wǎng)絡的安全策略
5.1物理安全策略。
唐山工業(yè)職業(yè)技術學院畢業(yè)論文
物理安全策略目的是保護計算機系統(tǒng)、網(wǎng)絡服務器、打印機等硬件實體和通信鏈路免受自然災害、人為破壞和搭線攻擊;驗證用戶的身份和使用權限、防止用戶越權操作;確保計算機系統(tǒng)有一個良好的電磁兼容工作環(huán)境;建立完備的安全管理制度,防止非法進入計算機控制室和各種偷竊、破壞活動的發(fā)生。物理安全策略還包括加強網(wǎng)絡的安全管理,制定有關規(guī)章制度,對于確保網(wǎng)絡的安全、可靠地運行,將起到十分有效的作用。網(wǎng)絡安全管理策略包括:確定安全管理等級和安全管理范圍;制訂有關網(wǎng)絡操作使用規(guī)程和人員出入機房管理制度;制定網(wǎng)絡系統(tǒng)的維護制度和應急措施等。
5.2常用的網(wǎng)絡安全技術。
由于網(wǎng)絡所帶來的諸多不安全因素,使得網(wǎng)絡使用者必須采取相應的網(wǎng)絡安全技術來堵塞安全漏洞和提供安全的通信服務。如今,快速發(fā)展的網(wǎng)絡安全技術能從不同角度來保證網(wǎng)絡信息不受侵犯,網(wǎng)絡安全的基本技術主要包括網(wǎng)絡加密技術、防火墻技術、操作系統(tǒng)安全內核技術、身份驗證技術、網(wǎng)絡防病毒技術。
5.2.1 網(wǎng)絡加密技術。
網(wǎng)絡加密技術是網(wǎng)絡安全最有效的技術之一。一個加密網(wǎng)絡,不但可以防止非授權用戶的搭線竊聽和入網(wǎng),而且也是對付惡意軟件的有效方法之一。網(wǎng)絡信息加密的目的是保護網(wǎng)內的數(shù)據(jù)、文件、口令和控制信息,保護網(wǎng)上傳輸?shù)臄?shù)據(jù)。網(wǎng)絡加密常用的方法有鏈路加密,端點加密和節(jié)點加密三種。鏈路加密的目的是保護網(wǎng)絡節(jié)點之間的鏈路信息安全;端點加密的目的是對源端用戶到目的端用戶的數(shù)據(jù)提供加密保護;節(jié)點加密的目的是對源節(jié)點到目的節(jié)點之間的傳輸鏈路提供加密保護。用戶可根據(jù)網(wǎng)絡情況選擇上述三種加密方式。信息加密過程是由形形色色的加密算法來具體實施的,它以很小的代價提供很牢靠的安全保護。在多數(shù)情況下,信息加密是保證信息機密性的唯一方法。據(jù)不完全統(tǒng)計,到目前為止,已經(jīng)公開發(fā)表的各種加密算法多達數(shù)百種。
如果按照收發(fā)雙方的密鑰是否相同來分類,可以將這些加密算法分為常規(guī)密碼算法和公鑰密碼算法。在實際應用中,人們通常將常規(guī)密碼和公鑰密碼結合在一起使用,比如:利用DES 或者IDEA 來加密信息,而采用RSA 來傳遞會話密鑰。如果按照每次加密所處理的比特來分類,可以將加密算法分為序列密碼算法和分組密碼算法,前者每次只加密一個比特。
5.2.2 防火墻技術。
防火墻技術是設置在被保護網(wǎng)絡和外界之間的一道屏障,是通過計算機硬件和軟件的組合來建立起一個安全網(wǎng)關,從而保護內部網(wǎng)絡免受非法用戶的入侵,它可以通過鑒別、限制,更改跨越防火墻的數(shù)據(jù)流,來實何保證通信網(wǎng)絡的安全對今后計算機通信網(wǎng)絡的發(fā)展尤為重要。現(xiàn)對網(wǎng)絡的安全保護。防火墻的組成可以表示為:防火墻= 過濾器+ 安全策略+ 網(wǎng)關,它是一種非常有效的網(wǎng)絡安全技術。在Internet 上,通過它來隔離風險區(qū)域與安全區(qū)域的連接,但不防礙人們對風險區(qū)域的訪問。防火墻可以監(jiān)控進出網(wǎng)絡的通信數(shù)據(jù),從而完成僅讓安全、核準的信息進入,同時又抵制對企業(yè)構成威脅的數(shù)據(jù)進入的任務。
根據(jù)防火墻所采用的技術不同,我們可以將它分為四種基本類型:包過濾型、網(wǎng)絡地址轉換—NAT、代理型和狀態(tài)監(jiān)測型。
包過濾型產(chǎn)品是防火墻的初級產(chǎn)品,其技術依據(jù)是網(wǎng)絡中的分包傳輸技術,工作在網(wǎng)絡層。網(wǎng)絡上的數(shù)據(jù)都是以“包”為單位進行傳輸?shù)?數(shù)據(jù)被分割成為一定大小的數(shù)據(jù)包,每一個數(shù)據(jù)包中都會包含一些特定信息,如數(shù)據(jù)的源地址、目標地址、源端口和目標端口等。防火墻通過讀取數(shù)據(jù)包中的地址信息來判斷這些“包”是否來自可信任的安全站點,一旦發(fā)現(xiàn)
唐山工業(yè)職業(yè)技術學院畢業(yè)論文
來自危險站點的數(shù)據(jù)包,防火墻便會將這些數(shù)據(jù)拒之門外。但包過濾防火墻的缺點有三:一是非法訪問一旦突破防火墻,即可對主機上的軟件和配置漏洞進行攻擊;二是數(shù)據(jù)包的源地址、目的地址以及IP 的端口號都在數(shù)據(jù)包的頭部,很有可能被竊聽或假冒;三是無法執(zhí)行某些安全策略。
網(wǎng)絡地址轉化—NAT。“你不能攻擊你看不見的東西”是網(wǎng)絡地址轉換的理論基礎。網(wǎng)絡地址轉換是一種用于把IP 地址轉換成臨時的、外部的、注冊的IP 地址標準。它允許具有私有IP 地址的內部網(wǎng)絡訪問因特網(wǎng)。當數(shù)據(jù)包流經(jīng)網(wǎng)絡時,NAT 將從發(fā)送端的數(shù)據(jù)包中移去專用的IP 地址,并用一個偽IP 地址代替。NAT 軟件保留專用IP 地址和偽IP 地址的一張地址映射表。當一個數(shù)據(jù)包返回到NAT 系統(tǒng),這一過程將被逆轉。當符合規(guī)則時,防火墻認為訪問是安全的,可以接受訪問請求,也可以將連接請求映射到不同的內部計算機中。當不符合規(guī)則時,防火墻認為該訪問是不安全的,不能被接受,防火墻將屏蔽外部的連接請求。如果黑客在網(wǎng)上捕獲到這個數(shù)據(jù)包,他們也不能確定發(fā)送端的真實IP 地址,從而無法攻擊內部網(wǎng)絡中的計算機。NAT 技術也存在一些缺點,例如:木馬程序可以通過NAT 進行外部連接,穿透防火墻。
代理型防火墻也可以被稱為代理服務器,它的安全性要高于包過濾型產(chǎn)品, 它分為應用層網(wǎng)關和電路層網(wǎng)關。代理服務器位于客戶機與服務器之間,完全阻擋了二者間的數(shù)據(jù)交流。從客戶機來看,代理服務器相當于一臺真正的服務器;而從服務器來看,代理服務器又是一臺真正的客戶機。當客戶機需要使用服務器上的數(shù)據(jù)時,首先將數(shù)據(jù)請求發(fā)給代理服務器,代理服務器再根據(jù)這一請求向服務器索取數(shù)據(jù), 然后再由代理服務器將數(shù)據(jù)傳輸給客戶機。從內部發(fā)出的數(shù)據(jù)包經(jīng)過這樣的防火墻處理后,就好像是源于防火墻外部網(wǎng)卡一樣,從而可以達到隱藏內部結構的作用,這種防火墻是網(wǎng)絡專家公的最安全的防火墻。缺點是速度相對較慢。
監(jiān)測型防火墻是新一代的產(chǎn)品,這一技術實際已經(jīng)超越了最初的防火墻定義。它是由Check Point 軟件技術有限公司率先提出的,也稱為動態(tài)包過濾防火墻??偟膩碚f,具有:高安全性,高效性,可伸縮性和易擴展性。實際上,作為當前防火墻產(chǎn)品的主流趨勢,大多數(shù)代理服務器也集成了包過濾技術,這兩種技術的混合顯然比單獨使用具有更大的優(yōu)勢??偟膩碚f,網(wǎng)絡的安全性通常是以網(wǎng)絡服務的開放性和靈活性為代價的,防火墻只是整個網(wǎng)絡安全防護體系的一部分,而且防火墻并非萬無一失。除了使用了防火墻后技術,我們還使用了其他技術來加強安全保護,數(shù)據(jù)加密技術是保障信息安全的基石。
5.2.4 操作系統(tǒng)安全內核技術。
操作系統(tǒng)安全內核技術除了在傳統(tǒng)網(wǎng)絡安全技術上著手,人們開始在操作系統(tǒng)的層次上考慮網(wǎng)絡安全性,嘗試把系統(tǒng)內核中可能引起安全性問題的部分從內核中剔除出去,從而使系統(tǒng)更安全。操作系統(tǒng)平臺的安全措施包括:采用安全性較高的操作系統(tǒng);對操作系統(tǒng)的安全配置;利用安全掃描系統(tǒng)檢查操作系統(tǒng)的漏洞等。美國國防部技術標準把操作系統(tǒng)的安全等級分成了D1、C1、C2、B1、B2、B4、A 級,其安全等級由低到高。目前主要的操作系統(tǒng)的安全等級都是C2 級,其特征包括:①用戶必須通過用戶注冊名和口令讓系統(tǒng)識別;②系統(tǒng)可以根據(jù)用戶注冊名決定用戶訪問資源的權限;③系統(tǒng)可以對系統(tǒng)中發(fā)生的每一件事進行審核和記錄;④可以創(chuàng)建其他具有系統(tǒng)管理權限的用戶。
5.2.4 身份驗證技術身份驗證技術。
身份驗證技術身份驗證技術是用戶向系統(tǒng)出示自己身份證明的過程。身份認證是系統(tǒng)查核用戶身份證明的過程。這兩個過程是判明和確認通信雙方真實身份的兩個重要環(huán)節(jié),人們常把這兩項工作統(tǒng)稱為身份驗證。它的安全機制在于首先對發(fā)出請求的用戶進行身份驗證,唐山工業(yè)職業(yè)技術學院畢業(yè)論文
確認其是否為合法的用戶,如是合法用戶,再審核該用戶是否有權對他所請求的服務或主機進行訪問。從加密算法上來講,其身份驗證是建立在對稱加密的基礎上的。
為了使網(wǎng)絡具有是否允許用戶存取數(shù)據(jù)的判別能力,避免出現(xiàn)非法傳送、復制或篡改數(shù)據(jù)等不安全現(xiàn)象,網(wǎng)絡需要采用的識別技術。常用的識別方法有口令、唯一標識符、標記識別等。口令是最常用的識別用戶的方法,通常是由計算機系統(tǒng)隨機產(chǎn)生,不易猜測、保密性強,必要時,還可以隨時更改,實行固定或不固定使用有效期制度,進一步提高網(wǎng)絡使用的安全性;唯一標識符一般用于高度安全的網(wǎng)絡系統(tǒng),采用對存取控制和網(wǎng)絡管理實行精確而唯一的標識用戶的方法,每個用戶的唯一標識符是由網(wǎng)絡系統(tǒng)在用戶建立時生成的一個數(shù)字,且該數(shù)字在系統(tǒng)周期內不會被別的用戶再度使用;標記識別是一種包括一個隨機精確碼卡片(如磁卡等)的識別方式,一個標記是一個口令的物理實現(xiàn),用它來代替系統(tǒng)打入一個口令。一個用戶必須具有一個卡片,但為了提高安全性,可以用于多個口令的使用。
5.2.5 網(wǎng)絡防病毒技術。
在網(wǎng)絡環(huán)境下,計算機病毒具有不可估量的威脅性和破壞力。CIH 病毒及愛蟲病毒就足以證明如果不重視計算機網(wǎng)絡防病毒,那可能給社會造成災難性的后果,因此計算機病毒的防范也是網(wǎng)絡安全技術中重要的一環(huán)。網(wǎng)絡防病毒技術的具體實現(xiàn)方法包括對網(wǎng)絡服務器中的文件進行頻繁地掃描和監(jiān)測,工作站上采用防病毒芯片和對網(wǎng)絡目錄及文件設置訪問權限等。防病毒必須從網(wǎng)絡整體考慮,從方便管理人員的能,在夜間對全網(wǎng)的客戶機進行掃描,檢查病毒情況;利用在線報警功能,網(wǎng)絡上每一臺機器出現(xiàn)故障、病毒侵入時,網(wǎng)絡管理人員都能及時知道,從而從管理中心處予以解決。
訪問控制也是網(wǎng)絡安全防范和保護的主要策略,它的主要任務是保證網(wǎng)絡資源不被非法使用和非常訪問。它也是維護網(wǎng)絡系統(tǒng)安全、保護網(wǎng)絡資源的重要手段,可以說是保證網(wǎng)絡安全最重要的核心策略之一。它主要包括:身份驗證、存取控制、入網(wǎng)訪問控制、網(wǎng)絡的權限控制、目錄級安全控制、屬性安全控制等。計算機信息訪問控制技術最早產(chǎn)生于上世紀60年代,隨后出現(xiàn)了兩種重要的訪問控制技術,自主訪問控制和強制訪問控制。隨著網(wǎng)絡的發(fā)展,為了滿足新的安全需求,今年來出現(xiàn)了以基于角色的訪問控制技術,基于任務的訪問控制。
六、結束語
總的來說,網(wǎng)絡安全不僅僅是技術問題,同時也是一個安全管理問題。網(wǎng)絡攻擊的日益猖獗已經(jīng)對網(wǎng)絡安全造成了很大的威脅。我們必須綜合考慮安全因素,制定合理的目標、技術方案和相關的配套法規(guī)等。世界上不存在絕對安全的網(wǎng)絡系統(tǒng),隨著計算機網(wǎng)絡技術的進一步發(fā)展,網(wǎng)絡安全防護技術也必然隨著網(wǎng)絡應用的發(fā)展而不斷發(fā)展。
計算機病毒形式以及傳播途徑日趨多樣化,計算機安全問題日益復雜話,我們必須正確認識、感知、防范計算機病毒的攻擊,以保護計算機數(shù)據(jù)安全,使得計算機網(wǎng)絡發(fā)揮其積極的作用,只要對其有充分的認識,就能筑起心理上和技術防范措施上的防線。對于任何黑客的惡意攻擊,只要了解了他們的攻擊手段,具有豐富的網(wǎng)絡知識,就可以抵御黑客們的瘋狂攻擊。減少因網(wǎng)絡安全引起的不必要的損失。
因此,加強計算機技術和技能的學習,掌握各種基礎軟件的使用技巧,已經(jīng)刻不容緩。
第五篇:LIB2.0中關于高校圖書館信息檢索系統(tǒng)的探索
一、高校圖書館信息檢索系統(tǒng)的現(xiàn)狀
隨著計算機技術的高速發(fā)展,圖書館信息檢索系統(tǒng)已經(jīng)完成從手工方式向計算機方式的轉變。讀者在信息檢索系統(tǒng)中輸入關鍵詞,信息檢索系統(tǒng)從館藏資源中檢索出滿足讀者需求的館藏資源,并標注出館藏資源所在的位置以及該資源的館藏數(shù)量和可借數(shù)量。同時讀者還可以對暫時沒有可借的館藏資源進行預約,這些服務方式極大的方便了讀者,減少了讀者尋找館藏資源的時間,一定程度上提高了館藏資源的利用率。
檢索系統(tǒng)缺乏與讀者的交互。檢索系統(tǒng)無法獲知讀者的興趣以及讀者對這些館藏資源的反饋,無法針對讀者提供個性化的服務。讀者只能單方向接受檢索系統(tǒng)結果,沒有辦法參與檢索系統(tǒng)的建設。檢索系統(tǒng)缺乏指導性。對于高校這個特殊群體來說,學生的層次是有區(qū)別的,剛進入學校的學生沒有足夠的知識來選擇合適的館藏資源來促進他們的學業(yè),這就需要在檢索系統(tǒng)中加入更多的指導因素,指導學生選擇更合適的館藏資源。檢索的結果缺乏動態(tài)性。檢索系統(tǒng)主要通過標題、關鍵字、作者等信息進行檢索。而這些信息在檢索系統(tǒng)中是不會變化的,這也就導致了檢索結果的靜態(tài)性。靜態(tài)的檢索結果反映不出館藏資源的優(yōu)劣、讀者的喜好等信息。
這些缺點影響著檢索系統(tǒng)的使用效果及館藏資源的利用率,同時檢索系統(tǒng)也不能為讀者提供個性化的服務。如何解決這些缺點成為當前以及未來信息檢索系統(tǒng)的迫切要求。
二、lib2.0中高校圖書館信息檢索系統(tǒng)
(一)推薦書目互動平臺
推薦書目,又名導讀書目、選讀書目,它是為了某一個特定目的將某類或特定主題的書目推薦給特定的人群。推薦書目在我國自古有之,現(xiàn)存最早的推薦書目是敦煌發(fā)現(xiàn)的《雜抄》(伯2171號卷子),為當時讀書人列出一份包括《史記》、《三國志》、《春秋》等25種文獻在內的書目清單。推薦書目平臺在充分考慮高校圖書館的特殊性前提下,構建了可設置的多個主題與學科專欄的平臺,形成以下幾個類型的推薦:
第一,按學科專業(yè)推薦。高校的學生均從屬于特定的專業(yè),如,計算機專業(yè),金融專業(yè),外語等。如何學好這個專業(yè)是學生在高校階段首要關心的話題。推薦書目廣泛邀請該專業(yè)的教師或高年級的學生參與構建學科專業(yè)推薦書目,以他們的知識和經(jīng)驗來指導、幫助其他讀者順利的完成學業(yè)。
第二,按學業(yè)課程推薦。高校的學生每學期均要完成一定的課程,如何學好這些課程也是學生關心比較多的一個話題。在學業(yè)課程推薦中邀請已完成該課程的同學進行推薦,介紹他們當年學習時閱讀的書籍,同時邀請課程教師對推薦書目進行修正和補充,以確保推薦書目的質量。
第三,按主題推薦。同一專業(yè)的學生畢業(yè)后可能從事不同技術方向的工作,如計算機專業(yè)的學生,畢業(yè)后可以從事c語言、c++語言、c#語言、java語言等方向的工作,不同方向所要閱讀的書籍也大相徑庭。通過教師和學生廣泛參與這些主題的書籍推薦,形成了一系列不同主題的推薦書目。學有余力的同學按照自己的興趣選擇不同的方向來閱讀書籍、擴展自己的知識面,提高自己的能力,為將來走向社會打下良好的基礎。
推薦書目平臺與信息檢索系統(tǒng)是一個有機的整體。讀者在輸入檢索條件檢索信息時,系統(tǒng)自動檢索這些關鍵詞的推薦書目信息,以供讀者參考。讀者在閱讀了相關的推薦書籍后,可以添加該書籍的閱讀心得,以方便后來的閱讀者。這種基于檢索系統(tǒng)的推薦書目平臺,改變傳統(tǒng)信息環(huán)境下“推薦者一推薦書目一讀者”的單向推薦書目模式,形成循環(huán)的推薦書目系統(tǒng)環(huán)節(jié)鏈。讀者、檢索系統(tǒng)與推薦書目平臺三者的流程關系。
檢索系統(tǒng)引入推薦書目,方便了教師與學生的參與,加強了受眾的互動與交流,實現(xiàn)了閱讀的分享與互動。眾多用戶通過檢索系統(tǒng)的廣泛參與推薦書目平臺,確保了推薦書目的質量。同時擁有推薦書目平臺的檢索系統(tǒng)也實現(xiàn)了檢索的平面化向網(wǎng)狀化轉變。
專題信息庫針對同一學科可設置多個知識點,這些知識點構建成知識網(wǎng)絡系統(tǒng),形成在學科內共享領域知識。所有讀者均可參與專題信息庫的建設,設立知識點,解釋知識點,通過共享寫作的方式,共同維護專題信息庫的質量與權威。
通過在檢索系統(tǒng)中嵌入專題信息庫,既能促進已有資源的使用,又能為圖書館增加新的資源。它的應用提供了一種嶄新的圖書館信息檢索系統(tǒng)個性化信息服務的模式。
(三)tag標簽云
tag是一種用戶決定、更為自由靈活的分類方式,這個標簽名可以來自關鍵詞,也可以來自分類。通過tag,不同用戶可以進行交叉查詢,即用戶可通過關鍵詞找到其他用戶的收藏 列表,也可以通過大家收藏的url找到其他用戶。這樣,用戶在提供信息的同時,也從他人的信息中受益。
傳統(tǒng)的高校信息檢索系統(tǒng)主要通過對文件的標題與關鍵字的搜索達到檢索目的,這種搜索方式簡單、準確,但不夠智能。在檢索系統(tǒng)中嵌入tag,提高了檢索系統(tǒng)的智能化。用戶參與使用tag主要有三種方式: 讀者對自己搜索過的圖書進行標簽。這種標簽對館藏進行重新的聚類,可以極大的方便他人或自己再次使用館藏資源。讀者在檢索系統(tǒng)中輸入關鍵字進行檢索,檢索系統(tǒng)在提供傳統(tǒng)檢索結果的基礎上,智能的檢索該關鍵字對應的tag,這樣,讀者就可以通過他人的tag更方便地找到自己需要的圖書。在瀏覽某tag對應圖書時,檢索系統(tǒng)智能化的列出該圖書所對應的其他tag,讀者可以通過這些tag進行網(wǎng)狀的瀏覽,確定自己的目標資源。
tag代表了一種新的組織和管理信息的方式,它不同于傳統(tǒng)的、針對文件本身的關鍵字搜索,而是一種模糊化、智能化的分類。在檢索系統(tǒng)中嵌入tag功能,更加符合高校圖書館中“體驗者”提高檢索結果的相似程度,極大提高了高校圖書館提供個性化信息服務的能力。
(四)優(yōu)化檢索
傳統(tǒng)檢索系統(tǒng)主要通過書籍標題、主題、作者等關鍵字進行搜索。檢索的結果是靜態(tài)的,忽略了讀者對檢索系統(tǒng)的參與,無法列出最優(yōu)化的搜索結果。
lib2.0下的檢索系統(tǒng)嵌入了推薦書目平臺、專題信息庫與tag標簽云,這為檢索的優(yōu)化提供了基礎。檢索的優(yōu)化主要依靠以下四個動態(tài)因素:第一、書籍是否被推薦,以及被推薦的情況;第二、書籍是否被專題信息庫引用;第三、書籍的tag是否包含搜索的關鍵詞;第四、書籍的借閱量。在用戶輸入關鍵詞進行搜索時,系統(tǒng)通過賦予這四個因素不同的搜索權重值,自動計算滿足關鍵詞的書籍權重,并按照權重順序進行排序。在檢索系統(tǒng)中引入動態(tài)檢索因素后,檢索系統(tǒng)能很好的體現(xiàn)了讀者的參與情況,并能為讀者提供個性化或有針對性的服務。


文檔為doc格式
聲明:本文內容由互聯(lián)網(wǎng)用戶自發(fā)貢獻自行上傳,本網(wǎng)站不擁有所有權,未作人工編輯處理,也不承擔相關法律責任。如果您發(fā)現(xiàn)有涉嫌版權的內容,歡迎發(fā)送郵件至:645879355@qq.com 進行舉報,并提供相關證據(jù),工作人員會在5個工作日內聯(lián)系你,一經(jīng)查實,本站將立刻刪除涉嫌侵權內容。
比較研究國內大學圖書館書目檢索系統(tǒng)
書目檢索(BibliographicRetrieval)是以文獻線索為檢索對象的信息檢索。檢索系統(tǒng)存儲的是以二次信息(目錄、索弓丨、文摘等)為對象的信息,它們是女獻信息的外部特征與內容特征......
信息檢索畢業(yè)論文(合集五篇)
上機檢索實習題目實驗一. 利用 “CNKI期刊全文數(shù)據(jù)庫“檢索我校歐陽鐘輝、江義火老師、吳昌錢老師在2000到2014年發(fā)表的有關“計算機”方面的文章,記下論文篇數(shù)、第一篇文章......
《水利水電技術標準全文檢索系統(tǒng)》2013年第一次升級
《水利水電技術標準全文檢索系統(tǒng)》 2013年第一次升級更新《水利水電技術標準全文檢索系統(tǒng)》自去年開始在我院局域網(wǎng)上運行,日前,對該全文檢索系統(tǒng)進行了2013年第一次升級更新......
大學生畢業(yè)論文與信息檢索(大全)
2014—2015學年第二學期《畢業(yè)論文寫作與信息檢索》考試題 姓名: 學號: 班級: 成績: 一、單項選擇題(共10分) 1、瀏覽超星數(shù)字圖書館,應首先安裝( D )。 A. Apabi Reader B. A......
信息資源管理專業(yè)獨立本科畢業(yè)論文參考題目
信息資源管理專業(yè)獨立本科畢業(yè)論文參考題目 1、試論信息資源管理特征 2、論信息資源管理的產(chǎn)生背景及前途 3、試論企業(yè)信息資源管理應注意的幾個問題 4、論信息系統(tǒng)項目管理......
畢業(yè)論文與信息檢索考試題(本站推薦)
2014—2015學年第二學期《畢業(yè)論文寫作與信息檢索》考試題 姓名: 學號: 班級: 成績: 一、單項選擇題(共10分) 1、瀏覽超星數(shù)字圖書館,應首先安裝( D )。 A. Apabi Reader B. A......
圖書館藏書目檢索系統(tǒng)的主要功能和使用方法專題
OPAC書目檢索系統(tǒng)使用方法 圖書館館藏書目檢索系統(tǒng)OPAC書目檢索系統(tǒng)的使用方法及操作步驟如下: 1. 書目檢索:輸入要查詢書目的題名,該系統(tǒng)即可檢索到該書的具體信息:索書號、作......
淺談鄉(xiāng)鎮(zhèn)政府信息公開的縱深推進畢業(yè)論文
淺談鄉(xiāng)鎮(zhèn)政府信息公開的縱深推進 [論文關鍵詞]鄉(xiāng)鎮(zhèn)政府;信息公開;運行機制;觀念 [論文內容提要]縱深推進鄉(xiāng)鎮(zhèn)政府信息公開是一個系統(tǒng)工程,不僅要生成適應鄉(xiāng)鎮(zhèn)政府信息公開......