第一篇:目前信息檢索系統(tǒng)的優(yōu)缺點(diǎn)
目前信息檢索系統(tǒng)的優(yōu)缺點(diǎn)
摘要
目前,Internet上信息檢索的方式主要分為二種:即非WEB信息檢索方式和WEB信息檢索方式。這兩種檢索方式為人們及時(shí)準(zhǔn)確地檢索網(wǎng)絡(luò)信息提供了極大的方便和可能,尤其WEB信息檢索工具中的搜索引擎,它已成為人們查詢網(wǎng)上信息最重要的檢索工具,幾乎成了網(wǎng)絡(luò)信息檢索工具的代稱,因而本文在論述網(wǎng)絡(luò)信息檢索工具時(shí)以搜索引擎為主要代表。然而目前網(wǎng)絡(luò)信息檢索又面臨一系列的挑戰(zhàn),如網(wǎng)絡(luò)信息量的迅猛增加,以至人工己經(jīng)無法對它們進(jìn)行有效的分類、索引和利用;簡單的關(guān)鍵詞搜索;返回的信息量過大已經(jīng)讓用戶無法承擔(dān);網(wǎng)絡(luò)信息組織的無序性;網(wǎng)絡(luò)信息日新月異的更變;信息媒體的多樣化等等,這些都給Internet信息的獲取和利用造成了極大的阻礙[1]。
引言
信息檢索系統(tǒng)的研究是伴隨著科學(xué)技術(shù)的發(fā)展和信息數(shù)量的俱增而興起的,是指信息用戶為處理解決各種問題而查找、識別、獲取相關(guān)的事實(shí)、數(shù)據(jù)、文獻(xiàn)的活動及過程,其主要研究范圍包括:信息檢索理論、信息檢索語義、信息檢索系統(tǒng)的構(gòu)建和評價(jià)、信息檢索技術(shù)和方法等。
信息檢索的研究已經(jīng)有多年的歷史,20世紀(jì)中葉以前,信息的存儲和傳播主要以紙質(zhì)介質(zhì)為載體,信息檢索的研究主要圍繞文獻(xiàn)的獲取和控制展開,主要關(guān)注如何檢索和利用文獻(xiàn)中記載的信息。直到50年代,計(jì)算機(jī)被圖書館等部門廣泛用來存儲和管理文檔,信息檢索技術(shù)作為新的熱點(diǎn)被廣泛地研究。到了80年代,信息檢索領(lǐng)域在索引模型,文檔內(nèi)容表示以及匹配策略等方面取得了許多突破性的研究成果,并且成功地開發(fā)了一些系統(tǒng)。例如Cornell大學(xué)的SMART系統(tǒng)和Massachusetts大學(xué)的INQUERY系統(tǒng)等。Web的出現(xiàn)為信息檢索提供了一個(gè)前所未有的實(shí)驗(yàn)環(huán)境和應(yīng)用情景,許多Web信息檢索系統(tǒng)應(yīng)運(yùn)而生,例如Yahoo!,Alta-vista等[2]。
目前信息檢索系統(tǒng)的優(yōu)缺點(diǎn)
1.評價(jià)標(biāo)準(zhǔn)
目前,得到普遍認(rèn)同的檢索效果的評價(jià)標(biāo)準(zhǔn)主要有以下幾個(gè):查全率、查準(zhǔn)率、收錄范圍、輸出格式,其中以查全率和查準(zhǔn)率最為重要[1]。綜合國內(nèi)外關(guān)于搜索引擎評價(jià)及其方法的研究,筆者將搜索引擎評價(jià)的研究方法分為以下幾種。
(1)實(shí)驗(yàn)方法
(2)調(diào)查方法
(3)數(shù)據(jù)分析法
(4)觀察法
(5)綜述和評論
綜合評價(jià)指標(biāo)是指對搜索引擎各個(gè)方面進(jìn)行考量時(shí)依據(jù)的參考標(biāo)準(zhǔn),如
Carpineto等就提出了3個(gè)一級指標(biāo),分別為:檢索界面、檢索性能和檢索輸入。其中,檢索界面包括搜索引擎存在、主頁檢索框、結(jié)果頁面檢索框以及高級檢索界面等4個(gè)二級指標(biāo);檢索性能有7個(gè)二級指標(biāo):大小寫敏感度、詞干檢索、禁用詞、部分匹配、短語檢索、布爾邏輯檢索、全站檢索等;檢索輸出包括基于相關(guān)度的排序、標(biāo)記檢索式、結(jié)果建議、無死鏈4個(gè)二級指標(biāo)[3]。
2.按照信息搜集方法和服務(wù)提供方式的不同,搜索引擎系統(tǒng)可以分為三大類:
2.1目錄式搜索引擎:
以人工方式或半自動方式搜集信息,由編輯員查看信息之后,人工形成信息摘要,并將信息置于事先確定的分類框架中,提供目錄瀏覽服務(wù)和直接檢索服務(wù)。該類搜索引擎因?yàn)榧尤肓巳说闹悄?,所以信息?zhǔn)確、導(dǎo)航質(zhì)量高,缺點(diǎn)是需要人工介入、維護(hù)量大、信息量少、信息更新不及時(shí)。
這類搜索引擎的代表是:Yahoo、LookSmart、Open Directory、Go Guide等。
2.2機(jī)器人搜索引擎:
由一個(gè)稱為蜘蛛(Spider)的機(jī)器人程序以某種策略自動地在互聯(lián)網(wǎng)中搜集和發(fā)現(xiàn)信息,然后索引器為搜集到的信息建立索引,再由檢索器根據(jù)用戶的查詢輸入檢索索引庫并將查詢結(jié)果返回給用戶。服務(wù)方式是面向網(wǎng)頁的全文檢索服務(wù)。該類搜索引擎的優(yōu)點(diǎn)是搜索的信息空間大,更新及時(shí),毋需人工干預(yù),缺點(diǎn)是返回信息過多,有很多無關(guān)信息,用戶必須從結(jié)果中進(jìn)行篩選。
這類搜索引擎的代表是:AltaVista,Northern Light,Excite,Infoseek,Inktomi,F(xiàn)AST/FastSearch,Lycos,Google,“天網(wǎng)”,悠游,OpenFind等。
2.3搜索引擎:這類搜索引擎沒有自己的數(shù)據(jù),而是將用戶的查詢請求同時(shí)向多個(gè)搜索引擎遞交,將返回的結(jié)果進(jìn)行重復(fù)排除、重新排序等處理后,作為自己的結(jié)果返回給用戶。服務(wù)方式為面向網(wǎng)頁的全文檢索。這類搜索引擎的優(yōu)點(diǎn)是返回結(jié)果更多、更全,缺點(diǎn)是不能充分利用所使用搜索引擎的功能,用戶需要做更多的篩選。
這類搜索引擎的代表是WebCrawler,InfoMarket等[4]。
3.新一代的智能Web信息檢索系統(tǒng):
3.1移動agent技術(shù)
一般來說,所有用移動agent實(shí)現(xiàn)的系統(tǒng)都可以用傳統(tǒng)的分布式技術(shù)賴實(shí)現(xiàn)。那么為什么要選擇移動agent呢?這是因?yàn)橐苿觓gnet為解決分布式問題提供了一個(gè)統(tǒng)一的模式。它為分布計(jì)算帶來了更多的靈活性、高效性、可靠性和可伸縮性。移動agent已成為繼CORBA、DCOM后新一代分布處理技術(shù)。移動agent具有以下5個(gè)優(yōu)點(diǎn):
(1)節(jié)約網(wǎng)絡(luò)帶寬和減少網(wǎng)絡(luò)延時(shí);
(2)移動agent能夠使傳統(tǒng)的C/S計(jì)算模式下的計(jì)算任務(wù)更加動態(tài)均勻地分配;
(3)在分布式環(huán)境下,移動agent系統(tǒng)能實(shí)現(xiàn)較好的并行性即并行任務(wù)求解;
(4)基于移動agent的分布式系統(tǒng)具有較好的可理解性;
(5)異步移動計(jì)算能力。
3.2本體技術(shù)
本體的目標(biāo)是捕獲相關(guān)領(lǐng)域的知識,提供對該領(lǐng)域知識的共同理解,確定該領(lǐng)域內(nèi)共同認(rèn)可的詞匯,并從不同層次的形式化模式上給出這些詞語和詞語間相互關(guān)系的明確定義。
本體的研究與應(yīng)用主要包括3方面:(1)理論研究,主要研究概念及其分類和本體上的代數(shù)運(yùn)算;(2)在信息系統(tǒng)中的應(yīng)用研究,主要研究信息組織、信息檢索和異構(gòu)信息系統(tǒng)互操作問題,(3)本體作為一種能在知識層提供知識共享和重用的工具在語義Web中的應(yīng)用[4]。
3.個(gè)性化搜索引擎技術(shù)
當(dāng)前,個(gè)性化搜索引擎技術(shù)主要表現(xiàn)在如下兩個(gè)方面:
(1)搜索引擎提供的搜索結(jié)果滿足用戶的個(gè)性化需求。由個(gè)性化搜索服務(wù)獲得的搜索結(jié)果更加準(zhǔn)確,使不同用戶能夠得到各自需要的搜索結(jié)果,同時(shí)避免出現(xiàn)不相關(guān)的搜索結(jié)果。個(gè)性化搜索引擎技術(shù)通過分析用戶的搜索詞,跟蹤用戶的搜索行為和環(huán)境,結(jié)合用戶的需求變化和網(wǎng)絡(luò)信息的動態(tài)變化實(shí)時(shí)更新等資料進(jìn)行信息檢索,從而為用戶提供更為個(gè)性化的、準(zhǔn)確的、真正需求的搜索結(jié)果。
(2)個(gè)性化搜索引擎所提供的服務(wù)和功能具有優(yōu)勢和特色,與通用搜索引擎不同。由于各大搜索引擎為了獲得競爭優(yōu)勢,不斷推出新的特色服務(wù)和功能,因此出現(xiàn)了從核心搜索衍生出的各種其他服務(wù),如桌面搜索、地圖搜索、生活搜索、RSS訂閱等服務(wù)。
目前不少搜索引擎都加入了個(gè)性化服務(wù)和功能,他們提出了各種技術(shù)和方法以實(shí)現(xiàn)個(gè)性化搜索服務(wù)。他們主要采用了基于規(guī)則的和基于信息、過濾的推薦技術(shù)。其中,基于信息過濾的技術(shù)又包括協(xié)作過濾和基于內(nèi)容的過濾?;谝?guī)則的技術(shù)允許系統(tǒng)管理員根據(jù)用戶的動態(tài)和靜態(tài)屬性生成規(guī)則,規(guī)則決定了在不同情況下如何提供不同的務(wù),一個(gè)規(guī)則本質(zhì)上是一個(gè)if-then語句。該方法的優(yōu)點(diǎn)是簡單、直接,缺點(diǎn)是規(guī)則不能動態(tài)更新,質(zhì)量難以保證,隨著規(guī)則數(shù)的增加,系統(tǒng)將更難管理。典型的系統(tǒng)有IBM的Webshere,BroadVision和ILOG等。
基于內(nèi)容過濾的技術(shù)利用資源和用戶興趣的相似度進(jìn)行信息過濾。該方法的優(yōu)點(diǎn)是簡單、高效,缺點(diǎn)是不能發(fā)現(xiàn)用戶新的興趣,并且難以區(qū)分資源內(nèi)容的質(zhì)量和風(fēng)格。典型的系統(tǒng)有 Personal web Watcher,syskill&webert,CiteSeer,和Web personalizer等。
基于協(xié)作的過濾技術(shù)是利用用戶之間的相似度來進(jìn)行信息過濾。該方法的優(yōu)點(diǎn)是能發(fā)現(xiàn)用戶新的興趣點(diǎn),但缺點(diǎn)是當(dāng)系統(tǒng)用戶和資源逐漸增多時(shí),系統(tǒng)性能會逐漸降低;另外,在系統(tǒng)使用的初期,難以發(fā)現(xiàn)相似的用戶。典型的系統(tǒng)有Web watcher,Let’s Browse,GrouLens,F(xiàn)irefly和Siteseer等。
還有其它的一些提供個(gè)性化服務(wù)的信息搜索系統(tǒng)同時(shí)采用了基于內(nèi)容和協(xié)作過濾兩種技術(shù)。如:webSIFT,F(xiàn)AB,Anatagonomy和Dynamicprofiler等,結(jié)合這兩種過濾技術(shù)可以克服協(xié)作過濾的稀疏性難題,使用用戶已瀏覽的內(nèi)容來預(yù)測用戶對其它資源的評價(jià),進(jìn)而增加資源評價(jià)的密度,再利用這些評價(jià)進(jìn)行協(xié)作過濾,從而改善協(xié)作過濾的效率[5]。
參考文獻(xiàn)
[1] 網(wǎng)絡(luò)信息檢索及其發(fā)展趨勢研究
[2] 基于結(jié)構(gòu)化向量空間模型的中文信息檢索系統(tǒng)研究與實(shí)現(xiàn)
[3] 搜索引擎檢索功能的性能評價(jià)研究
[4] 基于本體的Web信息檢索系統(tǒng)及其關(guān)鍵技術(shù)研究
[5] 基于內(nèi)容的個(gè)性化Web信息檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
第二篇:基于lucene的信息檢索系統(tǒng) 畢業(yè)論文
第三章 信息檢索系統(tǒng)及其關(guān)鍵技術(shù)
3.1 信息檢索系統(tǒng)簡介
信息檢索系統(tǒng)是利用信息檢索技術(shù)(如全文檢索等)幫助用戶查找特定信息的一種工具。它能夠?qū)π畔⑦M(jìn)行正確的表示、存儲和組織,同時(shí)還提供對于信息的訪問方式。在這里,信息的概念很寬泛,它可以是一篇文章,一段文本,一個(gè)網(wǎng)頁,一封郵件,一張照片,甚至是一些虛擬信息的集合。
3.2 信息檢索的過程
檢索的整個(gè)過程包括:構(gòu)建文本庫,建立索引,進(jìn)行檢索。1.構(gòu)建文本庫
在開發(fā)檢索功能前,一個(gè)信息檢索系統(tǒng)需要做些準(zhǔn)備工作。首先,必須構(gòu)建一個(gè)文本數(shù)據(jù)庫。這個(gè)文本數(shù)據(jù)庫用來保存所有用戶可能檢索的信息。在這些信息的基礎(chǔ)上,確定檢索系統(tǒng)中的文本模型。文本模型是被系統(tǒng)所認(rèn)可的一種信息格式,這種格式應(yīng)當(dāng)具有可識別、冗余度低等特點(diǎn)。當(dāng)然,在系統(tǒng)的運(yùn)作過程中,文本數(shù)據(jù)庫的信息可能會不斷地發(fā)生變化。
2.建立索引
有了文本模型后,就應(yīng)該根據(jù)數(shù)據(jù)庫內(nèi)的文本建立索引。索引可以大大提高信息檢索的速度。目前有多種索引的建立方式,采用哪種方式取決于信息檢索系統(tǒng)的規(guī)模。大型信息檢索系統(tǒng)(如百度、Google這樣的搜索引擎)均采用倒排的方式來建立索引。
3.進(jìn)行搜索
在為文本建立索引之后,就可以開始對其進(jìn)行搜索。通常由用戶提交一個(gè)檢索請求,該請求被分析,然后在索引中檢索并返回結(jié)果。
3.3 Lucene
Lucene是一個(gè)開源全文檢索工具包,它是apache軟件基金會jakarta項(xiàng)目組的一個(gè)子項(xiàng)目,是一個(gè)開放源代碼的全文檢索引擎工具包,即它不是一個(gè)完整的全文檢索引擎,而是一個(gè)全文檢索引擎的架構(gòu),提供了完整的查詢引擎和索引引擎,部分文本分析引擎(英文與德文兩種西方語言)。Lucene的目的是為軟件開發(fā)人員提供一個(gè)簡單易用的工具包,以方便的在目標(biāo)系統(tǒng)中實(shí)現(xiàn)全文檢索的功能,或者是以此為基礎(chǔ)建立起完整的全文檢索引擎。3.3.1 Lucene結(jié)構(gòu)分析
Lucene作為一個(gè)優(yōu)秀的全文檢索引擎,其結(jié)構(gòu)具有強(qiáng)烈的面向?qū)ο筇卣鳌J紫仁嵌x了一個(gè)與平臺無關(guān)的索引文件格式,其次通過抽象將其核心組成部分設(shè)計(jì)為抽象類,具體的平臺實(shí)現(xiàn)部分設(shè)計(jì)為抽象類的實(shí)現(xiàn),此外與具體平臺相關(guān)的部分比如文件存儲也封裝為類,經(jīng)過層層的面向?qū)ο笫降奶幚?,最終達(dá)成了一個(gè)低耦合高效率,容易二次開發(fā)的檢索引擎。Lucene的結(jié)構(gòu)和源碼組織結(jié)構(gòu)如圖3.1所示:
查詢語句org.apache.lucene.queryPaser被索引文件查詢結(jié)果org.apache.lucene.search對org.apache.lucene.analysis外接口org.apache.lucene.index核心索引org.apache.lucene.store索引文件org.apache.lucene.documentorg.apache.lucene.store基礎(chǔ)結(jié)構(gòu)封裝 圖3.1 Lucene結(jié)構(gòu)和源碼組織結(jié)構(gòu)
從圖中可以看出,Lucene由基礎(chǔ)結(jié)構(gòu)封裝、索引核心、對外接口三大部分組成。其中直接操作索引文件的索引核心又是系統(tǒng)的重點(diǎn)。Lucene的將所有源碼分為了7個(gè)模塊(在java語言中以包即package來表示),各個(gè)模塊所屬的部分也如圖3.1所示。3.3.2 Lucene索引的建立
索引是信息檢索引擎工作的第一步,只有建立了索引才能進(jìn)行信息檢索。Lucene用Document邏輯文件和Field域來組織各種數(shù)據(jù)源。Document向Lucene提供原始的要索引的文本內(nèi)容,Lucene從Document中取出相關(guān)的數(shù)據(jù)源,并根據(jù)屬性配置進(jìn)行相應(yīng)的處理,建立索引。
索引過程如下:
(1)創(chuàng)建一個(gè)IndexWriter用來寫索引文件,它有幾個(gè)參數(shù),INDEX_DIR就是索引文件所存放的位置,Analyzer便是用來對文檔進(jìn)行詞法分析和語言處理的。(2)創(chuàng)建一個(gè)Document代表我們要索引的文檔。
(3)將不同的Field加入到文檔中。我們知道,一篇文檔有多種信息,如題目,作者,修改時(shí)間,內(nèi)容等,不同類型的信息用不同的Field來表示。(4)
IndexWriter調(diào)用函數(shù)addDocument將索引寫到索引文件夾中。
3.3.3 Lucene的搜索
Lucene建立了功能強(qiáng)大的索引機(jī)制為搜索服務(wù),這是因?yàn)樵跈z索系統(tǒng)的使用中,用戶體驗(yàn)最深的還是搜索部分。如果這一部分的性能無法達(dá)到用戶要求,那么軟件就沒有太大的意義。
搜索過程如下:
(1)IndexReader將磁盤上的索引信息讀入到內(nèi)存,INDEX_DIR就是索引文件存放的位置。
(2)創(chuàng)建IndexSearcher準(zhǔn)備進(jìn)行搜索。
(3)創(chuàng)建Analyer用來對查詢語句進(jìn)行詞法分析和語言處理。(4)創(chuàng)建QueryParser用來對查詢語句進(jìn)行語法分析。
(5)QueryParser調(diào)用parser進(jìn)行語法分析,形成查詢語法樹,放到Query中。(6)
IndexSearcher調(diào)用search對查詢語法樹Query進(jìn)行搜索,得到查詢結(jié)果存放在TopScoreDocCollector。
3.3.4 中文分詞
中文分詞是處理中文信息的基礎(chǔ)與關(guān)鍵。由于Lucene自帶的分詞器對英文的分詞效果較好,但對中文的分詞效果并不如意。為了使檢索系統(tǒng)能更好的處理中文信息,本文采用了IKAnalyzer作為分詞器。IK Analyzer是一個(gè)開源的,基于java 語言開發(fā)的輕量級的中文分詞工具包。從2006年12月推出1.0 版開始,IKAnalyzer已經(jīng)推出了3個(gè)大版本。最初,它是以開源項(xiàng)目Luence 為應(yīng)用主體的,結(jié)合詞典分詞和文法分析算法的中文分詞組件。新版本的IKAnalyzer 3.X 則發(fā)展為面向Java 的公用分詞組件,獨(dú)立于Lucene 項(xiàng)目,同時(shí)提供了對Lucene 的默認(rèn)優(yōu)化實(shí)現(xiàn)。IKAnalyzer的特性:
? 采用了特有的“正向迭代最細(xì)粒度切分算法“,具有60 萬字/秒的高速處理能力。? 采用了多子處理器分析模式,支持:英文字母(IP 地址、Email、URL)、數(shù)字(日期,常用中文數(shù)量詞,羅馬數(shù)字,科學(xué)計(jì)數(shù)法),中文詞匯(姓名、地名處理)等分詞處理。
? 優(yōu)化的詞典存儲,更小的內(nèi)存占用。支持用戶詞典擴(kuò)展定義
? 針對Lucene 全文檢索優(yōu)化的查詢分析器IKQueryParser;采用歧義分析算法優(yōu)化查詢關(guān)鍵字的搜索排列組合,能極大的提高Lucene 檢索的命中率。
第四章 信息檢索系統(tǒng)的分析與設(shè)計(jì)
4.1 系統(tǒng)功能需求
隨著科技的發(fā)展,電腦的應(yīng)用越來越普遍,人們的學(xué)習(xí)工作幾乎都不能離開電腦。而筆記本電腦由于其輕便和時(shí)尚性,受到人們普遍的喜愛。但是,在購買筆記本時(shí),我們需要詳細(xì)地了解所買型號筆記本的外表及各種功能,為此我們往往要去各個(gè)商家挑選。為了方便,需要提供一個(gè)專門的筆記本電腦信息查詢系統(tǒng),能讓用戶輕松的獲取各種型號筆記本的詳細(xì)參數(shù)與外觀。該系統(tǒng)提供一個(gè)良好的用戶界面,用戶查詢時(shí),系統(tǒng)能根據(jù)用戶查詢語句精確地給出查詢信息,能夠較好地理解用戶的查詢語句。
4.2 系統(tǒng)開發(fā)平臺設(shè)計(jì)
本系統(tǒng)采用的是Eclipse6.5+MySQL5.1+Tomcat5.5的開發(fā)環(huán)境。
? Eclipse是一個(gè)開放源代碼的、基于Java的可擴(kuò)展開發(fā)平臺。在開發(fā)時(shí)搭配使用MyEclipse進(jìn)行開發(fā)。MyEclipse企業(yè)級工作平臺是對Eclipse IDE的擴(kuò)展,利用它可以在數(shù)據(jù)庫和J2EE的開發(fā)、發(fā)布,以及應(yīng)用程序服務(wù)器的整合方面極大地提高工作效率。它是功能豐富的J2EE集成開發(fā)環(huán)境,包括了完備的編碼、調(diào)試、測試和發(fā)布功能,完整支持HTML CSS、Javascript、Struts、Spring、SQL、Hibernate和JSF。
? MySQL是最受歡迎的開源SQL數(shù)據(jù)庫管理系統(tǒng),它由MySQL AB開發(fā)、發(fā)布和支持。MySQL服務(wù)器支持關(guān)鍵任務(wù)、重負(fù)載生產(chǎn)系統(tǒng)的使用,也可以將它嵌入到一個(gè)大配置的軟件中。本文采用的是當(dāng)前的穩(wěn)定版本5.1。
? Tomcat是一個(gè)免費(fèi)的、開放源碼的、支持JSP和Servlet的web服務(wù)器。Tomcat是一個(gè)小型的輕量級應(yīng)用服務(wù)器,在中、小型系統(tǒng)和并發(fā)訪問用戶不是很多的場合下被普遍使用,是開發(fā)和調(diào)試JSP程序的首選。它運(yùn)行時(shí)占用的系統(tǒng)資源小,擴(kuò)展性好,支持負(fù)載平衡與郵件服務(wù)等開發(fā)應(yīng)用系統(tǒng)常用的功能。目前Tomcat5.5是較穩(wěn)定的版本,而且Eclipse也很好的支持該版本的集成,所以本文采用Tomcat5.5進(jìn)行開發(fā)。此外,本系統(tǒng)所應(yīng)用到的其它開源工具為:Struts1.2、Spring2.5、Hibernate3.1,網(wǎng)絡(luò)爬蟲Heritrix1.14.3,網(wǎng)頁解析工具HtmlParser2.0,全文檢索工具包Lucene3.0,中文分詞軟件IKAnalyzer3.0。
4.3 系統(tǒng)的組成結(jié)構(gòu)
整個(gè)系統(tǒng)由三個(gè)部分組成:網(wǎng)頁采集分析模塊、索引與數(shù)據(jù)庫模塊、web搜索界面模塊。其中網(wǎng)頁采集與分析分別由開源工具網(wǎng)絡(luò)爬蟲Heritrix和網(wǎng)頁解析器HtmlParser完成;由Lucene完成索引系統(tǒng),并將索引與數(shù)據(jù)庫關(guān)聯(lián);web查詢界面基于SSH框架設(shè)計(jì)完成。模塊組成結(jié)構(gòu)如圖4.1所示。
網(wǎng)頁抓取分析模塊索引與數(shù)據(jù)庫模塊InternetHeritrixWeb檢索模塊抓取的信息網(wǎng)頁Lucene建立索引HtmlParser文本格式信息返回查詢結(jié)果創(chuàng)建數(shù)據(jù)庫數(shù)據(jù)庫索引根據(jù)索引查找數(shù)據(jù)庫查詢索引基于SSH設(shè)計(jì)
圖4.1 系統(tǒng)模塊結(jié)構(gòu)圖
4.4 網(wǎng)頁抓取分析模塊設(shè)計(jì)
4.4.1 站點(diǎn)選擇
從技術(shù)角度看,選擇網(wǎng)站的主要依據(jù)有:
(1)網(wǎng)站能夠被Heritrix爬蟲抓取。因?yàn)橛械木W(wǎng)站使用了反爬蟲技術(shù),防止未經(jīng)授權(quán)的爬蟲對面頁進(jìn)行抓取。
(2)網(wǎng)站的信息不是用javaScript動態(tài)生成的。這種動態(tài)生成的內(nèi)容需要在瀏覽器中運(yùn)行生成,是爬蟲無法獲取到的。
(3)網(wǎng)站的面頁結(jié)構(gòu)不應(yīng)該經(jīng)常變化,最好是使用一種模版動態(tài)生成的。這樣有利于在分析面頁時(shí),使用較為簡單的方式從網(wǎng)頁中解析數(shù)據(jù)。
除了上述3點(diǎn)技術(shù)方面的因素,在選擇網(wǎng)站時(shí),也應(yīng)當(dāng)盡量選擇那些訪問量較大、產(chǎn)品信息比較齊全的網(wǎng)站。這樣,有利于數(shù)據(jù)完整性?;谏鲜龈饕蛩氐目紤],本文選擇太平洋電腦網(wǎng)(http://$ 例如蘋果Macbook Pro 15(MC373CH/A):
http://product.pconline.com.cn/notebook/apple/411413.html 產(chǎn)品詳細(xì)參數(shù)面頁URL的正則表達(dá)式為:
^http://product.pconline.com.cn/notebook/+[wd]+/d{5,6}_detail.html$ 例如蘋果Macbook Pro 15(MC373CH/A)詳細(xì)參數(shù): http://product.pconline.com.cn/notebook/apple/411413_detail.html 產(chǎn)品頁的產(chǎn)品圖片URL都是以.jpg結(jié)尾。
通過對網(wǎng)站URL分析,可以總結(jié)出我們要抓取的面頁URL的規(guī)律,只要抓取產(chǎn)品面頁和產(chǎn)品詳細(xì)信息面頁及產(chǎn)品圖片即可。因此,要擴(kuò)展Heritrix來實(shí)現(xiàn)上述抓取策略。Heritrix有多個(gè)擴(kuò)展點(diǎn),本文選擇擴(kuò)展FrontierScheduler來抓取特定的內(nèi)容。FrontierScheduler是Heritrix的一個(gè)PostProcessor,它的作用是將Extractor中分析得出的鏈接加入到Frontier中,以待繼續(xù)處理。擴(kuò)展代碼如下:
protected void schedule(CandidateURI caURI){
//取得URI字符串
String url = caURI.toString();try{
//URI選擇策略 //匹配 具體型號url Pattern pattern_model = Pattern.compile(MODEL_URL);Matcher matcher_model = pattern_model.matcher(url);//匹配 型號詳細(xì)參數(shù)url
}
} Pattern pattern_detail = Pattern.compile(DETAIL_URL);Matcher matcher_detail = pattern_detail.matcher(url);//URL是產(chǎn)品面頁/詳細(xì)參數(shù)面頁/jpg圖片/DNS if(//matcher_detail.find()||matcher_model.find()||url.endsWith(“.jpg”)
} e.printStackTrace();||url.indexOf(“dns:”)!=-1){
getController().getFrontier().schedule(caURI);return;}else{ }catch(Exception e){ }finally{ 4.4.3 網(wǎng)頁解析工具HtmlParser 對于抓取到的網(wǎng)頁,需要經(jīng)過解析,提取出需要的信息以便更好的建立索引和創(chuàng)建數(shù)據(jù)庫。本文Html解析器是HtmlParser,HtmlParser是一個(gè)開源的Java庫,它提供接口,支持線程和嵌套的解析Html文本。HtmlParser提供了兩種訪問Html結(jié)點(diǎn)的方法:Visitor模式和Filter模式,本文采用了Filter模式。Filter模式通過設(shè)置一定的過濾條件,對每個(gè)結(jié)點(diǎn)進(jìn)行過濾,返回一個(gè)符合規(guī)則的節(jié)點(diǎn)列表。Org.htmlparser.filters包含所有已經(jīng)實(shí)現(xiàn)的Filter類型,定義了16種Filter。
例如要解析一個(gè)網(wǎng)頁中所有包含圖片的鏈接,分析可得該節(jié)點(diǎn)中具有鏈接標(biāo)簽名”a”,并且它的字節(jié)點(diǎn)中還必須包含圖片標(biāo)簽名”img”,則過濾器的定義為:
NodeFilter filter = new AndFilter(new TagNameFilter(“A”), New HasChildFilter(new TagNameFilter(“IMG”)))4.4.4 網(wǎng)頁信息結(jié)構(gòu)化
在抓取到筆記本產(chǎn)品各種信息的Html文本后,需要用HtmlParser對Html文本解析,得到建立索引所需的各種信息。處理后的的文件如圖4.2所示。
圖4.2 處理后產(chǎn)品的信息格式
從圖中可以看出文件的格式如下:第一行是筆記本品牌(包括中文和英文名稱);第二行是筆記本具體型號;最后一行則是該筆記本的對應(yīng)圖片文件名,圖片名是經(jīng)過Hash后的字符串;其余部分則是該筆記本的詳細(xì)參數(shù)。將所有筆記本產(chǎn)品的信息按上述格式存儲,以便建立索引。
4.5 數(shù)據(jù)庫與索引設(shè)計(jì)
4.5.1 數(shù)據(jù)庫設(shè)計(jì)
本文數(shù)據(jù)庫結(jié)構(gòu)簡單,只有一個(gè)數(shù)據(jù)表來存儲筆記本產(chǎn)品的各種信息,數(shù)據(jù)庫各字段含義如表4.1所示。
表4.1 數(shù)據(jù)庫字段含義
字段名 Id name type content abstractcontent
字段含義 主鍵
品牌名稱,如”蘋果”
型號,如” ibook G4 M9627CH/A” 筆記本產(chǎn)品的詳細(xì)信息
詳細(xì)參數(shù)的摘要,供建立索引時(shí)使用
創(chuàng)建數(shù)據(jù)庫的SQL語句如下: create database searchdb;use searchdb;create table product(id
int AUTO_INCREMENT, name varchar(128), type varchar(128), content varchar(20000), abstractcontent varchar(512),);4.5.2 索引設(shè)計(jì)
在使用Lucene建立索引時(shí),需要定義Lucene的Document格式。索引中的信息應(yīng)當(dāng)盡量少,只要能夠滿足用戶檢索要求就可以了。本文中,為Document構(gòu)建了4個(gè)Field:
//當(dāng)前產(chǎn)品在數(shù)據(jù)庫中的id
Field indentifier = new Field(“id”,id + “",Field.Store.YES, Field.Index.NOT_ANALYZED);//產(chǎn)品的品牌
Field name = new Field(”name“,product.getName(),Field.Store.YES, Field.Index.ANALYZED);//產(chǎn)品型號
Field type = new Field(”type“,product.getType(),Field.Store.YES, Field.Index.ANALYZED);//將筆記本產(chǎn)品的name、type、abstractcontent信息綜合起來,默認(rèn)的檢索域 Field all = new Field(”all“,text,Field.Store.YES, Field.Index.ANALYZED);上述4中Filed中,前3個(gè)與數(shù)據(jù)庫的內(nèi)容有直接的對應(yīng)關(guān)系,而最后一個(gè)Filed則是將name、type這兩個(gè)Filed拼接起來并添加了abstractcontent來進(jìn)行保存,為用戶提供一個(gè)檢索時(shí)的默認(rèn)Filed。這種方式占用了索引空間,但卻避免了使用多域搜索帶來的性能損失,還可提高檢索的全面性。
4.6 web檢索模塊設(shè)計(jì)
web檢索模塊基于SSH設(shè)計(jì)實(shí)現(xiàn),由Struts作為控制器,Spring作為業(yè)務(wù)層,Hibernate作為數(shù)據(jù)持久層,結(jié)構(gòu)如圖4.3所示。
控制器Struts業(yè)務(wù)層SpringSpringAOP持久層HibernateHibernateTemplaterequestActionServletActionFrom數(shù)據(jù)庫responseJSPActionSpringIocHibernateDAO圖4.3 基于SSH的web檢索模塊結(jié)構(gòu)圖
從圖中可以看出,用戶的請求會發(fā)送給ActionServlet,用戶數(shù)據(jù)通過ActionForm Bean傳遞給Action,由Action類來通過Spring的IoC容器訪問Hibernate的DAO,DAO負(fù)責(zé)數(shù)據(jù)庫的交互,然后再返回JSP面頁將查詢結(jié)果進(jìn)行顯示。
第五章 信息檢索系統(tǒng)的實(shí)現(xiàn)
5.1 網(wǎng)頁抓取的實(shí)現(xiàn)
在抓取任務(wù)開始前,需要對抓取的內(nèi)容進(jìn)行詳細(xì)地分析,確定種子,即開始抓取的網(wǎng)頁。本文中為了能盡量獲取全部的產(chǎn)品信息,直接將需要抓取的面頁(包括產(chǎn)品面頁、詳細(xì)參數(shù)面頁、圖片)的URL作為抓取的種子,這就需要找出所有產(chǎn)品的具體URL。在太平洋電腦網(wǎng)上提供了站內(nèi)搜索功能,當(dāng)輸入查詢某品牌的筆記本就能得到站內(nèi)所有該品牌標(biāo)記本的信息的面頁,當(dāng)然面頁中也包含這些筆記本的產(chǎn)品面頁的URL,這就提供了抓取的種子。依次查詢各個(gè)品牌的筆記本,將查詢結(jié)果面頁保存到本地,然后用HtmlParser解析得到其中產(chǎn)品面頁的URl,寫入種子文件。
圖5.1 查詢結(jié)果面頁源代碼
從網(wǎng)頁源代碼中可以發(fā)現(xiàn)解析網(wǎng)頁時(shí)可以得到該品牌所有筆記本產(chǎn)品的產(chǎn)品面頁和詳細(xì)參數(shù)面頁的URL。其中產(chǎn)品詳細(xì)參數(shù)面頁URL的節(jié)點(diǎn)形如:
第三篇:國內(nèi)目前快遞現(xiàn)狀及優(yōu)缺點(diǎn)評價(jià)
?
一、順豐速運(yùn):
順豐速運(yùn)網(wǎng)絡(luò)全部采用自建、自營的方式。有國內(nèi)同城件、國內(nèi)省內(nèi)件、省外件、香港件、即日件、次晨達(dá)、次日件。還可提供寄方支付、到方支付、第三方支付等多種結(jié)算方式。很多公司由于網(wǎng)點(diǎn)不統(tǒng)一,不能發(fā)到付件。即使可以發(fā),收費(fèi)往往也要貴上很多。資費(fèi):首重20元/公斤,續(xù)重10元/公斤。
賠付:最高賠付為運(yùn)費(fèi)的6倍,沒有保價(jià),無保價(jià)的分別,丟失或者破損的賠付是一樣的。
優(yōu)點(diǎn):服務(wù)好,速度快,安全,有獨(dú)立的免費(fèi)包裝袋,員工素質(zhì)高,讓人放心。缺點(diǎn):價(jià)格偏高,網(wǎng)點(diǎn)不夠全面,業(yè)務(wù)范圍多在南方地區(qū)。
順豐速運(yùn)的價(jià)位與郵政EMS相當(dāng),有實(shí)力,雖然去年虧損了好幾億,但還是包得起飛機(jī)。順豐專機(jī),所以派送的速度是又快又好。而且接件與后期操作都相當(dāng)正規(guī),服務(wù)與收費(fèi)成正比。
價(jià)格高:無論是賣家還是買家,網(wǎng)銷網(wǎng)購的都要考慮成本,所以極少有賣家會選擇。
二、申通快遞:
公司分別在全國各省會城市(除臺灣)以及其它大中城市建立起了800多個(gè)分公司,吸收1100余家加盟網(wǎng)點(diǎn),全網(wǎng)絡(luò)有員工2萬多人。主要承接非信函、樣品、大小物件的速遞業(yè)務(wù)。主要經(jīng)營市內(nèi)件和省際件。
資費(fèi):首重15元/1公斤,續(xù)重3元/1公斤。
賠付:丟失賠付:無保價(jià),小于等于1000元;破損賠付:無保價(jià),小于等于300元。優(yōu)點(diǎn):網(wǎng)點(diǎn)廣,速度在4天內(nèi),價(jià)格適中,運(yùn)輸相對安全,很少有丟件,損件的事故。缺點(diǎn):服務(wù)質(zhì)量一般,這個(gè)跟各地方的員工素質(zhì)有關(guān)。
價(jià)位低于順豐,但還是高于其他眾多快遞。而且與其他除順豐以外的快遞相比,其網(wǎng)點(diǎn)分布廣是其一個(gè)重要優(yōu)勢噢,所以申通很牛。價(jià)格就是一口價(jià),不跟你商量。量大到一定程度會給你點(diǎn)優(yōu)惠,不過這點(diǎn)優(yōu)惠與其他家的價(jià)位比起來,真是不讓人看上眼的小恩小惠。申通的速度還是可以。一律走航空。除航空不讓的液體之類,會另有說法。
但從另一個(gè)角度來看,這樣的價(jià)格對其自身的管理可能有好處,沒有內(nèi)部價(jià)格戰(zhàn),價(jià)不亂。
三、圓通快遞:
圓通速遞的服務(wù)涵蓋報(bào)關(guān)、報(bào)檢、海運(yùn)、空運(yùn)進(jìn)出口貨物的運(yùn)輸服務(wù);中轉(zhuǎn)、國際國內(nèi)的多式聯(lián)運(yùn);分撥、倉儲及特種運(yùn)輸?shù)纫幌盗械膶I(yè)物流服務(wù)。提供國內(nèi)件、國際間、限時(shí)服務(wù)。
資費(fèi):首重8元/1公斤,續(xù)重6元/1公斤
賠付:丟失賠付:無保價(jià),賠付金額,小于等于1500元;有保價(jià),保價(jià)率是1%,賠付金額,小于等于10000元;破損賠付:無保價(jià),賠付金額,3-5倍賠運(yùn)費(fèi);有保價(jià),保價(jià)率是1%,賠付金額,小于等于10000元
優(yōu)點(diǎn):價(jià)格便宜,速度在3-4天內(nèi)。
缺點(diǎn):網(wǎng)點(diǎn)不夠廣泛,偶爾有丟件等情況,員工素質(zhì)因人而異。
北方人用著比較多一些,價(jià)位比申通低,是大眾快遞,與其他快遞相當(dāng)。網(wǎng)點(diǎn)也相對可以。
圓通的速度是平價(jià)里相對快的,航空走貨。
四、韻達(dá)快遞:
韻達(dá)是具有中國特色的物流及快遞品牌,結(jié)合中國國情,用科技化和標(biāo)準(zhǔn)化的模式運(yùn)營網(wǎng)絡(luò)。已在全國擁有一千余個(gè)服務(wù)規(guī)范的服務(wù)站點(diǎn),致力于不斷向客戶提供富有創(chuàng)新和滿足客戶不同需求的解決方案。提供國內(nèi)件和同城當(dāng)天件。
資費(fèi):首重10元/1公斤,續(xù)重6元/1公斤
賠付:丟失賠付:無保價(jià),賠付金額,小于等于1000元;有保價(jià),保價(jià)率為1%,賠付金額,小于等于2000元。破損賠付:無保價(jià),賠付金額,3倍運(yùn)費(fèi);有保價(jià),保價(jià)率為1%,賠付金額,小于等于2000元。
優(yōu)點(diǎn):價(jià)格適中,速度一般3-4天。
缺點(diǎn):網(wǎng)點(diǎn)不是很多,服務(wù)質(zhì)量一般。
這個(gè)快遞,一般來說價(jià)位算是平價(jià)的,但發(fā)貨的速度可不夠快噢,經(jīng)常有汽運(yùn)出現(xiàn)。這可不是賣家能掌握滴。其實(shí)也是后來我了解到滴。
韻達(dá)的快遞長處在于江浙,網(wǎng)點(diǎn)真全。
五、中通快遞。
公司的服務(wù)項(xiàng)目有國內(nèi)快遞、國際快遞、物流配送與倉儲等,提供“門到門”服務(wù)和限時(shí)(當(dāng)天件、次晨達(dá)、次日達(dá)等)服務(wù)。同時(shí),開展了電子商務(wù)配送、代收貨款、簽單返回、到付和代取件等增值業(yè)務(wù)。服務(wù)網(wǎng)點(diǎn)近1800個(gè),分撥中心36個(gè),運(yùn)輸、派送車輛5000多輛。平價(jià)快遞,速度一般。沒有太明顯的優(yōu)惠,偏遠(yuǎn)地區(qū)價(jià)更高些。
六、天天快遞
天天快遞網(wǎng)絡(luò)現(xiàn)有20余個(gè)集散中心,快遞網(wǎng)絡(luò)分布在國內(nèi)1200多個(gè)城市,設(shè)有3000多個(gè)網(wǎng)點(diǎn),形成了以珠江三角洲、長江三角洲、環(huán)渤海灣地區(qū)為重點(diǎn)的快遞網(wǎng)絡(luò)布局,為客戶提供全年360天的服務(wù)。
網(wǎng)點(diǎn)少,價(jià)格也沒有什么優(yōu)惠。所以一般除買家指定外,基本沒有用過。
以下說幾種現(xiàn)象:
第一、現(xiàn)在接觸比較多的快遞公司,都是總公司包給地方的承包商,比方說某一城市的。然后這個(gè)承包者又根據(jù)這個(gè)城市的分區(qū),差不每區(qū)再轉(zhuǎn)包一層。而下面這個(gè)每區(qū)的負(fù)責(zé)呢,可以再把自己的片區(qū)再劃化一下,可能大點(diǎn)的就談轉(zhuǎn)包,小的就直接劃給快遞員。由于現(xiàn)在他們爭業(yè)務(wù)量所以常有跨區(qū)取貨的事,對我們來說無所謂,和哪個(gè)合作方便舒服就找誰發(fā)唄。像圓通快遞,一家的不同區(qū)的還來撬過呢。
第二、這里說到快遞員了。他們一般是公司給個(gè)價(jià)位,他們或按一定比例提成,或者自己在上面加價(jià)賺差價(jià)。具體跟下面的承包者管理有關(guān)滴。
他們由于快遞提成的高低,經(jīng)常在各快遞之間互相跳槽。遠(yuǎn)的不說,就近半年,申通負(fù)責(zé)我們這片的兩個(gè)快遞員就跳到圓通快遞了。據(jù)說圓通的提成比較好一些??爝f員一般取的次數(shù)多了,會熟悉起來,遇到一個(gè)責(zé)任感強(qiáng)一些的,你會省心很多。
第三、關(guān)于快遞的服務(wù)。
多數(shù)承包點(diǎn)人手都不是很足,因?yàn)榭爝f員工資不高,所以招人也不方便吧。一般客服都很少,查件也一般都是看網(wǎng)上,與我們自己在網(wǎng)上看的差不多。在件遇到問題時(shí),能主動跟你聯(lián)系的就不錯了。
也是由于人手原因吧,一般發(fā)貨他們都沒功夫給你看到還是不到,所以發(fā)出去不到再說。這點(diǎn)基本都靠你自己把握。不到的處理方式就是退回。一般都不會選擇轉(zhuǎn)發(fā),因?yàn)檗D(zhuǎn)發(fā)基本都只給你轉(zhuǎn)郵局的EMS,大頭才花得起那個(gè)價(jià)呢。當(dāng)然,特殊情況除外。
第四篇:信息革命優(yōu)缺點(diǎn)英文版
電信革命的優(yōu)點(diǎn)
As we all know ,from urban cities to rural areas, Almost everywhere can be seen the wire and some related equipments.This phenomenon is enough to prove that the popularity of telecommunications technology.Telecommunications technology can be used to facilitate people to communicate and learn knowledge at a distance, you do not need to leave home can know all the things.It is convenient for people ’s life.從城市到農(nóng)村,隨處可見鋪設(shè)的電纜及相關(guān)電信設(shè)備,這一現(xiàn)象足以見證電信技術(shù)的普及。利用電信技術(shù)我們可以遠(yuǎn)距離與人交流學(xué)習(xí),可以足不出戶便可知道天下的事,這大大便利了人們的生活。
電信革命的缺點(diǎn)
Of course, in addition to the above advantages.Unavoidably, there are some shortcomings.The phenomenon of fraud become more and more common.Fraud have affected the level of people’s life.Apart from these, not anyone is skillful at telecommunications, upon one’s telecommunication products getting problems, there will be some troubles.當(dāng)然了,除了以上的優(yōu)點(diǎn),不可避免的也會出現(xiàn)一些缺點(diǎn)。這體現(xiàn)在利用電信技術(shù)詐騙的人越來越多了,詐騙會對普通人帶來一定的困擾。另外,懂電信技術(shù)的人并不是普通大眾,一旦自己個(gè)人的電信產(chǎn)品出現(xiàn)問題,這將會是一個(gè)麻煩。自己的觀點(diǎn) Although telecommunications exists disadvantages, I personally support the popularity of telecommunication technology very much.I firmly believe that if everyone of us could try our best to obey rules, all of disgusting problems will be solved.我個(gè)人非常支持電信技術(shù)的普及,盡管它存在一定的缺陷。但我相信,只有我們每個(gè)人都盡到自己的責(zé)任,那些困擾我們的問題都將一一被解決。
第五篇:淺談目前網(wǎng)絡(luò)貿(mào)易的優(yōu)缺點(diǎn)及應(yīng)對策略
淺談目前網(wǎng)絡(luò)貿(mào)易的優(yōu)缺點(diǎn)及應(yīng)對策略
學(xué)號:11141621姓名:張夢舒
摘要:進(jìn)入90年代以后,現(xiàn)代信息網(wǎng)絡(luò)技術(shù)突飛猛進(jìn)地向前發(fā)展,將國際貿(mào)易帶進(jìn)了一個(gè)信息化時(shí)代。隨著計(jì)算機(jī)網(wǎng)絡(luò)、通信技術(shù)的日益發(fā)展和融合,以及互聯(lián)網(wǎng)的普及應(yīng)用和發(fā)展,網(wǎng)絡(luò)貿(mào)易應(yīng)運(yùn)而生。網(wǎng)絡(luò)貿(mào)易推動了國際貿(mào)易向信息化的方向發(fā)展,為國際貿(mào)易的可持續(xù)發(fā)展開辟了一條新的途徑,同時(shí)也帶來了一連串亟須解決的問題。本文就網(wǎng)絡(luò)貿(mào)易的特點(diǎn),分析了網(wǎng)絡(luò)貿(mào)易的優(yōu)缺點(diǎn),并且提出了一些應(yīng)對策略。
關(guān)鍵詞:網(wǎng)絡(luò)貿(mào)易,優(yōu)缺點(diǎn),策略
網(wǎng)絡(luò)貿(mào)易(Internet Trade),就是通過計(jì)算機(jī)網(wǎng)絡(luò)進(jìn)行的商貿(mào)活動。網(wǎng)絡(luò)貿(mào)易是電子商務(wù)的重要組成部分之一,它的整個(gè)交易過程包括交易磋商、簽約、貨物交付、貨款收付等。其交易的產(chǎn)品主要是數(shù)字化產(chǎn)品,如金融服務(wù)、網(wǎng)上娛樂、售票服務(wù)、軟件設(shè)計(jì)、音像書刊、咨詢服務(wù)、信息傳遞等;也有實(shí)物產(chǎn)品交易,其交易磋商、簽約、貨款支付在網(wǎng)上進(jìn)行,實(shí)物交付在具體地點(diǎn)進(jìn)行,即實(shí)現(xiàn)“在線交易,離線供貨”。
一. 網(wǎng)絡(luò)貿(mào)易的特點(diǎn)
(1)貿(mào)易虛擬化
網(wǎng)絡(luò)貿(mào)易開拓了一個(gè)全新的有別于傳統(tǒng)貿(mào)易的貿(mào)易空間,即媒體空間。隨著計(jì)算機(jī)網(wǎng)絡(luò)的迅速發(fā)展,貿(mào)易活動將從以實(shí)體市場的貿(mào)易轉(zhuǎn)向以虛擬市場的貿(mào)易為主,比如虛擬商品市場、虛擬金融市場等虛擬經(jīng)濟(jì)場所和經(jīng)濟(jì)主體。網(wǎng)絡(luò)貿(mào)易的虛擬化,縮減了貿(mào)易的時(shí)間成本、搜索成本、交易成本等,提高了貿(mào)易發(fā)展的效率。不過,應(yīng)該注意的是,這種虛擬化的網(wǎng)絡(luò)貿(mào)易,并不代表沒有貿(mào)易活動,因?yàn)樵谶@種依賴網(wǎng)絡(luò)的虛擬市場上,貿(mào)易活動正在通過網(wǎng)絡(luò)平臺進(jìn)行貿(mào)易交易的實(shí)現(xiàn)和達(dá)成。
(2)貿(mào)易全球化
網(wǎng)絡(luò)具有傳統(tǒng)市場所無法比擬的優(yōu)勢,即它可以縮短人們的空間距離,使得貿(mào)易可以擺脫其地域約束,同時(shí)為資源的全球流動提供了更加可靠有利的市場。這有助于形成全球范圍內(nèi)的國際貿(mào)易大市場,使得國際范圍內(nèi)的資源流動更加充分,提高了資源的有效配置,為實(shí)現(xiàn)經(jīng)濟(jì)全球化創(chuàng)造了良好的環(huán)境和基礎(chǔ)。
二. 網(wǎng)絡(luò)貿(mào)易的優(yōu)點(diǎn)
(1)網(wǎng)絡(luò)貿(mào)易將會大大降低買賣雙方的交易成本。
網(wǎng)絡(luò)貿(mào)易中,買賣雙方通過網(wǎng)絡(luò)直接接觸,無需貿(mào)易中介的參與,減少了交易的中間環(huán)節(jié)。參與交易的各方只需支付較低的網(wǎng)絡(luò)通信和管理費(fèi)用就可獲得,存儲,交換和處理信息,既節(jié)省了資金,又降低了成本。由于Internet是全球性開放網(wǎng)絡(luò),有利于交易雙方獲得“完整信息”,降低了市場上的搜尋成本,減少了交易的不確定性。在網(wǎng)上直接傳遞電子單證,既節(jié)約了紙單證的制作費(fèi)用,又可縮短交單結(jié)匯時(shí)間,加快資金周轉(zhuǎn),節(jié)省利息開支。
(2)網(wǎng)絡(luò)貿(mào)易將會極大地提高工作效率。
現(xiàn)有網(wǎng)絡(luò)技術(shù)實(shí)現(xiàn)了商業(yè)用戶間標(biāo)準(zhǔn)格式文件(如合同、提單、發(fā)票等)的即時(shí)傳送和交換,買賣雙方足不出戶就可在網(wǎng)上直接辦理訂購、談判、簽約、報(bào)關(guān)、報(bào)檢、租船訂艙、繳稅、支付結(jié)算等各項(xiàng)外貿(mào)業(yè)務(wù)手續(xù),大大縮短了交易時(shí)間,使整個(gè)交易非??旖莘奖?,從而帶動了金融、海關(guān)、運(yùn)輸、保險(xiǎn)等有關(guān)部門工作效率的提高。
(3)網(wǎng)絡(luò)貿(mào)易有利于企業(yè)增強(qiáng)競爭地位。
公司和廠商可以申請注冊域名,在Internet網(wǎng)上建立自己的網(wǎng)站,通過網(wǎng)頁介紹產(chǎn)品各方面的信息、勞務(wù)和宣傳企業(yè)形象,有利于擴(kuò)大企業(yè)知名度,開拓海外市場和提高國際競爭力。此外,網(wǎng)絡(luò)貿(mào)易無時(shí)間、地域的限制,并且受自然條件影響小,可以進(jìn)行“全天候交易”,幫助企業(yè)把產(chǎn)品推向全球,這樣不僅增加了貿(mào)易機(jī)會,同時(shí)又有助于及時(shí)、準(zhǔn)確地掌握市場動態(tài),密切同客戶的業(yè)務(wù)聯(lián)系,提高其市場競爭地位。
(4)網(wǎng)絡(luò)貿(mào)易的發(fā)展促進(jìn)了地區(qū)貿(mào)易的發(fā)展
對于一些經(jīng)濟(jì)條件差的地區(qū),由于受到地理?xiàng)l件的約束,交通發(fā)展相對滯后,貿(mào)易發(fā)展緩慢,使得這些地區(qū)的特色商品無法進(jìn)入大城市商品市場進(jìn)行銷售,進(jìn)而使得該地區(qū)的經(jīng)濟(jì)更加落后,地區(qū)貿(mào)易發(fā)展不暢。網(wǎng)絡(luò)貿(mào)易的興起,為這些地區(qū)的貿(mào)易發(fā)展提供了便利,只要這些地區(qū)的計(jì)算機(jī)網(wǎng)絡(luò)得到了發(fā)展,那就有利于這些地區(qū)的商品在網(wǎng)絡(luò)平臺上得以展示給消費(fèi)者,進(jìn)而為其消費(fèi)提供了保障。因此,網(wǎng)絡(luò)貿(mào)易的發(fā)展,為消費(fèi)者了解交通不便地區(qū)商品的特色提供了平臺,為這些商品的區(qū)域貿(mào)易發(fā)展構(gòu)建了銷售渠道,進(jìn)而促進(jìn)了區(qū)域貿(mào)易的快速發(fā)展。
(5)網(wǎng)絡(luò)貿(mào)易能帶動物流運(yùn)輸事業(yè)的發(fā)展
隨著網(wǎng)絡(luò)貿(mào)易的進(jìn)一步深入,以前商品的運(yùn)輸主要通過郵政和貨運(yùn)公司,現(xiàn)在有圓通,申通,順豐等快遞公司應(yīng)運(yùn)加盟。毫無疑問,在未來更長的時(shí)間里,網(wǎng)絡(luò)貿(mào)易將促進(jìn)運(yùn)輸事業(yè)的快速發(fā)展。據(jù)郵政統(tǒng)計(jì),網(wǎng)絡(luò)貿(mào)易已占郵政事業(yè)收入的40%以上,隨著網(wǎng)絡(luò)貿(mào)易的不斷擴(kuò)大,這一比例還將進(jìn)一步增加。
(6)網(wǎng)絡(luò)貿(mào)易的發(fā)展加強(qiáng)了信息的共享。
一方面,網(wǎng)絡(luò)貿(mào)易的發(fā)展為信息產(chǎn)業(yè)拓寬了渠道,信息產(chǎn)業(yè)是傳遞有用信息給需要的人,較之傳統(tǒng)的信息產(chǎn)業(yè)渠道,網(wǎng)絡(luò)渠道更加方便、快捷,成本更低,這使得信息產(chǎn)業(yè)的渠道更加多元化,更加可以滿足經(jīng)濟(jì)的快速發(fā)展。另一方面,網(wǎng)絡(luò)貿(mào)易的發(fā)展,在促進(jìn)信息產(chǎn)業(yè)發(fā)展的同時(shí),使得企業(yè)借助于網(wǎng)絡(luò)平臺,可以把商品信息以更快、更有效的方式傳遞給消費(fèi)者,大大促進(jìn)了產(chǎn)品的推廣力度,為產(chǎn)品營銷提供了更廣闊的平臺,這為企業(yè)形成了潛在的利潤市場。同時(shí),隨著網(wǎng)絡(luò)用戶的增加,在網(wǎng)上進(jìn)行交易的消費(fèi)者逐日增多,這使得企業(yè)以更低的成本獲取更大的效益。
三. 網(wǎng)絡(luò)貿(mào)易的缺點(diǎn)
(1)數(shù)據(jù)難以統(tǒng)計(jì)。
網(wǎng)絡(luò)貿(mào)易借助于網(wǎng)絡(luò)平臺進(jìn)行貿(mào)易交易,對于依靠海關(guān)進(jìn)行統(tǒng)計(jì)貿(mào)易的經(jīng)濟(jì)體來說,網(wǎng)絡(luò)貿(mào)易使得貿(mào)易數(shù)據(jù)比傳統(tǒng)貿(mào)易更加難以統(tǒng)計(jì),它發(fā)生的瞬間性更強(qiáng),因此導(dǎo)致統(tǒng)計(jì)口徑等會出現(xiàn)偏差。與此同時(shí),進(jìn)行貿(mào)易時(shí)存在時(shí)空上的差距,這更使得貿(mào)易雙方的貿(mào)易數(shù)據(jù)在時(shí)間上存在誤差,因此對于統(tǒng)計(jì)一國與他國的貿(mào)易情況,會存在一定的誤差。
(2)調(diào)控難度加大。
網(wǎng)絡(luò)貿(mào)易的全球化,使各國的法律制度很難對貿(mào)易交易進(jìn)行統(tǒng)一的規(guī)范。此外,借助于網(wǎng)絡(luò),信息的流動較之以前更加方便,以及信息流動導(dǎo)致了全球金融市場一體化,加劇了國際資本的流動,進(jìn)而促進(jìn)了跨國公司在全球范圍內(nèi)進(jìn)行融資,資本在充分流動的時(shí)候,也加劇了要素的全球性流動,這種全球范圍內(nèi)的資源流動使得政府的宏觀調(diào)控難度加大。
(3)信息的共享性導(dǎo)致市場的不正當(dāng)競爭。
網(wǎng)絡(luò)的快速發(fā)展,使得任何企業(yè)更加容易獲得一切與貿(mào)易合作有關(guān)的信息、資源、技術(shù)等。在全球市場上,各跨國公司在網(wǎng)絡(luò)貿(mào)易中的起點(diǎn)差距不大,即各
方的實(shí)力在貿(mào)易中有可能是均等的,那么跨國公司在面臨廣闊的市場時(shí),就會面對更多的競爭者,這些競爭者為了爭奪全球市場,勢必會加劇公司之間的競爭。與此同時(shí),當(dāng)跨國公司在從事網(wǎng)絡(luò)貿(mào)易時(shí),面臨許多商機(jī)和信息,這有可能會在競爭對手前暴露自己的經(jīng)濟(jì)實(shí)力。而在網(wǎng)絡(luò)貿(mào)易中,經(jīng)濟(jì)主體不需要接近對方,只需要通過網(wǎng)絡(luò)就可以獲得對方的商業(yè)機(jī)密,加之網(wǎng)絡(luò)的安全性有所欠缺,使得公司的重要信息等系統(tǒng)有可能被他人破壞和竊取,這會加大公司經(jīng)營的風(fēng)險(xiǎn)。
(4)網(wǎng)絡(luò)貿(mào)易時(shí)存在誠信問題
與傳統(tǒng)貿(mào)易不同的是,網(wǎng)絡(luò)貿(mào)易對貿(mào)易雙方的誠信要求更高。例如,團(tuán)購網(wǎng)的興起,使得網(wǎng)上消費(fèi)成為人們的最愛,可是在這期間,有不少消費(fèi)者因商家誠信缺失而蒙受了很大的經(jīng)濟(jì)損失,更讓消費(fèi)者對網(wǎng)上交易難以取信。對于全球范圍的網(wǎng)絡(luò)貿(mào)易來說,買賣雙方的誠信就更加重要,一旦一方受害,此金額要比個(gè)人消費(fèi)者來說大得多,再者,全球性的網(wǎng)絡(luò)貿(mào)易,其追蹤和控訴非常難,所以一旦貿(mào)易一方遭到另一方欺騙,那后果是很可怕的。
四. 針對網(wǎng)絡(luò)貿(mào)易的應(yīng)對策略
(1)加快信息基礎(chǔ)設(shè)施投資和建設(shè)。
網(wǎng)絡(luò)貿(mào)易要想得到迅速發(fā)展,必須首先大力發(fā)展國際互聯(lián)網(wǎng)服務(wù),以便實(shí)質(zhì)性地提高網(wǎng)絡(luò)的普及率和應(yīng)用水平,以便消費(fèi)者真正獲得更精彩、更準(zhǔn)確、更全面的信息,進(jìn)而得到比傳統(tǒng)銷售渠道更加經(jīng)濟(jì)實(shí)惠的商品和服務(wù)。這就要求政府和企業(yè)共同努力完善網(wǎng)絡(luò)基礎(chǔ)設(shè)施建設(shè):一是加大資金、人力投入,為網(wǎng)絡(luò)基礎(chǔ)設(shè)施建設(shè)提供保障;二是給予政策優(yōu)惠,提供融資優(yōu)惠服務(wù),為企業(yè)完善國際互聯(lián)網(wǎng)提供融資渠道;三是盡量做到設(shè)施齊全,這樣可以提高網(wǎng)絡(luò)貿(mào)易的效率,也可以提高網(wǎng)絡(luò)貿(mào)易的安全性。
(3)加強(qiáng)對網(wǎng)絡(luò)貿(mào)易的研究,規(guī)范網(wǎng)絡(luò)貿(mào)易的發(fā)展。
網(wǎng)絡(luò)貿(mào)易是一種全新的商業(yè)領(lǐng)域,具有廣闊的發(fā)展前景,但同時(shí)也帶來了不少新的問題,如交易的安全性、網(wǎng)絡(luò)貿(mào)易的征免稅、知識產(chǎn)權(quán)的保護(hù)、電子合同的有效性及糾紛的處理等等。這些問題的解決直接影響到網(wǎng)絡(luò)貿(mào)易的發(fā)展,而且由于網(wǎng)絡(luò)貿(mào)易的發(fā)展速度很快,業(yè)務(wù)方式?jīng)]有最終定型。在其發(fā)展過程中既有本身的新進(jìn)展,又有與現(xiàn)有體制的沖突,這給規(guī)范網(wǎng)絡(luò)貿(mào)易的發(fā)展帶來一定的困難。因此,必須對市場的發(fā)展保持高度的敏感,加強(qiáng)對網(wǎng)絡(luò)貿(mào)易的研究,制訂和完善相應(yīng)的政策、標(biāo)準(zhǔn)、法律和法規(guī),保證和規(guī)范網(wǎng)絡(luò)貿(mào)易在我國的健康發(fā)展。
(4)網(wǎng)絡(luò)貿(mào)易相關(guān)的法律法規(guī)
目前我們迫切需要解決的問題是,完善網(wǎng)絡(luò)貿(mào)易的相關(guān)法律,以解決在網(wǎng)上進(jìn)行貿(mào)易時(shí)所發(fā)生的貿(mào)易糾紛。此外,還必須要完善與網(wǎng)絡(luò)貿(mào)易相關(guān)的電子支付制度等,以有效地規(guī)范網(wǎng)絡(luò)貿(mào)易,并使其順利進(jìn)行。最重要的是,在與他國進(jìn)行網(wǎng)絡(luò)貿(mào)易時(shí),一定要密切關(guān)注網(wǎng)絡(luò)貿(mào)易的進(jìn)展情況,牽扯外國公司的網(wǎng)絡(luò)貿(mào)易比較復(fù)雜,加之缺乏全球性統(tǒng)一的有關(guān)網(wǎng)絡(luò)貿(mào)易的法律,所以要做好隨時(shí)頒布相應(yīng)的政策和法律條例。
五.總結(jié)
總之,網(wǎng)絡(luò)貿(mào)易的興起,是國際貿(mào)易領(lǐng)域里一場深刻的商業(yè)革命。在網(wǎng)絡(luò)貿(mào)易出現(xiàn)的今天,國際貿(mào)易正發(fā)生著巨大變化,不僅從貿(mào)易場所,主客體及運(yùn)行發(fā)生變化,而且由網(wǎng)絡(luò)所帶來的信息貿(mào)易的比重也飛速增長。此外,隨著國際網(wǎng)絡(luò)制度創(chuàng)新速度的加陜,相信國際貿(mào)易以網(wǎng)絡(luò)貿(mào)易形態(tài)進(jìn)行將取得更快更好的發(fā)展。


文檔為doc格式
聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻(xiàn)自行上傳,本網(wǎng)站不擁有所有權(quán),未作人工編輯處理,也不承擔(dān)相關(guān)法律責(zé)任。如果您發(fā)現(xiàn)有涉嫌版權(quán)的內(nèi)容,歡迎發(fā)送郵件至:645879355@qq.com 進(jìn)行舉報(bào),并提供相關(guān)證據(jù),工作人員會在5個(gè)工作日內(nèi)聯(lián)系你,一經(jīng)查實(shí),本站將立刻刪除涉嫌侵權(quán)內(nèi)容。
LIB2.0中關(guān)于高校圖書館信息檢索系統(tǒng)的探索(共五則范文)
一、高校圖書館信息檢索系統(tǒng)的現(xiàn)狀隨著計(jì)算機(jī)技術(shù)的高速發(fā)展,圖書館信息檢索系統(tǒng)已經(jīng)完成從手工方式向計(jì)算機(jī)方式的轉(zhuǎn)變。讀者在信息檢索系統(tǒng)中輸入關(guān)鍵詞,信息檢索系統(tǒng)從館藏......
插件名稱 目前版本 信息和說明
插件名稱 目前版本 信息和說明 2D3 http://004km.cn/ Boujou 3.0 強(qiáng)大的攝像機(jī)運(yùn)動信息跟蹤軟件,支持Ae調(diào)用。(常見的1.3版在Ae5.5下可用,新版暫沒有條件測試) Alie......
比較研究國內(nèi)大學(xué)圖書館書目檢索系統(tǒng)
書目檢索(BibliographicRetrieval)是以文獻(xiàn)線索為檢索對象的信息檢索。檢索系統(tǒng)存儲的是以二次信息(目錄、索弓丨、文摘等)為對象的信息,它們是女獻(xiàn)信息的外部特征與內(nèi)容特征......
《水利水電技術(shù)標(biāo)準(zhǔn)全文檢索系統(tǒng)》2013年第一次升級
《水利水電技術(shù)標(biāo)準(zhǔn)全文檢索系統(tǒng)》 2013年第一次升級更新《水利水電技術(shù)標(biāo)準(zhǔn)全文檢索系統(tǒng)》自去年開始在我院局域網(wǎng)上運(yùn)行,日前,對該全文檢索系統(tǒng)進(jìn)行了2013年第一次升級更新......
優(yōu)缺點(diǎn)
優(yōu)缺點(diǎn): 優(yōu)點(diǎn)1:對工作很有熱情, 每天都要求自己保持干勁十足的樣子,做事親力親為,要求把事情做到最好。 缺點(diǎn):有時(shí)候心腸太軟。 盡管好心腸可以被說成是一個(gè)優(yōu)點(diǎn), 但是作為管理者......
優(yōu)缺點(diǎn)
1、 優(yōu)點(diǎn):關(guān)心集體、關(guān)心同學(xué) 缺點(diǎn):不善于言談 2、 優(yōu)點(diǎn):對工作認(rèn)真負(fù)責(zé),具有創(chuàng)新精神 缺點(diǎn):做事不夠細(xì)心 3、 優(yōu)點(diǎn):容易相處,能吃苦 缺點(diǎn):不夠自信 4、 優(yōu)點(diǎn):勤奮好學(xué),熱心幫助同學(xué)......
優(yōu)缺點(diǎn)
優(yōu)點(diǎn): (1)能夠認(rèn)真學(xué)習(xí)黨的路線方針政策,與黨中央保持一致,認(rèn)真學(xué)習(xí)黨的十七大精神和各個(gè)會議的重要內(nèi)容,深入學(xué)習(xí)科學(xué)發(fā)展觀,政治方面把握、辨別力、敏銳性等。 (2)學(xué)習(xí)刻苦努力,成績......
優(yōu)缺點(diǎn)材料
本人敢于接受各種挑戰(zhàn),勇于堅(jiān)持,個(gè)性開朗,與人相處融洽,表達(dá)能力較強(qiáng),有很強(qiáng)的上進(jìn)心,思想積極,做事認(rèn)真、主動、有條理。政治思想上,與黨中央保持一致,有較高的政治敏銳性和立場堅(jiān)定......