欧美色欧美亚洲高清在线观看,国产特黄特色a级在线视频,国产一区视频一区欧美,亚洲成a 人在线观看中文

  1. <ul id="fwlom"></ul>

    <object id="fwlom"></object>

    <span id="fwlom"></span><dfn id="fwlom"></dfn>

      <object id="fwlom"></object>

      網(wǎng)絡(luò)搜索引擎檢索技巧小結(jié)

      時(shí)間:2019-05-13 19:28:54下載本文作者:會(huì)員上傳
      簡(jiǎn)介:寫寫幫文庫小編為你整理了多篇相關(guān)的《網(wǎng)絡(luò)搜索引擎檢索技巧小結(jié)》,但愿對(duì)你工作學(xué)習(xí)有幫助,當(dāng)然你在寫寫幫文庫還可以找到更多《網(wǎng)絡(luò)搜索引擎檢索技巧小結(jié)》。

      第一篇:網(wǎng)絡(luò)搜索引擎檢索技巧小結(jié)

      網(wǎng)上搜索資料的技巧心得總結(jié)

      [摘要]隨著信息技術(shù)的發(fā)展,網(wǎng)絡(luò)的迅速普及,搜索引擎在網(wǎng)絡(luò)用戶的生活中扮演著越來越重要的地位,了解并能熟練使用搜索引擎成為大眾的必修課。對(duì)搜索引擎的基本知識(shí)和種類作簡(jiǎn)要介紹,并結(jié)合親身實(shí)踐介紹幾種實(shí)用的搜索技巧。[關(guān)鍵詞]搜索引擎 種類 技巧

      很多人現(xiàn)在都是活在網(wǎng)上的,而在網(wǎng)上搜索資料更是每日必做的功課。在這里跟大家分享一些粗淺的搜索資料上的技巧和心得,先來一句話總結(jié):精選搜索引擎,用其利者,避其不善!具體細(xì)分如下:

      1、分析狀況,思考一下網(wǎng)搜是不是最快最合適的方式

      我估計(jì)不少人搜東西一般首選百度、Google等這些搜索引擎,直接輸入,一堆資料蜂擁而上。但是在海量搜索結(jié)果中精確撈出所需要的結(jié)果,就得有一定功力了。最恐怖的不是海量篩選,而是沒搜到自己想要的!

      百度、Google再神通,也搜不到網(wǎng)上沒有的內(nèi)容,有些內(nèi)容網(wǎng)上雖有,卻成為漏網(wǎng)之魚。所以在使用搜索引擎搜索前,該先花幾秒種想想:我要找的網(wǎng)上有嗎?如果有,可能在哪里,是什么樣子?含有哪些關(guān)鍵字?

      有些資料你根本用不著上網(wǎng),比如要找某公司某政府部門電話,打114查詢更省事,比搜索引擎快得多,你只要知道了一個(gè)電話號(hào)碼,就能問出一串相關(guān)的,何苦在網(wǎng)上費(fèi)勁兒找呢?

      還有些問題可能你想不到合適關(guān)鍵字搜索,或不能直接用搜索引擎搜到,那你不妨嘗試向精通這個(gè)問題的朋友請(qǐng)教,或者上這方面熱門論壇來問,要相信網(wǎng)友中臥虎藏龍?。∵@種方法也比較省事兒。

      要記住,網(wǎng)絡(luò)不是你尋找資料的唯一途徑,你身邊的朋友、老師、記者、其他媒體同仁都是一定程度上的“圖書館、資料庫”,當(dāng)然也別忘了書籍,必要時(shí)跑趟附近圖書館,找些報(bào)紙。圖書來翻,成噸信息也會(huì)到手。

      2、根據(jù)各搜索引擎特點(diǎn),選擇恰當(dāng)搜索引擎

      選不對(duì)搜索引擎,就想選了不合腳的鞋一樣,能走路,但艱辛痛苦,終于也跑不快走不遠(yuǎn)。使用搜索引擎首先要了解各種搜索引擎特點(diǎn),涇渭分明,否則你可能浪費(fèi)大量時(shí)間。這次搜索,你應(yīng)該使用百度還是Yahoo? Google還是百度? 分析你的需求,選根據(jù)需求找擁有相應(yīng)功能優(yōu)勢(shì)的搜索引擎。這里介紹一些:(1)從行業(yè)入手查找,比較好用的是“百度產(chǎn)品大全”(點(diǎn)擊首頁“更多”選項(xiàng)即可):行業(yè)報(bào)告——各行業(yè)官方報(bào)告/評(píng)定、專家解讀、行業(yè)與單個(gè)品牌市場(chǎng)綜述/分析、行業(yè)與單個(gè)品牌數(shù)據(jù)、過往新聞。當(dāng)然這個(gè)不乏廣告成分,所以需要鑒別,當(dāng)心受騙。

      (2)想找特定領(lǐng)域的人了解情況,想找合適采訪對(duì)象,如專家學(xué)者、老一輩,想先熟悉某個(gè)領(lǐng)域或了解某個(gè)城市、歷史、詞條??這些比較細(xì)致的東西,可以用“百度百科”,網(wǎng)友們集體貢獻(xiàn)的智慧是無窮的,而且網(wǎng)友的料也是無窮的,你往往能有意外收獲。另外wikipedia(維基百科)也是巨型資料庫,而且更新很快,如果有時(shí)打不開,可以用代理服務(wù)器上。

      (3)Google有一個(gè)實(shí)用搜索功能是“大學(xué)搜索”,要知道現(xiàn)在多數(shù)有點(diǎn)名的所謂專家學(xué)者都沒少在大學(xué)掛職,各種研究所、實(shí)驗(yàn)室、官方組織的這個(gè)那個(gè)不少也扎根大學(xué),而大學(xué)又是產(chǎn)生思想文化的重要陣地。用這個(gè)搜索可以一網(wǎng)打盡和某所大學(xué)有關(guān)的所有東東。

      (4)現(xiàn)在有一些新開發(fā)的搜索引擎,它們可以對(duì)網(wǎng)頁庫中的某類專門的信息進(jìn)行一次整合。有人稱之為:元搜索引擎。這種搜索引擎的特點(diǎn)是大大減少了你整合資料的時(shí)間。

      比如比比貓(Bbmao)。這個(gè)搜索引擎的特點(diǎn)是:自動(dòng)分類整理、自動(dòng)去掉重復(fù)結(jié)果、匯集五大搜索引擎結(jié)果。智能分類,你可能在分類中發(fā)現(xiàn)一些你不曾想到的東西。

      不過元搜索是不是好用,可能仁者見仁智者見智,但是只要適應(yīng)了這種新方式,會(huì)給你帶來很多方便。

      3、設(shè)計(jì)關(guān)鍵詞

      關(guān)鍵詞就像買衣服,你到服裝店里跟導(dǎo)購說“我要買衣服”,這就是廢話,服裝店難不成還賣電腦。

      但如果你說“我想看新款冬裝”,導(dǎo)購馬上就會(huì)帶你看到你想看的。在這里“新款”“冬裝”就是關(guān)鍵詞。所以,使用搜索引擎要避免大而空的關(guān)鍵詞,它不知道你要找啥,就可能返回很多莫名其妙結(jié)果。

      因此需要習(xí)慣多關(guān)鍵詞搜索,一般情況下兩個(gè)關(guān)鍵詞搜索就夠了,注意關(guān)鍵詞與關(guān)鍵詞之間以空格隔開。你可以先用簡(jiǎn)單關(guān)鍵詞測(cè)試,不忙著仔細(xì)查看搜索結(jié)果,而先從搜索結(jié)果頁面里尋找更多信息,(如果使用元搜索引擎,注意看“分類結(jié)果”)再設(shè)計(jì)一個(gè)更好的關(guān)鍵詞重搜,這樣重復(fù)幾次后,就能設(shè)計(jì)出很棒的關(guān)鍵詞,也就能搜索到滿意結(jié)果了。

      4、學(xué)會(huì)使用邏輯符號(hào)

      搜索引擎基本上都支持附加邏輯命令查詢。+ 北京+旅游 表示搜索包含所有北京和旅游這兩個(gè)詞組的頁面,不過現(xiàn)在基本用不著這個(gè)了,一般敲個(gè)空格就OK了-“-”可去除無關(guān)搜索結(jié)果,提高搜索結(jié)果相關(guān)性。比如,你要找“青島”的城市信息,輸入“青島”卻找搜到一堆“青島啤酒”新聞,在發(fā)現(xiàn)這些新聞的共同特征是“啤酒”后,輸入“青島 –啤酒”來搜索,就不會(huì)再有啤酒煩你了。

      “”

      利用雙引號(hào),來查詢完全符合關(guān)鍵字串的網(wǎng)站。例如:鍵入“莎士比亞喜劇”,會(huì)找出包含完整莎士比亞喜劇詞組的頁面。這種查詢方法要求用一對(duì)半角的雙引號(hào)來把關(guān)鍵字包括起來。

      5、告別錯(cuò)別字

      細(xì)節(jié)決定成敗,這老話也適用在搜索上。輸入的關(guān)鍵詞有錯(cuò)別字,會(huì)影響搜索準(zhǔn)確性。光“蔡依林”網(wǎng)上就有“蔡依靈”“蔡依琳”“蔡依玲”等眾多版本,你指望這樣的關(guān)鍵詞搜到些啥?所以發(fā)揚(yáng)你深厚的中文功底吧,別讓錯(cuò)別字害了。

      6、別逗留在錯(cuò)誤地方

      最近嫦娥在奔月,你要想看最新消息就別在搜索引擎上費(fèi)勁了,各搜索引擎的信息滯后周期從一周到一月不等,所以找最新內(nèi)容應(yīng)該去看新聞,用搜索引擎找不到最新內(nèi)容(指網(wǎng)頁)。不過專門的新聞內(nèi)容搜索可以用。另外,搜索引擎對(duì)動(dòng)態(tài)內(nèi)容,如:論壇、數(shù)據(jù)庫內(nèi)容,以及帶frame結(jié)構(gòu)的網(wǎng)頁檢索能力較弱,所以這類信息也不適合用搜索引擎搜索,而是應(yīng)該去相關(guān)的網(wǎng)站尋找,當(dāng)然,尋找相關(guān)網(wǎng)站的任務(wù)搜索引擎是當(dāng)仁不讓的。

      7、英文搜索首選Google(注意最好是Google英文版,而不是“谷歌”哦,還有g(shù).cn也可以用了),其次Yahoo

      8、中文搜索優(yōu)先百度,在中文領(lǐng)悟上,百度還是很老道的

      9、資料齊全性、廣泛性、時(shí)效性當(dāng)推Google,但是海量檢索的郁悶也是從Google比較多

      10、官網(wǎng)

      11、熟用提供網(wǎng)址導(dǎo)航的網(wǎng)站:典型的是hao123

      12、不要忽視知名論壇的力量,天涯、西祠、貓撲都是可利用資源

      13、博客也別忘了。尤其是名人博客 最后一點(diǎn)特別重要!不要放棄!

      可能有時(shí)你有這樣的感覺,你已盡全力搜索,但依然沒有找到需要的答案。這時(shí)千萬不要放棄,仔細(xì)回顧你的搜索過程,也許只要修正一個(gè)小差錯(cuò),一個(gè)看上去毫無希望的搜索,很有可能在改變搜索策略后獲得成功。決心、耐心和信心,你肯定可以!

      第二篇:網(wǎng)絡(luò)搜索引擎實(shí)驗(yàn)報(bào)告

      實(shí)驗(yàn)名稱:

      網(wǎng)絡(luò)搜索引擎營銷-我們熟悉的搜索引擎有哪些我們所不熟悉的內(nèi)容

      

      實(shí)驗(yàn)?zāi)康模?/p>

      讓學(xué)生通過訪問百度和Google,認(rèn)真了解和學(xué)習(xí)網(wǎng)絡(luò)搜索引擎怎么幫助企業(yè)推廣,從網(wǎng)絡(luò)營銷的角度重新認(rèn)識(shí)互聯(lián)網(wǎng),思考如何讓企業(yè)開展最適合自己的網(wǎng)絡(luò)營銷。

      實(shí)驗(yàn)內(nèi)容和步驟:

      1)訪問.cn,2)了解什么是 Google Adwords,什么是Google AdSense。

      3)訪問

      4)了解什么是 百度的競(jìng)價(jià)排名。

      5)比較百度和Google在同樣利用搜索引擎為企業(yè)做推廣這個(gè)流程,他們的相同點(diǎn)和不同點(diǎn)。

      6)怎樣用Google或者百度來為該釀造葡萄酒公司做廣告。

      7)假如你所在的公司是身處葡萄酒之鄉(xiāng)的一個(gè)釀造葡萄酒的小公司,請(qǐng)你思考用什么樣的方式可以開展網(wǎng)絡(luò)營銷,能花費(fèi)最少,收效最大。

      實(shí)驗(yàn)結(jié)論:

      Google AdWords,是一種在 Google 及其廣告合作伙伴的網(wǎng)站上快捷簡(jiǎn)便地刊登廣告的方式,無論廣告預(yù)算多少都可充分享受其高效廣告服務(wù)。Google AdSense 是一項(xiàng)免費(fèi)的廣告計(jì)劃,通過它在線發(fā)布商可以利用種類繁多的在線內(nèi)容來展示具有相關(guān)性的廣告并獲得收益。

      百度競(jìng)價(jià)排名是把企業(yè)的產(chǎn)品、服務(wù)等通過以關(guān)鍵詞的形式在百度搜索引擎平臺(tái)上作推廣,它是一種按效果付費(fèi)的新型而成熟的搜索引擎廣告。用少量的投入就可以給企業(yè)帶來大量潛在客戶,有效提升企業(yè)銷售額。企業(yè)在購買該項(xiàng)服務(wù)后,通過注冊(cè)一定數(shù)量的關(guān)鍵詞,其推廣信息就會(huì)率先出現(xiàn)在網(wǎng)民相應(yīng)的搜索結(jié)果中。

      百度和Google為企業(yè)做推廣流程相同點(diǎn):首先,在中國,它們的搜索量大、覆蓋范圍廣,都要通過對(duì)關(guān)鍵字進(jìn)行搜索;其次,它們的廣告都是按點(diǎn)擊次數(shù)收費(fèi),不點(diǎn)擊不收費(fèi);再次,它們的針對(duì)性都很強(qiáng),生意成功的機(jī)率大。不同點(diǎn):

      1、覆蓋范圍:Google覆蓋全球,在Google上做廣告意味著在全世界進(jìn)行了推廣,而百度只是中文搜索引擎,推廣范圍在中國。

      2、競(jìng)價(jià)排名規(guī)則:百度的競(jìng)價(jià)排名大致是以出價(jià)為第一標(biāo)準(zhǔn)的,誰出的點(diǎn)擊價(jià)格高誰就在前面,如果出價(jià)相當(dāng)則比較推廣質(zhì)量度。Google的排名重要影響因素有:網(wǎng)站的權(quán)重性、內(nèi)容的原創(chuàng)性、關(guān)鍵詞的密度、時(shí)間的要素、收錄升級(jí)次序、網(wǎng)站的創(chuàng)建時(shí)間。

      3、收費(fèi)標(biāo)準(zhǔn):競(jìng)價(jià)排名推廣費(fèi)最低預(yù)付金為5000元,專業(yè)服務(wù)費(fèi)600元/年;Google AdWords 關(guān)鍵字廣告首次預(yù)存廣告費(fèi)最低為 3500 元,續(xù)費(fèi)最低預(yù)存廣告費(fèi)為2000元,代理商服務(wù)費(fèi)不低于廣告費(fèi)的20%,最低開戶費(fèi)600元。

      用百度為釀造葡萄酒廠做廣告:首先,建立葡萄酒廠的網(wǎng)站;其次,為企業(yè)做百度推廣(百度推廣流程:交納點(diǎn)擊費(fèi)—注冊(cè)賬號(hào)—提交產(chǎn)品關(guān)鍵字—開通服務(wù),自主管理),提高網(wǎng)站的知名度。營銷方法:在百度上為葡萄酒廠做推廣,提升公司的競(jìng)價(jià)排名。建立公司網(wǎng)頁,讓顧客從百度上能了解本廠及產(chǎn)品。在本廠網(wǎng)站里可以貼上本廠環(huán)境及葡萄酒的圖片;對(duì)本廠做一個(gè)詳細(xì)描述,對(duì)葡萄酒進(jìn)行描述,注明其主要效用及適合場(chǎng)合,讓顧客較易進(jìn)行選擇;創(chuàng)建貼吧和論壇,提供葡萄酒交流平臺(tái);制作葡萄酒的視頻,以樂趣健康等為主題,在網(wǎng)上吸引起網(wǎng)民的注意,并引起其轉(zhuǎn)載、分享。

      第三篇:信息檢索與搜索引擎課程報(bào)告

      《信息檢索搜索引擎技術(shù)》

      期末考試報(bào)告

      學(xué) 期:2016-2017學(xué)年第一學(xué)期

      任課教師:毛存禮 專業(yè)年級(jí): 計(jì)科133 學(xué) 號(hào):201310405339、201310405326、201310405330、201310405325 學(xué)生姓名:李然、毛子銘、張倩、黃楓

      目錄

      一、系統(tǒng)概述................................................................................................................................3

      二、系統(tǒng)需求分析........................................................................................................................3 2.1功能需求分析....................................................................................................................3

      三、程序?qū)崿F(xiàn)................................................................................................................................4 3.1 爬蟲的實(shí)現(xiàn).......................................................................................................................4 3.1.1 對(duì)網(wǎng)頁進(jìn)行分析...................................................................................................4 3.1.2編寫爬蟲................................................................................................................5 3.2索引的實(shí)現(xiàn)........................................................................................................................7 3.2.1分詞的實(shí)現(xiàn)............................................................................................................7 3.2.2索引的建立............................................................................................................8 3.2.3檢索索引................................................................................................................9 3.3向量空間模型的實(shí)現(xiàn)......................................................................................................10 3.3.1向量空間模型概述..............................................................................................10 3.3.2建立向量空間模型..............................................................................................11 3.4利用Lucene打分機(jī)制對(duì)文檔打分................................................................................13

      四、測(cè)試......................................................................................................................................14

      五、心得體會(huì)..............................................................................................................................17

      一、系統(tǒng)概述

      隨著互聯(lián)網(wǎng)的迅猛發(fā)展、WEB信息的增加,用戶要在信息海洋里查找自己所需的信息,就像大海撈針一樣,搜索引擎技術(shù)恰好解決了這一難題。搜索引擎是指互聯(lián)網(wǎng)上專門提供檢索服務(wù)的一類網(wǎng)站,這些站點(diǎn)的服務(wù)器通過網(wǎng)絡(luò)搜索軟件或網(wǎng)絡(luò)登錄等方式,將Intenet上大量網(wǎng)站的頁面信息收集到本地,經(jīng)過加工處理建立信息數(shù)據(jù)庫和索引數(shù)據(jù)庫,從而對(duì)用戶提出的各種檢索做出響應(yīng),提供用戶所需的信息或相關(guān)指針。

      用戶的檢索途徑主要包括自由詞全文檢索、關(guān)鍵詞檢索、分類檢索及其他特殊信息的檢索。本系統(tǒng)基于HTMLUNIT框架,構(gòu)建爬蟲,基于LUCENE框架,構(gòu)建索引,利用向量空間模型向量化表示文檔間的相關(guān)性,利用LUCENE給相關(guān)文檔打分。

      二、系統(tǒng)需求分析

      2.1功能需求分析

      該系統(tǒng)分為四個(gè)功能模塊:

      (1)爬蟲模塊(2)索引模塊(3)向量化表示模塊(4)打分模塊 具體實(shí)現(xiàn)分工如下:

      ①爬蟲模塊:該模塊采用Htmlunit框架,主要負(fù)責(zé)爬取網(wǎng)頁內(nèi)容,在本地建立文檔庫,以便于索引功能模塊,將文檔庫里的文檔內(nèi)容建立成索引。(毛子銘所做)

      ②索引模塊:該模塊采用Lucene框架,功能分為兩塊:一是建立索引,將爬取的內(nèi)容建立成索引。二是檢索索引,即提供給用戶檢索索引。(張倩所做)

      ③向量化表示模塊:該模塊采用向量空間模型,其功能是將查詢文本和文檔向量化表示,以一種直觀的表示方法,展示出文檔間的相似度。(李然、黃楓合做)

      ④打分模塊:該模塊采用Lucene打分系統(tǒng),計(jì)算查詢文本和文檔的相似度,并對(duì)其文檔打分。(李然、黃楓合做)

      三、程序?qū)崿F(xiàn)

      3.1 爬蟲的實(shí)現(xiàn)

      3.1.1 對(duì)網(wǎng)頁進(jìn)行分析

      (1)我們首先,對(duì)網(wǎng)頁進(jìn)行分析,昆工新聞上每一則新聞,都有相應(yīng)的鏈接,通過點(diǎn)擊鏈接查看相應(yīng)的新聞。

      <1>昆工新聞網(wǎng)頁截圖

      <2>新聞內(nèi)容截圖

      (2)在瀏覽器中,查看新聞網(wǎng)的代碼,確定我們所需要的內(nèi)容并用XPATH表達(dá)式定位其內(nèi)容。

      <3>新聞代碼截圖

      3.1.2編寫爬蟲

      (1)在這里,我們使用了HtmlUnit作為我們爬蟲的框架,并指定內(nèi)容,對(duì)昆工新聞網(wǎng)進(jìn)行爬取。

      <4> 部分代碼展示

      (2)編寫XPATH表達(dá)式,定位所抓取的內(nèi)容,在爬取過程中,首先要找到新聞的標(biāo)題,然后,再模擬點(diǎn)擊標(biāo)題的動(dòng)作,進(jìn)入新聞頁面。

      (3)爬取內(nèi)容,并將其寫入文本文檔中。

      <5> 寫入文檔

      <6>爬取內(nèi)容

      3.2索引的實(shí)現(xiàn)

      3.2.1分詞的實(shí)現(xiàn)

      (1)在建立索引之前,分詞是必不可少的步驟,我們所采用的是基于Lucene框架的IK分詞技術(shù)分詞。

      <7> 部分代碼展示

      (2)對(duì)爬取的內(nèi)容,進(jìn)行分詞測(cè)試。

      <9>測(cè)試

      3.2.2索引的建立

      (1)索引的建立,我們也是基于Lucene框架建立的倒排索引,分詞技術(shù)的不同索引的差別也是很大,因此,分詞技術(shù)的選取一定要合理。

      <10> 部分代碼展示

      3.2.3檢索索引

      (1)在這里,我們對(duì)爬取好的內(nèi)容,已經(jīng)建立好了索引,我們分別測(cè)試了“宇宙”、“人民”這兩關(guān)鍵詞進(jìn)行檢索??梢钥匆姡稀叭嗣瘛边@個(gè)關(guān)鍵詞的文檔有2個(gè),符合“宇宙”這個(gè)關(guān)鍵詞的文檔不存在。

      <12> 索引

      <13> 索引結(jié)果

      3.3向量空間模型的實(shí)現(xiàn)

      3.3.1向量空間模型概述

      向量空間模型將文檔映射為一個(gè)特征向量V(d)=(t1,ω1(d);?;tn, ωn(d)),其中ti(i=1,2, ?,n)為一列互不雷同的詞條項(xiàng),ωi(d)為ti在d中的權(quán)值, 一般被定義為ti在d中出現(xiàn)頻率tfi(d)的函數(shù),即。

      在信息檢索中常用的詞條權(quán)值計(jì)算方法為 TF-IDF 函數(shù),其中N為所有文檔的數(shù)目,ni為含有詞條ti的文檔數(shù)目。TF-IDF公式有很多變種,下面是一個(gè)常用的TF-IDF公式:

      根據(jù)TF-IDF公式,文檔集中包含某一詞條的文檔越多,說明它區(qū)分文檔類別屬性的能力越低,其權(quán)值越?。涣硪环矫?,某一文檔中某一詞條出現(xiàn)的頻率越高,說明它區(qū)分文檔內(nèi)容屬性的能力越強(qiáng),其權(quán)值越大。兩文檔之間的相似度可以用其對(duì)應(yīng)的向量之間的夾角余弦來表示,即文檔di,dj的相似度可以表示為:

      進(jìn)行查詢的過程中,先將查詢條件Q進(jìn)行向量化,主要依據(jù)布爾模型:當(dāng)ti在查詢條件Q中時(shí),將對(duì)應(yīng)的第i坐標(biāo)置為1,否則置為0,即:

      從而文檔d與查詢Q的相似度為:

      根據(jù)文檔之間的相似度,結(jié)合機(jī)器學(xué)習(xí)的一些算法如神經(jīng)網(wǎng)絡(luò)算法,K-近鄰算法和貝葉斯分類算法等,可以將文檔集分類劃分為一些小的文檔子集。

      在查詢過程中,可以計(jì)算出每個(gè)文檔與查詢的相似度,進(jìn)而可以根據(jù)相似度的大小,將查詢的結(jié)果進(jìn)行排序。

      向量空間模型可以實(shí)現(xiàn)文檔的自動(dòng)分類和對(duì)查詢結(jié)果的相似度排序,能夠有效提高檢索效率;它的缺點(diǎn)是相似度的計(jì)算量大,當(dāng)有新文檔加入時(shí),則必須重新計(jì)算詞的權(quán)值。

      3.3.2建立向量空間模型

      (1)將文檔的前十五個(gè)關(guān)鍵字作為key并將文件的內(nèi)容作為value存Treemap中

      <14> 部分代碼展示

      (2)求兩個(gè)詞項(xiàng)的并集

      <15> 部分代碼展示

      (3)求兩個(gè)詞項(xiàng)的交集

      <15> 部分代碼展示

      (4)計(jì)算文章相似度

      <16> 部分代碼展示

      (5)計(jì)算公式:

      3.4利用Lucene打分機(jī)制對(duì)文檔打分

      (1)在這里,我們是基于Lucene框架,利用其自帶打分系統(tǒng),對(duì)查詢文本和文檔計(jì)算它們的相似度,再進(jìn)行打分。

      Lucene打分公式如下:

      (2)計(jì)算查詢文本(TermQuery)與文檔的相似度進(jìn)行打分。

      (3)在查找“人民”這兩個(gè)關(guān)鍵詞后出現(xiàn)兩個(gè)相關(guān)文檔,它們分別的得分為0.47782254和0.3901917,這說明第一個(gè)文檔更符合查詢

      <17> 打分

      四、測(cè)試

      <18> 測(cè)試截圖1

      <19> 測(cè)試截圖2

      <20> 測(cè)試截圖3

      <21> 測(cè)試截圖4

      <22> 測(cè)試截圖5

      <23> 測(cè)試截圖6

      <24> 測(cè)試截圖7

      <25> 測(cè)試截圖8

      <26> 測(cè)試截圖9

      五、心得體會(huì)

      此次報(bào)告要求實(shí)現(xiàn)第一個(gè)信息檢索系統(tǒng),涉及到多線程編程、排序、網(wǎng)絡(luò)爬蟲等多項(xiàng)技術(shù)。多線程是提高效率的一個(gè)非常重要的途徑,比如計(jì)算機(jī)并行計(jì)算等,本次實(shí)驗(yàn)完成了多線程的任務(wù),對(duì)網(wǎng)絡(luò)間通信以及搜索引擎如何實(shí)現(xiàn)向海量用戶在很短時(shí)間內(nèi)提供服務(wù)有了更深刻的認(rèn)識(shí)。通過實(shí)驗(yàn)我也認(rèn)識(shí)到了多線程編程的邊緣。在下一步的研究學(xué)習(xí)之中有很大助力。

      在此基礎(chǔ)之上建立檢索,通過對(duì)于索引的檢索,一方面可以加深對(duì)于索引的深層認(rèn)識(shí),另一方面又可以是我們運(yùn)用知識(shí)與學(xué)習(xí)知識(shí)相結(jié)合,可以使我們學(xué)的更好,運(yùn)用的有理可循。

      搜索引擎的處理對(duì)象是互聯(lián)網(wǎng)網(wǎng)頁,日前網(wǎng)頁數(shù)量不計(jì)其數(shù)。所以搜索引擎首先面臨的問題就是:如何能夠設(shè)計(jì)出高效的查詢以及下載系統(tǒng)。網(wǎng)絡(luò)爬蟲是搜索引擎中很關(guān)鍵也很基礎(chǔ)的構(gòu)建,通過網(wǎng)絡(luò)爬蟲的設(shè)計(jì),加深了我對(duì)實(shí)驗(yàn)原理的理解,同時(shí)也加強(qiáng)了自身的實(shí)踐能力。

      第四篇:案例1:網(wǎng)絡(luò)信息獲取技巧_搜索引擎_教學(xué)設(shè)計(jì)

      案例1:

      《網(wǎng)絡(luò)信息獲取技巧———搜索引擎》教學(xué)設(shè)計(jì)

      一、教學(xué)設(shè)想

      如何應(yīng)用網(wǎng)絡(luò)、查詢網(wǎng)絡(luò)信息是中學(xué)生利用網(wǎng)絡(luò)這一工具開展學(xué)習(xí)的一種重要技能。教學(xué)設(shè)計(jì)中要充分利用信息技術(shù)有效整合相關(guān)的教學(xué)資源、創(chuàng)設(shè)情景,激發(fā)學(xué)生強(qiáng)烈的求知欲,引導(dǎo)學(xué)生循序漸進(jìn)地認(rèn)識(shí)網(wǎng)絡(luò)應(yīng)用的重要意義及使用方法,培養(yǎng)利用網(wǎng)絡(luò)開展自學(xué)與探究學(xué)習(xí)能力。

      二、教學(xué)目標(biāo)

      1.讓學(xué)生了解網(wǎng)絡(luò)信息資源及其特點(diǎn)。

      2.了解搜索引擎的種類和使用技巧,學(xué)會(huì)巧妙運(yùn)用搜索策略。

      三、教學(xué)重點(diǎn)

      掌握常用搜索引擎的搜索技巧。

      四、教學(xué)難點(diǎn)

      讓學(xué)生掌握利用關(guān)鍵詞搜索的技巧獲取信息。

      五、教學(xué)環(huán)境

      多媒體網(wǎng)絡(luò)教室,Internet 網(wǎng)絡(luò)。

      六、教學(xué)過程

      (一)情境導(dǎo)入,引出課題

      師:我們?cè)賮砀惺芤幌律衿唢w天這一完美的歷史瞬間(學(xué)生機(jī)屏幕播放《神七飛天全程模擬動(dòng)畫》)學(xué)生們神情專注,邊看邊感嘆,播放完畢,有的學(xué)生問:“老師這個(gè)片子哪來的? ”

      師:是昨天在網(wǎng)上搜索到的。生:搜索? 怎么搜索???

      師:搜索可是網(wǎng)絡(luò)信息獲取的一種重要方法,今天我們的學(xué)習(xí)目標(biāo)就是來認(rèn)識(shí)搜索引擎,一旦大家掌握了搜索引擎的使用技巧,那么獲取網(wǎng)絡(luò)上的各種有用信息就得心應(yīng)手了。

      生:老師快教教我們吧!(學(xué)生急不可待的樣子)

      (二)體驗(yàn)中感知,網(wǎng)絡(luò)上驗(yàn)證

      師: 要想掌握獲取網(wǎng)絡(luò)信息的方法,首先讓我們來了解一下有關(guān)網(wǎng)絡(luò)信息資源的知識(shí)。網(wǎng)絡(luò)信息資源是指以電子數(shù)據(jù)的形式將文字、圖像、聲音、動(dòng)畫等多種形式的信息存放在光磁等非印刷型的載體中,并通過網(wǎng)絡(luò)通信、計(jì)算機(jī)或終端等方式再現(xiàn)出來的信息資源。具有數(shù)量龐大、內(nèi)容豐富、覆蓋面廣、共享程度高、交互性強(qiáng)等特點(diǎn)。

      生:老師,網(wǎng)絡(luò)真是太好了,幾乎什么信息都有,可以利用網(wǎng)絡(luò)學(xué)到很多知識(shí)。

      師:是啊,有價(jià)值的網(wǎng)絡(luò)信息豐富多彩,但是要查詢到我們需要的信息可要掌握一定的技巧才行。

      一般獲取網(wǎng)絡(luò)信息可以通過什么途徑呢? 共有三種:直接訪問網(wǎng)頁、使用搜索引擎、查詢?cè)诰€數(shù)據(jù)庫,其中搜索引擎是我們習(xí)慣采用的。

      1.常用的搜索引擎有如下幾種: 百度、Google(谷歌)、搜狐、新浪、網(wǎng)易、雅虎。

      2.常用搜索引擎的使用技巧:

      (1)簡(jiǎn)單查詢:在搜索引擎中輸入關(guān)鍵詞,然后點(diǎn)擊“搜索”就行了,使用方便,但是查詢的結(jié)果卻不準(zhǔn)確,可能包含著許多無用的信息。

      (2)使用雙引號(hào)(“?”):給要查詢的關(guān)鍵詞加上雙引號(hào)(半角的),可以實(shí)現(xiàn)精確的查詢。

      (3)使用加號(hào)(+):在關(guān)鍵詞的前面使用加號(hào),同時(shí)滿足兩個(gè)以上條件的。

      (4)使用減號(hào)(-):在關(guān)鍵詞的前面使用減號(hào),也就意味著在查詢結(jié)果中不能出現(xiàn)該關(guān)鍵詞。

      (5)使用通配符(* 和?):通配符包括星號(hào)(*)和問號(hào)(?),前者表示匹配的數(shù)量不受限制,后者匹配的字符數(shù)要受到限制,主要用在英文搜索引擎中。

      下面我們來搜索一下“神七”或“神舟七號(hào)”(演示:打開瀏覽器—地址欄輸入百度網(wǎng)址—在搜索欄輸入關(guān)鍵字—點(diǎn)百度一下),涉及神七的各種信息立刻出現(xiàn)在眼前,點(diǎn)擊查詢的條目就可以了解具體信息了。這就是查詢網(wǎng)絡(luò)信息最簡(jiǎn)單的步驟,自己體驗(yàn)一下吧。

      (學(xué)生按照操作步驟專注操作)

      (教師到學(xué)生身邊邊看邊適時(shí)給予指導(dǎo),有的學(xué)生網(wǎng)址輸入錯(cuò)誤打不開搜索網(wǎng)頁)生:老師我學(xué)會(huì)了,可是這樣搜索出來的信息太多了,怎么找到你播放的這個(gè)動(dòng)畫呢?

      師:嗯,關(guān)鍵詞很重要,通常搜索信息的時(shí)候可能有一個(gè)或多個(gè)限制條件,條件越多查找到的信息就越精確,利用剛才介紹的搜索技巧加入“動(dòng)畫”或者“全過程”,再來試一試。

      學(xué)生很快就找到剛才播放的《神七飛天全程模擬動(dòng)畫》視頻了,個(gè)個(gè)欣喜若狂。

      師:請(qǐng)大家思考一下:怎樣利用最短的時(shí)間獲取到最準(zhǔn)確、最有用的信息呢?

      事實(shí)上是要掌握搜索策略和技巧的。(1)首先確定提供相關(guān)信息的來源。(2)檢查信息來源所提供的信息量是否合適。

      (3)研究信息來源所提供的搜索命令、搜索方法,確定搜索任務(wù)。

      (4)準(zhǔn)確運(yùn)用關(guān)鍵詞,結(jié)合搜索引擎的使用技巧,縮小搜索范圍,提高搜索效率。

      (5)不要局限于一個(gè)搜索引擎,如遇到困難,可求助于搜索引擎的幫助系統(tǒng)。

      (三)認(rèn)識(shí)中感悟,實(shí)踐中提高

      師:大家打開百度和Google 的搜索頁面,觀察并熟悉它們各自的用法與功能及各自的幫助系統(tǒng)。

      選取原則是哪種搜索引擎好用就用哪種。下面結(jié)合搜索技巧以小組為單位搜索以下信息,完成任務(wù)的可以做其他組的任務(wù)或搜索自己感興趣的信息。

      1.A 組搜索2008 年奧運(yùn)會(huì)的圖片、歌曲“北京歡迎你”(mp3 格式)。

      2.B 組搜索“神七”的視頻、“5.12 地震”的新聞。3.C 組搜索Office 2000 軟件下載網(wǎng)頁。4.D 組搜索遷安的地圖、李曉鵬的教育博客。

      (任務(wù)設(shè)置意圖:通過不同任務(wù)的設(shè)置,讓學(xué)生親身感受一下百度和Google 的所具有的特點(diǎn),滿足學(xué)生的好奇心與求知欲,注意了知識(shí)的拓展。)

      七、小結(jié)與反思

      本節(jié)利用萬眾矚目的“神七”創(chuàng)設(shè)情境引入課題,激發(fā)了學(xué)生強(qiáng)烈的求知欲,充分學(xué)習(xí)了搜索引擎的種類與使用技巧,學(xué)生在實(shí)踐操作中體驗(yàn)了獲取網(wǎng)絡(luò)信息的方法。增強(qiáng)了利用網(wǎng)絡(luò)這一工具開展自主學(xué)習(xí)、網(wǎng)絡(luò)學(xué)習(xí)、探究學(xué)習(xí)的信心。不足之處是小組合作、討論不夠理想。

      第五篇:網(wǎng)絡(luò)搜索引擎實(shí)習(xí)題2014.9.23

      1.Google 和百度搜索引擎的網(wǎng)頁數(shù)量大概有多少?

      2.Sustainability Science, Practice & Policy(ISSN:1548-7733)是開放獲取期刊嗎?在哪個(gè)網(wǎng)站可以下載它刊載的全文?可以下載哪一年的?該刊的出版周期是多少? 3.什么是威客?威客理論最早由誰于什么時(shí)候提出? 4.百度搜索引擎最多能輸入多少漢字進(jìn)行搜索? 5.最早舉行國慶閱兵的國家是哪個(gè)?

      6.阿根廷詩人博爾赫斯在一首詩中寫到“我心里一直都在暗暗設(shè)想,天堂應(yīng)該是圖書館的模樣”,請(qǐng)寫出下兩句的中文譯文。

      7.“學(xué)術(shù)信息資源開放目錄”網(wǎng)站是第一個(gè)以志愿者為目錄編輯進(jìn)行學(xué)術(shù)信息收集和整理為主的網(wǎng)站,目前注冊(cè)編輯的數(shù)量有多少個(gè)? 8.請(qǐng)寫出查找國內(nèi)和國外黃頁信息的網(wǎng)站各一個(gè),要求寫出網(wǎng)站名稱、網(wǎng)站地址,寫出100字以內(nèi)的文字說明或簡(jiǎn)介。

      9.以兩個(gè)城市命名的報(bào)紙很少見,解放前出版的《上海寧波日?qǐng)?bào)》就是一例。在什么數(shù)據(jù)庫中能看到該報(bào)紙的全文?

      10.在國家知識(shí)產(chǎn)權(quán)局網(wǎng)站上檢索有關(guān)能源動(dòng)力方面的發(fā)明專業(yè),要求摘錄一條有“審定授權(quán)說明書”的專利名稱、專利號(hào)和授權(quán)公告號(hào)。

      11.查找現(xiàn)任哈商大能建學(xué)院一位老師所發(fā)表的學(xué)術(shù)論文全文,可以到哪些中外文數(shù)據(jù)庫或者信息資源中檢索?(列舉5個(gè)你認(rèn)為最合適或有代表性的數(shù)據(jù)庫或信息系統(tǒng),并列舉其作為第一作者發(fā)表的學(xué)術(shù)論文一篇)。

      12.在哪些網(wǎng)站可以查到國外名校的共享課程?請(qǐng)列舉出網(wǎng)站名稱,并寫出你感興趣的一門課程名稱。

      13.我校能源動(dòng)力類有多少位專任老師?請(qǐng)大家檢索一下這些教師近五年發(fā)表了哪些文章?這些文章是否被人引用?引用頻次是多少?

      14.我校圖書館主頁上有哪些OA資源?請(qǐng)用OA資源查找上次數(shù)據(jù)庫的課題,在上次基礎(chǔ)上任選一個(gè)課題,至少查5條題錄。寫清楚利用了哪些OA資源,檢索策略,檢索關(guān)鍵詞,并翻譯所查到文獻(xiàn)的題名。

      15.利用我們課堂上介紹的免費(fèi)資源進(jìn)行課題檢索,試比較網(wǎng)絡(luò)資源檢索與數(shù)據(jù)庫檢索的效率。

      作業(yè)要求:

      第13題分兩組完成,任務(wù)完成后進(jìn)行匯總,匯總到EXCEL或WORD上都可以,然后進(jìn)行簡(jiǎn)單的統(tǒng)計(jì)分析。這道題進(jìn)行綜合評(píng)分,哪組做得好給加分獎(jiǎng)勵(lì)。

      下載網(wǎng)絡(luò)搜索引擎檢索技巧小結(jié)word格式文檔
      下載網(wǎng)絡(luò)搜索引擎檢索技巧小結(jié).doc
      將本文檔下載到自己電腦,方便修改和收藏,請(qǐng)勿使用迅雷等下載。
      點(diǎn)此處下載文檔

      文檔為doc格式


      聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻(xiàn)自行上傳,本網(wǎng)站不擁有所有權(quán),未作人工編輯處理,也不承擔(dān)相關(guān)法律責(zé)任。如果您發(fā)現(xiàn)有涉嫌版權(quán)的內(nèi)容,歡迎發(fā)送郵件至:645879355@qq.com 進(jìn)行舉報(bào),并提供相關(guān)證據(jù),工作人員會(huì)在5個(gè)工作日內(nèi)聯(lián)系你,一經(jīng)查實(shí),本站將立刻刪除涉嫌侵權(quán)內(nèi)容。

      相關(guān)范文推薦

        獲取網(wǎng)絡(luò)信息的策略與技巧——搜索引擎教學(xué)設(shè)計(jì)

        獲取網(wǎng)絡(luò)信息的策略與技巧——搜索引擎教學(xué)設(shè)計(jì) [ 作者:席子哥哥 | 轉(zhuǎn)貼自:普通高中信息技術(shù)課程 | 點(diǎn)擊數(shù):1143 | 更新時(shí)間:2007-1-2 | 文章錄入:徐建剛 ] [學(xué)習(xí)目標(biāo)]——學(xué)習(xí)......

        網(wǎng)絡(luò)信息檢索及其局限性(本站推薦)

        【關(guān)鍵詞】 網(wǎng)絡(luò)信息 信息檢索 搜索引擎1 網(wǎng)絡(luò)信息檢索簡(jiǎn)介 隨著信息技術(shù)的飛速發(fā)展,信息已成為全社會(huì)的重要資源,對(duì)信息的占有程度及信息處理水平的先進(jìn)程度已成為衡量一個(gè)......

        網(wǎng)絡(luò)信息資源檢索心得體會(huì)

        網(wǎng)絡(luò)信息資源檢索心得體會(huì) 當(dāng)今社會(huì)是一個(gè)信息時(shí)代,而每天的信息量卻又如此繁多,令我們措手不及,電腦作為我們研究生獲取信息的重要工具,如何最高效的應(yīng)用它為我們服務(wù),是我們當(dāng)......

        網(wǎng)絡(luò)信息檢索實(shí)驗(yàn)報(bào)告

        網(wǎng)絡(luò)信息檢索的應(yīng)用和發(fā)展趨勢(shì)09軟件1 W班09144136張?jiān)秸弘S著信息時(shí)代的到來,網(wǎng)上信息資源的數(shù)量、種類不斷增加,電子信息資源日益豐富,互聯(lián)網(wǎng)技術(shù)也日新月異、層出不窮,人們......

        網(wǎng)絡(luò)信息檢索論文

        網(wǎng)絡(luò)時(shí)代新特征 ——讀《理解媒介:論人的延伸》有感由于沒讀《世界是平的》,所以談?wù)勛x《理解媒介:論人的延伸》對(duì)網(wǎng)絡(luò)時(shí)代新特征的理解。 加拿大傳播學(xué)巨匠麥克盧漢的著作《理......

        關(guān)于網(wǎng)絡(luò)信息檢索論文

        信息檢索是指信息按一定的方式組織起來,并根據(jù)信息用戶的需要找出有關(guān)的信息的過程和技術(shù)。下面小編為大家搜索整理了關(guān)于網(wǎng)絡(luò)信息檢索論文,希望對(duì)大家有所幫助。淺談網(wǎng)絡(luò)信息......

        劉挺的搜索引擎信息檢索實(shí)踐總結(jié)

        說實(shí)話,這本書看了好幾遍都是看不懂的,雖然說這本書是搜索引擎方面的入門書籍,我還是感覺這本書講得比較詳細(xì),里面涉及到的知識(shí)點(diǎn)太多了,短期內(nèi)很難吃透,所以一般平時(shí)我都是看這本......

        獲取網(wǎng)絡(luò)信息的策略與技巧——搜索引擎教學(xué)設(shè)計(jì)(精選5篇)

        獲取網(wǎng)絡(luò)信息的策略與技巧——搜索引擎教學(xué)設(shè)計(jì) [學(xué)習(xí)目標(biāo)] 1、知識(shí)與技能 掌握網(wǎng)絡(luò)信息檢索的幾種主要策略與技巧; 了解搜索引擎的相關(guān)知識(shí)(簡(jiǎn)單分類、工作原理、幫助系統(tǒng)等)......