欧美色欧美亚洲高清在线观看,国产特黄特色a级在线视频,国产一区视频一区欧美,亚洲成a 人在线观看中文

  1. <ul id="fwlom"></ul>

    <object id="fwlom"></object>

    <span id="fwlom"></span><dfn id="fwlom"></dfn>

      <object id="fwlom"></object>

      E團購網(wǎng)搜索引擎優(yōu)化(評估、分析)報告

      時間:2019-05-13 01:20:22下載本文作者:會員上傳
      簡介:寫寫幫文庫小編為你整理了多篇相關(guān)的《E團購網(wǎng)搜索引擎優(yōu)化(評估、分析)報告》,但愿對你工作學(xué)習(xí)有幫助,當(dāng)然你在寫寫幫文庫還可以找到更多《E團購網(wǎng)搜索引擎優(yōu)化(評估、分析)報告》。

      第一篇:E團購網(wǎng)搜索引擎優(yōu)化(評估、分析)報告

      E團購網(wǎng)搜索引擎優(yōu)化(評估、分析)報告

      一、關(guān)于SEO

      SEO 是英文 Search Engine Optimization 的縮寫,中文的意思就是搜索引擎優(yōu)化。在網(wǎng)絡(luò)營銷中,搜索引擎優(yōu)化對于網(wǎng)站排名是一種非常重要的手段,是通過了解各類搜索引擎如何抓取網(wǎng)站頁面、如何進行索引、以及如何確定其對某一特定關(guān)鍵詞的搜索結(jié)果排名等技術(shù),通過對網(wǎng)站的結(jié)構(gòu)、標(biāo)簽、排版等各方面的優(yōu)化,使Google等搜索引擎更容易搜索網(wǎng)站的內(nèi)容,并且讓網(wǎng)站的各個網(wǎng)頁在Google等搜索引擎中獲得較高的評分,從而提高網(wǎng)站在 Google上的排名,提高網(wǎng)站訪問量,最終提升網(wǎng)站的銷售能力或宣傳能力的技術(shù)

      二、搜索引擎優(yōu)化的是非辨析

      搜索引擎優(yōu)化的目標(biāo)是為了利用搜索引擎增加網(wǎng)站的訪問量,如果網(wǎng)站不能通過搜索引擎獲得更多的訪問,即使在某些關(guān)鍵詞檢索時排名靠前也是沒有意義的;在搜索結(jié)果中排名靠前并不一定能獲得用戶點擊(也就意味著不能增加訪問量),這是因為用戶需要對大量檢索結(jié)果進行判斷,如果反饋的摘要信息不能引起用戶的興趣,就無法獲得用戶對搜索結(jié)果的點擊。

      三、網(wǎng)站推廣目標(biāo)

      協(xié)議涉及合作項目:互聯(lián)網(wǎng)站技術(shù)性優(yōu)化(SEO);主關(guān)鍵字:南京團購、南京團購網(wǎng),排名目標(biāo):優(yōu)化后1-3個月排名顯著提高;輔關(guān)鍵字:南京家裝團購、南京家具團購、南京地板團購、南京陶瓷團購、南京建材團購等關(guān)鍵字,上榜率不及要求98%。

      四、優(yōu)化前站點情況

      1.百度收錄情況:收錄etgool.com信息總量約為3140條,收錄etgool.cn信息總量約為2380篇;主關(guān)鍵字“南京團購”“南京團購網(wǎng)”較為靠后約在20位之后(有時會進入前20位),其他輔關(guān)鍵字收錄不多且排名不一,由該關(guān)鍵字的冷熱程度決定,冷門關(guān)鍵字約較前。關(guān)鍵字搜索時位于前列的頁面以論壇頁面以及店鋪列表較多,此有超鏈接起作用。

      2.谷歌(google)收錄情況

      收錄etgool.com的信息總量約為9020條,收錄etgool.cn信息總量約為3750條;主關(guān)鍵字“南京團購”“南京團購網(wǎng)”較為靠后約在18位之后(有時會進入前15位),其他輔關(guān)鍵字收錄不多且排名不一。

      3.流量統(tǒng)計分析

      A、所有24小時訪問時段數(shù)據(jù)分析:網(wǎng)友訪問時間多集中在上午9:00~11:00以及下午1:00~5:00時間段。B、所有時間日訪問數(shù)據(jù)分析:每天訪問量平均基本相當(dāng)。C、周月數(shù)據(jù)訪問分析:網(wǎng)友一般集中在周一至周五之間。訪問量主要體現(xiàn)在8至12月,同時2006年7月份從26號開始統(tǒng)計,2007年2月份止于14號。從2006年7月26日至2007年2月14日總流量36178 IP,237258 PV。

      六、優(yōu)化后站點情況

      1.百度收錄情況

      收錄etgool.com信息總量約為516條,收錄etgool.cn信息總量約為273篇;主關(guān)鍵字“南京團購”“南京團購網(wǎng)”分別上升到第5位和第6位(截止于2007年4月18日),其他輔關(guān)鍵字收錄排名約在百名之外(南京家裝團購115位、南京婚慶公司暫無收錄)輔關(guān)鍵詞排名情況不理想。原因解釋:可能與服務(wù)器不太穩(wěn)定有關(guān)系,因百度蜘蛛抓的次數(shù)比較頻繁,幾次抓不到數(shù)據(jù)后,網(wǎng)站收錄及排名將會大打折扣。

      2.谷歌(google)收錄情況

      收錄etgool.com的信息總量約為16000條,收錄etgool.cn信息總量約為6910條;主關(guān)鍵字“南京團購”“南京團購網(wǎng)”上升幅度不大分別上升到第12位和第8位,其他輔關(guān)鍵字收錄排名不一(截止于2007年4月18日)。

      3.流量統(tǒng)計分析

      A、日時間段分析經(jīng)比較日訪問時間多集中在8:00~15:00之間。B、來路分析:主要集中在域名輸入直接到達(dá)本站,搜索引擎占了少數(shù),降低了優(yōu)化前的效果,訪問量降低。C、搜索引擎關(guān)鍵字(分類與不分類)統(tǒng)計分析:關(guān)鍵字不起作用,原因有二:

      1、搜索引擎沒有收錄該關(guān)鍵字,2、該類關(guān)鍵字用戶極少。

      七、建議與措施

      縱觀數(shù)據(jù),此次優(yōu)化沒有達(dá)到應(yīng)有的期望值,同時降低了baidu收錄信息條數(shù)根方下降。從訪問路徑來看直接輸入域名地址占了很大比例,降低了推廣的效果。以至于流量無法上升。在百度中,雖然單個關(guān)鍵字排名靠前但總體用戶點擊過低。在google中信息條數(shù)以及索引所占比有所增加,但以降低百度為代價。

      經(jīng)上文搜索引擎是非辨析可以判斷:

      1、關(guān)鍵字選取存在一定問題;

      2、優(yōu)化僅以排名為目的是不可取的;

      3、網(wǎng)絡(luò)營銷過于依賴網(wǎng)絡(luò)優(yōu)化。

      數(shù)據(jù)來源有跡可察,并保留原始數(shù)據(jù)。

      第二篇:Google+1的搜索引擎優(yōu)化分析

      Google+1的搜索引擎優(yōu)化分析

      自從GOOGLE新CEO上任之后,推出了很多的關(guān)于社交領(lǐng)域的產(chǎn)品,例如Google+,也有關(guān)于運用社交領(lǐng)域評價網(wǎng)頁的Google+1。Google+1按鈕實際上是給用戶對網(wǎng)頁進行評價,進而通過優(yōu)化GOOGLE的搜索結(jié)果。

      最近美國SEO軟件供應(yīng)商SEOMOZ做了一些實驗,創(chuàng)造一系列的URL之后,完全杜絕這些URL在其他網(wǎng)站上的傳播。在Twitter上作為信息最開始的傳播源之后,接著在GOOGLE+1進行更多分享,最后的實驗結(jié)果是這些URL非??焖俚墨@得了Google上的排名。

      Google+1產(chǎn)品的最初動機是因為社交。在Google+1產(chǎn)品的介紹頁面上,Google官方說道:“相比較陌生人推薦的內(nèi)容,朋友和熟人所推薦內(nèi)容的相關(guān)程度往往更高。舉個例子,專業(yè)影評人提供的影評固然不錯,但與您志趣相投的朋友提供的影評對您來說可能更加實用。” 因此,我們可以看到每個Google+1的分享實際上都是在一個圈子里面分享,即就是把信息分享給相關(guān)的人,這就于傳統(tǒng)的算法有所區(qū)別。比如現(xiàn)在搜索一個關(guān)鍵詞之后,每次打開的都是固定的一個網(wǎng)站,那么下次有可能你再搜索的時候,這個暴雪輔助網(wǎng)站跑到了第2、3名。這實際上是GOOGLE根據(jù)你點擊行為,猜測你的喜好給你推薦的結(jié)果。這個結(jié)果,并非對公眾的結(jié)果會有什么影響。

      Google+1大概也是沿此道理,但是它的范圍更加廣闊一些,是在一個相關(guān)的圈子里面?zhèn)鞑シ窒怼_@樣就形成了兩種排名格式,一個是圈子里面的,一個是公眾性(圈外的)的。通過圈子里面的不斷傳播分析之后,進而影響了公眾的排名結(jié)果,這應(yīng)當(dāng)是所有SEO都關(guān)注的。公眾性(圈外的)的SEO因素就是鏈接,內(nèi)容,網(wǎng)站權(quán)重,權(quán)威性等等,圈子里面的就是口碑,推薦等。

      同樣在Google+1產(chǎn)品介紹頁面上,Google官方提到了關(guān)于影響SEO排名方面的內(nèi)容: “因此,Google在確定您的網(wǎng)頁與用戶查詢之間的相關(guān)程度時,會適當(dāng)?shù)貐⒖寄呐笥押吐?lián)系人發(fā)表的“+1”內(nèi)容。這只是 Google 用于確定網(wǎng)頁的相關(guān)程度和排名的多種依據(jù)之一,我們會不斷地調(diào)整并完善相關(guān)算法,以便提高整體搜索質(zhì)量。與所有的新排名因素一樣,我們會謹(jǐn)慎啟用“+1”并積極了解此類因素對搜索質(zhì)量的影響?!?/p>

      Google+1是一款基于的網(wǎng)頁口碑評價產(chǎn)品,Google+1會讓網(wǎng)站內(nèi)容更加容易傳播,更加容易判斷網(wǎng)站價值,對網(wǎng)站內(nèi)容的質(zhì)量也有了更高的要求。很明顯現(xiàn)在Google+1還無法對網(wǎng)頁排序發(fā)揮更大的作用,還是有待完善的網(wǎng)頁評價算法,無法跟傳統(tǒng)的鏈接算法像比較。

      但可以看到在未來幾年,Google+1也有可能會逐步降低Google依賴鏈接算法的作用。

      本文轉(zhuǎn)載自暴雪輔助http://

      第三篇:搜索引擎優(yōu)化專員

      什么是搜索引擎優(yōu)化專員

      崗位職責(zé):

      1、長期跟蹤并深入研究Alexa、Google、Baidu和Yahoo的排名機制和優(yōu)化規(guī)則。熟悉各大搜索引擎蜘蛛爬行的規(guī)律規(guī)則及原理。對SEO有獨到的認(rèn)知與見解。

      2、能夠根據(jù)公司戰(zhàn)略發(fā)展要求,通過對網(wǎng)站的分析,制定前臺頁面和系統(tǒng)架構(gòu)等全面的搜索引擎排名及優(yōu)化的整體解決方案。

      3、分析網(wǎng)站及各頻道的關(guān)鍵詞解決方案,監(jiān)控網(wǎng)站關(guān)鍵字,監(jiān)控和研究競爭對手及其他網(wǎng)站相關(guān)做法,并圍繞優(yōu)化提出合理的網(wǎng)站調(diào)整建議。

      4、通過第三方平臺或網(wǎng)站進行流量、數(shù)據(jù)或服務(wù)交換,或戰(zhàn)略合作聯(lián)盟,增加網(wǎng)站的流量和知名度。

      5、撰寫相關(guān)部門的SEO操作文檔,對相關(guān)部門人員進行培訓(xùn),有效地推動其他部門的配合,完成網(wǎng)站的SEO工作。

      6、找出避免被各大搜索引擎懲罰的方法,并且作好相應(yīng)的補救措施。

      崗位要求:

      1、大專以上學(xué)歷,一年以上工作經(jīng)驗,擁有廣泛的網(wǎng)絡(luò)營銷資源,熟悉SEO。

      2、精通各大搜索引擎的搜索排名原理,掌握搜索引擎優(yōu)化技術(shù),熟悉各類網(wǎng)站推廣技術(shù)。

      3、有廣泛的互聯(lián)網(wǎng)知識,對于Web服務(wù)器、MySQL、域名、Linux等名詞不陌生,并了解其工作原理。

      4、有過編程經(jīng)驗,了解HTML、Javascript、ASP、PHP、CSS等頁面語言,精通HTML者為佳。

      5、對于搜索引擎的原理有深入的了解,精通排名原理、PR規(guī)則、網(wǎng)站收錄、網(wǎng)站流量、Alexa排名等概念及方法。熟悉各個品牌蜘蛛、爬蟲的口味和喜好。

      6、具有極強的分析能力,能從看似雜亂的數(shù)據(jù)中分析出合理的原因并制定應(yīng)對方案,有市場洞察和分析調(diào)研能力。

      7、有激情,工作積極主動有效,富有進取心,能夠勝任高強度的工作。

      8.有豐富Google英文SEO實踐經(jīng)驗者優(yōu)先;能效提高網(wǎng)站整體流量者優(yōu)先。

      競價專員: 崗位職責(zé):1.負(fù)責(zé)百度關(guān)鍵詞投放和日常維護,提升投放有效性,控制性價比;

      2.負(fù)責(zé)關(guān)鍵詞投放表、投放文案的規(guī)劃和優(yōu)化,以及展示定位的規(guī)劃和優(yōu)化;

      3.完成日常SEM廣告投放工作,對網(wǎng)站廣告投放Traffics,CTR等各項業(yè)務(wù)KPI負(fù)責(zé);

      4.負(fù)責(zé)相關(guān)數(shù)據(jù)分析挖掘,不斷優(yōu)化投放方式和頁面;

      5.負(fù)責(zé)分析關(guān)鍵詞及網(wǎng)站內(nèi)容的數(shù)據(jù)整合,向其他部門提供數(shù)據(jù)支持。

      任職資格:1.大專以上學(xué)歷,1年以上SEM工作經(jīng)驗;

      2.豐富的百度、Google等搜索引擎在線廣告運營經(jīng)驗;

      3.深入了解百度、GOOGLE的搜索引擎推廣產(chǎn)品,擅長搜索引擎營銷;

      4.較強的數(shù)據(jù)分析和挖掘經(jīng)驗;

      5.良好的語言溝通和文檔溝通能力;

      6.思維敏捷,富有創(chuàng)新精神,對數(shù)據(jù)變化敏感,具備良好的分析判斷能力;

      7.能有效應(yīng)對壓力,自主工作能力,具備百度及谷歌工作經(jīng)驗者優(yōu)先。

      崗位職責(zé)

      1、負(fù)責(zé)微信公眾號運營推廣,負(fù)責(zé)策劃并執(zhí)行微信營銷線日常活動及跟蹤、維護;

      2、提高粉絲活躍度,與微信的粉絲做好互動,對微信粉絲的網(wǎng)絡(luò)行為進行分析與總結(jié);

      3、挖掘和分析網(wǎng)友使用習(xí)慣、情感及體驗感受,即時掌握新聞熱點,能夠完成專題策劃、活動;

      4、深入了解互聯(lián)網(wǎng),尤其是微信特點及資源,有效運用相關(guān)資源;

      5、分析微信運營效果,線上線下內(nèi)容活動的策劃與運營,提升影響力。

      微信營銷主管/微博推廣專員

      任職資格

      1、大專以上學(xué)歷,有一年以上企業(yè)官方微信運營經(jīng)驗;

      2、酷愛玩微信,對微信有濃厚的興趣;

      3、具備一定的文字功底,文筆較好,善于揣摩網(wǎng)民的閱讀喜好,找出他們喜歡關(guān)注的各種內(nèi)容;

      4、對互聯(lián)網(wǎng)傳播有較深的認(rèn)識和看法;

      5、有服裝、飾品、禮品等營銷經(jīng)驗優(yōu)先考慮

      第四篇:搜索引擎優(yōu)化技術(shù)及發(fā)展趨勢

      搜索引擎優(yōu)化技術(shù)及發(fā)展趨勢

      一、引言

      “搜索引擎”作為互聯(lián)網(wǎng)上提供信息服務(wù)的一種工具,現(xiàn)在幾乎已經(jīng)是一個婦孺皆知的事物。按照中國互聯(lián)網(wǎng)絡(luò)信息中心在2006年7月19日發(fā)布的報告[1],中國網(wǎng)民中有66。3%經(jīng)常使用搜索引擎,比半年前又提高了近1個百分點。

      互聯(lián)網(wǎng)上的第一代搜索引擎出現(xiàn)于1994年前后,以AltaVista、Yahoo和Infoseek為代表,搜索結(jié)果的好壞通常用反饋結(jié)果的數(shù)量來衡量,或者說是“求全”。然而研究表明,當(dāng)時的搜索引擎性能并沒有想象中那么優(yōu)秀,根據(jù)SteveLawrence和C。LeeGiles在1999年2月的實驗[2],全球11個主要的搜索引擎中,每個搜索引擎僅能搜索到互聯(lián)網(wǎng)上全部頁面的16%,甚至更低(圖1)。造成這種情況的原因,主要是這些搜索引擎的處理能力和網(wǎng)絡(luò)帶寬等方面的限制。

      1998年,以Google為代表的第二代搜索引擎出現(xiàn)在互聯(lián)網(wǎng)上,其主要特點是提高了查準(zhǔn)率,或者說“求精”。當(dāng)時傳統(tǒng)的搜索引擎如Lycos等主要使用網(wǎng)頁中的關(guān)鍵詞進行搜索,而Google則使用了一種綜合頁面排名算法:它不僅考慮搜索關(guān)鍵詞,還考慮頁面間的鏈接關(guān)系,然后對整個網(wǎng)絡(luò)的鏈接結(jié)構(gòu)進行分析和迭代計算,從而對頁面進行區(qū)分[3]。

      第二代搜索引擎在技術(shù)和商業(yè)上都獲得了巨大成功,然而商業(yè)競爭和信息環(huán)境的變化仍在推動著它們不斷創(chuàng)新和發(fā)展。當(dāng)前所謂的第三代搜索引擎主要增加了互動性和個性化等技術(shù),為用戶使用搜索引擎獲取信息提供更好的體驗。至于互動性的評價標(biāo)準(zhǔn)是什么,以及第三代搜索引擎到底比第二代增加了多少價值,目前并沒有非常令人信服的研究結(jié)論。在以下的論述中,我們不對產(chǎn)品概念進行太多討論,而是就搜索引擎目前所面臨的挑戰(zhàn),以及它們的應(yīng)對方略和發(fā)展趨勢進行梳理和闡述。

      二、搜索引擎面臨的挑戰(zhàn)

      面對瞬息萬變的環(huán)境,搜索引擎如果在技術(shù)上不創(chuàng)新進取,從信息服務(wù)質(zhì)量的角度講,現(xiàn)在看來不錯的技術(shù),將來很可能會落伍。不進則退,在搜索引擎領(lǐng)域體現(xiàn)得很明顯。關(guān)于搜索引擎的基礎(chǔ)技術(shù),讀者可參見文獻[23],那么目前有些什么變化在影響著搜索引擎呢?

      (一)Web的發(fā)展

      1。信息大量增加

      Web自產(chǎn)生以來,其信息量一直以幾何級數(shù)的形式遞增,近兩年來尤其如此。這主要有兩方面原因:首先是Web2。0[16]的用戶和以前有所不同,他們正在由單純的信息消費者向生產(chǎn)者與消費者雙重身份轉(zhuǎn)變;其次是DeepWeb[4]的發(fā)展。

      如果說Web1。0是單純的網(wǎng)頁瀏覽模式,那么Web2。0則是通過了真正的個性化、去中心化和信息自主權(quán),向著內(nèi)容更豐富、聯(lián)系性更強、工具性更強而努力。盡管一切都還在探索中,但毋庸置疑,Web2。0已經(jīng)成為互聯(lián)網(wǎng)新的發(fā)展趨勢。這種轉(zhuǎn)變,從模式上可以概括為是從單純的“讀”向“寫”和“共同建設(shè)”發(fā)展。這也更體現(xiàn)了互聯(lián)網(wǎng)的第一規(guī)則,“用戶需要表達(dá)”。只要有機會和便利,網(wǎng)民就不會滿足于只是被動的信息接受者,他們需要表達(dá),希望駕馭自己的傳媒,而不是受其掣肘。在Web2。0實際應(yīng)用中,除了原先的IM(InstantMessenger,即時通訊)、P2P(PeertoPeer,對等網(wǎng)絡(luò))等得到新的發(fā)展,更是涌現(xiàn)出了很多社會化的新事物,比如Blog(Weblog,網(wǎng)絡(luò)日記)、RSS(RDFSiteSummary,站點摘要)、WIKI(網(wǎng)絡(luò)百科)、WB(WebBookmarks,Web文摘)、SNS(SocialNetworkSoftware,社交網(wǎng)絡(luò))等。

      這些新事物發(fā)展得非???。以RSS為例,美國提供RSS內(nèi)容的網(wǎng)站數(shù)目從2001年9月的1000余家激增至2004年9月的195000余家,短短的3年中增長了近150倍,市場的飛速發(fā)展令人矚目。而Blog站點的大量涌現(xiàn),更是為每一位用戶都提供了暢所欲言的場所——據(jù)計世資訊(CCWResearch)的統(tǒng)計,2006年第二季度,中國注冊博客的總數(shù)量達(dá)到6800萬,比第一季度增長51。1%;中國博客用戶則達(dá)到2100萬人,比第一季度增加40。0%。這些無疑都在刺激著Web信息生產(chǎn)和消費的繁榮。

      根據(jù)AlexandrosNtoulas等人的研究結(jié)果[5-6],每星期Web上新產(chǎn)生的頁面數(shù)大約為8%。而這個數(shù)字是非常保守的:他們的實驗是針對154個“popular”網(wǎng)站進行的,而實際上,那些大量涌現(xiàn)的新網(wǎng)站,如Blog網(wǎng)站,它們的成長速度遠(yuǎn)遠(yuǎn)超過這些所謂的流行網(wǎng)站。

      關(guān)于DeepWeb的研究最近幾年也受到越來越多的關(guān)注,DeepWeb又被稱為InvisibleWeb或者HiddenWeb。JillEllsworth于1994年首次提出的InvisibleWeb概念,是指那些常規(guī)搜索引擎難以發(fā)現(xiàn)的內(nèi)容。美國互聯(lián)網(wǎng)專家ChrisSherman和GaryPrice在他們著作《TheInvisibleWeb》中將InvisibleWeb定義為:“在互聯(lián)網(wǎng)上可獲得的,但傳統(tǒng)的搜索引擎由于技術(shù)限制不能或者經(jīng)過慎重考慮后不愿意作索引的那些文本網(wǎng)頁、文件或其他高質(zhì)量、權(quán)威的信息。”InvisibleWeb分為四種類型:不透明網(wǎng)絡(luò)(theOpaqueWeb)、私人網(wǎng)絡(luò)(thePrivateWeb)、專有網(wǎng)絡(luò)(theProprietaryWeb)和真正的隱形網(wǎng)絡(luò)(theTrulyInvisibleWeb)。我們認(rèn)為使用“deep”更為合適,因為這些內(nèi)容不是真的Invisible,只是藏在Web中較深的位置。

      根據(jù)BrightPlanet公司的調(diào)查[4],2001年的DeepWeb大概是SurfaceWeb的500倍左右,而且還在快速發(fā)展。ChrisSherman和GaryPrice的估算則保守些,他們認(rèn)為InvisibleWeb只有SurfaceWeb的2~50倍。但不論如何,DeepWeb在數(shù)量上都不容小覷。更為重要的是,DeepWeb通常都組織良好、信息權(quán)威、質(zhì)量很高,而且時新性強。正因為這樣,國內(nèi)外許多研究者都在克服重重困難,探索如何有效地發(fā)現(xiàn)這些有價值的信息,提供給更多用戶使用。各大搜索引擎要想鞏固和強化在搜索市場的地位,就必須重視DeepWeb,發(fā)展搜索技術(shù),提高競爭力。對于垂直搜索而言,DeepWeb的作用更為突出。

      Web信息的大量增加,使得搜索引擎面臨嚴(yán)峻的挑戰(zhàn)。任何技術(shù)都有它的適用范圍,超出這個范圍,其性能將嚴(yán)重下滑。以搜索引擎的檢索頁面集為例,粗略地說,當(dāng)頁面總數(shù)沒有超過某個閾值時,搜索引擎工作良好,一旦頁面總數(shù)超過這個閾值,搜索引擎的查詢結(jié)果質(zhì)量將急劇下降,用戶往往在查詢返回結(jié)果的前10位、前20位甚至前50位都找不到一個自己想要的結(jié)果。這一點在目前的幾大搜索引擎上都已經(jīng)初現(xiàn)端倪,相信他們已經(jīng)為此絞盡腦汁。

      2。信息更新加快

      Web上不但新信息涌現(xiàn)速度很快,信息變化速度也非常快。以網(wǎng)頁中的鏈接為例,根據(jù)AlexandrosNtoulas等人的研究結(jié)果[5],每星期將有25%的新鏈接產(chǎn)生,1年之后,將只有24%的原有鏈接仍然存在。Google等搜索引擎的成功在于正確地分析了頁面間的鏈接關(guān)系,為了保持這種成功,搜索引擎必須不斷地跟蹤鏈接結(jié)構(gòu)的變化,或者說不斷地刷新自己所保存的相關(guān)信息。就以每周25%的新鏈接為例,這樣的鏈接更新速度要求搜索引擎至少每周重新計算一次所有頁面的Ranking值,否則便不能及時地、恰如其分地反映RealWeb上的當(dāng)前狀況,失去搜索引擎所必需的時效性(timeliness)和時新性(freshness)。

      3。信息表現(xiàn)形式多種多樣

      隨著網(wǎng)絡(luò)速度的提高,Web上的多媒體信息也急劇增加,因此人們對多媒體信息的檢索需求也就隨之而來。傳統(tǒng)的信息檢索主要集中于文本的檢索,在多媒體方面的研究并不是很多。需求的發(fā)展使得目前各大搜索引擎都不斷推出自己的多媒體素材搜索產(chǎn)品,讓用戶可以在龐大的素材庫中進行檢索,如AltaVista可以讓用戶在5。5億個素材(包括5。4億個圖片、1100萬個視頻/音頻文件)中進行檢索,Google的素材庫也達(dá)到了4。4億的量級。然而,目前對這些多媒體素材庫的使用,大多還是標(biāo)注、分類等方法,缺乏對圖像、音視頻內(nèi)容的直接檢索。搜索引擎如何自動分析音視頻的內(nèi)容,允許用戶按內(nèi)容進行檢索,甚至在抓取音視頻素材時就按內(nèi)容進行,這些問題將在今后較長一段時間內(nèi)構(gòu)成挑戰(zhàn),成為搜索引擎所要迫切解決的問題。

      4。SEO正在蓬勃發(fā)展

      自古有矛便有盾,有盾便有矛。SEO目前已經(jīng)成為一個新興的互聯(lián)網(wǎng)行業(yè)。SEO是SearchEngineOptimization的縮寫,即搜索引擎優(yōu)化。從事這方面工作的就是SearchEngineOptimizer——搜索引擎優(yōu)化師。他們利用工具或其他手段使目標(biāo)網(wǎng)站符合搜索引擎的搜索規(guī)則從而獲得較好的網(wǎng)站排名。無止境地追求更高排名是搜索引擎優(yōu)化師們的目標(biāo),因為他們知道,如果想讓用戶在煙波浩渺的Web中發(fā)現(xiàn)自己,獲得一個很高的排名無疑是非常有效的一種方法。

      客觀地說,SEO的這種追求是很自然的,因為經(jīng)濟利益的誘惑實在是太大了。根據(jù)USCensusBureau的調(diào)查,2004年美國的電子商務(wù)銷售額就達(dá)到692億美元,并以7。8%的年增長率在發(fā)展,遠(yuǎn)遠(yuǎn)超過美國的GDP增長。而根據(jù)ForresterResearch的預(yù)測,美國B2C的銷售額將于2010年達(dá)到3290億美元,占全部零售額的13%。如果不能讓用戶認(rèn)識自己,何談電子商務(wù)呢?“搜索引擎優(yōu)化”正是讓大量用戶認(rèn)識自己的一種有效手段。

      搜索引擎優(yōu)化師們并不等于垃圾頁面制造者,但他們中的一部分的確為Web和搜索引擎制造著麻煩,為搜索引擎用戶制造著垃圾。雖然有良好素養(yǎng)和道德觀念的搜索引擎優(yōu)化師們?nèi)匀煌ㄟ^網(wǎng)站結(jié)構(gòu)的優(yōu)化、頁面質(zhì)量的提高等方法進行他們的工作,但那些不道德的搜索引擎優(yōu)化師們發(fā)現(xiàn)有一些“捷徑”更加有效,如在頁面上堆砌大量關(guān)鍵詞、使用重定位手段欺騙WebCrawler程序、構(gòu)造LinkFarm來提高目標(biāo)頁面的排名,等等[7,8]。他們運用這些手段欺騙搜索引擎,浪費了搜索引擎大量帶寬和時間,污染了搜索引擎的頁面集合,歪曲了排名結(jié)果,浪費了用戶的時間和精力,最后帶給用戶的只是大量垃圾。

      這些垃圾制造者通常被稱為WebSpammer。他們所運用的手段有Boosting技術(shù)和Hiding技術(shù)兩大類:Boosting技術(shù)是指使用不道德的頁面排名提升技術(shù),而Hiding技術(shù)是指對使用的Boosting技術(shù)進行隱藏,盡量不讓用戶和WebCrawler發(fā)現(xiàn)。

      Boosting技術(shù)包括TermSpamming和LinkSpamming。TermSpamming是較早出現(xiàn)的技術(shù),是指Spammer操縱Web頁面的正文,使其內(nèi)容和眾多的用戶查詢盡可能地相關(guān),方法是在Body、Title和AnchorText等處插入大量毫無關(guān)聯(lián)但用戶經(jīng)常使用的關(guān)鍵詞。由于技術(shù)簡單,只需要把別人已有的內(nèi)容進行重復(fù)、編織和黏合,所以至今很多Spammer還在采用這些TermSpamming技術(shù),而且已經(jīng)發(fā)展到自動化和智能化的程度。LinkSpamming則更具隱蔽性,WebSpammer通常使用HoneyPot或構(gòu)造強有力的LinkFarm來提高目標(biāo)頁面的排名。一個典型的LinkFarm可能包括幾千個支持頁面,而LinkFarm之間還可以構(gòu)成威力更大的聯(lián)盟[7]。由于隱蔽性很強,對于LinkSpamming的探測非常具有挑戰(zhàn)性。

      Hiding技術(shù)主要包括ContentHiding、Cloaking和Redirection。ContentHiding是指正文和頁面背景使用相同的顏色,從而掩蓋大量的無關(guān)正文,使得WebCrawler能夠發(fā)現(xiàn)而對用戶進行屏蔽。Cloaking是指對WebCrawler返回一個不同的頁面,從而欺騙搜索引擎。Redirection本質(zhì)上和Cloaking一樣,但它是對瀏覽器而非Crawler返回不同的頁面。Hiding技術(shù)也是Spammer所常用的,有時利益如此誘人,以至于一些著名大公司也躍躍欲試,如2006年初的時候,寶馬德國公司網(wǎng)站(bmw。com。de)就曾因為使用了該欺騙技術(shù)而遭到Google的懲罰。

      (二)用戶需求的發(fā)展

      1。更準(zhǔn)、更全、更新、更快

      經(jīng)過十幾年的技術(shù)發(fā)展和市場成熟,搜索引擎正日益滲透到人們?nèi)粘I畹姆椒矫婷?,人們對信息的獲取越來越依賴搜索引擎。在全世界網(wǎng)民中,搜索引擎的使用率僅次于電子郵件而位居第二。隨著對搜索引擎的使用不斷走向深入,網(wǎng)民的要求也在提高。從產(chǎn)品層面來看,準(zhǔn)、全、新、快仍然是用戶對搜索引擎最基本的四個要求,而且用戶希望搜索引擎在這些方面能做得更好。

      目前而言,圍繞這幾個問題,各大搜索引擎服務(wù)商都在做許多細(xì)致的工作,以力求趨向完美解決。比如“準(zhǔn)”,需要更準(zhǔn)確地理解用戶需求,不斷更新Ranking算法,同時又要嚴(yán)格控制垃圾網(wǎng)頁的干擾;“全”指的是全面,盡可能地把互聯(lián)網(wǎng)中“有價值”的網(wǎng)頁都索引下來,滿足最大用戶群的需要;“新”要求搜索引擎的抓取非常高效,能夠把最新的東西及時提取出來,同時還要不斷更新已抓取信息;第四點是“快”,不僅要讓用戶感覺速度很快,還要保持最大的系統(tǒng)穩(wěn)定性。“搜得準(zhǔn)、搜得全、搜得新、搜得快”,這是一個綜合的服務(wù)過程,任何一個環(huán)節(jié)出了問題,都有可能導(dǎo)致用戶滿意度的下降。

      2。使用更加方便和容易

      隨著技術(shù)的發(fā)展,人們希望搜索引擎無處不在,在任何時間任何地點,要尋找信息時都可以使用搜索引擎。而隨著搜索引擎的逐步普及,越來越多的使用者(他們中很大一部分對計算機和網(wǎng)絡(luò)了解不多)希望搜索引擎的工具性進一步加強,最好在不覺察的情況下使用搜索引擎服務(wù)。人們甚至期望搜索引擎的使用如微波爐和洗衣機一樣方便和容易。

      3。搜索個性化

      搜索引擎的一個經(jīng)驗就是,用戶很多時候并不確切地知道自己想要什么樣的結(jié)果,除非你把結(jié)果放在他的面前。所以用戶在使用搜索引擎時,很多時候相同表象的內(nèi)容卻意味著不同的需要。比如對于同一個查詢詞,不同的用戶所需要的查詢結(jié)果可能是不同的。即使是同一個用戶輸入同一個查詢詞,他在不同的時間、不同的地點和不同的查詢背景下,希望得到的查詢結(jié)果也可能是不一樣的。

      搜索引擎必須理解用戶的意圖和需求,才能非常到位地提供相關(guān)、準(zhǔn)確的信息。要理解用戶的意圖,首先要理解用戶的行為和習(xí)慣,對不同人的查詢做不同的處理,反饋給用戶個性化的內(nèi)容;其次要理解用戶查詢時的上下文背景,包括時間、地點、語義等。個性化的搜索,意味著向更加精確搜索結(jié)果的方向又邁進了一步。

      (三)網(wǎng)絡(luò)的發(fā)展

      1。網(wǎng)絡(luò)終端形式更加豐富

      目前各種客戶端搜索工具的發(fā)展,使得用戶可以不到搜索引擎的網(wǎng)站,而是直接在工具終端搜索所要查詢的信息。手機、PDA等終端設(shè)備的不斷發(fā)展,將最終幫助人們擺脫電腦的制約,而各種嵌入式智能裝備的推廣普及,正在印證著這一趨勢。隨著網(wǎng)絡(luò)終端形式越來越豐富,很多應(yīng)用找到了自己的位置,如手機電影;也有一些應(yīng)用隨著網(wǎng)絡(luò)終端形式的發(fā)展而不斷拓展,如Gmail的手機版。那么作為網(wǎng)絡(luò)第二大應(yīng)用的搜索引擎,也應(yīng)該與時俱進,不斷拓寬應(yīng)用之路。

      實際上很多搜索引擎已經(jīng)這么做了。如Nokia和Yahoo在2006年9月7日發(fā)布了面向Nokia便攜式終端的應(yīng)用軟件“NokiaMobileSearch”。該軟件面向NokiaNseriesS60終端,用Yahoo的網(wǎng)頁、圖像搜索功能可向用戶提供10種語言的搜索結(jié)果。但問題的關(guān)鍵是,只在新的網(wǎng)絡(luò)終端上發(fā)布搜索產(chǎn)品還遠(yuǎn)遠(yuǎn)不夠,應(yīng)該挖掘各種網(wǎng)絡(luò)終端的最佳應(yīng)用模式,更好更方便地、個性化地服務(wù)用戶,用戶才可能喜愛這些新生事物。例如使用手機進行搜索時,完全可以根據(jù)時間和地點進行個性化服務(wù)??梢韵胂?,如果快吃飯的時候使用手機查詢飯店,那么把手機持有者附近的知名飯店作為查詢結(jié)果返回,將會是一個很好的選擇。

      2。網(wǎng)絡(luò)速度的提高

      隨著基礎(chǔ)建設(shè)的發(fā)展和技術(shù)水平的提高,網(wǎng)絡(luò)速度一直在不斷提高。網(wǎng)速的提高對于搜索引擎的影響主要在兩個方面:首先極大地促進了頁面搜集的速度,能夠使搜集的頁面集合更全,覆蓋率更高,同時使頁面集合的更新更快,信息時效性更強;另一方面是在搜索結(jié)果的使用上,可以使用戶更快地打開頁面,下載自己需要的信息,包括pdf文件、圖像文件、音視頻文件等,給用戶更好的應(yīng)用體驗。

      網(wǎng)絡(luò)速度的提高提供了以上的可能性,而搜索引擎必須把這種可能變?yōu)楝F(xiàn)實。另外,搜索引擎還要抓住機會,比如隨著IPv6的發(fā)展,大力推進多媒體信息的搜索和使用。

      3。無線網(wǎng)絡(luò)的發(fā)展

      互聯(lián)網(wǎng)有從有線網(wǎng)絡(luò)向無線網(wǎng)絡(luò)發(fā)展的趨勢,隨著無線通訊技術(shù)的發(fā)展,無線傳輸速率、覆蓋面和穩(wěn)定性得到很大提高,3G的應(yīng)用將進一步擴大這個趨勢。摩根斯坦利(MorganStanley)2006年4月初發(fā)布了一份106頁的名為“全球互聯(lián)網(wǎng)趨勢(GlobalInternetTrends)”的調(diào)查報告[9],這個報告包含了互聯(lián)網(wǎng)的調(diào)查和市場數(shù)據(jù),從金融市場的角度分析了互聯(lián)網(wǎng)市場的風(fēng)險和機遇。摩根斯坦利在這份報告中,試圖說明互聯(lián)網(wǎng)的發(fā)展趨勢已經(jīng)從PC互聯(lián)網(wǎng)轉(zhuǎn)向移動互聯(lián)網(wǎng);而規(guī)模遠(yuǎn)超過PC用戶群,并且沒有經(jīng)過深度發(fā)掘的手機和消費電子設(shè)備,已經(jīng)成為了主導(dǎo)互聯(lián)網(wǎng)發(fā)展的主角。摩根斯坦利認(rèn)為移動互聯(lián)網(wǎng)將帶來新的商機,在未來的數(shù)年內(nèi),移動互聯(lián)網(wǎng)很可能會出現(xiàn)類似于Google那樣的大服務(wù)商。

      (四)來自非技術(shù)方面的挑戰(zhàn)

      1。知識產(chǎn)權(quán)問題

      Web上的知識產(chǎn)權(quán)保護是一個很復(fù)雜的問題——不僅搜索引擎公司覺得麻煩,用戶也很矛盾:一方面認(rèn)為合法的知識產(chǎn)權(quán)理所當(dāng)然應(yīng)該受到保護,另一方面也希望自己能夠更方便地獲得更多權(quán)威的、有價值的信息。

      事實上,Google公司不止一次地受到侵權(quán)起訴,Google使出渾然解數(shù),也不過與原告?zhèn)兇騻€平手而已。國內(nèi)的百度公司也因為提供MP3下載而屢屢為人詬病。知識產(chǎn)權(quán)的問題雖然最終要靠通過相應(yīng)的法律解決,但某種程度上的技術(shù)處理,可以減輕侵權(quán)的壓力。

      2。所在國法律

      搜索引擎龐大的搜羅萬象的能力并非總是它的優(yōu)勢,有時正是因為在這一點上違反了所在國的相關(guān)規(guī)定而遭到封鎖。比如“網(wǎng)頁快照”是Google非常好的一項功能,但在中國內(nèi)地因為與相關(guān)法規(guī)抵觸而被封鎖,而該項功能的封鎖,使得它的不少用戶不得不轉(zhuǎn)向其競爭對手的產(chǎn)品。類似這種問題,是搜索引擎本地化時首要考慮的問題。

      3。網(wǎng)絡(luò)誠信問題

      網(wǎng)絡(luò)誠信不只是搜索引擎發(fā)展中所遇到的難題,而且也是整個互聯(lián)網(wǎng)發(fā)展中的一個非技術(shù)瓶頸。這里以“點擊欺詐”為例來說明問題的嚴(yán)重性。

      “點擊計費”是目前主流搜索引擎商普遍采用的廣告收費模式,他們通過廣告點擊率向廣告主收取費用,其廣告收費=有效點擊次數(shù)×廣告投放價格,其中有效點擊次數(shù)是指排除點擊欺詐后的次數(shù)。點擊欺詐自互聯(lián)網(wǎng)誕生之際就出現(xiàn)了,成為全球搜索引擎商們的一大心病。雖然幾乎每個搜索引擎商都有自己的反欺詐系統(tǒng),但判斷某個點擊是“有效”還是“惡意”其實是非常困難的一件事。點擊欺詐在中國更是泛濫到無法收拾的地步:靠點擊廣告掙錢甚至已經(jīng)成為一個行業(yè)!點擊欺詐的泛濫告訴我們,網(wǎng)絡(luò)誠信遠(yuǎn)遠(yuǎn)沒有我們預(yù)期的那么好。

      2006年3月,網(wǎng)絡(luò)搜索巨頭Google宣布,公司同意支付最高9000萬美元費用與點擊欺詐案的原告達(dá)成和解。雖然Google這位行業(yè)老大終于愿意率先和廣告主們握手言和了,但我們擔(dān)心,Google能夠獨自承擔(dān)整個行業(yè)的重責(zé)嗎?恐怕這由非技術(shù)因素引起的挑戰(zhàn),最終還要靠技術(shù)手段把它們控制在搜索引擎公司能夠承受的范圍內(nèi)。

      三、搜索引擎應(yīng)對方略

      針對以上各種挑戰(zhàn),搜索引擎如何應(yīng)對呢?我們對搜索引擎所采用的方略和相關(guān)的成型研究進行梳理,歸納為以下幾點予以介紹。這幾點和上面介紹的挑戰(zhàn)并沒有一一對應(yīng)的關(guān)系。

      (一)多元化

      針對形形色色的用戶,針對用戶各種各樣的需求,搜索引擎已經(jīng)到了細(xì)分市場的時候,多元化是搜索引擎的必然之路。一方面,針對大量的普通用戶,搜索引擎仍然致力于最廣泛、最全面的信息檢索;另一方面,針對檢索目的明確、查詢要求精準(zhǔn)的用戶,搜索引擎在特定領(lǐng)域和行業(yè)中發(fā)展,推出更有針對性的垂直搜索系統(tǒng),為這些專業(yè)人士更好地服務(wù)。

      1。通用系統(tǒng):其定位是一個好的推薦系統(tǒng)

      在通用系統(tǒng)層面,搜索引擎的定位更加清晰:它只是一個好的推薦系統(tǒng),對于它的返回結(jié)果,用戶必須經(jīng)過自己的過濾和選擇,而不是把排在前一二位的結(jié)果直接拿來使用。

      作為一個好的推薦系統(tǒng),搜索引擎著力做好這樣幾件事情:①信息盡量全而有價值;②信息具有良好的時效性和時新性;③信息查詢盡量準(zhǔn)確,或者說通過盡可能少的交互,引導(dǎo)用戶找到其所需要的結(jié)果;④用戶界面友好;⑤查詢速度快。后面幾個小節(jié)中,我們會有針對性地討論這些方面。

      2。專業(yè)系統(tǒng):要求非常精準(zhǔn),有專業(yè)特色

      專業(yè)搜索系統(tǒng)又稱垂直搜索(verticalsearching)系統(tǒng),它是搜索引擎的細(xì)化和延伸,在最近幾年發(fā)展得如火如荼。垂直搜索引擎和通用搜索引擎的最大區(qū)別,是對網(wǎng)頁信息進行了一定程度的結(jié)構(gòu)化提取,然后將提取的數(shù)據(jù)進行深度加工處理,為用戶提供針對性更強、精確性更高的服務(wù)。

      垂直搜索引擎的應(yīng)用方向很多,比如地圖搜索、音樂搜索、圖片搜索、文獻搜索、企業(yè)信息搜索、求職信息搜索、購物搜索、房產(chǎn)搜索、天氣搜索……幾乎各行各業(yè)各類信息都可以細(xì)化成相應(yīng)的垂直搜索對象。垂直搜索引擎一般在規(guī)模上比通用搜索引擎要小,因為它只涉及某個特定的領(lǐng)域。垂直搜索引擎在技術(shù)上也需要信息搜集程序(但只在一些特定站點活動,并且不是對所有的鏈接都感興趣)、中間處理(分詞、信息提取和索引等)程序以及為用戶提供查詢服務(wù)。在信息搜集方面,Crawler除了使用各種技術(shù)在限定領(lǐng)域內(nèi)面向主題抓取盡可能全的信息外,從領(lǐng)域內(nèi)的各種系統(tǒng)和數(shù)據(jù)庫中獲得信息更為重要,因為這些信息更為權(quán)威、也更有價值。在中間處理上,最大的挑戰(zhàn)是如何利用模版、規(guī)則或Ontology技術(shù),整理所抓取的紛繁蕪雜的數(shù)據(jù),從中提取結(jié)構(gòu)化信息,然后使用關(guān)系模型或XML等半結(jié)構(gòu)化模型進行組織。只有經(jīng)過有效組織,才能提供有針對性的、更為精準(zhǔn)的查詢服務(wù)。

      CiteSeer、GoogleEarth、YahooShopping、Shopping。com等都是代表性的垂直搜索引擎。計算機論文搜索引擎CiteSeer(http://citeseer。ist。psu。edu/cs)是NEC研究院建立的一個學(xué)術(shù)論文數(shù)字圖書館,它提供了一種通過引文鏈接檢索文獻的方式。GoogleEarth使用了公共領(lǐng)域的圖片、受許可的航空照相圖片、KeyHole間諜衛(wèi)星的圖片和很多其他衛(wèi)星所拍攝的城鎮(zhèn)照片,并將它們和GIS布置在一個地球的三維模型上,使人足不出戶就可以在名川大山間翱翔,在摩天樓群中俯瞰。YahooShopping和Shopping。com是美國最大的購物搜索引擎,其中Shopping。com創(chuàng)建于1999年,每月可輸送2000萬個有效銷售給商家,2005年8月被eBay以6。2億美元收購。

      至于國內(nèi),垂直搜索市場更是群雄紛爭,令人眼花繚亂。然而問題是,大家在紛紛尋找好的贏利模式的時候,往往忽略了應(yīng)該有一個好的技術(shù)作為支持。這是一個很可悲的現(xiàn)象。

      (二)搜索質(zhì)量提高

      1。過濾垃圾頁面

      Web垃圾信息泛濫,不僅浪費了搜索引擎的帶寬和時間等寶貴資源,更重要的是,它們的存在大大降低了搜索引擎的查詢質(zhì)量和查詢效率,極大地影響了用戶對Web信息的有效使用。搜索引擎主要在兩個步驟上進行反擊:①在Crawler抓取階段即進行過濾,濾去那些質(zhì)量極低、毫無內(nèi)容可言的“高純度垃圾”,這樣可以節(jié)省網(wǎng)絡(luò)帶寬、費用、抓取時間、存儲空間等,并且大大減輕了下一步在信息分類、信息組織和查詢匹配時的負(fù)擔(dān);②在信息分類和組織階段,計算網(wǎng)頁信息的可信度,在用戶查詢信息時,把可信度作為一個重要因子對查詢結(jié)果集進行排序,從而提高查詢結(jié)果的信息質(zhì)量,滿足用戶的實際需要。

      搜索引擎公司傳統(tǒng)上的做法是,聘請專業(yè)人員,不斷地搜查探測那些惡意欺騙者。當(dāng)確認(rèn)了一個Web垃圾網(wǎng)站后,搜索引擎停止對它的搜索和索引。然而這個探測過程非常昂貴而且緩慢,鑒于此,搜索引擎公司、國內(nèi)外知名大學(xué)和研究機構(gòu)近幾年開始從不同的角度研究和尋找更好的方法,其中有代表性的研究成果如下:

      (1)Google在2002年就注意到Web垃圾信息日漸泛濫的問題,提出要在自己的排名算法中,加大頁面質(zhì)量的權(quán)重[10]。

      (2)Microsoft對近6億個頁面進行了研究,從URL屬性、HostName的解析、鏈接關(guān)系、內(nèi)容特點等幾方面分析了Web垃圾頁面的特點,并試圖按照這些統(tǒng)計屬性來確認(rèn)Web垃圾頁面[8]。

      (3)Stanford的Gyongyi等人受Haveliwala的“Topic-SensitivePageRank”思想的啟發(fā),認(rèn)為好的頁面所指向的鏈接頁面通常也是好的,于是他們提出了TrustRank的概念,依靠一個人工選取的好種子頁面集,計算他們的傳播結(jié)果,從而對Web站點按可信度排序,進而把所有站點分為“好”和“壞”兩種[11]。他們還對Webspam進行了分類研究[12],并對Linkspam聯(lián)盟技術(shù)做了分析[13]。Gyongyi等人提出TrustRank的概念后,受到了廣泛關(guān)注,陸續(xù)有很多研究者進行類似的研究,如匈牙利科學(xué)院的AndrásA。Benczúr等人,以及美國LehighUniversity的BaoningWu和BrianD。Davison等。

      雖然很難見到Google、Yahoo等搜索引擎關(guān)于如何去除垃圾頁面的技術(shù)報告,但他們一直在做著這樣的工作,并且已經(jīng)有所應(yīng)用。這一點從相關(guān)產(chǎn)品的使用體驗中可間接地驗證。

      2。提高查詢準(zhǔn)確度

      對于一個查詢,搜索引擎動輒返回幾十萬、幾百萬篇文檔。面對大量的返回結(jié)果,用戶只能在其中瀏覽篩選。實際上,用戶大多數(shù)時間都沒有足夠的耐心去瀏覽多屏結(jié)果。根據(jù)Silverstein等人的研究結(jié)果,有85%的查詢只需要給出前10個結(jié)果[14]。

      如何使用戶想要的查詢結(jié)果出現(xiàn)在返回集合的前列(最好是第一屏),這個本來就具有挑戰(zhàn)性的問題隨著搜索引擎檢索頁面集的增大而越來越急迫。目前解決這個問題的主要幾種方法是:

      (1)通過各種方法獲得用戶沒有在查詢語句中表達(dá)出來的真正用途,包括:①相關(guān)度反饋機制,使用戶告訴搜索引擎哪些文檔和自己的需求相關(guān)(及其相關(guān)的程度),哪些不相關(guān),通過多次交互逐步求精;②智能代理跟蹤用戶檢索行為,分析用戶模型;③用戶注冊使用,以便更好地分析用戶的使用特點和喜好。

      (2)使用正文分類技術(shù)將查詢結(jié)果分類,使用可視化技術(shù)顯示分類結(jié)構(gòu),用戶可以有選擇性地瀏覽自己感興趣的類別(GoogleNews就采用了這種方法)。

      (3)使用鏈接結(jié)構(gòu)分析進行站點聚類或頁面聚類,然后將信息推薦給用戶(Vivisimo公司就是采用對搜索結(jié)果自動聚類的辦法來滿足不同類型用戶的需要)。

      我們認(rèn)為最有力的方法是改進排名算法。Google的排名規(guī)則一直在變化中,2001年基于HillTop算法進行的優(yōu)化是比較明顯的變化(HillTop認(rèn)為來自相同主題的相關(guān)文檔鏈接對權(quán)重計算的貢獻更大),現(xiàn)在又到了迫切需要算法更新的時候了。據(jù)說Google正在研究“多倍索引信息獲取系統(tǒng)(MIBIRS)”,可以使搜索引擎的網(wǎng)頁索引數(shù)量達(dá)到驚人的1000億幅甚至更多,我們翹首以盼。

      (三)搜索能力加強

      1。對多媒體搜索的支持

      隨著多媒體信息在網(wǎng)絡(luò)上的大量涌現(xiàn)和人們對多媒體信息需求的高漲,知名搜索引擎如Google、Yahoo、AltaVista、Lycos、AllTheWeb等對于多媒體搜索的能力也在不斷加強。它們或在一個統(tǒng)一的用戶界面上提供資料類型選擇,或直接提供獨立的多媒體搜索引擎。另外,各種圖像搜索引擎和各種娛樂搜索引擎也不斷涌現(xiàn)。這些系統(tǒng)可以說在很大程度上滿足了用戶的需要,然而它們對多媒體搜索的支持都還在初級階段,基本上是基于文本關(guān)鍵詞和自動標(biāo)注進行多媒體信息檢索,缺乏基于圖像和音視頻內(nèi)容進行比對檢索的功能。

      一般的說,多媒體信息的內(nèi)容表示可分為物理層(如信號樣本、像素等)、特征層(如圖像的顏色和紋理、語音頻譜)、語義層內(nèi)容(如語音的腳本、音樂的音符、圖像中的物體形狀和人臉)等三個層次?;趦?nèi)容的檢索一般針對后兩個層次?;谔卣鲗哟蔚膬?nèi)容檢索主要應(yīng)用于以媒體實例為輸入的查詢方式。檢索時,首先對輸入的實例提取特征模板,再與檢索源中的數(shù)據(jù)相匹配。相關(guān)研究主要圍繞著檢索的快速性和準(zhǔn)確性問題展開,具體涉及特征選取、匹配策略、算法優(yōu)化等。

      關(guān)于圖像處理和檢索的專利較多,根據(jù)美國專利網(wǎng)的檢索結(jié)果,與圖像檢索相關(guān)的專利達(dá)186項,但是很少見它們應(yīng)用于實際系統(tǒng),而用于網(wǎng)絡(luò)多媒體搜索引擎的專利,則更是罕有。2004年Lowe提出了SIFT(Scale-InvariantFeatureTransform)[15]特征,該特征具有旋轉(zhuǎn)、縮放不變性,并且對光照、仿射變換以及視角變化等都具有相當(dāng)程度的魯棒性。除此之外,每一個SIFT特征都具有很強的描述和區(qū)分能力,因此非常適用于圖像實例檢索。但在對海量數(shù)據(jù)的檢索中,如何降低其復(fù)雜度需要進一步的深入研究。

      在音頻檢索方面,常用的特征包括:短時能量、頻譜、過零率、美標(biāo)度倒譜等。針對大數(shù)據(jù)量檢索問題,很多工作集中在特征匹配的策略優(yōu)化上?;趦?nèi)容的視頻檢索可以看做圖像和音頻檢索的擴展,所用特征除圖像和音頻中的常用特征以外,還包括一些專有特征:如物體運動、鏡頭切換等。關(guān)于音視頻檢索的專利也不少,根據(jù)美國專利網(wǎng)的檢索結(jié)果,與音頻和視頻檢索相關(guān)的分別為28項和80項,但是應(yīng)用于網(wǎng)絡(luò)多媒體搜索引擎的專利卻很少。

      語義層次上的內(nèi)容檢索研究相對更為困難一些,下面幾個方面是最近幾年進展較快的:場景分類技術(shù)、語音數(shù)據(jù)識別、語音說話人分割、視頻數(shù)據(jù)中精彩片段提取等。然而這些技術(shù)距離大規(guī)模檢索應(yīng)用還有相當(dāng)?shù)木嚯x。

      在這里值得一提的是,面對咄咄逼人的Google和Yahoo,法國總統(tǒng)雅克·希拉克在2006年新年講話時宣布,法國決定聯(lián)手德國,抓住多媒體搜索這個機會,開發(fā)“真正的多媒體搜索引擎Quaero,以應(yīng)對Google和Yahoo帶來的全球挑戰(zhàn)”。

      Quaero的拉丁語意是“我搜”,該項目的目標(biāo)是,搜索時無須借助文字描述就能“讀懂”音頻、圖像和視頻的內(nèi)容。目前,這樣的圖片識別程序已經(jīng)存在。法國中型軟件公司、Quaero項目成員LTUTechnologies向美國聯(lián)邦調(diào)查局(FBI)提供電腦取證分析工具,用于分析被扣押的硬盤中的圖片,并將其與已知的戀童癖罪犯的照片相比對。另外他們還有一些可將語音轉(zhuǎn)化為文字的音頻解析程序。Quaero項目組面臨的挑戰(zhàn)是,如何改進這些工具以提高搜索準(zhǔn)確度,同時提高速度,適應(yīng)大數(shù)據(jù)量的檢索。

      目前參與Quaero研發(fā)的主要公司和機構(gòu)包括法國電信、湯姆遜公司、法國視聽研究所、德國電信、貝塔斯曼集團和西門子公司等。Quaero項目預(yù)計在未來5年內(nèi)需要投入10億~20億歐元,所需資金將由法、德兩國政府以及兩國企業(yè)共同承擔(dān),其中法國政府已計劃5年內(nèi)投資2。5億歐元。這個項目究竟走勢如何,我們將拭目以待。

      2。對DeepWeb的搜索

      DeepWeb已經(jīng)擁有不少研究者,如Stanford和UIUC的學(xué)者們,他們分別搭建了HiWE[16]和MetaQuerier[17]兩個很好的原型系統(tǒng)。也有一些搜索引擎能夠搜索DeepWeb信息,如004km.cn、004km.cn。com、004km.cn等。然而它們或者太小,或者搜索Invisible信息的能力太弱,所以使用起來很多時候不能得心應(yīng)手。

      幾大主流搜索引擎尚未提供DeepWeb搜索功能,主要原因是技術(shù)上還不夠成熟。然而“需求是創(chuàng)新之母”,我們期待在不久的將來能使用Google、Yahoo等查詢DeepWeb信息,或者是基于DeepWeb查詢的搜索引擎迅速發(fā)展起來,為我們提供更好的服務(wù)。

      3。ArchiveSearch

      搜索引擎通常能夠提供的信息通常只是最近在網(wǎng)上有的信息,而很多情況下我們需要了解網(wǎng)上曾有的歷史信息,甚至需要將不同時間的信息進行歸納、比較和綜合。另外,對于搜索引擎來說,把自己辛辛苦苦搜集來的信息輕易拋棄也是很可惜的事。

      這方面的研究國內(nèi)國外都曾開展過,如InternetArchive、UCLA的WebArchive[18]和北京大學(xué)的WebInfoMall(http://004km.cn/)作為搜索引擎的領(lǐng)袖公司,一直在進行著前沿研究,并不斷推出新的產(chǎn)品。就在不久前,Google專門為中小企業(yè)推出了集成了Gmail、Gtalk、GoogleCalendar和GooglePageCreator等免費服務(wù)的GoogleAppsforYourDomain項目。接著Google又跟LitCam和UNESCO(教科文組織)合作,推出了一個專為教育和文化事業(yè)而設(shè)置的集成服務(wù)——Google知識工程。Google還推出了新搜索服務(wù)——SearchMash。com作為Google的子搜索網(wǎng)站,SearchMash采用了圖文結(jié)合的方式顯示搜索結(jié)果,左邊為文字搜索結(jié)果,右邊為符合度最高的圖像搜索結(jié)果。另外,Google正在研究“多倍索引信息獲取系統(tǒng)(MIBIRS)”,據(jù)說通過該項技術(shù),可以使Google搜索引擎的網(wǎng)頁索引數(shù)量達(dá)到驚人的1000億幅或更多。Google對于語義搜索的研究也在進行中。

      (2)Microsoft(http://research。microsoft。com/)對于搜索引擎這個龐大的市場當(dāng)然不肯放過。微軟亞洲研究院(http://research。microsoft。com/asia/)早在2001年底,便開始了有關(guān)互聯(lián)網(wǎng)信息檢索技術(shù)的研究,幾年來發(fā)表了很多高水平的論文,并不斷把這些研究成果轉(zhuǎn)化為技術(shù)。他們的代表性成果包括對網(wǎng)頁細(xì)分的“數(shù)據(jù)模塊化的Web檢索方法”、搜索動態(tài)網(wǎng)頁數(shù)據(jù)的“深層網(wǎng)絡(luò)數(shù)據(jù)發(fā)掘技術(shù)”,等等。對于分散于互聯(lián)網(wǎng)上的圖像資源,他們開發(fā)出的智能化圖片搜索技術(shù),已可自動識別與分類搜索結(jié)果。在2006年微軟創(chuàng)新日上,微軟亞洲研究院集中展示的38項技術(shù)中,搜索類技術(shù)就多達(dá)11種,包括對文字、圖像、新聞事件等進行搜索,應(yīng)用涵蓋了手機移動、IPTV等多個方面。微軟亞洲研究院院長沈向洋博士于2006年9月在北京宣布,微軟亞洲研究院將在原有四大研究方向:新一代多媒體、新一代用戶界面、無線及網(wǎng)絡(luò)技術(shù)和數(shù)字娛樂的基礎(chǔ)上,增加互聯(lián)網(wǎng)搜索和挖掘為該機構(gòu)的第五大研究方向。

      (3)Yahoo!(http://004km.cn)……就是例子。前面提到的法國和德國聯(lián)手開發(fā)Quaero搜索引擎的計劃也能給我們啟示。在上述包羅萬象數(shù)據(jù)(信息)的大搜索的概念下,本土努力將更有天然的優(yōu)勢,而一定的國家行為可以使這種優(yōu)勢發(fā)揮出最好的效益來。

      本文004km.cn 004km.cn A5首發(fā),轉(zhuǎn)載請保留。

      第五篇:搜索引擎優(yōu)化方法總結(jié)

      搜索引擎優(yōu)化方法總結(jié)

      有了做搜索引擎優(yōu)化的正確思想認(rèn)識,接著就是探討搜索引擎優(yōu)化的方法了。搜索引擎優(yōu)化可以從站內(nèi)優(yōu)化與站外優(yōu)化兩個方面去考慮。下面文軍信息給大家詳細(xì)介紹一下從網(wǎng)站源代碼入手該如何優(yōu)化和其他一些優(yōu)化方法總結(jié)。

      從網(wǎng)站源代碼做優(yōu)化主要從以下八個方面去考慮。

      1、盡可能少地使用javascript來做與內(nèi)容相關(guān)的事情。

      盡可能少地使用javascript來做與內(nèi)容相關(guān)的事情。例如用document.write去顯示正文。這樣會影響搜索引擎對頁面內(nèi)容的搜索。

      2、千萬不要去javascript來實現(xiàn)你網(wǎng)站的導(dǎo)航。

      Javascript腳本導(dǎo)航,方便了你但很可能會將搜索引擎拒之門外。那樣會讓搜索引擎迷失方向。

      3、每個頁面的關(guān)鍵字盡可能出現(xiàn)在頁面的標(biāo)題,也就是頭部的Title標(biāo)簽中。

      當(dāng)然,要合理應(yīng)用,不要太長,更別用大量與頁面內(nèi)容無關(guān)的網(wǎng)絡(luò)熱門關(guān)鍵字。因為那就不是優(yōu)化而是在作弊。

      4、將css與javascript全部用下邊的方法分離到外部文件中去。

      讓html代碼最大可能的只是用來顯示實際內(nèi)容。

      5、采用xhtml代碼編寫頁面,拋棄傳統(tǒng)Table布局模式,去掉頁面中的例如font/bgcolor等格式化控制標(biāo)簽。

      用符合web標(biāo)準(zhǔn)的代碼來制作頁面。這樣能夠讓xhtml代碼結(jié)構(gòu)化、語義化。提高頁面代碼的可讀性。

      6、讓頁面代碼體積變得更小。

      采用了上邊的方法你會發(fā)現(xiàn)你的html代碼會變得非常小,當(dāng)然如果可以的話。讓它變得更小。

      太大的頁面會影響搜索引擎的處理速度。一般通過xhtml+css設(shè)計的網(wǎng)頁,html代碼應(yīng)該可以控制在50K以內(nèi)。大家可以去看一下用web標(biāo)準(zhǔn)重構(gòu)得比較好的網(wǎng)站。

      7、用好圖片的alt標(biāo)簽,合理的使用頁面關(guān)鍵字去描述圖片,這樣能增加頁面的關(guān)鍵字密度。

      搜索引擎畢竟不是人腦,它不能讀懂圖片內(nèi)容然后生成概要。因此alt屬性的加入非常重要。使得合理的頁面關(guān)鍵字來描述圖片,會使得你的頁面對搜索引擎更友好。

      8、合理使用恰當(dāng)標(biāo)簽,體現(xiàn)文檔結(jié)構(gòu)。

      盡量在每個頁面代碼中合理使用標(biāo)簽并讓你的關(guān)鍵字出現(xiàn)在標(biāo)簽中,讓頁面的文檔結(jié)構(gòu)更清晰。這里只是將在頁面制作的過程中涉及到的一些細(xì)節(jié)問題拿出來和大家探討一下。由此也可以說明為什么基于web標(biāo)準(zhǔn)設(shè)計的網(wǎng)站會更有利于SEO了。文軍信息建議如果您不打算花錢去請專業(yè)的SEOER來為您的網(wǎng)站做優(yōu)化,那么可以讓頁面制作人員在制作上注意一些細(xì)節(jié)。相信這樣免費的一些細(xì)節(jié)也能達(dá)到一個比較好的效果。

      下面文軍信息給大家介紹其他一些SEO優(yōu)化的技巧:

      1、使用位置導(dǎo)航圖: 一個讓瀏覽者進入后不知東西的頁面很難留住人,瀏覽者可能馬上離開,提供一項位置導(dǎo)航圖不僅可以讓用戶體驗更好,同時可以讓搜索引擎的支柱程序更正確更快速的載入并記錄網(wǎng)站相關(guān)內(nèi)容,這樣有助于提升網(wǎng)頁PR值。

      2、了解搜索引擎到底要什么: 搜索引擎對于收錄頁面并如何判定頁面的PR值有一套規(guī)則,應(yīng)該閱讀它們,使優(yōu)化向著搜索引擎的知道原則方向去做使使網(wǎng)站被收錄的最快最有效的方法。

      3、使用關(guān)鍵字語句: 關(guān)鍵字沒必要只限于一個單詞或字符,事實上,并不是這樣的.使用關(guān)鍵字語句可以讓你更好的將內(nèi)容集中面向目標(biāo)客戶群體。

      4、使用合適的關(guān)鍵字: 使用最能概括您網(wǎng)站內(nèi)容的關(guān)鍵詞,而這個關(guān)鍵詞一般也應(yīng)該是普通的瀏覽者平常在搜索某一類產(chǎn)品像您的網(wǎng)站所列的一類產(chǎn)品所習(xí)慣使用的.直接使用不同的索引擎來試驗一下,看下您所設(shè)置的關(guān)鍵詞在搜索引擎下得到的結(jié)果,并改善。

      5、將關(guān)鍵字置于最前面。當(dāng)構(gòu)建頁面內(nèi)容時,確保您所使用的引導(dǎo)瀏覽者登錄到您網(wǎng)站的關(guān)鍵詞出現(xiàn)在第一個句子當(dāng)中,而這點正是搜索引擎在搜索結(jié)果中顯示出來的。

      6、雇傭?qū)I(yè)人士.并非所有的人都有非常專業(yè)的文字表達(dá)能力.雇傭?qū)I(yè)人士進行網(wǎng)站內(nèi)容的編排可以有助于使網(wǎng)站頁面看上去條例清晰,簡潔,內(nèi)容集中,這樣的網(wǎng)站用戶感覺更舒服,更愿意回頭再瀏覽。

      7、使用容易記的網(wǎng)址.對于一個容易吸引人,容易記的網(wǎng)址是無可替代的.務(wù)必使網(wǎng)址簡短,好記.,這就是為何谷歌搜索這個字眼引擎進入我們的日常語言的重要原因。

      8、在整個網(wǎng)頁中都使用關(guān)鍵詞: 一旦發(fā)現(xiàn)關(guān)鍵字的數(shù)量降下來了,一定要毫不吝惜的在頁面內(nèi)容中多加入些關(guān)鍵詞.關(guān)鍵詞是頁面內(nèi)容當(dāng)中非常吸引瀏覽者的一個方面,努力確保關(guān)鍵詞所指向的內(nèi)容為受眾所認(rèn)可.9、更新內(nèi)容: 一旦完成了相應(yīng)的優(yōu)化內(nèi)容并獲得了較好的PR值后,還必須做到網(wǎng)站內(nèi)容的及時更新,一定要記住競爭者隨時都在想一些更能吸引您現(xiàn)在顧客的方法,您的顧客可能會被挖走.如果網(wǎng)站內(nèi)容很舊而且又很久都沒有更新的網(wǎng)站很難帶來回頭瀏覽客,更別談留住瀏覽者,即便是您的網(wǎng)站在搜索引擎的搜索結(jié)果中非??壳啊?/p>

      10、鏈接到其它的網(wǎng)站: 使網(wǎng)站鏈接到其它相關(guān)聯(lián)的網(wǎng)站對于提升PR值是至關(guān)重要的.不要使用垃圾信息的方式(通過博客鏈接或者鏈接到一些根本就沒有內(nèi)容的“鏈接工廠”),而是使一些內(nèi)容關(guān)聯(lián)的,高質(zhì)量的網(wǎng)站鏈接到您的網(wǎng)站。一系列的互惠的鏈接對于對于突出網(wǎng)頁并提升PR值是非常重要的一個環(huán)節(jié)。

      下載E團購網(wǎng)搜索引擎優(yōu)化(評估、分析)報告word格式文檔
      下載E團購網(wǎng)搜索引擎優(yōu)化(評估、分析)報告.doc
      將本文檔下載到自己電腦,方便修改和收藏,請勿使用迅雷等下載。
      點此處下載文檔

      文檔為doc格式


      聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻自行上傳,本網(wǎng)站不擁有所有權(quán),未作人工編輯處理,也不承擔(dān)相關(guān)法律責(zé)任。如果您發(fā)現(xiàn)有涉嫌版權(quán)的內(nèi)容,歡迎發(fā)送郵件至:645879355@qq.com 進行舉報,并提供相關(guān)證據(jù),工作人員會在5個工作日內(nèi)聯(lián)系你,一經(jīng)查實,本站將立刻刪除涉嫌侵權(quán)內(nèi)容。

      相關(guān)范文推薦

        搜索引擎SCP分析

        搜索引擎是指根據(jù)一定的策略、運用特定的計算機程序從互聯(lián)網(wǎng)上搜集信息,在對信息進行組織和處理后,為用戶提供檢索服務(wù),將用戶檢索相關(guān)的信息展示給用戶的系統(tǒng) 全文:從互聯(lián)網(wǎng)提......

        團購網(wǎng)分析報告與協(xié)議合同書

        2010年國內(nèi)團購網(wǎng)站統(tǒng)計分析報告:餐飲為王,網(wǎng)購流行 各網(wǎng)站平均售價、成交人數(shù)和折扣幅度 上次我們給出了國內(nèi)團購網(wǎng)站典型交易的概括:“一個團購活動大概會有1200人參與,原價......

        搜索引擎優(yōu)化戰(zhàn)略合作協(xié)議書

        新勢力網(wǎng)絡(luò)營銷策劃 電話:0379-63367515手機:***董耀北 搜索引擎優(yōu)化戰(zhàn)略合作協(xié)議書甲方: 乙方: 甲乙雙方本著精誠合作,雙贏,平等互利互惠的原則,經(jīng)友好協(xié)商,就相關(guān)合作事宜......

        國內(nèi)搜索引擎優(yōu)化的發(fā)展趨勢

        國內(nèi)搜索引擎優(yōu)化的發(fā)展趨勢 一、搜索引擎優(yōu)化的行業(yè)發(fā)展趨勢 1、單純的seo技巧、跟蹤搜索引擎算法變化的意義越來越小。 seo本身的技術(shù)性越來越低,但它對相關(guān)從業(yè)人員的綜合......

        團購網(wǎng)站的風(fēng)險投資及其分析

        團購網(wǎng)站的風(fēng)險投資及其分析 從2010年3月中國首家團購網(wǎng)站——美團網(wǎng)在中國開始運營,團購網(wǎng)站以其飛快的速度在各個城市中發(fā)展。目前,拉手網(wǎng)已經(jīng)在北京、上海、廣州、深圳等一......

        2007年國內(nèi)視頻搜索引擎分析報告

        2007年國內(nèi)視頻搜索引擎分析報告 一,背景 互聯(lián)網(wǎng)正在經(jīng)歷著飛速發(fā)展的時代,在過去短短的幾年里互聯(lián)網(wǎng)從以telnet,email為代表的粗陋文本時代,一躍發(fā)展為豐富的寬帶多媒體時代。......

        搜索引擎優(yōu)化思路與方法總結(jié)

        上海開成網(wǎng)絡(luò)營銷策劃公司熊俞強: 搜索引擎優(yōu)化思路與方法總結(jié) 1 搜索引擎優(yōu)化如何去優(yōu)化,我們首先得從思想上開始,正確認(rèn)識搜索引擎營銷是第一步,接著才是探討搜索引擎營銷有哪......

        網(wǎng)站搜索引擎優(yōu)化(SEO)服務(wù)合同書

        網(wǎng)站搜索引擎優(yōu)化(SEO)服務(wù)合同書 甲方: 乙方:常州市姚沅網(wǎng)絡(luò)科技有限公司 經(jīng)甲、乙雙方友好協(xié)商達(dá)成以下共識。 第一條:網(wǎng)站搜索引擎優(yōu)化服務(wù)是指乙方通過針對甲方網(wǎng)站的網(wǎng)頁內(nèi)......