第一篇:google搜索國外客戶技巧(范文)
用google搜索國外客戶的三十絕招http://
第二篇:google搜索流程
2010年08月23日12:47 谷歌(Google),一個非常成功,但又十分神秘,而且?guī)в袔追掷硐牖实幕ヂ?lián)網(wǎng)搜索巨人,它還是一家相當(dāng)了不起的廣告公司,谷歌首頁上的那個搜索按鈕是其年贏利200億美元的殺手級應(yīng)用,也是Internet首屈一指的商業(yè)和技術(shù)神話。近日國外一家網(wǎng)站(PPCblog)精心繪制了一張谷歌搜索流程圖,這張流程圖展示了每天擁有3億次點(diǎn)擊量的Google搜索按鈕背后搜索引擎在那不到1秒的響應(yīng)時間內(nèi)所進(jìn)行的處理。
在你點(diǎn)擊了Google搜索按鈕之后到看到結(jié)果這不足1秒鐘的時間內(nèi),它做了什么?互聯(lián)網(wǎng)上的內(nèi)容如何被谷歌找到?什么樣的內(nèi)容會被收錄?想必大家一定都想知道谷歌搜索按鈕背后的秘密吧。別急,開始之前我們先來看一下神秘的谷歌數(shù)據(jù)中心。
谷歌自家設(shè)計服務(wù)器
谷歌的數(shù)據(jù)中心高度機(jī)密,我們所能得到的信息十分有限。我們先來看幾個數(shù)據(jù):谷歌在美國本土的數(shù)據(jù)中心有19個以上,另有17個分布在美國以外的世界各地;每個數(shù)據(jù)中心有50萬平方英尺(46450平方米),建造一個數(shù)據(jù)中心要花費(fèi)約6億美元;谷歌的數(shù)據(jù)中心是世界上最高效的設(shè)施之一,非常環(huán)保;數(shù)據(jù)中心使用50-100兆瓦的電力,考慮到冷卻問題,通常建在便于用水的地方;谷歌的服務(wù)器被安置在標(biāo)準(zhǔn)的海運(yùn)集裝箱中,每個集裝箱可容納1160臺服務(wù)器。關(guān)于谷歌的數(shù)據(jù)中心,我們就只知道這么多了。
圖1 谷歌自家設(shè)計的服務(wù)器
圖2服務(wù)器自備電池
谷歌擁有的數(shù)十萬臺服務(wù)器都是自己設(shè)計的,它們認(rèn)為這是公司的核心技術(shù)之一。每臺服務(wù)器都配有一顆12伏電池,確保萬一主電源斷電時還可持續(xù)供電。
至于為什么為每臺服務(wù)器配備電池,谷歌的回答是成本。一般數(shù)據(jù)中心多依賴UPS(不間斷電源系統(tǒng)),這基本上算是大電池,會在主電力失效而發(fā)電機(jī)還來不及啟動時暫時協(xié)助供電。而谷歌認(rèn)為直接把電力內(nèi)建到服務(wù)器更便宜,而且成本能直接跟服務(wù)器數(shù)量相符合,如此便不會浪費(fèi)多余的容量。另一個原因是效率,大型UPS可達(dá)92-95%的效率,這意味著許多電力還是被浪費(fèi)掉了,但谷歌采用的內(nèi)建電池作法效率超過99.9%。
圖3 谷歌的服務(wù)器被安裝在集裝箱中,每個集裝箱容納1160臺
圖4工作中的谷歌員工
谷歌如何找到并收錄你上傳的內(nèi)容?
圖5發(fā)生在用戶搜索之前
谷歌使用它的“爬蟲”工具在一刻不停地周游互聯(lián)網(wǎng)世界的每一個角落。上圖中間的6個步驟依次描繪了從內(nèi)容出現(xiàn)在互聯(lián)網(wǎng)上到內(nèi)容被收錄進(jìn)谷歌的數(shù)據(jù)庫供用戶檢索這一過程,其中第2、3、5步又有許多分支,所有這些都是為了建立一個信息“集匯池”,這是第一個階段的工作,第二個階段才是從這個“池”中為用戶篩選他們所需要的內(nèi)容。接下來我們一步步看谷歌是如何搜集并整合信息的。
1、網(wǎng)友上傳內(nèi)容,比如博客、微博或其它類型的WEB內(nèi)容被更新到網(wǎng)上。
2、Google的“爬蟲”發(fā)現(xiàn)了這一更新。在這一步,谷歌加入了許多判斷機(jī)制,主要包括以下幾點(diǎn):
2.1、Google的“爬蟲”沿著鏈接路徑(URL)周游互聯(lián)網(wǎng),但如果沒有URL指向某一站點(diǎn),則這一站點(diǎn)將不會被索引。
2.2、如果你在robots.txt中設(shè)置了不許索引(部分或全部),Google的“爬蟲”將不會抓取你站點(diǎn)上的相應(yīng)內(nèi)容。
2.3、如果指向你站點(diǎn)的連接上有nofollow標(biāo)簽,Google的“爬蟲”將不會從這些URL路徑來到你的站點(diǎn)。如下圖:
網(wǎng)頁原代碼中的nofollow標(biāo)簽
URL就像是Google“爬蟲”周游互聯(lián)網(wǎng)時的路標(biāo),谷歌當(dāng)然希望收錄有價值的網(wǎng)頁,所以必須采取一種機(jī)制分辨哪些URL是垃圾信息,nofollow標(biāo)簽正是谷歌所倡導(dǎo)的方法之一。網(wǎng)站的合法更新人員幾乎不會上傳垃圾URL,但它們往往大量出現(xiàn)在評論跟帖和論壇中,就像上圖中的例子,這些URL對于谷歌來講是沒有意義的,為了防止“爬蟲”經(jīng)由這些URL到達(dá)某一站點(diǎn),在源代碼中它們都會自動被加上nofollow標(biāo)簽。
2.4、Google也能通過blog軟件或xml站點(diǎn)地圖找到你的網(wǎng)站。
2.5、從權(quán)威性越高的網(wǎng)站鏈接到你網(wǎng)站的URL越多,你的網(wǎng)站的權(quán)威性也就越高,但Google“爬蟲”始終會忽略被加上了nofollow標(biāo)簽的URL。
上面這幾點(diǎn)大概就是谷歌在收錄信息時對內(nèi)容提出的“準(zhǔn)入”要求,看來在一些開放的地方(比如論壇)大量發(fā)布URL以求讓谷歌關(guān)注,這一小伎倆是沒有什么效果的。以上是信息被谷歌收錄之前所發(fā)生的事,一旦信息被谷歌收錄了會發(fā)生什么呢?請往下看:
圖8信息“素材”的存儲
3、信息被谷歌收錄之后當(dāng)然也要進(jìn)行加工處理,主要包括兩個步驟,一是信息“素材”的存儲,二是對收錄的信息按要求進(jìn)行優(yōu)化,上圖描繪了“素材”的存儲方式,主要包括兩部分:網(wǎng)頁標(biāo)題和鏈接數(shù)據(jù)被保存在一個索引中,用于廣度優(yōu)先搜索(可見文章標(biāo)題是多么的重要,做編輯的一定要有駕馭標(biāo)題黨的覺悟);網(wǎng)頁內(nèi)容保存在另一個索引中,以用于檢索頻率不高的長尾、個性化、深度優(yōu)先搜索。
此時可能你已經(jīng)明白了,當(dāng)你用谷歌搜索時,你并沒有在檢索時時更新的互聯(lián)網(wǎng),而是在檢索谷歌的緩存,只是谷歌更新的速度非??欤宰屍渚彺姹M量與互聯(lián)網(wǎng)上的內(nèi)容同步。
圖9優(yōu)化已收錄的信息
4、谷歌基于URL評估域名和網(wǎng)頁的總體權(quán)威性。
5、檢查網(wǎng)頁以防止作弊行為,包括以下幾點(diǎn):
5.1、谷歌的搜索質(zhì)量和反垃圾信息審查。
5.2、1萬多遠(yuǎn)程測試用戶評價搜索結(jié)果的質(zhì)量。
5.3、谷歌征請用戶對有PageRank訛詐嫌疑的垃圾信息進(jìn)行舉報。
5.4、谷歌根據(jù)數(shù)字千年版權(quán)法(DMCA)去除盜版內(nèi)容。
6、在對頁面進(jìn)行分析之后,每個頁面都被附加上很多用于輔助用戶搜索的數(shù)據(jù)片。
從信息出現(xiàn)在互聯(lián)網(wǎng)上到被谷歌收錄,然后谷歌對這些數(shù)據(jù)進(jìn)行分析優(yōu)化,至此,一個實(shí)時更新的互聯(lián)網(wǎng)信息“集匯池”就建立起來了,可以說谷歌存儲著整個互聯(lián)網(wǎng)的快照。以上就是我們在按谷歌搜索按鈕之前它所做的事情,接下來我們看一下谷歌如何響應(yīng)用戶的搜索請求,另外谷歌的廣告是如何來到我們面前的,不要忘記,谷歌可是靠廣告營生的。
只要有人用谷歌的服務(wù)它就能從中賺錢,就怕像安卓(Android)手機(jī)系統(tǒng)那樣,有些流氓廠家把安卓裝在了自己的智能手機(jī)中,但是把其上谷歌的各種服務(wù)全部抹掉,改用自己的服務(wù),這樣谷歌當(dāng)然不干了,所以安卓一更新,這些流氓手機(jī)廠家就緊張。
谷歌如何幫助用戶進(jìn)行搜索?
圖10從用戶開始檢索到生成初步結(jié)果
從用戶開始檢索到生成初步結(jié)果(這時的結(jié)果并不會直接呈現(xiàn)給用戶),經(jīng)歷了4個步驟:
1、用戶發(fā)出搜索請求。谷歌搜索質(zhì)量工程師PatrickRiley說:在大多數(shù)搜索中,你的搜索處于多個并行的控制過程或谷歌實(shí)驗(yàn)室的創(chuàng)新項(xiàng)目組過程中,可以說每一個查詢請求都會參與一些谷歌的創(chuàng)意實(shí)驗(yàn)。我們都是小白鼠?
2、谷歌會對用戶輸入的關(guān)鍵詞提供一些建議。
3、谷歌會用同義詞匹配與你的搜索關(guān)鍵詞語義相近的查詢結(jié)果。
4、生成初步的查詢結(jié)果,雖然谷歌宣稱可以找到成千上萬的相關(guān)結(jié)果,但一般只顯示不到1000條,同時查詢結(jié)果將被進(jìn)行本地化處理,本土站點(diǎn)在查詢結(jié)果中優(yōu)先出現(xiàn)。
搜索結(jié)果將如何被優(yōu)化?
1、對查詢結(jié)果按權(quán)威性和PageRank進(jìn)行排序,重復(fù)的查詢結(jié)果被剔除。此時的查詢結(jié)果已接近最終形態(tài),在這一基礎(chǔ)上,有兩個進(jìn)程將分開進(jìn)行--查詢結(jié)果優(yōu)化和為其匹配相應(yīng)的廣告。我們先來看查詢結(jié)果優(yōu)化。
圖11對查詢結(jié)果進(jìn)行過濾處理
2、對查詢結(jié)果進(jìn)行過濾處理。包括以下幾點(diǎn):
2.1、對通常的查詢,谷歌會把相關(guān)的專題性垂直搜索結(jié)果(比如新聞、購物、視頻、書籍、地圖等)也加到返回的查詢結(jié)果中。
2.2、個性化,用戶訪問過的網(wǎng)站在查詢結(jié)果列表中會更靠上
2.3、大量使用錨點(diǎn)的網(wǎng)站有可能被從查詢結(jié)果中刪除
2.4、如果網(wǎng)頁被其他高PageRank的網(wǎng)站引用,則網(wǎng)頁的重要性會大大提高。
2.5、趨勢分析:對搜索流量爆增或有大量新聞的搜索關(guān)鍵詞,谷歌會在新的查詢結(jié)果中增加額外的PageRank權(quán)值。
2.6、同一個域名下的多個網(wǎng)頁如果具有相同的PageRank會被歸為一組。
2.7、查詢結(jié)果最終形成(將與廣告一同顯示)
搜索結(jié)果與廣告
圖12 用戶所搜索的內(nèi)容如何與廣告相結(jié)合?
1、Google根據(jù)關(guān)鍵詞、廣告類型、用戶所處位置找出相關(guān)的被競價拍賣的關(guān)鍵詞廣告
1.1、關(guān)鍵詞廣告必須遵守當(dāng)?shù)胤蓷l文。廣告業(yè)主的非法廣告將被取締,如果關(guān)鍵詞的搜索流量過低或關(guān)鍵詞廣告點(diǎn)擊量偏低,則會被自動禁用,出于商業(yè)策略,像亞馬遜這樣的客戶會給予優(yōu)惠折扣。
1.2、關(guān)鍵詞相關(guān)廣告按收益潛力排序。
1.3、對廣告業(yè)主來說廣告內(nèi)容一般是固定的,但有時使用動態(tài)關(guān)鍵詞使關(guān)鍵詞廣告與搜索關(guān)鍵詞相關(guān)度更高。一些廣告允許增加附屬信息,比如網(wǎng)站鏈接、電話號碼、產(chǎn)品鏈接、地址等。
1.4、如果廣告擁有相當(dāng)高的點(diǎn)擊率,則會顯示在搜索結(jié)果列表的上方,以使其更顯眼。
1.5、其余的廣告依序顯示在頁面右側(cè)
經(jīng)過上述一系列復(fù)雜的信息處理過程,最終返回給用戶的是一個個性化的、具備地理位置特征的、布局簡潔的查詢結(jié)果頁面,當(dāng)然還精確匹配了廣告,所有這些步驟在總共不到1秒的時間內(nèi)完成,每天3億次的點(diǎn)擊量給Google帶來了超過200億美元的年收入
關(guān)于精確廣告匹配的小例子,請看下圖:
圖13思科路由器的廣告北京搜索結(jié)果
圖14思科路由器的廣告廣州搜索結(jié)果
海芯博業(yè)的廣告下面標(biāo)注了北京市三個字,可見這是一個地區(qū)性的廣告推廣,在廣州搜索結(jié)果中不可見。
谷歌官方對其搜索技術(shù)的敘述
我們搜索技術(shù)的后端軟件會在服務(wù)器側(cè)觸發(fā)一系列執(zhí)行時間不到1秒的并行計算,谷歌問世前的傳統(tǒng)搜索引擎的搜索結(jié)果嚴(yán)重依賴于關(guān)鍵詞在頁面上出現(xiàn)的頻度,我們使用了200多個指標(biāo)信號(其中包括我們擁有專利的PageRank頁面等級加權(quán)算法)用來檢查萬維網(wǎng)的鏈接結(jié)構(gòu)并決定網(wǎng)頁的重要程度。
我們假定一個網(wǎng)頁的重要程度取決于別的頁面對它的引用,就像學(xué)術(shù)論文中的引用指數(shù)一樣,重要的論文總是會被很多其他論文引用。然后我們再根據(jù)搜索條件進(jìn)行超文本匹配分析(對“爬蟲”抓取的頁面內(nèi)容進(jìn)行關(guān)鍵詞倒排索引檢索)確定跟搜索請求最相關(guān)的網(wǎng)頁。綜合最重要的網(wǎng)頁和跟搜索請求最相關(guān)的網(wǎng)頁兩個方面,我們就能按重要程度和用戶搜索請求相關(guān)程度把查詢結(jié)果排序后呈現(xiàn)給我們的用戶。
附:Googlegraphic原圖。
第三篇:如何關(guān)閉google安全搜索
如何關(guān)閉google安全搜索
在用google搜索查找相關(guān)信息時有時會出現(xiàn)如下圖所示的提示。那是因?yàn)橄到y(tǒng)檢測到搜索結(jié)果可能會讓人反感給過(濾)了。下面這個方法可以關(guān)閉google安全搜索功能。讓所有結(jié)果都顯示出來。
第1步、點(diǎn)擊右上角的“搜索設(shè)置”鏈接,你會看到如下圖所示界面。在界面語言設(shè)置項(xiàng)中選擇英文。再點(diǎn)上面的“保存設(shè)置”按鈕。
第2步、這是會自動返回搜索結(jié)果頁面。再次點(diǎn)擊右角的Search settings(搜索設(shè)置)鏈接。
第3步、設(shè)置不過濾搜索結(jié)果。設(shè)置如下圖所示。選擇之后點(diǎn)右上的“ Save preferences“按鈕會返回之前的搜索頁面。
經(jīng)過這種設(shè)置以后可以搜索任一字詞都不會過濾搜索結(jié)果。有什么好處就不用哥說了吧!
第四篇:淺談Google是怎樣排名搜索結(jié)果
淺談Google是怎樣排名搜索結(jié)果
Google是怎樣判斷哪些頁面是有排名的?它是使用算法來評估頁面,同時也雇用質(zhì)量評定人員。每天的搜集次數(shù)達(dá)到幾百萬次搜索,按照頻率排序,然后把它們發(fā)送給按照權(quán)威性、實(shí)用性和相關(guān)性評定搜索結(jié)果的人員。
首先排在最前面的是官方網(wǎng)站。這些是國家、政府機(jī)構(gòu)、組織、或個人的官方頁面。Google優(yōu)先選擇具有名稱的網(wǎng)站,比如國家、機(jī)構(gòu)、城市等名稱,如果你的網(wǎng)站具有權(quán)威性,則它通常是搜索的第一個結(jié)果。
其次是提供信息的頁面,該頁面應(yīng)該具有綜合性、高質(zhì)量和權(quán)威性。一般情況下這些是大學(xué)教授概述某一主題的頁面。它應(yīng)該陳述事實(shí),不偏不倚,不能過于寬泛,也不能過于詳細(xì)。搜索信息時,Wikipedia和其他百科類文章一般排名較高。
最后是相關(guān)頁面,這對于Google來說,是意味著頁面匹配用戶的搜索。如果頁面回答了搜索部分的一個信息,那么頁面會顯示在搜索結(jié)果中。
通常我們會看到有高排名的頁面不符合件。這說明什么?頁面暫時處于高排名,一旦有人建設(shè)比它更好的網(wǎng)站則排名就會掉下。你的頁面現(xiàn)在排在第幾位并能代表以后還在原地。如果Google檢查人員發(fā)現(xiàn)其他更好的頁面,則你的很可能就會掉下,他們的排名就會上去。
文章來源:
第五篇:【技術(shù)貼啊】google學(xué)術(shù) 論文搜索
【技術(shù)貼啊】google學(xué)術(shù) 論文搜索
2011-05-30 21:35:37 來自: 我會考上?。?不許扯我后腿!我要長大!)http://004km.cnpLINKer(cnpiec LINK service)在線數(shù)據(jù)庫檢索系統(tǒng),并正式開通運(yùn)行。cnpLINKer即“中圖鏈接服務(wù)”,目前主要提供約3600種國外期刊的目次和文摘的查詢檢索、電子全文鏈接及期刊國內(nèi)館藏查詢功能.并時時與國外出版社保持?jǐn)?shù)據(jù)內(nèi)容的一致性和最新性.點(diǎn)評:只提供了外文檢索的功能,但是無法得到全文。個人認(rèn)為不是很理想。3.專家個人主頁搜索引擎
http://hpsearch.uni-trier.de/ 搜索專家們的主頁,各位可以看看,具體的好處我還要進(jìn)一步的挖掘各位也可以提一些建議。4.InfoSeek http://004km.cnkikw”這個cnki常用密碼進(jìn)行搜索,然后搜索到的資源還是很多,至少感覺比百度強(qiáng)。就是缺少快照。但是也不錯!他的功能還要進(jìn)一步挖掘!6。Lycos http://004km.cn
多功能搜索引擎,提供類目、網(wǎng)站、圖象及聲音文件等多種檢索功能。目錄分類規(guī)范細(xì)致,類目設(shè)置較好,網(wǎng)站歸類較準(zhǔn)確,提要簡明扼要。收錄豐富。搜索結(jié)果精確度較高,尤其是搜索圖像和聲音文件上的功能很強(qiáng)。有高級檢索功能,支持邏輯條件限制查詢。
點(diǎn)評:在搜索其他的國外免費(fèi)資源的時候我發(fā)現(xiàn)還是比較好用,但是對于學(xué)術(shù)資源的搜索,我覺得至今還沒有挖掘出他的潛力。7.http://004km.cn
Google在同一水平的搜索引擎。是Amazon.com推出的,Web result部分是基于Google的,所以保證和Google在同一水平,另外增加了Amazon的在書本內(nèi)搜索的功能和個性化功能:主要是可以記錄你的搜索歷史?,F(xiàn)在還是Beta,不過試用后感覺很好,向大家推薦一試,不過缺憾是現(xiàn)在書本內(nèi)搜索沒有中文內(nèi)容。8。http://vivisimo.com/
推薦一個很有特色的搜索引擎 http://vivisimo.com/,cmu的作品,對搜索的內(nèi)容進(jìn)行分類,這樣可以有效地做出選擇,比較有特色??蓪?shí)現(xiàn)分類檢索,檢索速度也很好,如EBSCO 密碼幾分鐘就可找一大堆.http://search.epnet.com/
9。goole 搜索引擎goole.com,與google比較了一下發(fā)現(xiàn),能搜索到一些google搜索不到的好東東。它界面簡潔,功能強(qiáng)大,速度快,YAHOO、網(wǎng)易都采用了它的搜索技術(shù)。各位可以一試。10。looksmart 一個檢索免費(fèi)paper的好工具,網(wǎng)址是:http://004km.cn/ 進(jìn)入網(wǎng)頁以后,可以看到他有三個功能,driectory web article,其中article對我們很有幫助,你可以嘗試輸入你要找的文章,會有很多發(fā)現(xiàn)的!