第一篇:Unity3D技術(shù)之角色的創(chuàng)建及優(yōu)化
Unity3D技術(shù)之角色建模優(yōu)化
1、模型
(1)合并模型,渲染靜態(tài)窗口比較有用。
(2)100個三角形的MESH,在渲染時與1500個面數(shù)的物體是沒太大差別的,所以最佳的渲染設(shè)置應(yīng)該在每個模型大約1500-4000個三角面。
(3)一個Mesh 一個材質(zhì)(按材質(zhì)合并)。
(4)合并時可以將燈光附近的物體合并,加快渲染。
(5)實時燈光數(shù)量限制。
2、實時燈光
(1)每個被燈光照射到的GameObject都會在每一幀被渲染一次。經(jīng)常被燈光照射的物體最好合并他。以免多次渲染,文章出處【狗刨學(xué)習(xí)網(wǎng)】。
(2)每一個燈光都會有一個Render Mode設(shè)置,F(xiàn)orce Pixel 或者 Force Vertex。
夜晚打開車燈,前面的車燈就是游戲中最重要的燈光。因此,前大燈的渲染模式將會被設(shè)置為Force Pixel比較好。
如果燈光不是很重要,就可以選用“Force Vertex”的渲染模式。
3、陰影
陰影運算量比較大。如果不是做光照分析建議使用 Lighting Map。
4、角色建模優(yōu)化
(1)角色應(yīng)該只被用于一個蒙皮模型渲染器。當(dāng)然有時候可能需要多個蒙皮的模型,但是如果你同時用兩個蒙皮來作為一個角色,它就相當(dāng)于你進行了兩個角色的運算量。
(2)要保持MESH的材質(zhì)數(shù)量盡可能低。一般建議身體的材質(zhì)數(shù)量為2-3個,當(dāng)然如果你有武器的材質(zhì),也是需要單獨一個的,因為你需要換武器。
(3)一般來說游戲中的骨骼數(shù)量為15-60個。骨骼越少運行速度越快,一般來說30塊骨骼就可以讓角色動的很舒服了。如果你不是有特殊的設(shè)置,強烈建議每個角色30個骨骼。
(4)面數(shù)主要是看游戲的質(zhì)量要求,500-6000個三角面是比較推薦的。如果你的游戲場景中將會出現(xiàn)多個角色,那么就要適當(dāng)?shù)臏p面。如果你想要在比較老的 機器上運行,需要更少的面。比如,半條命2游戲的角色通常是2500-5000個三角面。達到AAA標準的次時代游戲比如像是ps3或者XBOX360上 的游戲角色通常有5000-7000個三角面。(5)把IK控制器和FK控制器分離,當(dāng)動畫導(dǎo)入以后,IK的節(jié)點將會烘焙到FK上,其實unity并不需要IK節(jié)點,你可以刪除它們。
(6)創(chuàng)建一個公共的骨架,這樣就可以讓你讓不同的角色之間共享動作了。
(7)給每一個骨骼正確的命名,方便團隊工作,也方便類似于Motionbuilder的動作軟件,不然你得每次指定骨骼。
(8)UV接縫的數(shù)量盡可能少
第二篇:多媒體技術(shù)下的課堂教學(xué)之優(yōu)化
多媒體技術(shù)下的課堂教學(xué)之優(yōu)化
韓偉 趙建國
中國石油管道學(xué)院 河北 廊坊 065000
摘 要:多媒體技術(shù)為現(xiàn)代課堂教學(xué)改革和創(chuàng)新提供了重要的技術(shù)支持。要用好多媒體技術(shù),就必須提高對現(xiàn)代教學(xué)理論的認識,更新教學(xué)觀念,優(yōu)化課堂教學(xué)設(shè)計和教學(xué)過程,將教師、學(xué)生、教學(xué)內(nèi)容和多媒體等教學(xué)因素進行有效融合、和諧統(tǒng)一,努力實現(xiàn)教學(xué)效果優(yōu)化。
關(guān)鍵詞:多媒體;課堂教學(xué);優(yōu)化
現(xiàn)代教育教學(xué)技術(shù)的應(yīng)用使課堂教學(xué)發(fā)生了重大變革,它對轉(zhuǎn)變教學(xué)方式、優(yōu)化課堂教學(xué)、提高教學(xué)質(zhì)量產(chǎn)生了巨大影響。同時,也對課堂教學(xué)提出了更高的要求。它要求教育者必須熟悉現(xiàn)代教學(xué)理論,掌握現(xiàn)代教育技術(shù),通過現(xiàn)代教學(xué)媒體與技術(shù)對教學(xué)過程和教學(xué)資源進行研究、設(shè)計、開發(fā)和利用,在理論和實踐兩方面均實現(xiàn)課堂教學(xué)的優(yōu)化。
一、優(yōu)化理論認識 重視媒體作用
何為課堂教學(xué)優(yōu)化?一種認識是把優(yōu)化視為一種活動,一個過程,對教學(xué)進行優(yōu)化,使教學(xué)變得更完美;另一種認識則把優(yōu)化視為教學(xué)的一種狀態(tài),一種境界,即優(yōu)良的教學(xué)、成功的教學(xué)。如
【】果把這兩方面結(jié)合起來,則更能全面把握現(xiàn)代優(yōu)化教學(xué)的含義1:在充分利用現(xiàn)代多媒體技術(shù)的條件下,通過不斷改革創(chuàng)新,尋求合理的教學(xué)結(jié)構(gòu),達到最佳的教學(xué)狀態(tài),爭取最好的教學(xué)效果的過程。
按照原蘇聯(lián)教育家巴班斯基的最優(yōu)化教學(xué)理論。優(yōu)化教學(xué)就是在一定的條件下,使當(dāng)前教學(xué)任務(wù)的解決花費最少的時間,達到最佳的效果。這一理論,要求從整體上探討教學(xué)過程的最優(yōu)化模式,從而推動教學(xué)現(xiàn)代化的進程?,F(xiàn)代多媒體技術(shù)在課堂教學(xué)中具有開放性、交互性、共享性和協(xié)作性等優(yōu)勢,合理使用多媒體技術(shù)不僅能夠收到優(yōu)良的課堂效果,而且還會提高課堂教學(xué)的效率,促使課堂教學(xué)的行為和結(jié)果達到最優(yōu),顯示出多媒體技術(shù)在教學(xué)最優(yōu)化中有著重要的地位和作用。因此,優(yōu)化教學(xué)理論為多媒體技術(shù)深入課堂教學(xué)提供了理論基礎(chǔ)。
建構(gòu)主義學(xué)習(xí)理論強調(diào)以學(xué)生為中心,不僅要求學(xué)生由外部刺激的被動接受者和知識的灌輸對象轉(zhuǎn)變?yōu)樾畔⒓庸さ闹黧w、知識意義的主動建構(gòu)者,而且要求教師要由知識的傳授者、灌輸者轉(zhuǎn)變?yōu)閷W(xué)生主動建構(gòu)意義的指導(dǎo)者、幫助者和促進者。因此,在教學(xué)過程中應(yīng)關(guān)注動機的激發(fā)與維持以及提供學(xué)生自主學(xué)習(xí)的工具性支持。多媒體技術(shù)為這種主動的構(gòu)建創(chuàng)造了環(huán)境,它可以激發(fā)學(xué)生的學(xué)習(xí)興趣,調(diào)動其學(xué)習(xí)的主動性、積極性;它不是幫助教師傳授知識的手段、方法,而是用來創(chuàng)設(shè)情境、進行協(xié)作學(xué)習(xí)和交流,即把多媒體作為學(xué)生主動學(xué)習(xí)、協(xié)作式探索的認知工具,使自身認知結(jié)構(gòu)得到發(fā)展,以此達到優(yōu)化教學(xué)的目的。
從系統(tǒng)科學(xué)理論的角度出發(fā),課堂教學(xué)作為一個系統(tǒng),現(xiàn)代多媒體教學(xué)手段是教學(xué)系統(tǒng)中的重要要素之一。系統(tǒng)中各要素不可分割、相互協(xié)調(diào)、平衡、互為作用。利用現(xiàn)代教學(xué)媒體,激發(fā)和強化這個系統(tǒng)的構(gòu)成要素,實現(xiàn)各要素的優(yōu)化組合,使教學(xué)系統(tǒng)的整體功能得以加強。從信息論的角度看,現(xiàn)代教育媒體有豐富的表現(xiàn)力,在規(guī)定時間內(nèi)可以比傳統(tǒng)媒體承載更多的信息,可以將傳統(tǒng)媒體不易表述清楚的信息表述得清晰、明確,可以優(yōu)化信息儲存形態(tài),使某些教學(xué)難點迎刃而解,可以拓寬信息傳輸通道、調(diào)動學(xué)生的多種感官接受信息。
教育傳播理論已成為現(xiàn)代教育技術(shù)重要的理論基礎(chǔ)。教育作為一種信息傳播活動,它是按照確定的教學(xué)目標,選擇合適的信息內(nèi)容,通過教學(xué)媒體把知識、技能、思想、觀念等傳送給特定對象的一種活動。在課堂教學(xué)這個信息傳遞與反饋、雙向或多向的動態(tài)過程中,教師與學(xué)生是傳播主體;媒體是教學(xué)信息的載體,又是教學(xué)的信息來源渠道?,F(xiàn)代多媒體教育技術(shù)不僅為我們提供了優(yōu)化傳輸?shù)南冗M技術(shù),同時也為我們提供了反饋的媒體技術(shù)和教學(xué)反饋測評系統(tǒng)。多媒體的介入,會營造一個學(xué)生得以參與教學(xué)過程的具體環(huán)境,溝通了師生之間的信息通道,使以學(xué)生為主體和面向全體形式的要求得以落到實處。
現(xiàn)代教學(xué)理論為課堂教學(xué)多媒體技術(shù)應(yīng)用提供了可靠的理論依據(jù)。所以,要十分重視現(xiàn)代多媒體技術(shù)的作用,充分發(fā)揮多媒體的功能。首先,對多媒體的作用要有正確的認識:多媒體教學(xué)技術(shù)是一種先進的教學(xué)手段,是傳統(tǒng)教學(xué)手段無法比擬的;第二,課堂教學(xué)中要把多媒體技術(shù)的先進性發(fā)揮出來,但如果利用不好,則適得其反;第三,優(yōu)化教學(xué)設(shè)計:運用教育技術(shù)去分析、研究教學(xué)問題和需求,確定解決它們的方法和途徑;第四,加強課堂教學(xué)過程的組織,把握好學(xué)生、教師、多媒體三者之間的關(guān)系,達到三方面的和諧,實現(xiàn)課堂教學(xué)的最優(yōu)化。
二、優(yōu)化教學(xué)設(shè)計 科學(xué)利用媒體
多媒體課堂教學(xué)設(shè)計是以傳播理論和學(xué)習(xí)理論為基礎(chǔ),應(yīng)用系統(tǒng)理論和現(xiàn)代教育技術(shù)理論的觀點和方法,分析研究教學(xué)中的問題和需求, 從而確定教學(xué)目標、制定教學(xué)策略,進行合理的教學(xué)結(jié)構(gòu)和教學(xué)評價的設(shè)計過程[2]。教學(xué)設(shè)計的目的就是為了優(yōu)化課堂教學(xué),提高課堂教學(xué)效率和質(zhì)量。有專家稱“沒有優(yōu)化的教學(xué)設(shè)計就沒有優(yōu)化的教學(xué)過程,沒有優(yōu)化的教學(xué)過程也就沒有優(yōu)良的教學(xué)效果”。要優(yōu)化教學(xué)設(shè)計,必須改變教學(xué)設(shè)計的觀念,以現(xiàn)代教育技術(shù)下的教學(xué)觀念進行教學(xué)設(shè)計[3]。
1、教學(xué)設(shè)計要以學(xué)生為中心
現(xiàn)代多媒體教育技術(shù)不僅僅是一先進的教學(xué)技術(shù),同時也體現(xiàn)了現(xiàn)代教育的觀念,是現(xiàn)代教育思想在教育技術(shù)上的直接體現(xiàn)。按照現(xiàn)代教育思想和觀念,教育教學(xué)的核心是促進學(xué)生素質(zhì)全面發(fā)展,要以學(xué)生為中心,也就是說我們的一切教育教學(xué)活動都必須服務(wù)于學(xué)生的學(xué)習(xí),有利于教師的教學(xué)。在教學(xué)設(shè)計中,對教學(xué)內(nèi)容的分析,對教學(xué)目標的確定,對教學(xué)媒體的選擇和組合運用,對教學(xué)方法的使用等,都必須考慮學(xué)生的接受心理和接受能力,而不能脫離學(xué)生實際。我們在設(shè)計教學(xué)中必須深刻思考:一是教師是為誰服務(wù)的,搞教學(xué)設(shè)計的最終目的是什么,搞教學(xué)設(shè)計是寫教師怎么教,還是寫學(xué)生怎么學(xué);二是應(yīng)用哪些現(xiàn)代教學(xué)媒體來促進師生合作,達到教學(xué)過程的和諧;三是師生運用媒體的共同指向是什么,應(yīng)該達到何種目的等。所以,教學(xué)設(shè)計絕非教師與教學(xué)內(nèi)容的簡單結(jié)合,也不是教師與媒體技術(shù)的簡單組合,而是以學(xué)生為中心的教師、教學(xué)內(nèi)容、教學(xué)媒體技術(shù),在一定時空中的最優(yōu)整合。
2、教學(xué)設(shè)計要包含多媒體組合
課堂教學(xué)作為一個系統(tǒng),多媒體技術(shù)手段是這個系統(tǒng)重要組成部分。因此,進行教學(xué)設(shè)計時,必須考慮多媒體的教學(xué)特征和功能,處理知識信息時必須從整體出發(fā),合理選擇,并優(yōu)化組合,從而增加教學(xué)的信度和效度。傳統(tǒng)的教學(xué)設(shè)計中往往側(cè)重對單個知識點和對教學(xué)層次劃分,并在此基礎(chǔ)上確立教學(xué)重難點,沒有把對教學(xué)媒體的選擇和組合運用納入教學(xué)設(shè)計的范圍,無法形成完整的教學(xué)設(shè)計系統(tǒng)。現(xiàn)代教育技術(shù)融入教學(xué)設(shè)計后,教師能夠從更高層次對教學(xué)內(nèi)容進行全面分析,并結(jié)合教學(xué)對象和教學(xué)媒體的實際情況,確定教學(xué)目標和重難點,選擇系統(tǒng)的教學(xué)策略。例如,過去用傳統(tǒng)手段難以講清的抽象內(nèi)容,是教學(xué)難點,現(xiàn)在通過多媒體手段,可使之具體、生動、形象,那它就不是難點了。就單個知識看是重點,但多媒體納入之后,或許是非重點。
3、教學(xué)設(shè)計要體現(xiàn)人機和諧
教學(xué)設(shè)計除確立恰當(dāng)?shù)慕虒W(xué)目標、教學(xué)重難點之外,必須考慮教學(xué)活動中師生之間、師生與媒體之間的和諧?,F(xiàn)代多媒體教育技術(shù)介入課堂教學(xué),教師首先必須思考如何通過現(xiàn)代教學(xué)媒體的利用,去點撥、啟發(fā)、指導(dǎo)學(xué)生積極主動地學(xué)習(xí);必須思考怎樣才能讓學(xué)生主動掌握和運用教學(xué)媒體開展人機對話,生動活潑地獲取知識等。這里當(dāng)然還包括如何創(chuàng)設(shè)教學(xué)情境,如何激發(fā)學(xué)習(xí)興趣,如何強化學(xué)生注意,如何啟發(fā)學(xué)生質(zhì)疑思考,如何組織學(xué)生討論等,這一系列活動都必須讓現(xiàn)代教學(xué)媒體有所作為,一定到達人機合作,人機互動。
教學(xué)設(shè)計中的另一重要問題是如何運用現(xiàn)代媒體來建立一個良好的導(dǎo)學(xué)機制。如媒體運用的可行性問題,媒體介入的適宜性問題和師生與媒體的整合性問題。教師設(shè)計教學(xué)時必須了解各類媒體的優(yōu)勢,尤其是組合優(yōu)勢,還要聯(lián)系所教學(xué)科的特點,使多媒體能發(fā)揮其優(yōu)化作用。其次要考慮在教學(xué)過程中媒體的介入契機,即在什么時空、情境和知識出現(xiàn)程序中介入哪種媒體更利于教師指導(dǎo)學(xué)生學(xué)習(xí)。另外要知道教學(xué)媒體是教育技術(shù)的硬件,不能自發(fā)地發(fā)揮作用,它必須和人的主觀能力相結(jié)合才能真正發(fā)揮現(xiàn)代教育技術(shù)的優(yōu)勢。因此,我們必須考慮“機與人”的智能整合,架起師與
生、導(dǎo)與學(xué)的信息橋梁,讓師生雙方在教學(xué)過程中達到交互共鳴、互相升華的境界。這就是現(xiàn)代課堂教學(xué)設(shè)計所追求的目標。
4、課件設(shè)計要科學(xué)合理
課堂教學(xué)設(shè)計為課堂教學(xué)提供了精細的教學(xué)方案,為多媒體課件的設(shè)計和制作奠定了基礎(chǔ)。在多媒體課件教學(xué)的過程中,教師主要是通過多媒體課件和學(xué)生發(fā)生關(guān)系,故課件的優(yōu)劣將直接影響教學(xué)的效果和質(zhì)量。課件設(shè)計和制作要堅持教育性和科學(xué)性原則,要目標明確,結(jié)構(gòu)合理,突出重點和難點,同時要注意以啟發(fā)式的教學(xué)原則為指導(dǎo),提高課件的應(yīng)用價值,使其能從各個方面、各個角度啟發(fā)學(xué)生的智慧和想象力,打開思維空間。多媒體課件還要具備技術(shù)性和藝術(shù)性,使得課件既操作方便,使用安全、可靠,又激發(fā)學(xué)習(xí)興趣、吸引力強。具體在課件設(shè)計和制作中,課件結(jié)構(gòu)上應(yīng)采用超媒體結(jié)構(gòu);文字內(nèi)容要簡明扼要、以提綱式為主;在課件中,聲音、圖形、圖像、動畫、視頻等要恰到好處,合理運用,設(shè)計和運用得好,可以起到事半功倍的效果。
三、優(yōu)化教學(xué)過程 注重課堂效果
課堂教學(xué)是教學(xué)工作的主要形式,課堂教學(xué)過程是學(xué)生在教師指導(dǎo)下,有目的、有組織、有計劃地進行“教”和“學(xué)”的過程。多媒體課堂教學(xué)過程的實施,就是教師、學(xué)生、多媒體課件三者在課堂上如何進行活動,怎樣調(diào)節(jié)關(guān)系,優(yōu)化教學(xué)過程,從而達到最佳的教學(xué)效果。
1、教師態(tài)度端正 呈現(xiàn)教學(xué)藝術(shù)
課堂教學(xué)是一門藝術(shù)性工作,教師要有親和力。教師要站姿端正,親切自然,儀表大方,精神飽滿,要激發(fā)興趣和美感,引發(fā)學(xué)習(xí)激情。教師要做課堂上的“主持人”,不要做多媒體的“播音員”。
教師在課堂上的語言要精練、生動形象、通俗易懂、規(guī)范準確、清晰流暢。教師應(yīng)精心錘煉自己的教學(xué)語言,在備課上,反復(fù)斟酌,精心打磨,不能出現(xiàn)語病。課堂上,教師還應(yīng)該還要注意語音、語調(diào)、語速、節(jié)奏的把握,通過表情、手勢等身態(tài)語來傳情達意。
2、師生互動交流 課堂氣氛活躍
課堂教學(xué)中要加強課堂上師生的交互作用。教學(xué)過程是教師與學(xué)生之間、學(xué)生與學(xué)生間的交流互動與傳遞信息的學(xué)習(xí)過程。教學(xué)互動是一種知識的傳遞、更是一種情感的交流。教師要恰當(dāng)把握師生互動時機和學(xué)生的情感需要,鼓勵學(xué)生質(zhì)疑、自主探究,激發(fā)興趣,調(diào)動學(xué)生的積極性和學(xué)習(xí)興趣,切忌教師一言堂。要增強學(xué)生的活動性與參與性,構(gòu)建相互信任,相互尊重、和諧民主的教學(xué)環(huán)境。
3、強化重點難點 結(jié)合傳統(tǒng)手段
對于教學(xué)中的重點或難點內(nèi)容,要進行強化,注意學(xué)生的反應(yīng),要激發(fā)出學(xué)生的情緒和興趣,引發(fā)學(xué)生高度關(guān)注,有時還要進行重復(fù),穿插提問、評價等方式,注意結(jié)合使用語言、表情或體態(tài)語進行強調(diào),方式方法可以多樣。
在多媒體體教學(xué)技術(shù)使用當(dāng)中,要適當(dāng)使用傳統(tǒng)手段,如黑板、實物或模型等。要善于發(fā)揮黑板板書具有靈活、方便的特點,對一些重點或難點內(nèi)容,可以通過一定的黑板板書進行再強調(diào)、再說明,對一些課堂上的突發(fā)問題,更能夠通過板書進行評說、學(xué)習(xí)。
4、教學(xué)組織得當(dāng) 把握環(huán)節(jié)到位
課堂上往往有些不可預(yù)知的學(xué)情,要靈活調(diào)整教學(xué)設(shè)計時各環(huán)節(jié)的時間分配,或做出取舍。大體按照教學(xué)設(shè)計的思路,控制課堂內(nèi)容的走向,不因偶發(fā)事件或枝蔓錯誤地偏離主航道。還要注意控制信息量達到合適,不應(yīng)太多或太少,信息量太多是多媒體教學(xué)一個常犯的錯誤,教學(xué)進度要和學(xué)生的接受能力一致,不能只按照預(yù)先設(shè)置好的進度按部就班,不考慮具體實際。
在班級授課制條件下,教師是面向全體學(xué)生的。但是,要盡量關(guān)注每一個學(xué)生,對于優(yōu)秀、一般、較差的學(xué)生都要照顧到,不能滿足于少數(shù)積極學(xué)生烘托的課堂氣氛,對沉默和邊緣的學(xué)生予以特別關(guān)注。學(xué)習(xí)較好的學(xué)生,適當(dāng)增加任務(wù),讓他們吃得飽;學(xué)習(xí)較差的,經(jīng)常給予鼓勵,利用提問、交流、個別指點,進行感情和智力的支持,以提高班級的整體水平。
課件放映時間、速度、方式,教師的講解、板書要與學(xué)生視覺、聽覺、思考進行恰到好處的銜接,不能違背學(xué)生的生理、認知規(guī)律。多媒體課切不可“以讀代講”,不能“滿堂看”,也不宜“滿
堂講”。對于字數(shù)或圖表信息量較大的頁面,要注意給學(xué)生留有辨認、記錄和思考的時間,讓學(xué)生在教學(xué)過程中能夠?qū)⒆灾鲗W(xué)習(xí)理念真正體現(xiàn)出來。
教師備課階段就要熟悉上課思路,課件的放映順序與細節(jié)需默記于心。將使用多媒體的時間進行有效控制,精心地準備在一節(jié)課中必須通過多媒體展現(xiàn)的部分,如:導(dǎo)課環(huán)節(jié)、幫助渲染的重點環(huán)節(jié)、幫助突破難于理解的難點環(huán)節(jié)、知識拓展環(huán)節(jié)等。
5、熟練技術(shù)操作 應(yīng)對突發(fā)故障
教師要熟練現(xiàn)代教學(xué)媒體操作,并掌握一定的維修和管理技術(shù)。如電腦的使用與操作,課件的使用,投影機使用和功放機、錄像機等設(shè)備的操作以及簡單維護與維修。一方面可以使我們在利用多媒體時得心應(yīng)手,另一方面可以應(yīng)對一些突發(fā)的機械故障,保證課堂教學(xué)的正常進行。
參考文獻
[1]王本陸.優(yōu)化教學(xué):概念·標準·策略[J].課程·教材·教法,2004.(1)[2]李克東,謝幼如.多媒體組合教學(xué)設(shè)計[M].北京:科學(xué)出版社,2000,第二版
[3]陳龍泉,張長輝.應(yīng)用現(xiàn)代教育技術(shù) 改變教學(xué)設(shè)計觀念[J].成都教育學(xué)院學(xué)報, 2001(3)
作者簡介:韓偉(1980~),男,中國石油管道學(xué)院管道運輸系講師
通訊地址:河北省廊坊市愛民西道90號;單位:中國石油管道學(xué)院管道運輸系;郵編:065000;聯(lián)系電話:***;E-mail: hblfzhaojg@163.com
第三篇:淺談教師角色之“引導(dǎo)者”
淺談教師角色之“引導(dǎo)者”
【摘要】要使課堂教學(xué)適應(yīng)素質(zhì)教育的要求,充分發(fā)揮教師的主導(dǎo)作用,是促進學(xué)生學(xué)習(xí)的關(guān)鍵。為此,教注重于引導(dǎo),致力于指導(dǎo);導(dǎo)著眼于學(xué),服務(wù)于提高,真正使學(xué)生在學(xué)習(xí)活動中掌握學(xué)習(xí)的方法,把“學(xué)會”轉(zhuǎn)化為“會學(xué)”。
【關(guān)鍵詞】引導(dǎo)者;發(fā)現(xiàn);探索
實施素質(zhì)教育,課堂教學(xué)是主要陣地。聯(lián)合國教科文組織在《學(xué)會生存——教育世界的今天和明天》中指出:“教師要成為一個顧問,一位交換意見的參加者,一位幫助發(fā)現(xiàn)矛盾論點而不是拿出現(xiàn)成真理的人?!币簿褪切隆稊?shù)學(xué)課程標準》中所說的:“學(xué)生是數(shù)學(xué)學(xué)習(xí)的主人,教師是數(shù)學(xué)學(xué)習(xí)的組織者、引導(dǎo)者與合作者。”在這里我想針對目前以素質(zhì)教育為核心的課堂教學(xué)改革中關(guān)于教師在課堂教學(xué)中的主導(dǎo)性,提出一點自己膚淺的看法。
要使課堂教學(xué)適應(yīng)素質(zhì)教育的要求,我認為:課堂教學(xué)是教師的教與學(xué)生的學(xué)的一種雙邊活動,教師是這一活動的設(shè)計者與組織者,主導(dǎo)著這一活動的全過程,擔(dān)負著帶領(lǐng)全班學(xué)生去達成教學(xué)目標的任務(wù),充分發(fā)揮教師的主導(dǎo)作用,是促進學(xué)生學(xué)習(xí)的關(guān)鍵。為此,教注重于引導(dǎo),致力于指導(dǎo);導(dǎo)著眼于學(xué),服務(wù)于提高,真正使學(xué)生在學(xué)習(xí)活動中掌握學(xué)習(xí)的方法,把“學(xué)會”轉(zhuǎn)化為“會學(xué)”,素質(zhì)教育才能落到實處。
一、注重引導(dǎo)
引導(dǎo)不僅是老師在教學(xué)過程中的簡單提問,更重要的是要引而得法。
(一)誘發(fā)興趣
“良好的開端,是成功的一半”。如何誘發(fā)學(xué)生產(chǎn)生與學(xué)習(xí)內(nèi)容、學(xué)習(xí)活動本身相聯(lián)系的直接學(xué)習(xí)興趣,使學(xué)生從新課伊始就產(chǎn)生強烈的求知欲望是至關(guān)重要的。尤其是一年級的小學(xué)生,激發(fā)學(xué)習(xí)興趣更加顯得尤為重要。例如:在上人教版實驗教材一年級上冊“連加、連減”這一內(nèi)容時,我用動畫片《西游記》來導(dǎo)入新課,學(xué)生的注意力一下子就被吸引過來,從而產(chǎn)生了濃厚的學(xué)習(xí)興趣。
(二)引導(dǎo)學(xué)生注意力的方向
用動畫片引起學(xué)生的興趣并非圖一時之樂,更主要的是為本節(jié)課將要學(xué)習(xí)的內(nèi)容服務(wù),因此,教師要引導(dǎo)學(xué)生注意力的方向,使學(xué)生明確自己的任務(wù)。例如:在教學(xué)“連加、連減”時,教師在播放動畫片前先提出要求:“觀察動畫片中人物的變化?!痹诮處煹囊龑?dǎo)下,學(xué)生會有目標的去觀察,搜集信息,為解決后面的學(xué)習(xí)目標奠定基礎(chǔ)。
(三)引導(dǎo)學(xué)生學(xué)會思考
由于是一年級的小學(xué)生,還沒有養(yǎng)成良好的學(xué)習(xí)習(xí)慣,因此在課堂教學(xué)中教師不僅要引導(dǎo)學(xué)生掌握知識內(nèi)容,更重要的是引導(dǎo)學(xué)生養(yǎng)成良好學(xué)習(xí)習(xí)慣,而學(xué)會思考是完成學(xué)習(xí)目標的重要保證。例如:在上人教版實驗教材一年級下冊《擺一擺,想一想》時,教師首先組織學(xué)生用1、2、3、4、5、6個圓片分別擺出了2、3、4、5、6、7個100以內(nèi)不同的數(shù),學(xué)生已經(jīng)初步獲得這些數(shù)的排列規(guī)律,接著教師引導(dǎo)學(xué)生探究用圓片擺數(shù)的規(guī)律:“同學(xué)們,用
7個圓片能擺出的數(shù)是哪幾個呢?為什么?你來驗證一下,可以擺圓片,也可以不擺,把數(shù)寫出來。”也許是出于對擺圓片的好玩,也許是受到定勢的影響,同學(xué)們紛紛拿出圓片擺了起來,課堂紀律也亂了起來,如果任其發(fā)展,教學(xué)目標就無法達成,學(xué)生的問題意識也得不到培養(yǎng),課堂效率就更無從談起,于是我趕緊引導(dǎo):“我看到鄭文韜同學(xué)沒有擺圓片,而是在安靜的思考,老師支持你!”在我的引導(dǎo)下,許多同學(xué)放下手中的圓片,向鄭文韜同學(xué)一樣,開始思考規(guī)律性的問題,我的課堂教學(xué)得以有效的繼續(xù),同時也培養(yǎng)了學(xué)生思考的習(xí)慣。
(四)引導(dǎo)學(xué)生自主探索
在探究性學(xué)習(xí)中,教師引導(dǎo)什么呢?歸結(jié)起來為:探究思路的指導(dǎo)、探究方法的指導(dǎo)和信息資料來源的指導(dǎo)。教師在課堂上巡視,當(dāng)學(xué)生研究“碰壁”之后,困惑之時需要教師“指點迷津”,但只能“點到為止”“撥正思路”,不能扶著走路,需要充分發(fā)揮學(xué)生的主觀能動性。
教師要在學(xué)生已有的信息基礎(chǔ)上,引導(dǎo)其整理信息,提煉信息,并根據(jù)關(guān)鍵信息提出數(shù)學(xué)問題,最后引導(dǎo)學(xué)生探索解決問題的方法,從而培養(yǎng)學(xué)生自主學(xué)習(xí)的能力。例如:在上人教版實驗教材一年級上冊“連加、連減”時,引導(dǎo)學(xué)生從找到的眾多信息中提煉出和人物數(shù)量相關(guān)的三個信息:“先來了唐僧師徒四人”,“又遇到了兩個小朋友”,“最后小朋友的爸爸媽媽回來了”。學(xué)生根據(jù)這三個關(guān)鍵信息自主提出數(shù)學(xué)問題:“一共有多少人?”再進一步引導(dǎo)學(xué)生運用已有的加法知識解決提出的問題。在這時教師已不再是傳統(tǒng)的講授者,而變成一位引導(dǎo)者,學(xué)生也不再是被動的接受者,而是主動的求學(xué)者。
(五)引導(dǎo)學(xué)生評價與交流
在課堂上引導(dǎo)學(xué)生參與評價,可以激發(fā)學(xué)生自主學(xué)習(xí)的興趣,啟發(fā)學(xué)生主動探索,嘗試學(xué)習(xí),培養(yǎng)學(xué)生的創(chuàng)新能力,從而優(yōu)化課堂教學(xué)。因此要讓學(xué)生參與評價,教師就必須發(fā)揮“引導(dǎo)”作用,幫助學(xué)生掌握評價的方向,點撥他們評價的方法和要領(lǐng),重點不在于發(fā)表“個人意見”,而在于引導(dǎo)學(xué)生交流,促進有效溝通,幫助學(xué)生學(xué)會傾聽,學(xué)會寬容,學(xué)會尊重。例如:班上有一個說話很慢而且發(fā)音不準的孩子,他很少發(fā)言。在教學(xué)“11~20各數(shù)的認識”時,教師提出“用你自己喜歡的方法記住它們”,他小心翼翼的舉了手,我立刻想到該給他這次鍛煉的機會,可他剛一開口說話就有學(xué)生發(fā)出嘲笑的聲音,為了不打擊這位學(xué)生的信心和積極性我立即引導(dǎo):“老師從他的眼神里看出他有一個奇妙的想法,你們想知道嗎?”所有學(xué)生立刻安靜下來,當(dāng)他說完“16的鄰居是15和17”時,教師再次引導(dǎo):“誰來說一說他今天值得大家學(xué)習(xí)的地方在哪里?”其他學(xué)生爭先恐后的舉手評價“他能勇敢的說出自己的想法”“他給數(shù)也找到鄰居了,數(shù)就不孤單了”“他的方法很好懂,我們?nèi)菀子涀 ??漸漸的,這個學(xué)生自信心增強了,學(xué)習(xí)興趣也提高了,其他學(xué)生也愿意和他交往了。
(六)引導(dǎo)學(xué)生發(fā)現(xiàn)身邊的數(shù)學(xué)
荷蘭著名學(xué)者弗賴登塔爾明確指出:“學(xué)習(xí)數(shù)學(xué)的唯一正確方法是由學(xué)生本人把要學(xué)的東西自己去發(fā)現(xiàn)或創(chuàng)造出來,教師的任務(wù)是引導(dǎo)和幫助學(xué)生去進行這種再創(chuàng)造的工作。”小學(xué)數(shù)學(xué)知識,在生活中都能找到其原型,教師只有把數(shù)學(xué)的符號、概念還原到學(xué)生的生活實際中去,變成學(xué)生看得見的“數(shù)學(xué)事實”,讓學(xué)生去探索,去“再創(chuàng)造”。要完成這種再創(chuàng)
造的工作關(guān)鍵就要求教師做好引導(dǎo)者。
例如:在上人教版實驗教材一年級下冊“位置”時,教師引導(dǎo)學(xué)生觀察教室并說說各種事物的位置關(guān)系,學(xué)生很快說出燈在我們的上面,椅子在桌子的下面,××在××的前面,××在××的后面,在生活中找到原型后,再來學(xué)習(xí)書上的內(nèi)容就容易多了。通過找生活中的事實,學(xué)生深切感受到我們的身邊處處有數(shù)學(xué),數(shù)學(xué)知識就在我們的生活中,從而明白學(xué)習(xí)數(shù)學(xué)的意義及重要性。
二、致力于指導(dǎo)
指導(dǎo)與引導(dǎo)是相輔相成的。所謂致力于指導(dǎo),是說指導(dǎo)要得力,要從學(xué)生的認識能力出發(fā),盡可能運用直觀的教具學(xué)具,讓學(xué)生在課堂上動起來,擺一擺,挪一挪,首先建立感性認識,再逐漸向理性認識過渡升華。例如:在教學(xué)連加、連減的算法時,先引導(dǎo)學(xué)生用小棒擺一擺,首先建立感性認識,初步理解連加連減的算理,繼而抽象出連加連減的算法。同時教師運用多媒體課件展示事物的合與分,學(xué)生直觀的感受到數(shù)量的變化、整體與部分的關(guān)系,從而突破本節(jié)課的難點。
課堂教學(xué)的過程不僅是學(xué)生認識新知識的過程,也是學(xué)生的感性認識向理性認識的升華過程,更是教師教學(xué)藝術(shù)不斷更新的過程,在這個過程中不論學(xué)生的素質(zhì)還是教師的素質(zhì)都得到完善和提高,這正是素質(zhì)教育的落腳點。
“振興民族的希望在教育,振興教育的希望在教師?!痹谡n堂教學(xué)中離不開教師這一主導(dǎo)者,在教師的引導(dǎo)下,學(xué)生才能更快更準的達成學(xué)習(xí)目標,更重要的是學(xué)生逐步從“學(xué)會”實現(xiàn)了“會學(xué)”。
參考文獻:
1.埃德加·富爾 1996年6月 《學(xué)會生存——教育世界的今天和明天》 教育科學(xué)出版社
2.袁振國 2002年3月 《教育新理念》 教育科學(xué)出版社
3.常汝吉 2001年7月 《數(shù)學(xué)課程標準》 北京師范大學(xué)出版社
第四篇:SEO網(wǎng)站優(yōu)化之鏈接分析技術(shù)
http:// 速貸114貸款導(dǎo)航網(wǎng)
SEO網(wǎng)站優(yōu)化之鏈接分析技術(shù)
對SEO稍有了解的人都知道鏈接是網(wǎng)站排名的重要因素,但不一定完整理解鏈接鏈接分析的內(nèi)容。下面就簡單總結(jié)鏈接以哪些方式影響排名。
鏈接分析技術(shù)的含義比Google PR要廣泛得多。因為google的光環(huán)和對PR的宣傳,很多人把PR看的異常重,其實搜索引擎對鏈接的分析要廣泛得多。鏈接分析包括所有反向鏈接,不僅限于外部鏈接。
除了大家耳熟能詳?shù)臋?quán)重傳遞、錨文字作用,搜索引擎還會分析鏈接的以下特征。? ? 反向鏈接數(shù)目。顯然,數(shù)目越大,投票越多,對排名越有利。
反向鏈接頁面本身的重要性。并不是所有鏈接都有相同的投票能力,高權(quán)重網(wǎng)頁的鏈接對排名影響更大。質(zhì)量比數(shù)量更重要。? ? 反向鏈接增加的速度。增加速度過快,可能引起作弊嫌疑,或進入沙盒。反向鏈接所在網(wǎng)站的內(nèi)容主題。來自相關(guān)內(nèi)容網(wǎng)站的鏈接對排名幫助更大。來自SEO博客的鏈接對美食網(wǎng)站排名不會有什么影響。? 反向鏈接所在頁的內(nèi)容是否相關(guān)。也屬于內(nèi)容的相關(guān)性。SEO博客里也可能有專門談美食的一篇帖子,從這篇帖子來的鏈接對美食網(wǎng)站排名幫助就打一些。? ? 反向鏈接的鏈接文字,也就是錨文字,是影響網(wǎng)頁排名的重要因素之一。反向鏈接錨文字前后臨近的文字。有時候鏈接文字沒有什么意義,比如常見的“點擊這里”,鏈接文字前后的文字可以幫助判斷鏈接目標頁的內(nèi)容。這里所說的“前后”,指的是HTML代碼中的距離,而不一定是頁面顯示出來的視覺距離。? 鏈接在頁面的位置。搜索引擎通過算法可以辨別導(dǎo)航、廣告區(qū)、頁面底部版權(quán)聲明等區(qū)塊。鏈接出現(xiàn)在頁面不同位置意味著不同目的。通常出現(xiàn)在正文中的鏈接才是最有投票意義的鏈接。
http:// 速貸114貸款導(dǎo)航網(wǎng)
? 外部鏈接所在域名年齡。歷史越長的域名越被信任,來自老域名的鏈接也更被信任。
? 外部鏈接所在的域名是否曾經(jīng)轉(zhuǎn)手。域名所有人一直沒有變化,說明網(wǎng)站能持續(xù)經(jīng)營。域名轉(zhuǎn)手后,原來積累的信任度可能會受影響,因為無法保證網(wǎng)站轉(zhuǎn)手后還保持高質(zhì)量,需要重新考驗。
? 反向鏈接所在頁第一次被收錄的日期。發(fā)出反向鏈接的頁面越老,收錄的越早,越被信任。如果這個頁面已經(jīng)存在十幾年,比搜索引擎還老,上面的鏈接顯然沒有操縱排名的意圖,很可能被高度重視。
? 反向鏈接所在頁頁面內(nèi)容是否曾經(jīng)變化?有什么樣的變化?大部分資料性的網(wǎng)頁不會隨時間產(chǎn)生明顯內(nèi)容變化,最多是增加更多資料。如果頁面內(nèi)容發(fā)生主題方面的重大變化,頁面上的鏈接投票力也會變化,很有可能變得不再內(nèi)容相關(guān)。
? 反向鏈接第一次出現(xiàn)在頁面上是什么時候。一個很老的頁面上很早就出現(xiàn)的鏈接顯然有比較高的可信度。最近才出現(xiàn)的鏈接則需要過一段時間才能走出試用期。鏈接越老,作用越大,很多做SEO的人對此都深有體會。
? 反向鏈接所在頁還鏈接像那些其他網(wǎng)站?這些其他網(wǎng)站內(nèi)容是否相關(guān)?質(zhì)量怎么樣?頁面上所有鏈接都指向高質(zhì)量網(wǎng)站,那么每一個鏈接投票力都相應(yīng)增強,被鏈接的網(wǎng)站獲益也最大。被鏈接的網(wǎng)站如果內(nèi)容不相關(guān),整體質(zhì)量也很低,從這樣的頁面得到鏈接,效用不會高到哪里去。
? 外部鏈接是否有垃圾鏈接嫌疑?查看一些網(wǎng)站的外部鏈接,經(jīng)常能發(fā)現(xiàn)絕大部分是來自論壇簽名、博客評論,缺少頁面正文或博客帖子里的有意義的推薦鏈接,這絕不是一個健康的鏈接構(gòu)成。
? 鏈接點擊率。在搜索引擎能夠監(jiān)測用戶行為時,鏈接的點擊率也說明鏈接的重要
http:// 速貸114貸款導(dǎo)航網(wǎng)
性及投票能力。用戶的觀感更說明問題,用戶點擊越多,說明對用戶幫助越大。? 用戶點擊鏈接后在目標網(wǎng)站停留多長時間。同樣也是通過用戶行為方式判斷網(wǎng)站質(zhì)量,看到底是否對用戶有用。
第五篇:搜索引擎優(yōu)化技術(shù)及發(fā)展趨勢
搜索引擎優(yōu)化技術(shù)及發(fā)展趨勢
一、引言
“搜索引擎”作為互聯(lián)網(wǎng)上提供信息服務(wù)的一種工具,現(xiàn)在幾乎已經(jīng)是一個婦孺皆知的事物。按照中國互聯(lián)網(wǎng)絡(luò)信息中心在2006年7月19日發(fā)布的報告[1],中國網(wǎng)民中有66。3%經(jīng)常使用搜索引擎,比半年前又提高了近1個百分點。
互聯(lián)網(wǎng)上的第一代搜索引擎出現(xiàn)于1994年前后,以AltaVista、Yahoo和Infoseek為代表,搜索結(jié)果的好壞通常用反饋結(jié)果的數(shù)量來衡量,或者說是“求全”。然而研究表明,當(dāng)時的搜索引擎性能并沒有想象中那么優(yōu)秀,根據(jù)SteveLawrence和C。LeeGiles在1999年2月的實驗[2],全球11個主要的搜索引擎中,每個搜索引擎僅能搜索到互聯(lián)網(wǎng)上全部頁面的16%,甚至更低(圖1)。造成這種情況的原因,主要是這些搜索引擎的處理能力和網(wǎng)絡(luò)帶寬等方面的限制。
1998年,以Google為代表的第二代搜索引擎出現(xiàn)在互聯(lián)網(wǎng)上,其主要特點是提高了查準率,或者說“求精”。當(dāng)時傳統(tǒng)的搜索引擎如Lycos等主要使用網(wǎng)頁中的關(guān)鍵詞進行搜索,而Google則使用了一種綜合頁面排名算法:它不僅考慮搜索關(guān)鍵詞,還考慮頁面間的鏈接關(guān)系,然后對整個網(wǎng)絡(luò)的鏈接結(jié)構(gòu)進行分析和迭代計算,從而對頁面進行區(qū)分[3]。
第二代搜索引擎在技術(shù)和商業(yè)上都獲得了巨大成功,然而商業(yè)競爭和信息環(huán)境的變化仍在推動著它們不斷創(chuàng)新和發(fā)展。當(dāng)前所謂的第三代搜索引擎主要增加了互動性和個性化等技術(shù),為用戶使用搜索引擎獲取信息提供更好的體驗。至于互動性的評價標準是什么,以及第三代搜索引擎到底比第二代增加了多少價值,目前并沒有非常令人信服的研究結(jié)論。在以下的論述中,我們不對產(chǎn)品概念進行太多討論,而是就搜索引擎目前所面臨的挑戰(zhàn),以及它們的應(yīng)對方略和發(fā)展趨勢進行梳理和闡述。
二、搜索引擎面臨的挑戰(zhàn)
面對瞬息萬變的環(huán)境,搜索引擎如果在技術(shù)上不創(chuàng)新進取,從信息服務(wù)質(zhì)量的角度講,現(xiàn)在看來不錯的技術(shù),將來很可能會落伍。不進則退,在搜索引擎領(lǐng)域體現(xiàn)得很明顯。關(guān)于搜索引擎的基礎(chǔ)技術(shù),讀者可參見文獻[23],那么目前有些什么變化在影響著搜索引擎呢?
(一)Web的發(fā)展
1。信息大量增加
Web自產(chǎn)生以來,其信息量一直以幾何級數(shù)的形式遞增,近兩年來尤其如此。這主要有兩方面原因:首先是Web2。0[16]的用戶和以前有所不同,他們正在由單純的信息消費者向生產(chǎn)者與消費者雙重身份轉(zhuǎn)變;其次是DeepWeb[4]的發(fā)展。
如果說Web1。0是單純的網(wǎng)頁瀏覽模式,那么Web2。0則是通過了真正的個性化、去中心化和信息自主權(quán),向著內(nèi)容更豐富、聯(lián)系性更強、工具性更強而努力。盡管一切都還在探索中,但毋庸置疑,Web2。0已經(jīng)成為互聯(lián)網(wǎng)新的發(fā)展趨勢。這種轉(zhuǎn)變,從模式上可以概括為是從單純的“讀”向“寫”和“共同建設(shè)”發(fā)展。這也更體現(xiàn)了互聯(lián)網(wǎng)的第一規(guī)則,“用戶需要表達”。只要有機會和便利,網(wǎng)民就不會滿足于只是被動的信息接受者,他們需要表達,希望駕馭自己的傳媒,而不是受其掣肘。在Web2。0實際應(yīng)用中,除了原先的IM(InstantMessenger,即時通訊)、P2P(PeertoPeer,對等網(wǎng)絡(luò))等得到新的發(fā)展,更是涌現(xiàn)出了很多社會化的新事物,比如Blog(Weblog,網(wǎng)絡(luò)日記)、RSS(RDFSiteSummary,站點摘要)、WIKI(網(wǎng)絡(luò)百科)、WB(WebBookmarks,Web文摘)、SNS(SocialNetworkSoftware,社交網(wǎng)絡(luò))等。
這些新事物發(fā)展得非常快。以RSS為例,美國提供RSS內(nèi)容的網(wǎng)站數(shù)目從2001年9月的1000余家激增至2004年9月的195000余家,短短的3年中增長了近150倍,市場的飛速發(fā)展令人矚目。而Blog站點的大量涌現(xiàn),更是為每一位用戶都提供了暢所欲言的場所——據(jù)計世資訊(CCWResearch)的統(tǒng)計,2006年第二季度,中國注冊博客的總數(shù)量達到6800萬,比第一季度增長51。1%;中國博客用戶則達到2100萬人,比第一季度增加40。0%。這些無疑都在刺激著Web信息生產(chǎn)和消費的繁榮。
根據(jù)AlexandrosNtoulas等人的研究結(jié)果[5-6],每星期Web上新產(chǎn)生的頁面數(shù)大約為8%。而這個數(shù)字是非常保守的:他們的實驗是針對154個“popular”網(wǎng)站進行的,而實際上,那些大量涌現(xiàn)的新網(wǎng)站,如Blog網(wǎng)站,它們的成長速度遠遠超過這些所謂的流行網(wǎng)站。
關(guān)于DeepWeb的研究最近幾年也受到越來越多的關(guān)注,DeepWeb又被稱為InvisibleWeb或者HiddenWeb。JillEllsworth于1994年首次提出的InvisibleWeb概念,是指那些常規(guī)搜索引擎難以發(fā)現(xiàn)的內(nèi)容。美國互聯(lián)網(wǎng)專家ChrisSherman和GaryPrice在他們著作《TheInvisibleWeb》中將InvisibleWeb定義為:“在互聯(lián)網(wǎng)上可獲得的,但傳統(tǒng)的搜索引擎由于技術(shù)限制不能或者經(jīng)過慎重考慮后不愿意作索引的那些文本網(wǎng)頁、文件或其他高質(zhì)量、權(quán)威的信息?!盜nvisibleWeb分為四種類型:不透明網(wǎng)絡(luò)(theOpaqueWeb)、私人網(wǎng)絡(luò)(thePrivateWeb)、專有網(wǎng)絡(luò)(theProprietaryWeb)和真正的隱形網(wǎng)絡(luò)(theTrulyInvisibleWeb)。我們認為使用“deep”更為合適,因為這些內(nèi)容不是真的Invisible,只是藏在Web中較深的位置。
根據(jù)BrightPlanet公司的調(diào)查[4],2001年的DeepWeb大概是SurfaceWeb的500倍左右,而且還在快速發(fā)展。ChrisSherman和GaryPrice的估算則保守些,他們認為InvisibleWeb只有SurfaceWeb的2~50倍。但不論如何,DeepWeb在數(shù)量上都不容小覷。更為重要的是,DeepWeb通常都組織良好、信息權(quán)威、質(zhì)量很高,而且時新性強。正因為這樣,國內(nèi)外許多研究者都在克服重重困難,探索如何有效地發(fā)現(xiàn)這些有價值的信息,提供給更多用戶使用。各大搜索引擎要想鞏固和強化在搜索市場的地位,就必須重視DeepWeb,發(fā)展搜索技術(shù),提高競爭力。對于垂直搜索而言,DeepWeb的作用更為突出。
Web信息的大量增加,使得搜索引擎面臨嚴峻的挑戰(zhàn)。任何技術(shù)都有它的適用范圍,超出這個范圍,其性能將嚴重下滑。以搜索引擎的檢索頁面集為例,粗略地說,當(dāng)頁面總數(shù)沒有超過某個閾值時,搜索引擎工作良好,一旦頁面總數(shù)超過這個閾值,搜索引擎的查詢結(jié)果質(zhì)量將急劇下降,用戶往往在查詢返回結(jié)果的前10位、前20位甚至前50位都找不到一個自己想要的結(jié)果。這一點在目前的幾大搜索引擎上都已經(jīng)初現(xiàn)端倪,相信他們已經(jīng)為此絞盡腦汁。
2。信息更新加快
Web上不但新信息涌現(xiàn)速度很快,信息變化速度也非??臁R跃W(wǎng)頁中的鏈接為例,根據(jù)AlexandrosNtoulas等人的研究結(jié)果[5],每星期將有25%的新鏈接產(chǎn)生,1年之后,將只有24%的原有鏈接仍然存在。Google等搜索引擎的成功在于正確地分析了頁面間的鏈接關(guān)系,為了保持這種成功,搜索引擎必須不斷地跟蹤鏈接結(jié)構(gòu)的變化,或者說不斷地刷新自己所保存的相關(guān)信息。就以每周25%的新鏈接為例,這樣的鏈接更新速度要求搜索引擎至少每周重新計算一次所有頁面的Ranking值,否則便不能及時地、恰如其分地反映RealWeb上的當(dāng)前狀況,失去搜索引擎所必需的時效性(timeliness)和時新性(freshness)。
3。信息表現(xiàn)形式多種多樣
隨著網(wǎng)絡(luò)速度的提高,Web上的多媒體信息也急劇增加,因此人們對多媒體信息的檢索需求也就隨之而來。傳統(tǒng)的信息檢索主要集中于文本的檢索,在多媒體方面的研究并不是很多。需求的發(fā)展使得目前各大搜索引擎都不斷推出自己的多媒體素材搜索產(chǎn)品,讓用戶可以在龐大的素材庫中進行檢索,如AltaVista可以讓用戶在5。5億個素材(包括5。4億個圖片、1100萬個視頻/音頻文件)中進行檢索,Google的素材庫也達到了4。4億的量級。然而,目前對這些多媒體素材庫的使用,大多還是標注、分類等方法,缺乏對圖像、音視頻內(nèi)容的直接檢索。搜索引擎如何自動分析音視頻的內(nèi)容,允許用戶按內(nèi)容進行檢索,甚至在抓取音視頻素材時就按內(nèi)容進行,這些問題將在今后較長一段時間內(nèi)構(gòu)成挑戰(zhàn),成為搜索引擎所要迫切解決的問題。
4。SEO正在蓬勃發(fā)展
自古有矛便有盾,有盾便有矛。SEO目前已經(jīng)成為一個新興的互聯(lián)網(wǎng)行業(yè)。SEO是SearchEngineOptimization的縮寫,即搜索引擎優(yōu)化。從事這方面工作的就是SearchEngineOptimizer——搜索引擎優(yōu)化師。他們利用工具或其他手段使目標網(wǎng)站符合搜索引擎的搜索規(guī)則從而獲得較好的網(wǎng)站排名。無止境地追求更高排名是搜索引擎優(yōu)化師們的目標,因為他們知道,如果想讓用戶在煙波浩渺的Web中發(fā)現(xiàn)自己,獲得一個很高的排名無疑是非常有效的一種方法。
客觀地說,SEO的這種追求是很自然的,因為經(jīng)濟利益的誘惑實在是太大了。根據(jù)USCensusBureau的調(diào)查,2004年美國的電子商務(wù)銷售額就達到692億美元,并以7。8%的年增長率在發(fā)展,遠遠超過美國的GDP增長。而根據(jù)ForresterResearch的預(yù)測,美國B2C的銷售額將于2010年達到3290億美元,占全部零售額的13%。如果不能讓用戶認識自己,何談電子商務(wù)呢?“搜索引擎優(yōu)化”正是讓大量用戶認識自己的一種有效手段。
搜索引擎優(yōu)化師們并不等于垃圾頁面制造者,但他們中的一部分的確為Web和搜索引擎制造著麻煩,為搜索引擎用戶制造著垃圾。雖然有良好素養(yǎng)和道德觀念的搜索引擎優(yōu)化師們?nèi)匀煌ㄟ^網(wǎng)站結(jié)構(gòu)的優(yōu)化、頁面質(zhì)量的提高等方法進行他們的工作,但那些不道德的搜索引擎優(yōu)化師們發(fā)現(xiàn)有一些“捷徑”更加有效,如在頁面上堆砌大量關(guān)鍵詞、使用重定位手段欺騙WebCrawler程序、構(gòu)造LinkFarm來提高目標頁面的排名,等等[7,8]。他們運用這些手段欺騙搜索引擎,浪費了搜索引擎大量帶寬和時間,污染了搜索引擎的頁面集合,歪曲了排名結(jié)果,浪費了用戶的時間和精力,最后帶給用戶的只是大量垃圾。
這些垃圾制造者通常被稱為WebSpammer。他們所運用的手段有Boosting技術(shù)和Hiding技術(shù)兩大類:Boosting技術(shù)是指使用不道德的頁面排名提升技術(shù),而Hiding技術(shù)是指對使用的Boosting技術(shù)進行隱藏,盡量不讓用戶和WebCrawler發(fā)現(xiàn)。
Boosting技術(shù)包括TermSpamming和LinkSpamming。TermSpamming是較早出現(xiàn)的技術(shù),是指Spammer操縱Web頁面的正文,使其內(nèi)容和眾多的用戶查詢盡可能地相關(guān),方法是在Body、Title和AnchorText等處插入大量毫無關(guān)聯(lián)但用戶經(jīng)常使用的關(guān)鍵詞。由于技術(shù)簡單,只需要把別人已有的內(nèi)容進行重復(fù)、編織和黏合,所以至今很多Spammer還在采用這些TermSpamming技術(shù),而且已經(jīng)發(fā)展到自動化和智能化的程度。LinkSpamming則更具隱蔽性,WebSpammer通常使用HoneyPot或構(gòu)造強有力的LinkFarm來提高目標頁面的排名。一個典型的LinkFarm可能包括幾千個支持頁面,而LinkFarm之間還可以構(gòu)成威力更大的聯(lián)盟[7]。由于隱蔽性很強,對于LinkSpamming的探測非常具有挑戰(zhàn)性。
Hiding技術(shù)主要包括ContentHiding、Cloaking和Redirection。ContentHiding是指正文和頁面背景使用相同的顏色,從而掩蓋大量的無關(guān)正文,使得WebCrawler能夠發(fā)現(xiàn)而對用戶進行屏蔽。Cloaking是指對WebCrawler返回一個不同的頁面,從而欺騙搜索引擎。Redirection本質(zhì)上和Cloaking一樣,但它是對瀏覽器而非Crawler返回不同的頁面。Hiding技術(shù)也是Spammer所常用的,有時利益如此誘人,以至于一些著名大公司也躍躍欲試,如2006年初的時候,寶馬德國公司網(wǎng)站(bmw。com。de)就曾因為使用了該欺騙技術(shù)而遭到Google的懲罰。
(二)用戶需求的發(fā)展
1。更準、更全、更新、更快
經(jīng)過十幾年的技術(shù)發(fā)展和市場成熟,搜索引擎正日益滲透到人們?nèi)粘I畹姆椒矫婷?,人們對信息的獲取越來越依賴搜索引擎。在全世界網(wǎng)民中,搜索引擎的使用率僅次于電子郵件而位居第二。隨著對搜索引擎的使用不斷走向深入,網(wǎng)民的要求也在提高。從產(chǎn)品層面來看,準、全、新、快仍然是用戶對搜索引擎最基本的四個要求,而且用戶希望搜索引擎在這些方面能做得更好。
目前而言,圍繞這幾個問題,各大搜索引擎服務(wù)商都在做許多細致的工作,以力求趨向完美解決。比如“準”,需要更準確地理解用戶需求,不斷更新Ranking算法,同時又要嚴格控制垃圾網(wǎng)頁的干擾;“全”指的是全面,盡可能地把互聯(lián)網(wǎng)中“有價值”的網(wǎng)頁都索引下來,滿足最大用戶群的需要;“新”要求搜索引擎的抓取非常高效,能夠把最新的東西及時提取出來,同時還要不斷更新已抓取信息;第四點是“快”,不僅要讓用戶感覺速度很快,還要保持最大的系統(tǒng)穩(wěn)定性?!八训脺?、搜得全、搜得新、搜得快”,這是一個綜合的服務(wù)過程,任何一個環(huán)節(jié)出了問題,都有可能導(dǎo)致用戶滿意度的下降。
2。使用更加方便和容易
隨著技術(shù)的發(fā)展,人們希望搜索引擎無處不在,在任何時間任何地點,要尋找信息時都可以使用搜索引擎。而隨著搜索引擎的逐步普及,越來越多的使用者(他們中很大一部分對計算機和網(wǎng)絡(luò)了解不多)希望搜索引擎的工具性進一步加強,最好在不覺察的情況下使用搜索引擎服務(wù)。人們甚至期望搜索引擎的使用如微波爐和洗衣機一樣方便和容易。
3。搜索個性化
搜索引擎的一個經(jīng)驗就是,用戶很多時候并不確切地知道自己想要什么樣的結(jié)果,除非你把結(jié)果放在他的面前。所以用戶在使用搜索引擎時,很多時候相同表象的內(nèi)容卻意味著不同的需要。比如對于同一個查詢詞,不同的用戶所需要的查詢結(jié)果可能是不同的。即使是同一個用戶輸入同一個查詢詞,他在不同的時間、不同的地點和不同的查詢背景下,希望得到的查詢結(jié)果也可能是不一樣的。
搜索引擎必須理解用戶的意圖和需求,才能非常到位地提供相關(guān)、準確的信息。要理解用戶的意圖,首先要理解用戶的行為和習(xí)慣,對不同人的查詢做不同的處理,反饋給用戶個性化的內(nèi)容;其次要理解用戶查詢時的上下文背景,包括時間、地點、語義等。個性化的搜索,意味著向更加精確搜索結(jié)果的方向又邁進了一步。
(三)網(wǎng)絡(luò)的發(fā)展
1。網(wǎng)絡(luò)終端形式更加豐富
目前各種客戶端搜索工具的發(fā)展,使得用戶可以不到搜索引擎的網(wǎng)站,而是直接在工具終端搜索所要查詢的信息。手機、PDA等終端設(shè)備的不斷發(fā)展,將最終幫助人們擺脫電腦的制約,而各種嵌入式智能裝備的推廣普及,正在印證著這一趨勢。隨著網(wǎng)絡(luò)終端形式越來越豐富,很多應(yīng)用找到了自己的位置,如手機電影;也有一些應(yīng)用隨著網(wǎng)絡(luò)終端形式的發(fā)展而不斷拓展,如Gmail的手機版。那么作為網(wǎng)絡(luò)第二大應(yīng)用的搜索引擎,也應(yīng)該與時俱進,不斷拓寬應(yīng)用之路。
實際上很多搜索引擎已經(jīng)這么做了。如Nokia和Yahoo在2006年9月7日發(fā)布了面向Nokia便攜式終端的應(yīng)用軟件“NokiaMobileSearch”。該軟件面向NokiaNseriesS60終端,用Yahoo的網(wǎng)頁、圖像搜索功能可向用戶提供10種語言的搜索結(jié)果。但問題的關(guān)鍵是,只在新的網(wǎng)絡(luò)終端上發(fā)布搜索產(chǎn)品還遠遠不夠,應(yīng)該挖掘各種網(wǎng)絡(luò)終端的最佳應(yīng)用模式,更好更方便地、個性化地服務(wù)用戶,用戶才可能喜愛這些新生事物。例如使用手機進行搜索時,完全可以根據(jù)時間和地點進行個性化服務(wù)。可以想象,如果快吃飯的時候使用手機查詢飯店,那么把手機持有者附近的知名飯店作為查詢結(jié)果返回,將會是一個很好的選擇。
2。網(wǎng)絡(luò)速度的提高
隨著基礎(chǔ)建設(shè)的發(fā)展和技術(shù)水平的提高,網(wǎng)絡(luò)速度一直在不斷提高。網(wǎng)速的提高對于搜索引擎的影響主要在兩個方面:首先極大地促進了頁面搜集的速度,能夠使搜集的頁面集合更全,覆蓋率更高,同時使頁面集合的更新更快,信息時效性更強;另一方面是在搜索結(jié)果的使用上,可以使用戶更快地打開頁面,下載自己需要的信息,包括pdf文件、圖像文件、音視頻文件等,給用戶更好的應(yīng)用體驗。
網(wǎng)絡(luò)速度的提高提供了以上的可能性,而搜索引擎必須把這種可能變?yōu)楝F(xiàn)實。另外,搜索引擎還要抓住機會,比如隨著IPv6的發(fā)展,大力推進多媒體信息的搜索和使用。
3。無線網(wǎng)絡(luò)的發(fā)展
互聯(lián)網(wǎng)有從有線網(wǎng)絡(luò)向無線網(wǎng)絡(luò)發(fā)展的趨勢,隨著無線通訊技術(shù)的發(fā)展,無線傳輸速率、覆蓋面和穩(wěn)定性得到很大提高,3G的應(yīng)用將進一步擴大這個趨勢。摩根斯坦利(MorganStanley)2006年4月初發(fā)布了一份106頁的名為“全球互聯(lián)網(wǎng)趨勢(GlobalInternetTrends)”的調(diào)查報告[9],這個報告包含了互聯(lián)網(wǎng)的調(diào)查和市場數(shù)據(jù),從金融市場的角度分析了互聯(lián)網(wǎng)市場的風(fēng)險和機遇。摩根斯坦利在這份報告中,試圖說明互聯(lián)網(wǎng)的發(fā)展趨勢已經(jīng)從PC互聯(lián)網(wǎng)轉(zhuǎn)向移動互聯(lián)網(wǎng);而規(guī)模遠超過PC用戶群,并且沒有經(jīng)過深度發(fā)掘的手機和消費電子設(shè)備,已經(jīng)成為了主導(dǎo)互聯(lián)網(wǎng)發(fā)展的主角。摩根斯坦利認為移動互聯(lián)網(wǎng)將帶來新的商機,在未來的數(shù)年內(nèi),移動互聯(lián)網(wǎng)很可能會出現(xiàn)類似于Google那樣的大服務(wù)商。
(四)來自非技術(shù)方面的挑戰(zhàn)
1。知識產(chǎn)權(quán)問題
Web上的知識產(chǎn)權(quán)保護是一個很復(fù)雜的問題——不僅搜索引擎公司覺得麻煩,用戶也很矛盾:一方面認為合法的知識產(chǎn)權(quán)理所當(dāng)然應(yīng)該受到保護,另一方面也希望自己能夠更方便地獲得更多權(quán)威的、有價值的信息。
事實上,Google公司不止一次地受到侵權(quán)起訴,Google使出渾然解數(shù),也不過與原告?zhèn)兇騻€平手而已。國內(nèi)的百度公司也因為提供MP3下載而屢屢為人詬病。知識產(chǎn)權(quán)的問題雖然最終要靠通過相應(yīng)的法律解決,但某種程度上的技術(shù)處理,可以減輕侵權(quán)的壓力。
2。所在國法律
搜索引擎龐大的搜羅萬象的能力并非總是它的優(yōu)勢,有時正是因為在這一點上違反了所在國的相關(guān)規(guī)定而遭到封鎖。比如“網(wǎng)頁快照”是Google非常好的一項功能,但在中國內(nèi)地因為與相關(guān)法規(guī)抵觸而被封鎖,而該項功能的封鎖,使得它的不少用戶不得不轉(zhuǎn)向其競爭對手的產(chǎn)品。類似這種問題,是搜索引擎本地化時首要考慮的問題。
3。網(wǎng)絡(luò)誠信問題
網(wǎng)絡(luò)誠信不只是搜索引擎發(fā)展中所遇到的難題,而且也是整個互聯(lián)網(wǎng)發(fā)展中的一個非技術(shù)瓶頸。這里以“點擊欺詐”為例來說明問題的嚴重性。
“點擊計費”是目前主流搜索引擎商普遍采用的廣告收費模式,他們通過廣告點擊率向廣告主收取費用,其廣告收費=有效點擊次數(shù)×廣告投放價格,其中有效點擊次數(shù)是指排除點擊欺詐后的次數(shù)。點擊欺詐自互聯(lián)網(wǎng)誕生之際就出現(xiàn)了,成為全球搜索引擎商們的一大心病。雖然幾乎每個搜索引擎商都有自己的反欺詐系統(tǒng),但判斷某個點擊是“有效”還是“惡意”其實是非常困難的一件事。點擊欺詐在中國更是泛濫到無法收拾的地步:靠點擊廣告掙錢甚至已經(jīng)成為一個行業(yè)!點擊欺詐的泛濫告訴我們,網(wǎng)絡(luò)誠信遠遠沒有我們預(yù)期的那么好。
2006年3月,網(wǎng)絡(luò)搜索巨頭Google宣布,公司同意支付最高9000萬美元費用與點擊欺詐案的原告達成和解。雖然Google這位行業(yè)老大終于愿意率先和廣告主們握手言和了,但我們擔(dān)心,Google能夠獨自承擔(dān)整個行業(yè)的重責(zé)嗎?恐怕這由非技術(shù)因素引起的挑戰(zhàn),最終還要靠技術(shù)手段把它們控制在搜索引擎公司能夠承受的范圍內(nèi)。
三、搜索引擎應(yīng)對方略
針對以上各種挑戰(zhàn),搜索引擎如何應(yīng)對呢?我們對搜索引擎所采用的方略和相關(guān)的成型研究進行梳理,歸納為以下幾點予以介紹。這幾點和上面介紹的挑戰(zhàn)并沒有一一對應(yīng)的關(guān)系。
(一)多元化
針對形形色色的用戶,針對用戶各種各樣的需求,搜索引擎已經(jīng)到了細分市場的時候,多元化是搜索引擎的必然之路。一方面,針對大量的普通用戶,搜索引擎仍然致力于最廣泛、最全面的信息檢索;另一方面,針對檢索目的明確、查詢要求精準的用戶,搜索引擎在特定領(lǐng)域和行業(yè)中發(fā)展,推出更有針對性的垂直搜索系統(tǒng),為這些專業(yè)人士更好地服務(wù)。
1。通用系統(tǒng):其定位是一個好的推薦系統(tǒng)
在通用系統(tǒng)層面,搜索引擎的定位更加清晰:它只是一個好的推薦系統(tǒng),對于它的返回結(jié)果,用戶必須經(jīng)過自己的過濾和選擇,而不是把排在前一二位的結(jié)果直接拿來使用。
作為一個好的推薦系統(tǒng),搜索引擎著力做好這樣幾件事情:①信息盡量全而有價值;②信息具有良好的時效性和時新性;③信息查詢盡量準確,或者說通過盡可能少的交互,引導(dǎo)用戶找到其所需要的結(jié)果;④用戶界面友好;⑤查詢速度快。后面幾個小節(jié)中,我們會有針對性地討論這些方面。
2。專業(yè)系統(tǒng):要求非常精準,有專業(yè)特色
專業(yè)搜索系統(tǒng)又稱垂直搜索(verticalsearching)系統(tǒng),它是搜索引擎的細化和延伸,在最近幾年發(fā)展得如火如荼。垂直搜索引擎和通用搜索引擎的最大區(qū)別,是對網(wǎng)頁信息進行了一定程度的結(jié)構(gòu)化提取,然后將提取的數(shù)據(jù)進行深度加工處理,為用戶提供針對性更強、精確性更高的服務(wù)。
垂直搜索引擎的應(yīng)用方向很多,比如地圖搜索、音樂搜索、圖片搜索、文獻搜索、企業(yè)信息搜索、求職信息搜索、購物搜索、房產(chǎn)搜索、天氣搜索……幾乎各行各業(yè)各類信息都可以細化成相應(yīng)的垂直搜索對象。垂直搜索引擎一般在規(guī)模上比通用搜索引擎要小,因為它只涉及某個特定的領(lǐng)域。垂直搜索引擎在技術(shù)上也需要信息搜集程序(但只在一些特定站點活動,并且不是對所有的鏈接都感興趣)、中間處理(分詞、信息提取和索引等)程序以及為用戶提供查詢服務(wù)。在信息搜集方面,Crawler除了使用各種技術(shù)在限定領(lǐng)域內(nèi)面向主題抓取盡可能全的信息外,從領(lǐng)域內(nèi)的各種系統(tǒng)和數(shù)據(jù)庫中獲得信息更為重要,因為這些信息更為權(quán)威、也更有價值。在中間處理上,最大的挑戰(zhàn)是如何利用模版、規(guī)則或Ontology技術(shù),整理所抓取的紛繁蕪雜的數(shù)據(jù),從中提取結(jié)構(gòu)化信息,然后使用關(guān)系模型或XML等半結(jié)構(gòu)化模型進行組織。只有經(jīng)過有效組織,才能提供有針對性的、更為精準的查詢服務(wù)。
CiteSeer、GoogleEarth、YahooShopping、Shopping。com等都是代表性的垂直搜索引擎。計算機論文搜索引擎CiteSeer(http://citeseer。ist。psu。edu/cs)是NEC研究院建立的一個學(xué)術(shù)論文數(shù)字圖書館,它提供了一種通過引文鏈接檢索文獻的方式。GoogleEarth使用了公共領(lǐng)域的圖片、受許可的航空照相圖片、KeyHole間諜衛(wèi)星的圖片和很多其他衛(wèi)星所拍攝的城鎮(zhèn)照片,并將它們和GIS布置在一個地球的三維模型上,使人足不出戶就可以在名川大山間翱翔,在摩天樓群中俯瞰。YahooShopping和Shopping。com是美國最大的購物搜索引擎,其中Shopping。com創(chuàng)建于1999年,每月可輸送2000萬個有效銷售給商家,2005年8月被eBay以6。2億美元收購。
至于國內(nèi),垂直搜索市場更是群雄紛爭,令人眼花繚亂。然而問題是,大家在紛紛尋找好的贏利模式的時候,往往忽略了應(yīng)該有一個好的技術(shù)作為支持。這是一個很可悲的現(xiàn)象。
(二)搜索質(zhì)量提高
1。過濾垃圾頁面
Web垃圾信息泛濫,不僅浪費了搜索引擎的帶寬和時間等寶貴資源,更重要的是,它們的存在大大降低了搜索引擎的查詢質(zhì)量和查詢效率,極大地影響了用戶對Web信息的有效使用。搜索引擎主要在兩個步驟上進行反擊:①在Crawler抓取階段即進行過濾,濾去那些質(zhì)量極低、毫無內(nèi)容可言的“高純度垃圾”,這樣可以節(jié)省網(wǎng)絡(luò)帶寬、費用、抓取時間、存儲空間等,并且大大減輕了下一步在信息分類、信息組織和查詢匹配時的負擔(dān);②在信息分類和組織階段,計算網(wǎng)頁信息的可信度,在用戶查詢信息時,把可信度作為一個重要因子對查詢結(jié)果集進行排序,從而提高查詢結(jié)果的信息質(zhì)量,滿足用戶的實際需要。
搜索引擎公司傳統(tǒng)上的做法是,聘請專業(yè)人員,不斷地搜查探測那些惡意欺騙者。當(dāng)確認了一個Web垃圾網(wǎng)站后,搜索引擎停止對它的搜索和索引。然而這個探測過程非常昂貴而且緩慢,鑒于此,搜索引擎公司、國內(nèi)外知名大學(xué)和研究機構(gòu)近幾年開始從不同的角度研究和尋找更好的方法,其中有代表性的研究成果如下:
(1)Google在2002年就注意到Web垃圾信息日漸泛濫的問題,提出要在自己的排名算法中,加大頁面質(zhì)量的權(quán)重[10]。
(2)Microsoft對近6億個頁面進行了研究,從URL屬性、HostName的解析、鏈接關(guān)系、內(nèi)容特點等幾方面分析了Web垃圾頁面的特點,并試圖按照這些統(tǒng)計屬性來確認Web垃圾頁面[8]。
(3)Stanford的Gyongyi等人受Haveliwala的“Topic-SensitivePageRank”思想的啟發(fā),認為好的頁面所指向的鏈接頁面通常也是好的,于是他們提出了TrustRank的概念,依靠一個人工選取的好種子頁面集,計算他們的傳播結(jié)果,從而對Web站點按可信度排序,進而把所有站點分為“好”和“壞”兩種[11]。他們還對Webspam進行了分類研究[12],并對Linkspam聯(lián)盟技術(shù)做了分析[13]。Gyongyi等人提出TrustRank的概念后,受到了廣泛關(guān)注,陸續(xù)有很多研究者進行類似的研究,如匈牙利科學(xué)院的AndrásA。Benczúr等人,以及美國LehighUniversity的BaoningWu和BrianD。Davison等。
雖然很難見到Google、Yahoo等搜索引擎關(guān)于如何去除垃圾頁面的技術(shù)報告,但他們一直在做著這樣的工作,并且已經(jīng)有所應(yīng)用。這一點從相關(guān)產(chǎn)品的使用體驗中可間接地驗證。
2。提高查詢準確度
對于一個查詢,搜索引擎動輒返回幾十萬、幾百萬篇文檔。面對大量的返回結(jié)果,用戶只能在其中瀏覽篩選。實際上,用戶大多數(shù)時間都沒有足夠的耐心去瀏覽多屏結(jié)果。根據(jù)Silverstein等人的研究結(jié)果,有85%的查詢只需要給出前10個結(jié)果[14]。
如何使用戶想要的查詢結(jié)果出現(xiàn)在返回集合的前列(最好是第一屏),這個本來就具有挑戰(zhàn)性的問題隨著搜索引擎檢索頁面集的增大而越來越急迫。目前解決這個問題的主要幾種方法是:
(1)通過各種方法獲得用戶沒有在查詢語句中表達出來的真正用途,包括:①相關(guān)度反饋機制,使用戶告訴搜索引擎哪些文檔和自己的需求相關(guān)(及其相關(guān)的程度),哪些不相關(guān),通過多次交互逐步求精;②智能代理跟蹤用戶檢索行為,分析用戶模型;③用戶注冊使用,以便更好地分析用戶的使用特點和喜好。
(2)使用正文分類技術(shù)將查詢結(jié)果分類,使用可視化技術(shù)顯示分類結(jié)構(gòu),用戶可以有選擇性地瀏覽自己感興趣的類別(GoogleNews就采用了這種方法)。
(3)使用鏈接結(jié)構(gòu)分析進行站點聚類或頁面聚類,然后將信息推薦給用戶(Vivisimo公司就是采用對搜索結(jié)果自動聚類的辦法來滿足不同類型用戶的需要)。
我們認為最有力的方法是改進排名算法。Google的排名規(guī)則一直在變化中,2001年基于HillTop算法進行的優(yōu)化是比較明顯的變化(HillTop認為來自相同主題的相關(guān)文檔鏈接對權(quán)重計算的貢獻更大),現(xiàn)在又到了迫切需要算法更新的時候了。據(jù)說Google正在研究“多倍索引信息獲取系統(tǒng)(MIBIRS)”,可以使搜索引擎的網(wǎng)頁索引數(shù)量達到驚人的1000億幅甚至更多,我們翹首以盼。
(三)搜索能力加強
1。對多媒體搜索的支持
隨著多媒體信息在網(wǎng)絡(luò)上的大量涌現(xiàn)和人們對多媒體信息需求的高漲,知名搜索引擎如Google、Yahoo、AltaVista、Lycos、AllTheWeb等對于多媒體搜索的能力也在不斷加強。它們或在一個統(tǒng)一的用戶界面上提供資料類型選擇,或直接提供獨立的多媒體搜索引擎。另外,各種圖像搜索引擎和各種娛樂搜索引擎也不斷涌現(xiàn)。這些系統(tǒng)可以說在很大程度上滿足了用戶的需要,然而它們對多媒體搜索的支持都還在初級階段,基本上是基于文本關(guān)鍵詞和自動標注進行多媒體信息檢索,缺乏基于圖像和音視頻內(nèi)容進行比對檢索的功能。
一般的說,多媒體信息的內(nèi)容表示可分為物理層(如信號樣本、像素等)、特征層(如圖像的顏色和紋理、語音頻譜)、語義層內(nèi)容(如語音的腳本、音樂的音符、圖像中的物體形狀和人臉)等三個層次?;趦?nèi)容的檢索一般針對后兩個層次。基于特征層次的內(nèi)容檢索主要應(yīng)用于以媒體實例為輸入的查詢方式。檢索時,首先對輸入的實例提取特征模板,再與檢索源中的數(shù)據(jù)相匹配。相關(guān)研究主要圍繞著檢索的快速性和準確性問題展開,具體涉及特征選取、匹配策略、算法優(yōu)化等。
關(guān)于圖像處理和檢索的專利較多,根據(jù)美國專利網(wǎng)的檢索結(jié)果,與圖像檢索相關(guān)的專利達186項,但是很少見它們應(yīng)用于實際系統(tǒng),而用于網(wǎng)絡(luò)多媒體搜索引擎的專利,則更是罕有。2004年Lowe提出了SIFT(Scale-InvariantFeatureTransform)[15]特征,該特征具有旋轉(zhuǎn)、縮放不變性,并且對光照、仿射變換以及視角變化等都具有相當(dāng)程度的魯棒性。除此之外,每一個SIFT特征都具有很強的描述和區(qū)分能力,因此非常適用于圖像實例檢索。但在對海量數(shù)據(jù)的檢索中,如何降低其復(fù)雜度需要進一步的深入研究。
在音頻檢索方面,常用的特征包括:短時能量、頻譜、過零率、美標度倒譜等。針對大數(shù)據(jù)量檢索問題,很多工作集中在特征匹配的策略優(yōu)化上?;趦?nèi)容的視頻檢索可以看做圖像和音頻檢索的擴展,所用特征除圖像和音頻中的常用特征以外,還包括一些專有特征:如物體運動、鏡頭切換等。關(guān)于音視頻檢索的專利也不少,根據(jù)美國專利網(wǎng)的檢索結(jié)果,與音頻和視頻檢索相關(guān)的分別為28項和80項,但是應(yīng)用于網(wǎng)絡(luò)多媒體搜索引擎的專利卻很少。
語義層次上的內(nèi)容檢索研究相對更為困難一些,下面幾個方面是最近幾年進展較快的:場景分類技術(shù)、語音數(shù)據(jù)識別、語音說話人分割、視頻數(shù)據(jù)中精彩片段提取等。然而這些技術(shù)距離大規(guī)模檢索應(yīng)用還有相當(dāng)?shù)木嚯x。
在這里值得一提的是,面對咄咄逼人的Google和Yahoo,法國總統(tǒng)雅克·希拉克在2006年新年講話時宣布,法國決定聯(lián)手德國,抓住多媒體搜索這個機會,開發(fā)“真正的多媒體搜索引擎Quaero,以應(yīng)對Google和Yahoo帶來的全球挑戰(zhàn)”。
Quaero的拉丁語意是“我搜”,該項目的目標是,搜索時無須借助文字描述就能“讀懂”音頻、圖像和視頻的內(nèi)容。目前,這樣的圖片識別程序已經(jīng)存在。法國中型軟件公司、Quaero項目成員LTUTechnologies向美國聯(lián)邦調(diào)查局(FBI)提供電腦取證分析工具,用于分析被扣押的硬盤中的圖片,并將其與已知的戀童癖罪犯的照片相比對。另外他們還有一些可將語音轉(zhuǎn)化為文字的音頻解析程序。Quaero項目組面臨的挑戰(zhàn)是,如何改進這些工具以提高搜索準確度,同時提高速度,適應(yīng)大數(shù)據(jù)量的檢索。
目前參與Quaero研發(fā)的主要公司和機構(gòu)包括法國電信、湯姆遜公司、法國視聽研究所、德國電信、貝塔斯曼集團和西門子公司等。Quaero項目預(yù)計在未來5年內(nèi)需要投入10億~20億歐元,所需資金將由法、德兩國政府以及兩國企業(yè)共同承擔(dān),其中法國政府已計劃5年內(nèi)投資2。5億歐元。這個項目究竟走勢如何,我們將拭目以待。
2。對DeepWeb的搜索
DeepWeb已經(jīng)擁有不少研究者,如Stanford和UIUC的學(xué)者們,他們分別搭建了HiWE[16]和MetaQuerier[17]兩個很好的原型系統(tǒng)。也有一些搜索引擎能夠搜索DeepWeb信息,如004km.cn、004km.cn。com、004km.cn等。然而它們或者太小,或者搜索Invisible信息的能力太弱,所以使用起來很多時候不能得心應(yīng)手。
幾大主流搜索引擎尚未提供DeepWeb搜索功能,主要原因是技術(shù)上還不夠成熟。然而“需求是創(chuàng)新之母”,我們期待在不久的將來能使用Google、Yahoo等查詢DeepWeb信息,或者是基于DeepWeb查詢的搜索引擎迅速發(fā)展起來,為我們提供更好的服務(wù)。
3。ArchiveSearch
搜索引擎通常能夠提供的信息通常只是最近在網(wǎng)上有的信息,而很多情況下我們需要了解網(wǎng)上曾有的歷史信息,甚至需要將不同時間的信息進行歸納、比較和綜合。另外,對于搜索引擎來說,把自己辛辛苦苦搜集來的信息輕易拋棄也是很可惜的事。
這方面的研究國內(nèi)國外都曾開展過,如InternetArchive、UCLA的WebArchive[18]和北京大學(xué)的WebInfoMall(http://004km.cn/)作為搜索引擎的領(lǐng)袖公司,一直在進行著前沿研究,并不斷推出新的產(chǎn)品。就在不久前,Google專門為中小企業(yè)推出了集成了Gmail、Gtalk、GoogleCalendar和GooglePageCreator等免費服務(wù)的GoogleAppsforYourDomain項目。接著Google又跟LitCam和UNESCO(教科文組織)合作,推出了一個專為教育和文化事業(yè)而設(shè)置的集成服務(wù)——Google知識工程。Google還推出了新搜索服務(wù)——SearchMash。com作為Google的子搜索網(wǎng)站,SearchMash采用了圖文結(jié)合的方式顯示搜索結(jié)果,左邊為文字搜索結(jié)果,右邊為符合度最高的圖像搜索結(jié)果。另外,Google正在研究“多倍索引信息獲取系統(tǒng)(MIBIRS)”,據(jù)說通過該項技術(shù),可以使Google搜索引擎的網(wǎng)頁索引數(shù)量達到驚人的1000億幅或更多。Google對于語義搜索的研究也在進行中。
(2)Microsoft(http://research。microsoft。com/)對于搜索引擎這個龐大的市場當(dāng)然不肯放過。微軟亞洲研究院(http://research。microsoft。com/asia/)早在2001年底,便開始了有關(guān)互聯(lián)網(wǎng)信息檢索技術(shù)的研究,幾年來發(fā)表了很多高水平的論文,并不斷把這些研究成果轉(zhuǎn)化為技術(shù)。他們的代表性成果包括對網(wǎng)頁細分的“數(shù)據(jù)模塊化的Web檢索方法”、搜索動態(tài)網(wǎng)頁數(shù)據(jù)的“深層網(wǎng)絡(luò)數(shù)據(jù)發(fā)掘技術(shù)”,等等。對于分散于互聯(lián)網(wǎng)上的圖像資源,他們開發(fā)出的智能化圖片搜索技術(shù),已可自動識別與分類搜索結(jié)果。在2006年微軟創(chuàng)新日上,微軟亞洲研究院集中展示的38項技術(shù)中,搜索類技術(shù)就多達11種,包括對文字、圖像、新聞事件等進行搜索,應(yīng)用涵蓋了手機移動、IPTV等多個方面。微軟亞洲研究院院長沈向洋博士于2006年9月在北京宣布,微軟亞洲研究院將在原有四大研究方向:新一代多媒體、新一代用戶界面、無線及網(wǎng)絡(luò)技術(shù)和數(shù)字娛樂的基礎(chǔ)上,增加互聯(lián)網(wǎng)搜索和挖掘為該機構(gòu)的第五大研究方向。
(3)Yahoo?。╤ttp://004km.cn)……就是例子。前面提到的法國和德國聯(lián)手開發(fā)Quaero搜索引擎的計劃也能給我們啟示。在上述包羅萬象數(shù)據(jù)(信息)的大搜索的概念下,本土努力將更有天然的優(yōu)勢,而一定的國家行為可以使這種優(yōu)勢發(fā)揮出最好的效益來。
本文004km.cn 004km.cn A5首發(fā),轉(zhuǎn)載請保留。