第一篇:體育視頻的內(nèi)容標(biāo)注和解析技術(shù)研究
一,開(kāi)展本課題研究的意義
近年來(lái),數(shù)字視頻的應(yīng)用日趨廣泛.諸如視頻點(diǎn)播,數(shù)字電視,數(shù)字圖書(shū)館,視頻會(huì)議,遠(yuǎn)程教育等等,已經(jīng)為越來(lái)越多的人所接受和熟悉.面對(duì)大量涌現(xiàn)的視頻數(shù)據(jù),如何找到所需的視頻信息就成為一個(gè)急需解決的問(wèn)題.簡(jiǎn)單的視頻名查詢和類似錄像機(jī)的播放功能已不能滿足人們的需要.正如一本書(shū)通常會(huì)有目錄和索引幫助人們迅速瀏覽和查詢內(nèi)容,一部視頻同樣需要有效的目錄和索引.傳統(tǒng)的方法需要由人對(duì)視頻內(nèi)容進(jìn)行標(biāo)注,十分費(fèi)時(shí)費(fèi)力.尤其是當(dāng)視頻資源的數(shù)量達(dá)到海量級(jí),或是處理的速度要求接近實(shí)時(shí)的時(shí)候,完全采用人工的方法都會(huì)遇到難以克服的困難.為了解決這一問(wèn)題,九十年代以來(lái),出現(xiàn)了基于內(nèi)容的視頻分析和檢索[1][2][3].其核心就是通過(guò)對(duì)視頻內(nèi)容進(jìn)行計(jì)算機(jī)分析理解,建立結(jié)構(gòu)和語(yǔ)義索引,以方便用戶檢索.巨大的商業(yè)前景和重要的學(xué)術(shù)價(jià)值,吸引了來(lái)自于業(yè)界和學(xué)術(shù)界不同領(lǐng)域的研究人員在這一問(wèn)題上開(kāi)展研究.一些原型系統(tǒng)先后被提出,主要有ibm的qbic/cuevideo[4][5],virage公司的video engine[6],卡內(nèi)基梅隆大學(xué)的informedia[7],哥倫比亞大學(xué)的videoq[8]等.這些努力最終促成了國(guó)際標(biāo)準(zhǔn)——mpeg-7(多媒體內(nèi)容描述接口)的誕生.但是隨著問(wèn)題的深入,研究人員面臨了更大的障礙:視覺(jué)/聽(tīng)覺(jué)內(nèi)容的機(jī)器理解,即難以建立底層特征與高層語(yǔ)義的聯(lián)系.同樣的難題困擾了人工智能領(lǐng)域多年.一般認(rèn)為,尋找通用的解決方法是異常艱難的.因此,一些研究轉(zhuǎn)而專注于解決特定領(lǐng)域的應(yīng)用問(wèn)題,如新聞,電影等.在這些特定領(lǐng)域,結(jié)合相應(yīng)的領(lǐng)域知識(shí),是可能將底層特征與高層語(yǔ)義建立某種聯(lián)系的.體育視頻,即體育比賽的電視轉(zhuǎn)播,作為一個(gè)重要的應(yīng)用領(lǐng)域,一直備受關(guān)注.體育比賽一般很漫長(zhǎng),但對(duì)于大多數(shù)觀眾來(lái)說(shuō),真正關(guān)心并有可能反復(fù)觀看的只是其中的一小部分.例如一場(chǎng)跳水比賽常常需要持續(xù)幾個(gè)小時(shí),而其中的精彩部分——運(yùn)動(dòng)員從起跳到入水的過(guò)程卻只有短短幾分鐘.人們需要一種方便快捷的手段來(lái)訪問(wèn)體育視頻的內(nèi)容.與其他視頻相比,體育視頻具有自己的特點(diǎn).首先,體育視頻中存在一些領(lǐng)域相關(guān)的語(yǔ)義事件,如跳水比賽中運(yùn)動(dòng)員的跳水,足球比賽中的射門等.這些語(yǔ)義事件往往是視頻中最有價(jià)值的部分,需要進(jìn)行標(biāo)注以便于檢索.其次,體育比賽一般有較強(qiáng)的結(jié)構(gòu)性,如跳水比賽由若干輪組成,每輪又由若干選手組成等.為了便于對(duì)視頻內(nèi)容的瀏覽,原始的視頻數(shù)據(jù)應(yīng)按這些結(jié)構(gòu)進(jìn)行解析并組織成層次目錄.本課題的目標(biāo)就是研究針對(duì)體育視頻內(nèi)容的語(yǔ)義標(biāo)注和結(jié)構(gòu)解析技術(shù).盡管限于當(dāng)前的技術(shù)水平,完全自動(dòng)的,通用的視頻內(nèi)容理解是不太可能的,但是本課題的研究將證明部分的解決是有可能的和有價(jià)值的,此外我們的研究也將為最終的全面解決奠定基礎(chǔ).除了學(xué)術(shù)上的意義,本課題的研究還可以有以下一些直接的應(yīng)用:
1,視頻資料庫(kù):適用于各類體育專業(yè)人士或愛(ài)好者對(duì)收集的體育比賽視頻資料進(jìn)行查詢,瀏覽和管理.目前,我們已申請(qǐng)到國(guó)家體育總局的科研項(xiàng)目——跳水訓(xùn)練圖像分析軟件系統(tǒng)研制.通過(guò)對(duì)跳水比賽視頻的內(nèi)容標(biāo)注與解析,能夠方便快捷的實(shí)現(xiàn)一個(gè)典型動(dòng)作的視頻數(shù)據(jù)庫(kù).2,web多媒體發(fā)布:適用于新聞或者體育網(wǎng)站在web上及時(shí)發(fā)布體育多媒體信息.今天,已經(jīng)有越來(lái)越多人的習(xí)慣于從網(wǎng)上獲取最新的資訊.基于我們的技術(shù),可以在第一時(shí)間采編和發(fā)布綜合圖文和視音頻在內(nèi)的體育多媒體信息.3,個(gè)人移動(dòng)業(yè)務(wù):適用于無(wú)線服務(wù)提供商為個(gè)人提供定制的多媒體消息服務(wù)(multimedia message service,簡(jiǎn)稱mms).我們的內(nèi)容標(biāo)注和解析技術(shù),可以為冗長(zhǎng)的體育視頻生成摘要,從而可以根據(jù)用戶的個(gè)人喜好和終端能力,向移動(dòng)設(shè)備發(fā)送體育多媒體消息.二,國(guó)內(nèi)外研究現(xiàn)狀分析
國(guó)際上對(duì)于體育視頻的研究是從90年代中期開(kāi)始的,屬于視頻檢索領(lǐng)域的一個(gè)子課題.與新聞視頻領(lǐng)域取得的成功相比[9][10][11],體育視頻的研究相對(duì)較少也更為困難.這主要是因?yàn)樾侣勔曨l有一個(gè)基本一致的時(shí)域結(jié)構(gòu)和場(chǎng)景語(yǔ)義,即先是播音員鏡頭,然后是新聞報(bào)道,最后再回到播音員鏡頭進(jìn)行下面的新聞報(bào)道,而對(duì)于體育視頻則不存在這樣統(tǒng)一的結(jié)構(gòu)和語(yǔ)義.目前體育視頻的研究尚處于初期探索階段,對(duì)于其過(guò)程和方法還沒(méi)有統(tǒng)一的結(jié)論,也還沒(méi)有可以投入實(shí)用的系統(tǒng).1,鏡頭檢測(cè)
通常在對(duì)體育視頻進(jìn)行分析前,需要將其分割成鏡頭.所謂鏡頭,是指攝像機(jī)不間斷拍攝的一組幀序列,它常被看成一部視頻的最小結(jié)構(gòu)單元.為了將鏡頭分割出來(lái),需要進(jìn)行鏡頭邊界檢測(cè).鏡頭與鏡頭之間的邊界有兩種類型:突變和漸變.突變時(shí),鏡頭直接切換到下一個(gè);漸變時(shí),從一個(gè)鏡頭到下一個(gè)鏡頭會(huì)有一個(gè)持續(xù)多幀的變化過(guò)程,常見(jiàn)的主要有淡出淡入(fade out and fade in),溶解(dissolve),擦變(wipe)等.淡出淡入是指視頻幀逐漸隱去直到完全黑屏,再逐漸顯現(xiàn)后一鏡頭的幀圖像.溶解是指在前一鏡頭幀圖像逐漸模糊的同時(shí),后一鏡頭的幀逐漸增強(qiáng),并且產(chǎn)生前后幀圖像的重疊.擦變表現(xiàn)為后一鏡頭幀圖像的區(qū)域逐漸變大把前一鏡頭的圖像擦掉.鏡頭檢測(cè)的關(guān)鍵問(wèn)題是如何區(qū)分鏡頭之間的切換和因?yàn)閿z像機(jī)或物體運(yùn)動(dòng)造成的鏡頭內(nèi)變化.由于這個(gè)原因,漸變比突變更難以檢測(cè).早期的工作主要在突變檢測(cè),近來(lái)更多的研究集中到對(duì)漸變的分析.鏡頭檢測(cè)的方法可以分為兩類:非壓縮域的和壓縮域的.在[12][13]中,對(duì)各種非壓縮域的鏡頭檢測(cè)算法進(jìn)行了實(shí)驗(yàn)評(píng)價(jià).與非壓縮域的方法相比,基于壓縮域的方法不需要對(duì)視頻編碼流進(jìn)行解碼,而是直接使用如dct系數(shù),運(yùn)動(dòng)矢量,宏塊(macroblock)信息等壓縮域特征進(jìn)行分析,從而提高了處理速度[14][15][16][17].今天大量的視頻數(shù)據(jù)是以壓縮格式(如mpeg)存儲(chǔ)的,因此基于壓縮域的方法往往具有更大的實(shí)用價(jià)值.2,語(yǔ)義標(biāo)注
所謂語(yǔ)義標(biāo)注,是指對(duì)體育視頻中的語(yǔ)義事件進(jìn)行檢測(cè)和標(biāo)注,其實(shí)質(zhì)就是依據(jù)事先定義好的類別對(duì)視頻片段進(jìn)行識(shí)別.當(dāng)前,國(guó)內(nèi)外對(duì)體育視頻研究實(shí)際上主要集中在這個(gè)方面,下面介紹一下相關(guān)工作.y.gong等首先提出了對(duì)足球比賽視頻的分析[18].他們結(jié)合足球比賽的領(lǐng)域知識(shí),通過(guò)場(chǎng)地白線識(shí)別,攝像機(jī)運(yùn)動(dòng)檢測(cè),足球和運(yùn)動(dòng)員檢測(cè)等分析,對(duì)視頻內(nèi)容進(jìn)行推斷,包括處在球場(chǎng)什么位置,射門,角球等.例如,如果場(chǎng)景接近球門區(qū)域而且足球有一個(gè)向球門的運(yùn)動(dòng),則可以推斷這是一個(gè)射門.實(shí)驗(yàn)結(jié)果表明,系統(tǒng)對(duì)于球場(chǎng)位置的識(shí)別較為準(zhǔn)確,達(dá)到90%,但是射門和角球的識(shí)別率只有53%,這主要是因?yàn)楦咚龠\(yùn)動(dòng)和遮擋關(guān)系,使得足球的檢測(cè)較為困難.哥倫比亞大學(xué)的peng xu等觀察到足球比賽可以劃分為兩種狀態(tài):進(jìn)行和暫停(如因?yàn)榍蛟诮缤饣虿门袝憾ū荣?.他們開(kāi)發(fā)了一個(gè)能夠檢測(cè)視頻中的足球比賽是在進(jìn)行還是暫停的系統(tǒng)[19].該系統(tǒng)對(duì)足球視頻分析分為兩步.首先,根據(jù)顏色分析得出每一幀中的草地顏色比率,使用這個(gè)特征將幀標(biāo)注為三種:全景(globe view),近景(zoom-in view)和特寫(close-up view).在檢測(cè)的時(shí)候,算法可以對(duì)草色和分類決策進(jìn)行學(xué)習(xí)和自動(dòng)調(diào)整.接著,在對(duì)視頻幀進(jìn)行上述分類標(biāo)記后,根據(jù)經(jīng)驗(yàn)總結(jié)的規(guī)則(如全景一般是比賽進(jìn)行,特寫一般是比賽中斷等)判斷比賽是在進(jìn)行還是暫停了.實(shí)驗(yàn)使用了四段來(lái)自不同足球比賽的五分鐘片斷,檢測(cè)準(zhǔn)確率最好達(dá)到86.5%,最壞只有67.3%.在另一篇文章里,他們使用了基于隱馬爾科夫模型(hmm)的統(tǒng)計(jì)方法[20].根據(jù)足球視頻的特點(diǎn),選擇主色比率(dominant-color ratio)和運(yùn)動(dòng)強(qiáng)度(motion intensity)為提取特征.他們?yōu)檫M(jìn)行和暫停分別建立了各自的隱馬爾科夫模型組,依據(jù)最大的可能性對(duì)足球視頻進(jìn)行標(biāo)注.與基于規(guī)則的方法相比,這種方法不需要去直接建立復(fù)雜的分類規(guī)則和確定閾值,而是通過(guò)訓(xùn)練樣本自動(dòng)學(xué)習(xí).實(shí)驗(yàn)結(jié)果表明該方法較為有效而且表現(xiàn)穩(wěn)定,對(duì)不同的測(cè)試集準(zhǔn)確率都在80%以上,平均準(zhǔn)確率達(dá)到83.5%.清華大學(xué)的ming luo等也以足球?yàn)槔岢隽艘粋€(gè)體育視頻分析系統(tǒng)[21].他們的系統(tǒng)根據(jù)關(guān)鍵幀中場(chǎng)地顏色的比率和物體的大小,將鏡頭分類為遠(yuǎn)鏡頭和近鏡頭.此外,對(duì)于遠(yuǎn)鏡頭,他們觀察到在射門或長(zhǎng)傳時(shí),快速的攝像機(jī)運(yùn)動(dòng)通常會(huì)使圖像模糊,從而提出根據(jù)幀圖像的模糊度(blur extent)來(lái)檢測(cè)足球比賽中的這些事件.實(shí)驗(yàn)結(jié)果表明算法對(duì)射門和長(zhǎng)傳事件檢測(cè)的查準(zhǔn)率為89.3%,查全率為97.2%.drew d.saur等人使用直接基于mpeg壓縮域的特征,實(shí)現(xiàn)了對(duì)籃球視頻內(nèi)容的自動(dòng)分析和標(biāo)注[22].算法首先進(jìn)行基于壓縮域dc圖的鏡頭分割,然后對(duì)每個(gè)p幀統(tǒng)計(jì)其中運(yùn)動(dòng)矢量的大小,考慮特寫(close-up)鏡頭比廣角(wide-angle)鏡頭一般變化更激烈,將視頻劃分為廣角鏡頭和特寫鏡頭.對(duì)于廣角鏡頭,進(jìn)一步分析其中的攝像機(jī)運(yùn)動(dòng),來(lái)標(biāo)注特定的視頻內(nèi)容,如搶斷,快攻,可能的投籃等.微軟研究院的y.rui等人提出一種依據(jù)計(jì)算量較小的音頻特征來(lái)檢測(cè)棒球比賽中精彩事件的方法,適用于計(jì)算能力有限的環(huán)境[23].他們的算法首先是基于機(jī)器學(xué)習(xí)的解說(shuō)員激動(dòng)語(yǔ)音識(shí)別和棒球擊打聲檢測(cè),然后將這兩者進(jìn)行概率混合來(lái)推斷最終的精彩片斷.與人工標(biāo)注的精彩片斷進(jìn)行對(duì)比,實(shí)驗(yàn)表明他們的算法能夠達(dá)到75%的準(zhǔn)確率.同樣對(duì)于棒球,dongqing zhang等通過(guò)對(duì)比賽中比分和狀態(tài)的字幕顯示進(jìn)行檢測(cè)和識(shí)別來(lái)分析語(yǔ)義事件的發(fā)生[24][25],如觸壘得分和最后一投(投手被罰出局).他們使用視頻文本檢測(cè)和識(shí)別技術(shù)分析比賽中的字幕信息.識(shí)別結(jié)果再進(jìn)一步利用領(lǐng)域知識(shí)模型來(lái)提高準(zhǔn)確度.b.li和m.i.sezan對(duì)美式橄欖球比賽的電視轉(zhuǎn)播進(jìn)行了分析[26].為了濾除比賽視頻中死球的時(shí)間,生成更為緊湊的摘要,他們將比賽片斷定義為表現(xiàn)球在運(yùn)動(dòng)的視頻片斷,并提出了兩種檢測(cè)方法:確定的基于規(guī)則方法和概率的基于統(tǒng)計(jì)的方法.基于規(guī)則的方法,分析了場(chǎng)地顏色,場(chǎng)地標(biāo)線,攝像機(jī)運(yùn)動(dòng)和運(yùn)動(dòng)員衣服顏色等,然后根據(jù)經(jīng)驗(yàn)總結(jié)的規(guī)則,對(duì)視頻內(nèi)容進(jìn)行判斷.基于統(tǒng)計(jì)的方法,使用hmm推斷視頻中的比賽片斷,實(shí)驗(yàn)表明這種方法也是很有效的.兩者相比,前者易于實(shí)現(xiàn)和計(jì)算,但是需要制定推導(dǎo)規(guī)則,而后者則具有一定的學(xué)習(xí)能力避免了直接設(shè)定閾值的困難.在體育比賽轉(zhuǎn)播的時(shí)候,通常會(huì)在精彩事件之后及時(shí)穿插重放慢鏡頭,這方面也吸引了許多研究者的注意[27][28][29][30].通過(guò)檢測(cè)重放事件,以及發(fā)現(xiàn)之前視頻中相同內(nèi)容的正常鏡頭,就可以為冗長(zhǎng)的體育視頻生成一個(gè)令人滿意的精彩索引.di.zhang針對(duì)體育視頻的分析,試圖提出一個(gè)一般性的框架[31].為了兼顧效率和準(zhǔn)確性,他認(rèn)為事件的檢測(cè)可以分為兩步進(jìn)行.即基于壓縮域分析的初選階段,和基于對(duì)象層次的驗(yàn)證階段.第一步,選擇一些壓縮域的特征,如顏色和運(yùn)動(dòng)等,通過(guò)統(tǒng)計(jì)學(xué)習(xí)的方法實(shí)現(xiàn)對(duì)事件的初選.第二步,在候選場(chǎng)景中進(jìn)行對(duì)象分割,根據(jù)總結(jié)的領(lǐng)域規(guī)則進(jìn)行判定,如對(duì)于網(wǎng)球比賽的發(fā)球鏡頭,圖像中應(yīng)有大塊場(chǎng)地區(qū)域,在下方有小的運(yùn)動(dòng)員對(duì)象.j.assfalg等認(rèn)為體育視頻的鏡頭一般可以分為三類:場(chǎng)地,運(yùn)動(dòng)員和觀眾[32].場(chǎng)地鏡頭關(guān)注體育運(yùn)動(dòng)本身,表現(xiàn)為大塊一致的顏色區(qū)域和場(chǎng)地線條等.在運(yùn)動(dòng)員鏡頭中,運(yùn)動(dòng)員作為前景中的物體出現(xiàn),而背景則變得模糊.在觀眾鏡頭中,個(gè)體常常是不清楚的,而觀眾整體可以看作一種紋理.基于這些認(rèn)識(shí),他們通過(guò)邊緣提取,圖形分割和顏色
分析等,對(duì)三類鏡頭實(shí)現(xiàn)了有效的識(shí)別.n.babaguchi綜合了文本和視覺(jué)特征來(lái)對(duì)體育視頻中的事件進(jìn)行檢測(cè)[33].文本信息來(lái)自于電視信號(hào)中的隱藏字幕(closed caption).首先,通過(guò)搜尋文本中事件相關(guān)的關(guān)鍵字,估計(jì)事件發(fā)生的可能時(shí)間段.然后,再對(duì)時(shí)間段內(nèi)的鏡頭進(jìn)行視覺(jué)特征分析,計(jì)算與已有的事件例子的匹配度,檢測(cè)出事件相關(guān)的鏡頭.3,結(jié)構(gòu)解析一部視頻中常常包含了成百上千個(gè)鏡頭,特別是在體育視頻中.這主要是因?yàn)轶w育比賽電視轉(zhuǎn)播的時(shí)候,會(huì)有多個(gè)攝像機(jī)從不同視角對(duì)比賽進(jìn)行拍攝,它們之間的頻繁切換就構(gòu)成了鏡頭.為了更好的訪問(wèn)視頻內(nèi)容,除了語(yǔ)義標(biāo)注,還需要對(duì)鏡頭進(jìn)行有效的組織.結(jié)構(gòu)解析的任務(wù)就是通過(guò)鏡頭組織為視頻數(shù)據(jù)流建立類似書(shū)目的分層瀏覽結(jié)構(gòu).以[34][35]為代表,一些研究人員提出了通用的視頻結(jié)構(gòu)分析方法.他們用時(shí)間約束的聚類法把視覺(jué)上相似和時(shí)間上相鄰的鏡頭聚類在一起,再在聚類組的基礎(chǔ)上構(gòu)造場(chǎng)景轉(zhuǎn)換圖(scene transition graph)或高層場(chǎng)景,進(jìn)而形成層次化的瀏覽結(jié)構(gòu).但是這種統(tǒng)一的結(jié)構(gòu)組織方式(如[34]中將視頻分成幀/鏡頭/組/場(chǎng)景四層)并不適合針對(duì)體育視頻的分析,這主要是因?yàn)轶w育比賽都有自己特定結(jié)構(gòu)(如圖1所示),對(duì)體育視頻的分析應(yīng)當(dāng)結(jié)合這種領(lǐng)域知識(shí).圖1 跳水比賽的樹(shù)狀結(jié)構(gòu)
4,總結(jié)
綜上對(duì)國(guó)內(nèi)外研究現(xiàn)狀的調(diào)查,我們有以下結(jié)論:
(1)應(yīng)當(dāng)結(jié)合領(lǐng)域知識(shí)進(jìn)行特征選擇.領(lǐng)域知識(shí)包括比賽相關(guān)和制作相關(guān).比賽相關(guān)的領(lǐng)域特征涉及特定的體育運(yùn)動(dòng),如足球比賽中的草色比率,籃球比賽中快攻時(shí)攝像機(jī)的運(yùn)動(dòng)等.制作相關(guān)的領(lǐng)域特征適用于大多數(shù)體育視頻的分析,主要來(lái)自對(duì)體育視頻制作的總結(jié),如精彩場(chǎng)面的重放,有關(guān)運(yùn)動(dòng)員和比分信息的字幕顯示等.綜合這兩類領(lǐng)域知識(shí),選擇合適的特征進(jìn)行分析是取得研究成功的基礎(chǔ).(2)多模式融合分析代表了新的研究趨勢(shì).除了視覺(jué)特征外,綜合體育視頻中所包含的音頻特征和文本信息,能夠有效提高視頻分析的準(zhǔn)確度.這也是近年來(lái)的研究熱點(diǎn).在體育視頻中,一個(gè)語(yǔ)義事件常常是一個(gè)多模式的表達(dá),如運(yùn)動(dòng)員的跳水事件既有視覺(jué)上的運(yùn)動(dòng)也有聽(tīng)覺(jué)上的踏板聲和入水聲,只對(duì)其中一個(gè)模式進(jìn)行分析是不完整的.因此在對(duì)體育視頻進(jìn)行內(nèi)容分析時(shí),融合多模式尤為重要.(3)盡量考慮壓縮域的特征分析.一場(chǎng)體育比賽長(zhǎng)達(dá)數(shù)個(gè)小時(shí),其視頻數(shù)據(jù)也非常龐大,因而提高處理速度是很有意義的,在某些要求實(shí)時(shí)應(yīng)用的場(chǎng)合也是必需的.直接基于壓縮域的分析,不需要完全解碼,可以顯著提高處理速度.[22][31]表明基于壓縮域的分析不僅能夠大幅度降低計(jì)算量,同時(shí)也能獲得較好的結(jié)果,或者作為進(jìn)一步處理的基礎(chǔ).(4)基于統(tǒng)計(jì)的事件檢測(cè)方法要優(yōu)于基于規(guī)則的方法.早期的研究多采用基于規(guī)則的方法.但是,體育視頻中的事件檢測(cè)常常需要綜合多種特征分析手段,需要適應(yīng)不同的場(chǎng)景.這些都增加了直接設(shè)定規(guī)則的難度.與之相比,統(tǒng)計(jì)算法易于混合多種特征同時(shí)又具備一定的學(xué)習(xí)能力,因而具有更大的實(shí)用價(jià)值.(1)自動(dòng)生成體育視頻的分層瀏覽目錄;
(2)實(shí)際應(yīng)用中視頻流可能不完整或存在標(biāo)注錯(cuò)誤,解析器應(yīng)具有良好的容錯(cuò)能力;
(3)對(duì)于大數(shù)據(jù)量的體育視頻,要求結(jié)構(gòu)解析的效率要高.四,擬采取的研究方法,技術(shù)路線及可行性分析
1,基于壓縮域的鏡頭分割算法
體育視頻中常見(jiàn)的漸變主要有溶解,擦變,特別是其中的一些擦變具有特技效果,如圖3所示.這些特定模式的擦變,通常出現(xiàn)在慢鏡重放的開(kāi)始和結(jié)束,識(shí)別這種鏡頭邊界是十分有價(jià)值的.現(xiàn)有壓縮域算法主要對(duì)切變檢測(cè)比較成功,而對(duì)于漸變的研究不多.我們將綜合壓縮域的dct系數(shù),運(yùn)動(dòng)矢量以及宏塊信息等,研究一種有效的漸變檢測(cè)方法.圖3 體育視頻中特定模式的擦變
一般在進(jìn)行鏡頭邊界檢測(cè)的時(shí)候,首先從相鄰幀提取合適的特征,然后比較這些特征之間的差值,如果差值超過(guò)了事先設(shè)定的閾值,則認(rèn)為出現(xiàn)了鏡頭轉(zhuǎn)換.因此,選取合適的閾值是非常關(guān)鍵的.常用的方法包括單閾值法,多閾值法和局部閾值法.單閾值法使用一個(gè)全局閾值,方法簡(jiǎn)單,但是對(duì)于漸變不能很好檢測(cè).多閾值法使用多個(gè)閾值進(jìn)行分級(jí)判定,如使用較大閾值檢測(cè)突變,使用較小閾值檢測(cè)漸變.局部閾值法根據(jù)局部范圍內(nèi)的變化情況自動(dòng)調(diào)整合適的鏡頭切分閾值,代表了新的研究趨勢(shì).目前,有關(guān)閾值選取的研究仍然是視頻處理中的一個(gè)難點(diǎn).我們將主要基于局部閾值法進(jìn)行研究.2,體育視頻中語(yǔ)義事件的檢測(cè)
我們將體育視頻中的語(yǔ)義事件分為三類:重放事件,狀態(tài)事件和目標(biāo)事件.重放事件是指體育比賽轉(zhuǎn)播中穿插播放的慢鏡重放片斷.重放事件反映了比賽中觀眾感興趣的精彩部分.狀態(tài)事件發(fā)生在比賽狀態(tài)發(fā)生變化的時(shí)候,如跳水比賽每一輪結(jié)束的評(píng)分,網(wǎng)球比賽中一局的開(kāi)始鏡頭等.狀態(tài)事件的檢測(cè)對(duì)于視頻結(jié)構(gòu)的解析有非常重要的作用.目標(biāo)事件,如跳水比賽中運(yùn)動(dòng)員的跳水,足球比賽中的射門等,是指體育比賽中具有觀賞性的特定運(yùn)動(dòng),通常表現(xiàn)為物體及其之間的運(yùn)動(dòng)關(guān)系.對(duì)這三類事件,我們分別采用如下的技術(shù)路線:
(1)通過(guò)標(biāo)志性邊界檢測(cè)來(lái)識(shí)別重放事件
[1]中將重放分為三種類型:重復(fù)播放的同一鏡頭;慢動(dòng)作方式重放的同一鏡頭;同一場(chǎng)景但是由不同攝像機(jī)在不同視角拍攝的.直接從內(nèi)容上比較重放事件和先前視頻鏡頭的相似性來(lái)進(jìn)行分析,是很難識(shí)別準(zhǔn)確的,尤其對(duì)于最后一種重放.通過(guò)對(duì)體育比賽電視轉(zhuǎn)播的觀察,可以發(fā)現(xiàn)一般對(duì)于精彩片斷的重放都會(huì)以一個(gè)標(biāo)志性的鏡頭切換引入,再以類似的變化結(jié)束,如圖3所示.因此對(duì)于重放事件的檢測(cè),事實(shí)上可以歸結(jié)到對(duì)這種標(biāo)志性鏡頭邊界的檢測(cè),從而簡(jiǎn)化問(wèn)題.我們將主要研究這種方法.(2)利用視頻文本識(shí)別確定狀態(tài)事件
狀態(tài)事件是和體育比賽的狀態(tài)變化直接相關(guān)的,而通常在比賽狀態(tài)發(fā)生變化的時(shí)候,電視轉(zhuǎn)播會(huì)在視頻中加入相關(guān)字幕提示,如跳水比賽中在運(yùn)動(dòng)員入場(chǎng)的時(shí)候,會(huì)有文字說(shuō)明運(yùn)動(dòng)員姓名和所要做的動(dòng)作;在一輪比賽結(jié)束的時(shí)候,會(huì)顯示該輪所有選手的得分情況.根據(jù)這個(gè)特性,我們提出通過(guò)視頻中文本檢測(cè)和識(shí)別的方法來(lái)檢測(cè)狀態(tài)事件.該方法包括兩個(gè)層次.首先,通過(guò)視頻文本的檢測(cè)[36][37][38][39][40]就可以初步確定狀態(tài)事件的出現(xiàn).然后,我們對(duì)檢測(cè)的文本進(jìn)行識(shí)別,通過(guò)關(guān)鍵字的匹配,識(shí)別狀態(tài)事件的類別.例如,運(yùn)動(dòng)員入場(chǎng)的字幕顯示中有關(guān)鍵字“round”(輪次),“rank”(排名),“dd”(難度),“total”(總分)等,通過(guò)匹配這些關(guān)鍵字,就可以判斷當(dāng)前鏡頭為運(yùn)動(dòng)員入場(chǎng)的狀態(tài)事件.(3)融合視音頻雙模式的目標(biāo)事件檢測(cè)
在目標(biāo)事件中,往往存在顯著的運(yùn)動(dòng)和音頻特征,如運(yùn)動(dòng)員的跳水事件既有視覺(jué)上的運(yùn)動(dòng)也有聽(tīng)覺(jué)上的踏板聲和入水聲.融合視音頻的分析避免了單純使用視覺(jué)或聽(tīng)覺(jué)特征不能完整描述語(yǔ)義事件的不足,可以有效提高識(shí)別精度.在進(jìn)行識(shí)別的時(shí)候,我們采用混合隱馬爾科夫模型和支持向量機(jī)的方法[41].支持向量機(jī)能夠在小樣本條件下,通過(guò)結(jié)構(gòu)風(fēng)險(xiǎn)最小化準(zhǔn)則,實(shí)現(xiàn)有效分類.但是支持向量機(jī)只是靜態(tài)分類機(jī),不能很好模擬時(shí)序過(guò)程.與之相反,隱馬爾科夫模型雖然能夠較好的處理隨機(jī)時(shí)序數(shù)據(jù)的識(shí)別,但是并不能保證訓(xùn)練好的模型能夠良好的分類未知數(shù)據(jù).這樣,將兩者混合起來(lái)使用,通過(guò)在隱馬爾科夫模型中引入靜態(tài)數(shù)據(jù)識(shí)別良好的支持向量機(jī),能對(duì)視頻流數(shù)據(jù)取得最佳的識(shí)別效果.3,語(yǔ)法制導(dǎo)
的結(jié)構(gòu)解析為了對(duì)輸入的體育視頻數(shù)據(jù)進(jìn)行結(jié)構(gòu)解析,首先我們需要對(duì)該類體育比賽的文法規(guī)則進(jìn)行描述.喬姆斯基(chomsky)把文法分成4種類型,即0型文法(或稱短語(yǔ)文法),1型文法(或稱上下文有關(guān)文法),2型文法(或稱上下文無(wú)關(guān)文法)和3型文法(或稱正則文法).型號(hào)越高所受約束越多,對(duì)語(yǔ)言的描述能力也就越弱.我們使用上下文無(wú)關(guān)文法對(duì)體育比賽的結(jié)構(gòu)進(jìn)行描述,主要是基于以下考慮:(1)上下文無(wú)關(guān)文法完全可以勝任對(duì)體育比賽樹(shù)狀結(jié)構(gòu)的描述;(2)上下文無(wú)關(guān)文法在自然語(yǔ)言理解,句法模式識(shí)別,編譯技術(shù)等領(lǐng)域有廣泛的應(yīng)用,技術(shù)比較成熟;(3)基于上下文無(wú)關(guān)文法的解析器不僅可以為視頻有效生成層次瀏覽樹(shù),而且具有較強(qiáng)的錯(cuò)誤處理能力.其中終結(jié)符r,b,e,u分別表示一輪比賽的結(jié)束,選手比賽開(kāi)始,選手比賽結(jié)束和一般鏡頭,非終結(jié)符和為結(jié)構(gòu)單元,分別代表每輪比賽和每個(gè)選手的比賽.對(duì)于語(yǔ)義標(biāo)注序列“buuuuuuuebuuuuuuuueeur”,使用文法分析器進(jìn)行解析得到它的層次結(jié)構(gòu)“[[buuuuuuue][buuuuuuuue]eur]”.其中序列最后“r”前面的“eu”為錯(cuò)誤標(biāo)示,可以用錯(cuò)誤恢復(fù)策略進(jìn)行處理(例如,在發(fā)現(xiàn)終結(jié)符不能匹配時(shí),彈出該終結(jié)符并發(fā)出警告).由于視頻序列在進(jìn)行基于統(tǒng)計(jì)的語(yǔ)義標(biāo)注時(shí),存在某種程度的不確定性.所以錯(cuò)誤處理應(yīng)當(dāng)結(jié)合語(yǔ)義標(biāo)注的確定度來(lái)進(jìn)行.如果出錯(cuò)標(biāo)注本身的確定度比較低,則可以認(rèn)為該標(biāo)注有錯(cuò);如果出錯(cuò)標(biāo)注的確定度比較高,則可以認(rèn)為錯(cuò)誤發(fā)生在它的前面.以上,我們通過(guò)基于壓縮域的鏡頭分割,語(yǔ)義事件的檢測(cè)和語(yǔ)法制導(dǎo)的結(jié)構(gòu)解析實(shí)現(xiàn)了體育視頻的內(nèi)容標(biāo)注和解析.雖然我們主要以跳水視頻為例進(jìn)行分析,但是其中的技術(shù)完全可以應(yīng)用到其他類似體育視頻的分析中,甚至一般視頻的處理中.我們的研究表明,盡管限于當(dāng)前的技術(shù)水平,完全自動(dòng)的,通用的視頻內(nèi)容理解是不太可能的,但是通過(guò)有效的人機(jī)交互和建立應(yīng)用相關(guān)的模型,新的技術(shù)將可以面對(duì)視頻信息大量涌現(xiàn)的挑戰(zhàn),給人們帶來(lái)更加豐富和方便的體驗(yàn).五,預(yù)期研究成果及創(chuàng)新之處
一個(gè)壓縮域鏡頭邊界檢測(cè)的有效算法
體育視頻中慢鏡重放的檢測(cè)方法
基于壓縮域的視頻文本檢測(cè)和分割
體育視頻中狀態(tài)事件的識(shí)別
視音頻融合的事件檢測(cè)
基于文法的體育視頻結(jié)構(gòu)解析
一個(gè)通用的體育視頻內(nèi)容分析框架及其系統(tǒng)實(shí)現(xiàn)
六,已有工作基礎(chǔ)
1,已有資源:
4.96g的跳水比賽視頻數(shù)據(jù),總長(zhǎng)度約8小時(shí)20分鐘;
5.33g的足球比賽視頻數(shù)據(jù),總長(zhǎng)度約9個(gè)小時(shí);
2.58g的其他體育視頻數(shù)據(jù),包括籃球,排球和網(wǎng)球等;
2,已進(jìn)行工作
一個(gè)基于內(nèi)容的智能視頻檢索系統(tǒng):ivideo
一種通過(guò)關(guān)鍵幀提取和組織來(lái)瀏覽視頻的方式:xplayer
可視化的視頻分析工具:medialab
綜合顏色特征和攝像機(jī)運(yùn)動(dòng)分析的鏡頭邊界檢測(cè)算法
基于標(biāo)志模板的重放鏡頭檢測(cè)算法
跳水比賽視頻中精彩片斷的自動(dòng)提取:ivideoanalyzer
基于壓縮域文本檢測(cè)的體育視頻結(jié)構(gòu)分析:sportsplayer
3,專利和文章
王扉,李錦濤,張勇東,林守勛,“跳水比賽視頻中精彩片斷的自動(dòng)提取”,計(jì)算機(jī)研究與發(fā)展,評(píng)審中.王扉,張勇東,李錦濤,林守勛,“在體育比賽視頻中檢測(cè)精彩片斷的方法”,(發(fā)明)專利號(hào)02156973.8,已受理.七,研究計(jì)劃及預(yù)期進(jìn)展
XX/01 – XX/04 基于文法的體育視頻結(jié)構(gòu)解析
XX/05 – XX/06 壓縮域的鏡頭邊界檢測(cè)算法
XX/07 – XX/10 體育視頻中的語(yǔ)義事件檢測(cè)
XX/11 – XX/12 跳水比賽的視頻分析和檢索系統(tǒng)
XX/01 – XX/04 技術(shù)改進(jìn),論文寫作
八,參考文獻(xiàn)
content-based video analysis and retrieval
[1] c.w.ngo, h.j.zhang, and t.c.pone, “recent advances in content based video analysis”, international journal of image and graphics, dec XX.[2] n.dimitrova, h.j.zhang, b.shahraray, i.sezan, t.huang, and a.zakhor, “applications of video-content analysis and retrieval”, ieee multimedia, vol.9, no.4, XX.[3] 莊越挺,潘云鶴,吳飛編著,網(wǎng)上多媒體信息分析與檢索,清華大學(xué)出版社,XX年.[4] m.flickner et al, “query by image and video content: the qbic system”, ieee computer, 28(9), 1995.[5] d.ponceleon, s.srinivasan, a.amir, d.petkovic, and d.diklic, “key to effective video retrieval: effective cataloging and browsing”, in proc.acm multimedia, 1998.[6] a.hampapur, a.gupta, b.horowitz, c-f.shu, c.fuller, j.bach, m.gorkani, and r.jain, “virage video engine”, spie storage and retrieval for images and video databases v, 1997.[7] h.d.wactlar, t.kanade, m.a.smith, and s.m.stevens, “intelligent access to digital video: informedia project”, ieee computer, vol.29, no.3, pp.46-52, may 1996.[8] s.-f.chang, w.chen, h.meng, h.sundaram, and d.zhong, “videoq: an automated content based video search system using visual cues”, in proc.acm multimedia, november 1997.
第二篇:分布式視頻編碼技術(shù)研究
分布式視頻編碼技術(shù)研究
摘要:對(duì)于視頻壓縮領(lǐng)域,分布式編碼是一種新出現(xiàn)的應(yīng)用機(jī)制,是基于20世紀(jì)70年代Slepian和Wolf以及Wyner和Ziv提出的信息理論而建立的。分布式視頻編碼技術(shù)與傳統(tǒng)編碼技術(shù)相比,從原理到實(shí)現(xiàn)方法上都是全新的。本文在介紹分布式編碼基本原理的基礎(chǔ)上,著重介紹了分布式視頻編碼技術(shù)各個(gè)環(huán)節(jié)的最新研究進(jìn)展,并對(duì)發(fā)展趨勢(shì)進(jìn)行了展望。
關(guān)鍵詞:
分布式視頻編碼
有損編碼
錯(cuò)誤恢復(fù)
Abstract:For video compression distributed video coding is a new paradigm, which is based on the information theory established in 1970’s by Slepian,Wolf and Wyner,Ziv.Compared with traditional video coding standard, distributed video coding is a radical departure.Based on the introduction of distributed coding principles, this paper reviews the advances of fundamental building blocks of distributed
video coding, and the future development is pointed out.Key words: Distributed video coding
lossy compression error resilient
1引言
傳統(tǒng)的視頻編碼標(biāo)準(zhǔn),如MPEG和H.26X等,采用的都是不對(duì)稱編碼方式,編碼器端隱含一個(gè)解碼器。編碼端的主要步驟包括變換,量化,熵編碼,相應(yīng)的解碼過(guò)程,以及運(yùn)動(dòng)估計(jì)和運(yùn)動(dòng)補(bǔ)償。因此編碼端的復(fù)雜度遠(yuǎn)遠(yuǎn)高于解碼端,尤其是運(yùn)動(dòng)估計(jì)和運(yùn)動(dòng)補(bǔ)償占用了大量的資源,使編碼端的復(fù)雜度在解碼端的5 至10倍以上。這種不對(duì)稱的編碼方式對(duì)于廣播,流媒體的點(diǎn)播等服務(wù)是非常合適的,因?yàn)檫@些領(lǐng)域的工作方式是一次壓縮多次播放。近年來(lái)隨著“普適計(jì)算”(Pervasive Computing)概念的提出, ”無(wú)所不在的計(jì)算”已經(jīng)成為計(jì)算機(jī)發(fā)展的大趨勢(shì)。在這種背景下,越來(lái)越多的移動(dòng)視頻錄制設(shè)備加入到了網(wǎng)絡(luò)中,如監(jiān)控系統(tǒng)中的無(wú)線視頻探測(cè)頭,便攜式視頻攝像機(jī),無(wú)線PC相機(jī)等。這些設(shè)備都需要進(jìn)行現(xiàn)場(chǎng)的視頻編碼,并把碼流傳送到一個(gè)中心節(jié)點(diǎn),如監(jiān)控室的中央處理機(jī),進(jìn)行解碼播放。這些應(yīng)用領(lǐng)域中編碼設(shè)備比較簡(jiǎn)單,而解碼設(shè)備擁有較多的資源可以進(jìn)行復(fù)雜的計(jì)算,與傳統(tǒng)視頻編碼標(biāo)準(zhǔn)適用的場(chǎng)景恰恰相反。
MPEG和H.26x等傳統(tǒng)的視頻編碼標(biāo)準(zhǔn)在發(fā)展的過(guò)程中一直遵循一個(gè)模式,就是由編碼器負(fù)責(zé)信源統(tǒng)計(jì)特性的充分利用,作為一個(gè)基本原則這很少被質(zhì)疑過(guò)。然而通過(guò)只在解碼端進(jìn)行信號(hào)統(tǒng)計(jì)特性的利用同樣可以進(jìn)行有效的壓縮編碼。這個(gè)令人驚異的發(fā)現(xiàn)來(lái)自20世紀(jì)70年代建立的信息理論,即Slepian和Wolf建立的分布式無(wú)損編碼理論以及Wyner 和Ziv建立的使用解碼端輔助信息(Side Information)的有損編碼理論。根據(jù)以上理論建立的機(jī)制被統(tǒng)稱為分布式編碼算法。
[1]2 分布式編碼的信息論基礎(chǔ)
傳統(tǒng)的圖像編碼存在兩種形式的壓縮方法,一種是有損壓縮[2],一種是無(wú)損壓縮,無(wú)損壓縮是有損壓縮的基礎(chǔ),有損壓縮往往是在無(wú)損壓縮的基礎(chǔ)上加上通過(guò)附加一個(gè)優(yōu)化的量化器而實(shí)現(xiàn)的。分布式編碼的信息論原理同樣有兩種形式,即無(wú)損分布式編
碼的Slepian-Wolf理論[3]和使用解碼端輔助信息(Side Information)的有損分布式編碼Wyner-Ziv理論。其中,Wyner-Ziv理論是分布式視頻編碼技術(shù)的主要理論依據(jù),為了紀(jì)念二人對(duì)信息論的貢獻(xiàn),這種視頻編碼機(jī)制又被稱為Wyner-Ziv Video Coding。
2.1分布式無(wú)損信源編碼
分布式壓縮指的是編碼兩個(gè)獨(dú)立的任意序列;每個(gè)具有分離的編碼器,每一個(gè)編碼器發(fā)送一個(gè)獨(dú)立的碼流到一個(gè)獨(dú)立的解碼器;該解碼器聯(lián)合解碼所有的碼流并且計(jì)算統(tǒng)計(jì)相關(guān),如圖1所示。
假設(shè)兩個(gè)統(tǒng)計(jì)相關(guān)獨(dú)立同分布的無(wú)限長(zhǎng)隨機(jī)序列X 和Y,在傳統(tǒng)的熵編碼和解碼可以達(dá)到RY?H(Y)和RX?H(X)的碼率, H(X)和H(Y)為X 和Y 的熵。有趣的是, 聯(lián)合解碼具有更好的率失真性能(獨(dú)立編碼)[4]。對(duì)于編碼長(zhǎng)序列,如果滿足對(duì)于恢復(fù)X和Y的殘差錯(cuò)誤概率足夠小,Slepian-Wolf 理論建立碼率區(qū)域
RX?RY?H(XY,)
RX?H(X|Y),RY?H(X|Y)
在此可以發(fā)現(xiàn), RX + RY 可以達(dá)到聯(lián)合信息熵H(X,Y)。
在圖2中的A 點(diǎn),對(duì)X 編碼的碼率為RX =H(X),而對(duì)Y進(jìn)行壓縮時(shí)所需要的碼率僅為RY = H(Y |X)。同樣在B 點(diǎn),對(duì)Y編碼的碼率為RY =H(Y),而對(duì)X 進(jìn)行壓縮時(shí)所需要的碼率僅為RX =H(X |Y)。這就是在解碼端具有邊信息的無(wú)損信源編碼問(wèn)題的理論。
2.2 分布式有損信源編碼
對(duì)于在解碼端具有邊信息有損信源編碼問(wèn)題Wyner和Ziv給出了其碼率界。給定失真D下的碼率記為為
RX|Y(D); 另外,將兩邊都能得到邊信息Y時(shí)的率失真函數(shù)記
WZRY|X(D)?RY|X(D),D?0RY|X(D)。在文獻(xiàn)[2]中Wyner和Ziv證明,而且給出當(dāng)失真的度量為均方誤差, Y服從獨(dú)立高斯分布,X=Y+U, U也服從獨(dú)立高斯分布且與Y獨(dú)立時(shí)WZRY|X(D)?RY|X(D),D?0。對(duì)于一般信源, 在均方誤差度量下, 其碼率損失小于0.5bit/ sample,在漢明距度量下碼率損失小于0.22 bit。Gastpar對(duì)多信源的Wyner-Ziv編碼進(jìn)行研究并給出了相應(yīng)的理論界。分布式視頻編碼關(guān)鍵技術(shù)
分布式編碼是在視頻壓縮領(lǐng)域的一個(gè)新框架, 基于Slepian-Wolf和Wyner-Ziv的理論。近年來(lái), 人們也著手于實(shí)際編/解碼系統(tǒng)的開(kāi)發(fā),熵編碼、量化和變換。
3.1 Slepian-Wolf編碼器
雖然Slepian-Wolf的理論產(chǎn)生于20世紀(jì)70年代, 但是它卻是在最近幾年才獲得了實(shí)際的應(yīng)用。三十年前人們就明白Slepian-Wolf編碼非常接近于信道編碼, 可以使用一個(gè)系統(tǒng)信道編碼傳輸校驗(yàn)位。在解碼端, 可以連接校驗(yàn)位和邊信息Y, 并且執(zhí)行糾錯(cuò)解碼。如果X、Y非常相似, 只需要傳輸少許校驗(yàn)位和重要的壓縮結(jié)果。需要強(qiáng)調(diào)的是這個(gè)方法并不執(zhí)行前向糾錯(cuò)來(lái)保護(hù)信道傳輸?shù)腻e(cuò)誤, 而是使用一個(gè)虛擬的相關(guān)信道來(lái)獲取X 和邊信息Y的統(tǒng)計(jì)關(guān)[6]
[5]。
另一種編碼實(shí)現(xiàn)方法, 即將序列X分為陪集, 編碼端發(fā)送X所屬的陪集索引, 接收端通過(guò)選擇陪集中與邊信息Y最可能的碼字??梢钥闯鰞煞N解釋是相同的, 在校驗(yàn)位的解釋下,發(fā)送一個(gè)二進(jìn)制的行矢量
XP?XP,G為系統(tǒng)線性塊編碼的生成矩陣,在陪集的解釋下,發(fā)送伴隨陣S = XH, H 是線性塊碼C的校驗(yàn)矩陣。如果P = H, 傳輸?shù)拇a流是相同的。
可以使用Turbo碼來(lái)實(shí)現(xiàn)Slepian-Wolf編碼器。由于Turbo碼的良好性能, 這種方法能夠很好接近Slepian-Wolf給定的編碼界。之后, Liveris等人采用LDPC(low-density paritycheck)碼來(lái)實(shí)現(xiàn)Slepian-Wolf編碼器。仿真結(jié)果表明它比當(dāng)時(shí)所有的turbo碼的壓縮性能都好, 更能接近理論限。后來(lái)他們又使用IRA(irregular repeat accumulate)碼進(jìn)行實(shí)驗(yàn), 也得到了很好的結(jié)果。另外, Lan、Liveris、Naryanan、Xiong 和Georghiades對(duì)多信源的Slepian-Wolf編碼問(wèn)題進(jìn)行了研究。
3.2 量化技術(shù)及Wyner-Ziv編碼器
因?yàn)閳D像的失真度基本上是由量化器決定的, 所以對(duì)于視頻編碼而言, 量化器是非常關(guān)鍵的一個(gè)環(huán)節(jié)。由于分布式編碼中, 解碼器的動(dòng)作是整個(gè)編碼系統(tǒng)結(jié)構(gòu)的核心, 這不同于傳統(tǒng)的編碼器端決定圖像質(zhì)量的工作方式。分布式編碼中的量化器無(wú)法直接繼承傳統(tǒng)圖像視頻編碼技術(shù)中的量化器設(shè)計(jì)方法。在Slepian-Wolf編碼的基礎(chǔ)上, Wyner-Ziv 編碼機(jī)制有了很大進(jìn)展, 對(duì)于重建邊信息的初步量化器設(shè)計(jì)目的來(lái)自于信息論證。在特定情況下, 線性編碼和嵌入式格子, 接近Wyner-Ziv 的率失真函數(shù)。特別是當(dāng)信源和邊信息是聯(lián)合高斯的情況, 構(gòu)成了分布式編碼中量化器設(shè)計(jì)的理論基礎(chǔ)。
通常情況下, 認(rèn)為Wyner-Ziv編碼器由一個(gè)量化器和一個(gè)Slepian-Wolf組成。量化器將信號(hào)空間分為單元, 不相連的子單元影射到相同的量化索引Q, 它由固定碼率的局部最優(yōu) Lloyd算法、Wyner-Ziv矢量量化器設(shè)計(jì)。量化器的設(shè)計(jì)用于理想Slepian-Wolf編碼器編碼量化的索引, 碼率估算依賴于量化索引和邊信息, 使Slepian-Wolf編碼器的塊長(zhǎng)與量化器維數(shù)分離。這是實(shí)際系統(tǒng)的基本要求。對(duì)于高碼率, 在特定的情況下, 最優(yōu)量化是格子量化, 分離的量化單元不需要影射到同一個(gè)索引。在編碼端不具有邊信息的情況下, 它是漸進(jìn)無(wú)性能損失的。
在Wyner-Ziv編碼器的設(shè)計(jì)實(shí)現(xiàn)上,Zanir等人給出的嵌套線性/格形碼可以達(dá)Wyner-Ziv界。嵌套格形碼的實(shí)現(xiàn)由Servetto中給出。Xiong等人通過(guò)嵌入量化器加Slepian-Wolf構(gòu)成Wyner-Ziv編碼器, 后來(lái)又使用TCQ(trellis-coded quantization)構(gòu)成Wyner-Ziv編碼器, 兩種方法都能逼近理論界。此外, 可以使用Lbyd算法設(shè)計(jì)量化器加上Slepian-Wolf編碼器實(shí)現(xiàn)Wyner-Ziv編碼。
3.3 聯(lián)合解碼和運(yùn)動(dòng)補(bǔ)償
為了獲得更高的壓縮效率, 可以在解碼端進(jìn)行運(yùn)動(dòng)補(bǔ)償。傳統(tǒng)的運(yùn)動(dòng)補(bǔ)償編碼可以在這里采用。例如,CRC可以用于解碼端的運(yùn)動(dòng)補(bǔ)償, Viterbi解碼對(duì)一系列運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)塊進(jìn)行操作, 每一個(gè)具有不同的運(yùn)動(dòng)矢量, 每個(gè)解碼版本的CRC和傳送的CRC 進(jìn)行比較選用。另外一種方法由Stanford完成, 即發(fā)送一個(gè)魯棒的hash碼字來(lái)輔助解碼端估計(jì)運(yùn)動(dòng)。目前, 本文的hash 簡(jiǎn)單地由量化的DCT系數(shù)的小子集組成, 在低延遲系統(tǒng)使用前一幀產(chǎn)生邊信息。因?yàn)閔ash比原數(shù)據(jù)小, 所以允許將上幀的hash存儲(chǔ)到內(nèi)存。對(duì)于當(dāng)前幀的每個(gè)塊, 計(jì)算對(duì)應(yīng)的魯棒hash的相鄰幀距離。如果超過(guò)一定距離,則發(fā)送hash 數(shù)據(jù)和Wyner-Ziv 位。在hash的基礎(chǔ)上, 解碼端執(zhí)行一個(gè)運(yùn)動(dòng)搜索來(lái)產(chǎn)生最優(yōu)的邊信息塊, 量化系數(shù)的hash碼能修正Turbo解碼的相應(yīng)概率, 因此進(jìn)一步減少了校驗(yàn)位的碼率。Hash 也能在重建時(shí)用于精簡(jiǎn)。這非常近似于通用的Slepian-Wolf編碼的相關(guān)信道。
3.4 碼率控制
Wyner-Ziv的碼率控制由當(dāng)前幀和邊信息的統(tǒng)計(jì)相關(guān)特性來(lái)決定。編碼算法本身并不需要改變, 碼率隨信道的統(tǒng)計(jì)特性而變化。每個(gè)幀需要多少碼率的傳輸是靈活的, 因?yàn)檫呅畔⑹窃诮獯a端獲取而不是在編碼端獲取。
碼率控制解決的方法之一: 完全依賴于解碼端的反饋信息; 解碼端將決定最優(yōu)編碼速率并反饋給編碼端。解碼端使用相關(guān)信道估計(jì)算法將預(yù)測(cè)碼率傳輸給編碼端。
在解碼端進(jìn)行碼率控制, 明顯降低了編碼端的負(fù)擔(dān); 反饋允許解碼器在產(chǎn)生邊信息方面具有很大的靈活性;從簡(jiǎn)單的拷貝幀的機(jī)制到非常復(fù)雜的運(yùn)動(dòng)補(bǔ)償; 基于對(duì)象的分割或多幀預(yù)測(cè);一個(gè)精確的邊信息, 需要很少的碼率。因此整個(gè)系統(tǒng)性能的改善只與解碼器有關(guān)系。這與傳統(tǒng)的視頻編碼方式是有區(qū)別的。
這種方法有兩個(gè)比較明顯的缺點(diǎn):首先需要一個(gè)反饋信道,這會(huì)造成延遲; 統(tǒng)計(jì)特性估計(jì)和解碼過(guò)程都是在線執(zhí)行。因此這種算法不適宜于低復(fù)雜度的設(shè)備應(yīng)用。
另外一個(gè)碼率控制方式是使用一些在編碼端的估計(jì), 如PRISM。編碼端存儲(chǔ)前一幀, 基于幀差的能量;每個(gè)塊分為不同的編碼模式, 具有不同的碼率, 幀差過(guò)小, 則不編碼;在這兩種模式中間是不同的伴隨陣和不同的碼率, 取決于估計(jì)的統(tǒng)計(jì)相關(guān)。運(yùn)動(dòng)估計(jì)在解碼端沒(méi)有, 可以降低解碼復(fù)雜度;邊信息的精度不影響碼率, 但是會(huì)影響重建的信號(hào)質(zhì)量。
[8]
[7]4 兩種分布式視頻編碼的仿真實(shí)現(xiàn)及分析
本文對(duì)空間域Wyner-Ziv視頻編碼和頻域Wyner-Ziv視頻編碼算法分別加以仿真實(shí)現(xiàn),并且和H.263的幀間編碼和頓內(nèi)編碼進(jìn)行比較。本文采用的turbo編碼器碼率為4/5,生成矩陣34342M??2,4,8,16?[1,(1?D?D?D)/(1?D?D)]為。通過(guò)對(duì)量化級(jí)數(shù)的調(diào)整,產(chǎn)生出不同的輸出碼率,從而獲得不同的壓縮率。關(guān)鍵幀K采用H.263的幀內(nèi)編碼, 它和Wyner-Ziv 幀S的編碼順序?yàn)椤癒-S-S-S”, 即每2個(gè)關(guān)鍵幀K之間有3個(gè)Wyner-Ziv幀S。H.263的編碼器為 TMN8,選取Carphone和Salesman兩個(gè)標(biāo)準(zhǔn)序列,其圖像格式為QCIF(176X144),編碼幀數(shù)為100幀(25fps)。仿真實(shí)驗(yàn)的結(jié)果如圖3所示
圖3 空間域和頻域Wyner-Ziv視頻編碼仿真結(jié)果
從上述的仿真實(shí)驗(yàn)結(jié)果可以看出, 分布式視頻編碼在相同編碼復(fù)雜度的情況下, 其壓縮效率要明顯高于傳統(tǒng)的幀內(nèi)編碼, 但和傳統(tǒng)的幀間編碼相比尚有較大差距。頻域Wyner-Ziv,視頻編碼效率比空間域Wyner-Ziv算法平均高1.5dB以上, 這是因?yàn)轭l域Wyner-Ziv編碼算法在編碼端對(duì)當(dāng)前幀進(jìn)行DCT變換,變換后的低頻分量和高頻分量獨(dú)立編碼, 壓縮了圖像信號(hào)的空間冗余度,提高了編碼效率。結(jié)論和研究展望
本研究對(duì)于探索新的視頻編碼技術(shù)、解決傳統(tǒng)視頻編碼僅在編碼端進(jìn)行信源統(tǒng)計(jì)所遇到的編碼復(fù)雜度高等問(wèn)題, 具有重要的理論意義和實(shí)用價(jià)值。為了降低編碼端的復(fù)
雜度,分布式視頻編碼采用幀內(nèi)編碼幀間譯碼,將視頻幀分為關(guān)鍵幀與Wyner-Ziv幀,關(guān)鍵幀是使用H.264/AVC進(jìn)行編碼,在譯碼端使用已譯碼的關(guān)鍵幀產(chǎn)生邊信息,并將邊信息作為輔助信息來(lái)實(shí)現(xiàn)當(dāng)前Wyner-Ziv幀的編碼。與傳統(tǒng)的視頻編碼相比,分布式視頻編碼在編碼效率方面存在一定的差距,并目_譯碼端的復(fù)雜度較高,因此如何提高分布式視頻編碼的編碼效率與降低譯碼端的復(fù)雜度是本文的主要研究?jī)?nèi)容。
為了提高分布式視頻編碼的效率,可以使用編碼模式選擇機(jī)制、較好的信道編碼機(jī)制與較好的邊信息產(chǎn)生方法。在我們提出的編碼端碼率控制算法中,在編碼端使用編碼模式選擇機(jī)制來(lái)通過(guò)產(chǎn)生邊信息與當(dāng)前幀之間的相關(guān)性來(lái)選擇合適的編碼模式,從而提高分布式視頻編碼的效率。
為了降低譯碼端的復(fù)雜度,本文提出了一種不使用反饋信道的編碼端碼率控制算法。大多數(shù)的分布式視頻編碼使用反饋信道在譯碼端執(zhí)行碼率控制,使用反饋信道會(huì)增加譯碼端的復(fù)雜度并會(huì)帶來(lái)一些時(shí)延,為了克服這些缺陷,我們?cè)诰幋a端對(duì)碼率進(jìn)行控制,在編碼端產(chǎn)生一個(gè)低復(fù)雜度的邊信息來(lái)對(duì)譯碼端產(chǎn)生的邊信息進(jìn)行估計(jì),從得到譯碼過(guò)程中錯(cuò)誤概率的估計(jì)值,使用該估計(jì)值來(lái)為前幀分配合適數(shù)目的校驗(yàn)位。
本文對(duì)分布式視頻編碼的理論基礎(chǔ)、關(guān)鍵技術(shù)進(jìn)行了研究,并給出了新的解決方案,但是還有更深入的研究有待進(jìn)行,如:本文使用了比較典型的運(yùn)動(dòng)補(bǔ)償幀內(nèi)插法來(lái)產(chǎn)生邊信息的,該方法產(chǎn)生邊信息的質(zhì)量較好,但是它需要的計(jì)算量較大,因此如何產(chǎn)生一個(gè)質(zhì)量好并且計(jì)算量小的邊信息是我們未來(lái)工作的一個(gè)研究方向。
本文主要是基十像素域的分布式視頻編碼框架上對(duì)分布式視頻編碼進(jìn)研究的,下一步我們可以研究應(yīng)用十基十像素域的分布式視頻編碼與PRISM視頻編碼下相應(yīng)的解決方案。
6、參考文獻(xiàn)
[1] Baoguo Du and Hong Shen, A Novel Reconstruction Approach for Pixel-Domain Distributed Video Coding.(Accepted by ICFCC 2010).[2] Wang H S, Cheung N M and Ortega A.2006.A framework for adaptive scalable video coding using Wvner-Ziv techniques[ J ] EURASIP Journal on Applied Signal Processing, [3] Xu Q and Xiong Z.2006.Layered Wyner-Ziv video coding [J].IEEE Transactions on ImageProcessing, 15(12): 3791-3803.[4] Zamir R.1996.The rate loss in the Wvner-Ziv problem }J}.IEEE Transactions on InformationTheory, 42(6): 2073-2084.[5] 杜保國(guó) 沈鴻 對(duì)分布式視頻編碼若干關(guān)鍵技術(shù)的研究 2010.[6] 干宗良 朱秀昌分布式視頻編碼技術(shù)的研究現(xiàn)狀及其展望 2007.[7] 房勝
鐘玉琢.分布式視頻編解碼技術(shù)的研究進(jìn)展2005.[8]張前進(jìn),郭雷.分布式視頻編碼關(guān)鍵技術(shù)及研究進(jìn)展,2007.
第三篇:社會(huì)實(shí)踐視頻內(nèi)容
紅色追憶,綠色創(chuàng)想
2011年暑假,我院為了貫徹
《中共中央國(guó)務(wù)院關(guān)于進(jìn)一步
加強(qiáng)和改進(jìn)大學(xué)生思想政治教育的意見(jiàn)》
和團(tuán)委《關(guān)于組織我院學(xué)生開(kāi)展2011年
暑假社會(huì)實(shí)踐活動(dòng)的通知》文件精神,積極組織學(xué)生參加了各種形式的社會(huì)實(shí)踐活動(dòng)。
此次暑假社會(huì)實(shí)踐活動(dòng)我院參加人數(shù)近1000名,效果顯著,影響深遠(yuǎn),被學(xué)校團(tuán)委評(píng)為“暑假社會(huì)實(shí)踐活動(dòng)先進(jìn)單位”榮譽(yù)稱號(hào),我院趙小萍等134名同學(xué)被學(xué)校團(tuán)委評(píng)為“社會(huì)實(shí)踐積極分子”,受到學(xué)校團(tuán)委表彰。
在此次社會(huì)實(shí)踐中,我院有優(yōu)秀學(xué)生代表組成的赴湖南積極開(kāi)展主題為“紅色追憶,綠色創(chuàng)想”的實(shí)踐團(tuán),實(shí)踐團(tuán)成員通過(guò)瞻仰毛澤東故居,感悟愛(ài)國(guó)情懷,走進(jìn)新型農(nóng)莊,深化“三下鄉(xiāng)”等系列活動(dòng),向黨的90華誕獻(xiàn)禮,堅(jiān)定“永遠(yuǎn)跟黨走”的決心。
七月十日下午,我們舉行了出征儀式,蔣麗萍院長(zhǎng)給我們發(fā)表了講話并叮囑安全注意事項(xiàng),接著給我們實(shí)踐團(tuán)授旗。這次是我們外國(guó)語(yǔ)學(xué)院第一次組團(tuán)去外省進(jìn)行社會(huì)實(shí)踐活動(dòng),團(tuán)員們深感榮幸,心情激動(dòng),聽(tīng)了蔣院長(zhǎng)的講話也感到肩上責(zé)任的重大,決心不辜負(fù)領(lǐng)導(dǎo)的厚望。
七月十二日早晨,天蒙蒙亮,我們開(kāi)始了我們此次社會(huì)實(shí)踐活動(dòng)的第一個(gè)具體行程:韶山之行,感悟愛(ài)國(guó)情懷。雖然早晨下著大雨,卻不能影響我們實(shí)踐的激情。實(shí)踐團(tuán)的成員們參觀了毛澤東銅像廣場(chǎng),在那里我們向毛主席銅像敬獻(xiàn)了花籃,并且在毛主席銅像前重溫了入黨誓詞,這更加堅(jiān)定我們青年大學(xué)生“永遠(yuǎn)跟黨走”的決心。隨后,我們參觀了毛主席故居,看著故居內(nèi)簡(jiǎn)單的擺設(shè),實(shí)踐團(tuán)成員們深深地感受到了偉人樸素的生活作風(fēng);在參觀毛澤東紀(jì)念館內(nèi)建黨九十周年專題展覽時(shí),我們也深刻體會(huì)到建黨90年來(lái)我們黨走過(guò)的艱辛歷程和取得的豐功偉績(jī)。
在參觀故居途中,我們了解到武漢大學(xué)、長(zhǎng)安大學(xué)和景德鎮(zhèn)陶瓷學(xué)院等多個(gè)大學(xué)也派了實(shí)踐團(tuán)來(lái)到韶山進(jìn)行社會(huì)實(shí)踐。我們主動(dòng)聯(lián)系上了長(zhǎng)安大學(xué)實(shí)踐團(tuán),與他們進(jìn)行深入地溝通交流,照相留念,分享實(shí)踐收獲,而且直到現(xiàn)在我們還經(jīng)常與他們聯(lián)系。
七月十三日上午,我院實(shí)踐團(tuán)的成員們一起參觀了橘子洲景區(qū),在那里我們感悟到當(dāng)年毛主席“問(wèn)蒼茫大地,誰(shuí)主沉浮”的氣魄,隨意識(shí)到作為當(dāng)代大學(xué)生,我們應(yīng)該樹(shù)立正確的人生觀、世界觀和價(jià)值觀,肩負(fù)起祖國(guó)賦予青年大學(xué)生的歷史使命。
通過(guò)韶山之行和參觀橘子洲景區(qū),我們實(shí)踐團(tuán)成員感悟到了偉人樸素的生活作風(fēng),體會(huì)到建黨90周年來(lái)的艱辛歷程和豐功偉績(jī),意識(shí)到作為當(dāng)代大學(xué)生,我們應(yīng)該以“志存高遠(yuǎn),腳踏實(shí)地”自勉,樹(shù)立正確地人生觀、世界觀和價(jià)值觀,堅(jiān)定“永遠(yuǎn)跟黨走”的決心。七月十四日下午我們實(shí)踐團(tuán)的成員們走訪了湖南長(zhǎng)沙湘繡文化城,品位了當(dāng)?shù)氐奶厣耖g藝術(shù)。我們對(duì)其主要管理人員進(jìn)行了采訪,了解湘繡的歷史起源、藝術(shù)價(jià)值、經(jīng)營(yíng)模式等,并使的觀摩了繡娘繡制湘繡的過(guò)程。
在了解湘繡的過(guò)程中,團(tuán)員們聯(lián)想到了我們廣西的民歌、竹編、芒編等這些令人驕傲的民間藝術(shù)在不斷的受到“素食經(jīng)濟(jì)文化”的沖擊,它們有的甚至面臨失傳的困境。我們實(shí)踐團(tuán)的朱同學(xué)深思并感慨:“作為青年學(xué)生,我們應(yīng)該多了解民間藝術(shù),多宣傳民間文化;同時(shí)也希望我們廣西能夠借鑒湖南湘繡的傳承模式爭(zhēng)取培養(yǎng)更多的民間藝術(shù)文化人才,在秉承傳統(tǒng)藝術(shù)的基礎(chǔ)上,推陳出新,將廣西的民間藝術(shù)發(fā)揚(yáng)廣大”。
7月14日上午,實(shí)踐團(tuán)成員一起來(lái)到長(zhǎng)沙市北山鎮(zhèn),采訪了榮合橋社區(qū)的謝村官,了解他們是如何探索生態(tài)農(nóng)村發(fā)展之路,從中我們認(rèn)識(shí)到了新生態(tài)農(nóng)村建設(shè)的必要性。此外,我們也與謝村官對(duì)于當(dāng)代大學(xué)生的就業(yè)觀進(jìn)行了交流討論。從交流中我們知道,謝村官是這里土生土長(zhǎng)的大學(xué)生,而且剛畢業(yè)一年就毅然地回到了家鄉(xiāng)。當(dāng)問(wèn)及為何當(dāng)時(shí)毅然地選擇回到自己家鄉(xiāng)的時(shí)候,謝村官意味深長(zhǎng)地跟我們講到:“我會(huì)盡自己的全部,將我所學(xué)到的科學(xué)知識(shí)運(yùn)用到家鄉(xiāng)的新農(nóng)村建設(shè)中,希望家鄉(xiāng)以后能有更大的發(fā)展?!甭?tīng)了謝村官的話,實(shí)踐團(tuán)的成員也認(rèn)識(shí)到,身為大學(xué)生的我們,應(yīng)珍惜在校學(xué)習(xí)專業(yè)知識(shí)的寶貴時(shí)間。只有打下堅(jiān)實(shí)的專業(yè)知識(shí),我們才能在未來(lái)的崗位中更好的貢獻(xiàn)社會(huì)。
下午我們又走訪了圣毅園現(xiàn)代化農(nóng)莊的經(jīng)營(yíng)發(fā)展概況進(jìn)行了全面的調(diào)查。圣毅園現(xiàn)代化農(nóng)莊是集生態(tài)農(nóng)業(yè),農(nóng)產(chǎn)品深加工,生態(tài)旅游三位一體的現(xiàn)代化農(nóng)業(yè)企業(yè)。他們一直堅(jiān)持“創(chuàng)新、樹(shù)牌、強(qiáng)企、富民”的經(jīng)濟(jì)宗旨,以土地承包經(jīng)營(yíng)權(quán)流轉(zhuǎn)為手段,來(lái)發(fā)展適度規(guī)模經(jīng)營(yíng)。目前,圣毅園涉及到6個(gè)村,1.5萬(wàn)人,規(guī)劃流轉(zhuǎn)土地3.7萬(wàn)畝,采取每畝地流轉(zhuǎn)325公斤稻谷或等值現(xiàn)金及分紅來(lái)回報(bào)農(nóng)民。原區(qū)內(nèi)建成中國(guó)植物SOD產(chǎn)業(yè)基地,有才生產(chǎn)基地等多個(gè)現(xiàn)代化農(nóng)業(yè)生產(chǎn)基地。但在當(dāng)前發(fā)展過(guò)程中,略顯昌進(jìn),有些項(xiàng)目為全面考評(píng)當(dāng)?shù)貙?shí)際情況將就匆忙上馬,未達(dá)到明顯效果。
七月十五日,我們的實(shí)踐活動(dòng)圓滿結(jié)束,并踏上歸程。在這一整個(gè)實(shí)踐活動(dòng)中,我們深刻理解我們黨90年來(lái)的光榮歷史、豐功偉績(jī)、寶貴經(jīng)驗(yàn),激勵(lì)我們珍惜現(xiàn)有美好生活,努力學(xué)好科學(xué)文化知識(shí),在實(shí)踐中奮發(fā)成才,服務(wù)人民,鍛煉獨(dú)立思考、開(kāi)拓創(chuàng)新的能力,為今后走出校門,服務(wù)社會(huì)貢獻(xiàn)力量;同時(shí)我們實(shí)踐團(tuán)的每個(gè)成員相互學(xué)習(xí)、相互鼓勵(lì),從而建立了姐妹般的情誼。而這一段回憶,我們每個(gè)實(shí)踐團(tuán)的成員都會(huì)捧在手心,好好珍藏,好好回味。
實(shí)踐活動(dòng)之后我們實(shí)踐團(tuán)的成員們就體驗(yàn)生態(tài)農(nóng)村這方面引起了思考:長(zhǎng)沙市沙坪鎮(zhèn)主要是發(fā)展當(dāng)?shù)氐氖止I(yè)——湘繡,打造湖南湘繡文化城并享譽(yù)國(guó)內(nèi)外;長(zhǎng)沙市的北山鎮(zhèn)主要是發(fā)展期特色農(nóng)業(yè),建立了圣毅園現(xiàn)代化農(nóng)莊。如今,沙坪鎮(zhèn)的湘繡在不斷發(fā)展,而生意遠(yuǎn)在高速發(fā)展中也遇到其瓶頸,略顯昌進(jìn)。但是它們都是在不斷探索符合各自的生態(tài)農(nóng)村之路,為老百姓奔小康作貢獻(xiàn)。我們廣西在建設(shè)社會(huì)主義新農(nóng)村過(guò)程中應(yīng)該借鑒兩鎮(zhèn)良好經(jīng)驗(yàn),尋找當(dāng)?shù)靥厣l(fā)展點(diǎn),服務(wù)社會(huì)主義新農(nóng)村建設(shè)。
第四篇:視頻內(nèi)容總結(jié)
1.微課程:
視頻內(nèi)容總結(jié)
是指時(shí)間在10分鐘以內(nèi),有明確的教學(xué)目標(biāo),內(nèi)容短小,集中說(shuō)明一個(gè)問(wèn)題的小課程。(理論上講)
間于“文本閱讀”與“影視閱讀”間的一種閱讀方式,在優(yōu)美的音樂(lè)聲中靜靜地閱讀文字、欣賞畫面、進(jìn)而引發(fā)思考。(形式上看)2.微課程六大要素:
(1)精美:音樂(lè)+畫面+文字(極精、極簡(jiǎn)、極美)(2)簡(jiǎn)潔:5分鐘學(xué)習(xí)300秒思考 一事一議、開(kāi)門見(jiàn)山
(3)具體:以小見(jiàn)大、直指原因或?qū)Σ?將理論暗含于問(wèn)題、故事、策略中
(4)意外:巧妙設(shè)疑、有懸念、層層遞進(jìn)(總有想不到的地方,總有恍然大悟的感覺(jué))
(5)深刻:看到問(wèn)題背后的問(wèn)題,對(duì)問(wèn)題本質(zhì)的深度思考(6)情感:讓你產(chǎn)生情感共鳴,進(jìn)而產(chǎn)生親近感與認(rèn)同感 3.微課程設(shè)計(jì)
(1)選題設(shè)計(jì):選題要精練,教學(xué)內(nèi)容要明晰,可取代、聚集于課前導(dǎo)入、課后拓展、關(guān)鍵概念、難點(diǎn)、某一技能、某一方法、某一問(wèn)題。
(2)時(shí)間設(shè)計(jì):時(shí)長(zhǎng)一般為5——8分鐘左右,最長(zhǎng)不宜越過(guò)10分鐘。
(3)教學(xué)過(guò)程設(shè)計(jì):基本原則是簡(jiǎn)短、完整,快速引入課題,并能吸引學(xué)生,內(nèi)容講授線索要清晰,盡可能圍繞一個(gè)線索展開(kāi),在這條線索上突出重點(diǎn),顯露主干,剪掉側(cè)枝旁葉,總結(jié)收尾要快捷,好的總結(jié)能使一節(jié)課上升到一個(gè)新的檔次,讓人清晰地感覺(jué)到通過(guò)這節(jié)課學(xué)到了什么。
(4)資源設(shè)計(jì):要設(shè)計(jì)跟本課程相關(guān)的教學(xué)支持資源。
(5)教學(xué)語(yǔ)言:最后要設(shè)計(jì)教學(xué)語(yǔ)言,最好撰寫出文字腳本,并在制作之前預(yù)演一遍
4.微課程教學(xué)設(shè)計(jì)與傳統(tǒng)教學(xué)設(shè)計(jì)有何區(qū)別?(1)包含內(nèi)容:導(dǎo)入、講授、活動(dòng)、評(píng)價(jià)、小結(jié)
傳統(tǒng):幾個(gè)知識(shí)點(diǎn)45分鐘 微課程:一個(gè)知識(shí)點(diǎn),10分鐘以內(nèi)(2)教學(xué)原則:針對(duì)性、集中性、整體性、指導(dǎo)性、啟發(fā)性、參與性?? 適應(yīng)于微課程,更精練、精彩、精確 5.微課程設(shè)計(jì)兩步曲:
微視頻(導(dǎo)入、講授、小結(jié))、學(xué)習(xí)任務(wù)單(活動(dòng)、評(píng)價(jià))(1)微視頻設(shè)計(jì)策略: 環(huán)節(jié)一:導(dǎo)入方式
目標(biāo)導(dǎo)入、情景導(dǎo)入、故事導(dǎo)入、范例導(dǎo)入、問(wèn)題導(dǎo)入、游戲?qū)?? 策略一:簡(jiǎn)短,1分鐘以內(nèi),一句話點(diǎn)明學(xué)習(xí)目標(biāo) 策略二:激趣
策略三:導(dǎo)入和內(nèi)容流暢銜接
環(huán)節(jié)二:授導(dǎo)——?jiǎng)?chuàng)新方法、精細(xì)設(shè)計(jì) 策略一:他山之石,可以攻玉 策略二:講清楚基本概念和關(guān)鍵技能 策略三:用問(wèn)題串聯(lián)你的課程內(nèi)容
策略四:口語(yǔ)化講解,營(yíng)造一對(duì)一的學(xué)習(xí)氣氛 策略五:不要輕易跳過(guò)學(xué)習(xí)步驟 策略六:要給學(xué)生提示性信息
策略七:用字幕方式補(bǔ)充微課程不容易說(shuō)清楚的部分 策略八:加強(qiáng)人與資源互動(dòng)和學(xué)生的思維參與 環(huán)節(jié)三:回顧和總結(jié)(2)學(xué)習(xí)任務(wù)單:
是和微課程配套的學(xué)案,主要包括以下內(nèi)容: 學(xué)習(xí)目標(biāo)、學(xué)習(xí)資源、學(xué)習(xí)方法、學(xué)習(xí)任務(wù) 學(xué)習(xí)反思、后續(xù)學(xué)習(xí)預(yù)告 6.微課程的評(píng)價(jià)標(biāo)準(zhǔn) 【教學(xué)設(shè)計(jì)】10% ?選題小而精,在課程中具有典型性、代表性 ?學(xué)習(xí)目標(biāo)明確 ?教學(xué)組織思路清晰 ?教學(xué)媒體運(yùn)用得當(dāng) 【教學(xué)內(nèi)容】20% ?教學(xué)內(nèi)容正確,無(wú)科學(xué)性錯(cuò)誤,表達(dá)準(zhǔn)確無(wú)誤; ?教學(xué)內(nèi)容組織富有邏輯性,符合學(xué)生認(rèn)知特點(diǎn)。【教學(xué)過(guò)程】40% ?切入課題迅速,方法新穎,對(duì)學(xué)生有吸引力 ?講授線索清晰
?總結(jié)收尾快捷,起到提綱契領(lǐng)的作用,能加深學(xué)生對(duì)所學(xué)內(nèi)容的印象
?板書(shū)精煉、合理,要點(diǎn)突出
?教態(tài)自然大方,語(yǔ)言準(zhǔn)確、簡(jiǎn)明、生動(dòng),富有感染力。【作品規(guī)范】10% ?視頻結(jié)構(gòu)完整,具備片頭、片尾,主要教學(xué)環(huán)節(jié)有字幕提示 ?技術(shù)規(guī)范,時(shí)長(zhǎng)一般不超過(guò)10分鐘、圖像清晰穩(wěn)定、構(gòu)圖合理、聲音清楚、聲畫同步?!窘虒W(xué)效果】20% ?形式新穎:微課程設(shè)計(jì)有創(chuàng)新或創(chuàng)意新穎,教學(xué)方法富有創(chuàng)意,整體印象較好;
?趣味性強(qiáng):教學(xué)過(guò)程深入淺出,形象生動(dòng),精彩有趣,能運(yùn)用多種策略激發(fā)學(xué)習(xí)動(dòng)機(jī),注意啟發(fā),促進(jìn)思維,培養(yǎng)能力 ?目標(biāo)達(dá)成:完成設(shè)定的教學(xué)目標(biāo);
?推廣應(yīng)用:作品發(fā)布后受到歡迎,點(diǎn)擊率、人氣旺、分享數(shù)量多,用戶評(píng)價(jià)好,有較大推廣價(jià)值。7.制作技術(shù)標(biāo)準(zhǔn):
1.視頻結(jié)構(gòu)完整,具備片頭、片尾(各不超過(guò)10秒鐘)2.時(shí)長(zhǎng)控制在10分鐘以內(nèi); 3.視頻畫質(zhì)清晰,鏡頭穩(wěn)定。
4.講解語(yǔ)言通俗易懂,深入淺出、詳略得當(dāng)、聲音洪亮、抑揚(yáng)頓挫
第五篇:視頻會(huì)議系統(tǒng)全面解析
視頻會(huì)議系統(tǒng)全面解析
一、什么是遠(yuǎn)程視頻會(huì)議系統(tǒng)?
設(shè)想一個(gè)問(wèn)題:一個(gè)跨國(guó)集團(tuán)其總部在美國(guó),其分部分別在歐洲、亞洲、非洲。某一天總部通知要開(kāi)一個(gè)集團(tuán)高層會(huì)議,各大洲的老總們就要匆匆收拾行囊,花一大筆錢,在飛機(jī)上坐14-24小時(shí)去開(kāi)只有一到兩天的會(huì)。換來(lái)的是滿身的疲勞及工作效率的低下。再如在國(guó)內(nèi),國(guó)務(wù)院要召開(kāi)一個(gè)全國(guó)會(huì)議表彰先進(jìn);或者北京大學(xué)教授要給全國(guó)各分校學(xué)生授課;或者現(xiàn)代化戰(zhàn)爭(zhēng)要求軍隊(duì)需要即時(shí)了解戰(zhàn)場(chǎng)情況;或者天壇醫(yī)院專家要給遠(yuǎn)在海南的垂危病人指導(dǎo)手術(shù);再或者政府、軍隊(duì)布置抗洪搶險(xiǎn)緊急事宜等等??
圖一 視頻會(huì)議效果圖
如何快速、高效、經(jīng)濟(jì)地解決這些問(wèn)題?
答案是使用視頻會(huì)議。需要開(kāi)會(huì)的每個(gè)會(huì)場(chǎng)安裝一套視頻會(huì)議終端,接上電視機(jī)、攝像頭、麥克風(fēng)等附件,再接入相應(yīng)的寬帶網(wǎng)絡(luò)如IP,ISDN,E1/T1等,即可實(shí)現(xiàn)視頻、音頻、數(shù)據(jù)的實(shí)時(shí)傳送,從而讓我們真正實(shí)現(xiàn)天涯共一室的夢(mèng)想。隨著現(xiàn)代視頻壓縮技術(shù),尤其是寬帶網(wǎng)絡(luò)的日益完善和發(fā)展,實(shí)時(shí)視頻通訊已成為寬帶網(wǎng)絡(luò)中除電視、數(shù)據(jù)之外的第三大服務(wù)內(nèi)容。
如果有這么一套視頻會(huì)議系統(tǒng),那么歐洲的老板只需坐在其辦公室即可同各大洲的他的下屬們面對(duì)面地商討公司業(yè)務(wù);黨中央國(guó)務(wù)院的會(huì)議精神可以通過(guò)網(wǎng)絡(luò)直接傳到各縣、鄉(xiāng)、鎮(zhèn),任一鄉(xiāng)鎮(zhèn)的會(huì)場(chǎng)圖像亦可實(shí)時(shí)傳給中央;北大各分校學(xué)生可即時(shí)向北大授課的教授提問(wèn);如《DA師》中的軍隊(duì)渡海畫面可以在指揮中心實(shí)時(shí)展現(xiàn);各行業(yè)遠(yuǎn)程診斷、遠(yuǎn)程指揮、遠(yuǎn)程抉擇等都能成為現(xiàn)實(shí)。這種不受地域限制、建立在寬帶網(wǎng)絡(luò)基礎(chǔ)上的雙向、多點(diǎn)、實(shí)時(shí)的視音頻交互系統(tǒng)就稱為遠(yuǎn)程視頻會(huì)議系統(tǒng)。
二、采用遠(yuǎn)程視頻會(huì)議系統(tǒng)的優(yōu)勢(shì)
(一)節(jié)約會(huì)議的經(jīng)費(fèi)、時(shí)間
在我國(guó),召開(kāi)一次全國(guó)32個(gè)省市自治區(qū)的電視會(huì)議,費(fèi)用僅為5萬(wàn)元。相同規(guī)模的會(huì)議若在賓館召開(kāi),會(huì)議費(fèi)用將高達(dá)100萬(wàn)元。
據(jù)統(tǒng)計(jì),日本、美國(guó)之間開(kāi)通1小時(shí)的國(guó)際電視會(huì)議,雙方總資費(fèi)不超過(guò)50萬(wàn)日元,并能允許10多人直接參會(huì),通過(guò)數(shù)據(jù)流、投影等可以讓所有員工旁聽(tīng)。但50萬(wàn)日元遠(yuǎn)遠(yuǎn)不能支付1個(gè)人的出差費(fèi)用。
據(jù)相關(guān)資料,各級(jí)管理機(jī)構(gòu)的工作人員每年參加會(huì)議的時(shí)間約占全部工作時(shí)間的30%以上;每年用于公務(wù)出差的費(fèi)用高達(dá)300億元,而每次開(kāi)會(huì)或會(huì)面中約有80%的時(shí)間需花費(fèi)在路途中。
(二)提高開(kāi)會(huì)的效率
由于召開(kāi)電視會(huì)議的費(fèi)用大致與開(kāi)會(huì)的時(shí)間成正比,可促使與會(huì)代表節(jié)省時(shí)間,提高效率。
由于參加會(huì)議的人員就在本地,和會(huì)議有關(guān)的材料、文件、實(shí)物都在身邊,可以充分方便地交流。
(三)適應(yīng)某些特殊情況
對(duì)于某些交通狀況不好,特別是地處山區(qū)、邊疆的城市,視頻會(huì)議將帶來(lái)極大的方便。在一些緊急場(chǎng)合,如救災(zāi)、防汛,戰(zhàn)地會(huì)議等,可以用視頻會(huì)議系統(tǒng)及時(shí)了解或發(fā)布緊急情況和決策,收效則難以用金錢來(lái)衡量。
(四)增加參會(huì)人員
視頻會(huì)議可當(dāng)作高質(zhì)量的可視電話,連線兩方訴說(shuō)心情,也可多人多點(diǎn)參加形成會(huì)議。同時(shí),視頻會(huì)議系統(tǒng)具有投影、VGA端口以及數(shù)據(jù)流功能可以隨時(shí)增加會(huì)議代表甚至召開(kāi)全體會(huì)議??偛繘Q策可即時(shí)傳達(dá)到所有員工。
三、視頻會(huì)議的實(shí)現(xiàn)方式
當(dāng)前,視頻會(huì)議的實(shí)現(xiàn)方式有三種:(1)廣電系統(tǒng)(電視臺(tái))常用的電視直播式視頻會(huì)議;(2)MPEG1、MPEG2壓縮格式VOD視頻傳輸式視頻會(huì)議系統(tǒng);
(3)ITU(國(guó)際電信聯(lián)盟)提出的基于H.261/H.263視頻壓縮格式的H.320/H.323規(guī)范的視頻會(huì)議系統(tǒng)。
我們需要什么樣的視頻會(huì)議系統(tǒng)呢?首先是價(jià)格適度,能為大多數(shù)行業(yè)用戶承受及使用的視頻會(huì)議系統(tǒng)才是真正意義上的視頻會(huì)議系統(tǒng)。其次是技術(shù)上的指標(biāo):實(shí)現(xiàn)高質(zhì)量圖像/聲音傳輸?shù)珟捲降驮胶茫浑p向交互、需要支持長(zhǎng)時(shí)間開(kāi)機(jī)工作(低功耗);操作簡(jiǎn)單,無(wú)需專業(yè)知識(shí),操作失誤也無(wú)損壞;應(yīng)無(wú)操作系統(tǒng),不怕病毒攻擊、不怕突發(fā)性斷電、應(yīng)具備多種網(wǎng)絡(luò)接口(ISDN,IP,V.35,E1/T1)、具有自適應(yīng)功能,完全智能化、穩(wěn)定可靠,返修率低等等。
那么以上三種實(shí)現(xiàn)方式哪一種才是真正意義上的視頻會(huì)議系統(tǒng)呢?讓我們來(lái)分析一下:(1)電視臺(tái)電視直播式視頻會(huì)議。此方式需要租用專用的衛(wèi)星通道,傳輸方式為單向轉(zhuǎn)輸,若要雙向則必須租用兩個(gè)信道。租用衛(wèi)星的費(fèi)用非常昂貴,時(shí)間越長(zhǎng),費(fèi)用越高。另外會(huì)議方式需要專業(yè)技術(shù)人員,還必須通過(guò)復(fù)雜的審批手續(xù)。因此這種會(huì)議方式只能供一些特種行業(yè)單位如中央電視臺(tái)使用。
(2)MPEG1、MPEG2壓縮格式的視頻會(huì)議系統(tǒng)。由于MPEG1的傳輸需要1.5M的帶寬,MPEG2需要3M的帶寬,且圖像質(zhì)量將隨網(wǎng)絡(luò)傳輸距離急劇下降,通常只能用于本地的高速網(wǎng)段上。試想要實(shí)現(xiàn)文章開(kāi)頭的視頻會(huì)議,則需歐美、歐亞、歐非之間建立幾條高達(dá)幾M帶寬單純用于視頻會(huì)議的網(wǎng)絡(luò),這是不可想象的。即使是國(guó)內(nèi)亦只有電信局這些具有自己網(wǎng)絡(luò)資源的職能部門才能建立這種基于高帶寬的專用的視頻會(huì)議系統(tǒng)。而且隨著IP網(wǎng)絡(luò)的普及,這種高度浪費(fèi)帶寬資源的工作模式勢(shì)必走向淘汰。
(3)基于ITU(國(guó)際電信聯(lián)盟)H.320、H.323系列標(biāo)準(zhǔn)以及MPEG4壓縮格式的視頻會(huì)議系統(tǒng)的出現(xiàn)才使高貴的視頻會(huì)議進(jìn)入商用領(lǐng)域。但是由于MPEG4標(biāo)準(zhǔn)定立很晚,各家先行開(kāi)發(fā)的MPEG4標(biāo)準(zhǔn)并不十分統(tǒng)一,這就造成了MPEG4標(biāo)準(zhǔn)的視頻會(huì)議系統(tǒng)先天兼容性不足?,F(xiàn)階段市場(chǎng)上技術(shù)成熟并占真正主導(dǎo)地位的是基于H.320/H.323標(biāo)準(zhǔn)的視頻會(huì)議系統(tǒng)。這種實(shí)施價(jià)格平易近人,網(wǎng)絡(luò)要求不高(通常僅需要共享數(shù)據(jù)廣域網(wǎng)或使用ISDN甚至使用Internet),技術(shù)已經(jīng)成熟的視頻會(huì)議系統(tǒng)才我們真正意義上的視頻會(huì)議系統(tǒng)。H.323是指基于IP方式進(jìn)行傳輸?shù)囊曨l會(huì)議;H.320是以IP以外的其它網(wǎng)絡(luò)方式進(jìn)行傳輸?shù)囊曨l會(huì)議,通常有ISDN,DDN,幀中繼,ATM等等。以業(yè)界高端視頻會(huì)議終端生產(chǎn)廠商挪威泰德視訊公司(TANDBERG)H.323/H.320視頻會(huì)議終端T6000型為例,其工作帶寬為64kbps-3Mbps,實(shí)際應(yīng)用中建議使用384kbps-768kbps就可達(dá)到VCD級(jí)的傳輸效果(iCIF模式,352x576分辨率,50場(chǎng)/秒,PAL制)。在H.323協(xié)議(IP)環(huán)境中視頻會(huì)議系統(tǒng)可與其他業(yè)務(wù)如IP語(yǔ)音,IP數(shù)據(jù)共享帶寬,從而可以讓用戶將已有的寬帶廣域數(shù)據(jù)網(wǎng)改造為視頻、音頻、數(shù)據(jù)三網(wǎng)合一的綜合性平臺(tái),從而更充分地利用已有網(wǎng)絡(luò)的網(wǎng)絡(luò)資源。
四、視頻會(huì)議系統(tǒng)的組成
圖二:視頻會(huì)議系統(tǒng)的組成
會(huì)議系統(tǒng)的組成非常簡(jiǎn)單,每個(gè)會(huì)場(chǎng)安放一臺(tái)視頻會(huì)議終端,終端接上電視機(jī)作為回顯設(shè)備、接上網(wǎng)絡(luò)作為傳輸媒介就可以了。一臺(tái)終端通常有一臺(tái)核心編解碼器、一個(gè)攝像頭,一個(gè)全向麥克風(fēng)以及一個(gè)遙控器。核心編解碼將攝像頭和麥克風(fēng)輸入的圖像及聲音編碼通過(guò)網(wǎng)絡(luò)傳走,同時(shí)將網(wǎng)絡(luò)傳來(lái)的數(shù)據(jù)解碼后將圖像和聲音還原到電視機(jī)和音響上,即實(shí)現(xiàn)了與遠(yuǎn)端的實(shí)時(shí)交互。終端通過(guò)呼叫IP地址或ISDN號(hào)碼進(jìn)行連接(專線無(wú)需撥號(hào))。但在有三點(diǎn)會(huì)場(chǎng)就必須采用MCU(視頻會(huì)議多點(diǎn)控制單元)進(jìn)行管理。同電話交換機(jī)相似,MCU(多點(diǎn)控制單元)的作用就是在視頻會(huì)議三點(diǎn)以上時(shí),決定將哪一路(或哪四路合并成一個(gè))圖像作為主圖像廣播出去,以供其他會(huì)場(chǎng)點(diǎn)收看。所有會(huì)場(chǎng)的聲音是實(shí)時(shí)同步混合傳輸?shù)?。在具有MCU的會(huì)議系統(tǒng)里,所有終端的音視頻數(shù)據(jù)均實(shí)時(shí)傳到MCU供選擇廣播。MCU的數(shù)據(jù)流量較大,通常接于網(wǎng)絡(luò)的中心交換機(jī)上,控制人員通過(guò)筆記本電腦調(diào)用MCU管理界面在會(huì)場(chǎng)進(jìn)行遠(yuǎn)程管理。呼叫方式可以由控制人員由MCU呼叫各個(gè)終端,亦可由各終端呼叫控設(shè)置好的會(huì)議號(hào)。
圖三:視頻會(huì)議系統(tǒng)終端構(gòu)成
如果客戶規(guī)劃的視頻會(huì)議系統(tǒng)網(wǎng)絡(luò)比較大,在MCU下面還可建立另外視頻會(huì)議網(wǎng),兩個(gè)網(wǎng)的MCU實(shí)現(xiàn)視音頻交換,此種方法叫MCU的級(jí)連。比如,中央到各省的視頻會(huì)議網(wǎng)絡(luò)帶寬為2M,省上自己亦有自己的視頻會(huì)議系統(tǒng)。中央開(kāi)會(huì)用自己的MCU,省上開(kāi)會(huì)用省上的MCU,需要上傳下達(dá)時(shí),將MCU級(jí)連起來(lái)就可以了。級(jí)連的好處一是管理上不會(huì)混亂;二是到中央的帶寬亦不允許省下面幾十點(diǎn)的數(shù)據(jù)全擠到這上面來(lái)
五、視頻會(huì)議系統(tǒng)終端的工作原理
圖四:視頻會(huì)議終端的工作原理
如圖所示:視頻會(huì)議終端將輸入進(jìn)來(lái)的視頻使用H.261、H.263或H.264協(xié)議、音頻使用G.711、G.722或G.728、數(shù)據(jù)、控制信令進(jìn)行單獨(dú)編碼,然后將編碼后的數(shù)據(jù)進(jìn)行“復(fù)用”打包后形成遵循網(wǎng)絡(luò)協(xié)議的數(shù)據(jù)包,通過(guò)網(wǎng)絡(luò)接口傳到MCU供選擇廣播。從MCU傳來(lái)的其他會(huì)場(chǎng)的數(shù)據(jù)包通過(guò)“解復(fù)用”,分別還原成視頻、音頻以及數(shù)據(jù)及控制信令分別相應(yīng)的輸出設(shè)備上回顯或執(zhí)行。
在這原理圖中有兩處要強(qiáng)調(diào)的地方:一是音頻數(shù)據(jù)量(小于等于64K)遠(yuǎn)遠(yuǎn)小于視頻的數(shù)據(jù)量,編碼的時(shí)延也比視頻時(shí)間短。因此在早期的視頻會(huì)議系統(tǒng)中經(jīng)常會(huì)出現(xiàn)聽(tīng)到聲音后很久才看到人嘴動(dòng)的情況。業(yè)界術(shù)語(yǔ)叫唇音同步?,F(xiàn)在的視頻會(huì)議知名品牌都在音頻編碼后加入一定的時(shí)延,唇音同步問(wèn)題已完全解決。
二、在傳輸?shù)男畔⒗锩?,?yōu)先級(jí)的排列順序?yàn)椋阂纛l->視頻->控制信令->數(shù)據(jù)。因?yàn)闀?huì)議以說(shuō)話為主,在網(wǎng)絡(luò)擁塞時(shí),畫面可能會(huì)有馬塞克,但會(huì)議的聲音必然首先保證是連貫和清晰的。
另外,ITU已經(jīng)在2003年中期公布了H.264視頻編碼協(xié)議。采用該協(xié)議,384kbps下傳輸?shù)囊曇纛l質(zhì)量相當(dāng)于H.263視頻編碼協(xié)議768kbps帶寬下的質(zhì)量與效果。H.264協(xié)議是視頻會(huì)議發(fā)展的一個(gè)分水嶺,視頻會(huì)議終端及MCU是否支持H.264這種最新的視頻編碼協(xié)議,成為該視頻會(huì)議品牌是否具有生命力和研發(fā)能力的一個(gè)標(biāo)志。
六、視頻會(huì)議產(chǎn)品常見(jiàn)的品牌 TANDBERG騰博
產(chǎn)地挪威,該品牌為視頻會(huì)議業(yè)界的高端產(chǎn)品。該品牌全系列均屬第三代產(chǎn)品,具有多項(xiàng)視頻會(huì)議的首創(chuàng)技術(shù),最高功耗只有65W,最高帶寬3M,是美國(guó)國(guó)防部、加拿大國(guó)防部、聯(lián)合國(guó)教科文組織、歐洲多個(gè)國(guó)家王室及大型跨國(guó)集團(tuán)選用的品牌。目前是世界市場(chǎng)量前三位之一
POLYCOM寶利通
產(chǎn)地美國(guó),視頻會(huì)議界的元老品牌,主要致力于中低端市場(chǎng),大部分產(chǎn)品為第三代產(chǎn)品,但沒(méi)有完成全系列轉(zhuǎn)化。目前是世界市場(chǎng)量前三位之一
SONY索尼
產(chǎn)地日本。SONY是全球電子產(chǎn)品數(shù)一數(shù)二的知名品牌,進(jìn)入視頻會(huì)議終端市場(chǎng)后。憑借其雄厚的技術(shù)實(shí)力以及完善的銷售渠道,很快就成為全球視頻會(huì)議市場(chǎng)占有量前三位