第一篇:“教學(xué)用音頻處理技術(shù)”學(xué)習(xí)心得
“教學(xué)用音頻處理技術(shù)”學(xué)習(xí)心得
不知不覺 “教學(xué)用音頻處理技術(shù)”已經(jīng)學(xué)完了,對于這門課程,我學(xué)到的東西還是蠻多的。從最初的一無所知,到現(xiàn)在的初見成效,其間付出了時間和心血,也從中感受到無窮的樂趣。
大學(xué)里接觸過“教學(xué)用音頻處理技術(shù)”,但現(xiàn)在已經(jīng)畢業(yè)這么久,該會的知識也忘記的差不多了?,F(xiàn)在再次學(xué)習(xí)這么課程,覺得無比的親切,雖然作業(yè)完成的不是很好。通過學(xué)習(xí),我對“教學(xué)用音頻處理技術(shù)”有了進(jìn)一步的認(rèn)識,知道了好多以前根本沒有接觸過的東西。就像一籠中之鳥見到了蔚藍(lán)的天空,小河里的一條小魚見到了大海。一點(diǎn)也不夸張,這只是心里的一些想法。
我們的作業(yè),其實就是一次藝術(shù)創(chuàng)作的過程,從構(gòu)思、選材到制作完成需要花費(fèi)時間和精力,而每天的上網(wǎng)時間是有限的,因為我的課程比較多,所以只好下班后再進(jìn)行學(xué)習(xí)。聽自己做的“聲音”我被感動了,很有成就感和自豪感。我并不是為自己驕傲,而是自己有了進(jìn)步,我知道,“教學(xué)用音頻處理技術(shù)”的知識是淵博的,我只是學(xué)了皮毛。
學(xué)習(xí)的過程就是一個提高的過程,只有不段地學(xué)習(xí)、不斷地總結(jié),才能不斷地提高。
第二篇:教學(xué)視頻處理技術(shù) 學(xué)習(xí)心得
教學(xué)視頻處理技術(shù)學(xué)習(xí)心得
相城實驗中學(xué) 方艷玲
這次網(wǎng)上培訓(xùn),我選擇學(xué)習(xí)教學(xué)視頻處理技術(shù),帶著初學(xué)者的好奇,在接觸之前以為很難,因為這是個一比較專業(yè)的軟件處理技術(shù)。起初是為了完成任務(wù)的心態(tài)去學(xué)習(xí)它,但是深入學(xué)習(xí)了解之后,覺得教學(xué)視頻處理技術(shù)是一個非常有意思、值得學(xué)習(xí)的軟件。
通過這次視頻處理技術(shù)的學(xué)習(xí),彌補(bǔ)以往視頻處理技術(shù)知識的空缺。過去只會通過QQ影音等軟件對視頻、音樂進(jìn)行簡單的剪輯,但對整個視頻畫面的剪輯還是第一次接觸,經(jīng)過這一段時間的學(xué)習(xí),收獲頗豐,希望接下來一段時間再接再厲,努力掌握好教學(xué)視頻入門處理技術(shù)。
在學(xué)習(xí)的過程中,我按照老師的教學(xué)視頻,從最基本的知識和最基礎(chǔ)的操作開始,一步一步按部就班的學(xué)習(xí),慢慢我開始入門了,開始掌握一些基本操作。對于比較復(fù)雜的知識塊,我就反復(fù)看老師的視頻資料,我會將比較復(fù)雜的地方做筆記,然后反復(fù)練習(xí),最后在經(jīng)過多次的實踐后也就自然掌握了。在對視頻教學(xué)處理技術(shù)不斷深入的學(xué)習(xí)后,也逐漸感覺到了這個軟件技術(shù)其實對我們的教學(xué)工作的幫助也挺大的。
教學(xué)視頻處理技術(shù)能對現(xiàn)有的視頻文件進(jìn)行處理,使其滿足自己的需要,通過學(xué)習(xí),我掌握了幾種小方法。它不僅可以將自己需要的的幾種視頻合并在一起,還能將自己不需要的視頻部分刪除掉,這樣子可以節(jié)約活動中不必要 的時間。運(yùn)用電腦制作一些文件,可動可靜,生動活潑,使教學(xué)過程更加生動、直觀、形象,吸引學(xué)生的注意力,提升學(xué)生參加活動的興趣。現(xiàn)在課堂教學(xué)以學(xué)生為 主體視頻教學(xué)技術(shù)可以調(diào)動學(xué)生的學(xué)習(xí)積極性,增加學(xué)生的學(xué)習(xí)興趣.讓學(xué)生被動學(xué)轉(zhuǎn)化為主動學(xué),愿意學(xué)。
現(xiàn)在,我已經(jīng)掌握了一些視頻的制作技巧,遇到困難,可以網(wǎng)上搜索教學(xué)視頻,然后反復(fù)練習(xí),熟能生巧。在今后的教學(xué)活動會中有效的利用現(xiàn)代化資源,不僅可以創(chuàng)設(shè)情境,還能把枯燥的活動變得生動、有趣。讓孩子們在愉快的氣氛中主動學(xué)習(xí),使學(xué)習(xí)活動達(dá)到最佳的效果。作為新時代的教師,應(yīng)該不斷的學(xué)習(xí)充電,學(xué)習(xí)掌握新的知識和技術(shù)。通過這次網(wǎng)上視頻處理軟件專題的學(xué)習(xí),我也讓對現(xiàn)代信息技術(shù)的強(qiáng)大功能深有體會。在學(xué)習(xí)的過程中收獲很多,在此感謝老師提供的豐富的學(xué)習(xí)資源和熱情的幫助。這次培訓(xùn)的經(jīng)歷我懂得了掌握電腦技巧,需要不斷地實踐。
第三篇:音頻制作學(xué)習(xí)心得
學(xué)習(xí)音頻軟件心得體會
潘
飛
今年暑假,我學(xué)習(xí)了數(shù)字音頻技術(shù),帶著初學(xué)者的好奇,在接觸之前以為很難,因為這是個一比較專業(yè)的軟件處理工具。起初是完成任務(wù)的心態(tài)去學(xué)習(xí)它,但是深入學(xué)習(xí)了解之后,覺得音頻軟件是一個非常有意思的軟件。
在學(xué)習(xí)的過程中,我會將比較復(fù)雜的地方做筆記,然后反復(fù)練習(xí)。音頻數(shù)字技術(shù)在今后的教學(xué)中對我們幫助太大。數(shù)字音頻編輯能對現(xiàn)有的音頻文件進(jìn)行處理,使其滿足自己的需要,通過學(xué)習(xí),我學(xué)會了幾個小方法方法。它不僅可以將自己需要的的幾首歌曲合并在一起,還能將自己不需要的歌曲部分刪除掉,這樣子可以節(jié)約活動中不必要的時間。運(yùn)用電腦制作一些文件,可動可靜,生動活潑,使教學(xué)過程更加生動、直觀、形象,吸引幼兒的注意力,提升幼兒參加活動的興趣。現(xiàn)在課堂教學(xué)以幼兒為主體,音頻數(shù)字技術(shù)可以調(diào)動幼兒的學(xué)習(xí)積極性,增加幼兒的學(xué)習(xí)興趣.讓幼兒被動學(xué)轉(zhuǎn)化為主動學(xué),愿意學(xué).。現(xiàn)在,我已經(jīng)掌握了一些數(shù)字音頻的編輯技巧,還學(xué)習(xí)了PPT、photoshop這兩個軟件,遇到困難,可以網(wǎng)上搜索答案,然后反復(fù)練習(xí),熟能生巧。在今后的教學(xué)活動會中有效的利用現(xiàn)代化資源,不僅可以創(chuàng)設(shè)情境,還能把枯燥的活動變得生動、有趣。讓孩子們在愉快的氣氛中主動學(xué)習(xí),使活動得到最有效的收獲。
作為新時代的青年教師的我們,更應(yīng)該不斷的學(xué)習(xí)充電。通過這個專題的學(xué)習(xí),我不由得對自己肅然起敬,對現(xiàn)代信息技術(shù)的好處深有體會.。原來學(xué)習(xí)真的很重要!在學(xué)習(xí)的過程中會遇到很多困難,但只要不斷地實踐,掌握電腦技巧,就會覺得這些并不難相信做出的文件會越來越好,越來越實用。
第四篇:視頻會議中的各種音頻技術(shù)
視頻系統(tǒng)術(shù)語---音頻技術(shù)
音頻技術(shù)
視頻通訊過程是視頻和音頻的實時雙向完整通訊過程。在這個過程中我們?yōu)榱双@得高清晰視頻圖像,有時卻忽略了另外一個重要的過程——音頻通訊過程。如果我們在觀看高清晰視頻圖像的時候,不能得到一個更清晰、連續(xù)的音頻效果。那么這個過程實際上就沒有任何意義,所以其重要性甚至超過視頻。在傳統(tǒng)的視頻會議系統(tǒng)中音頻技術(shù)發(fā)展極其緩慢,原因在于目前應(yīng)用于視頻通訊的音頻編解碼壓縮標(biāo)準(zhǔn)都是為了保持傳輸時的低帶寬占用和較高的編解碼效率,從而將音頻信號的采樣頻率、采樣精度和采樣范圍指標(biāo)做了極大的降低,使得所能提供的音頻清晰度和還原性都有很大程度上的衰減。與用于存儲和回放非實時壓縮協(xié)議的標(biāo)準(zhǔn)(如OGG、MP3等)相比,音頻的保真度非常低。這樣就在某種程度上對現(xiàn)場聲音的還原達(dá)不到要求。目前傳統(tǒng)視頻通訊過程中主要采用的是G.711、G.722、G.721、G.728等音頻標(biāo)準(zhǔn),音頻寬度僅有50Hz-7KHz單聲道,而人耳所能感知的自然界的頻響能力可以達(dá)到20Hz-20KHz,因此,在對現(xiàn)場環(huán)境音的還原過程中過多的音頻信息的丟失造成了無法真實表現(xiàn)現(xiàn)場情況。所以在高清晰視頻通訊過程中我們勢必要有一種相輔助的音頻處理方式解決此問題。使整個高清晰通訊過程更去近于完美。
目前國際上對音頻處理技術(shù)上標(biāo)準(zhǔn)較多,在對下一代實時交互音頻處理上可以采用MPEG-1 Layer 2或AAC系列音頻,對選用標(biāo)準(zhǔn)的原則是,音頻頻響范圍要達(dá)到22KHz,這樣就幾乎可以覆蓋了人耳聽覺的全部范圍,甚至在高頻方面還有所超越,能夠使現(xiàn)場音頻得到真實自然的還原,并且在還原時可以采用雙聲道立體聲回放,使整個視頻通訊的聲音有更強(qiáng)的臨近感,達(dá)到CD級音質(zhì)。同時在對鏈路帶寬的適應(yīng)和編解碼效率上達(dá)到最佳。下面是各種音頻編碼標(biāo)準(zhǔn)的說明:
1G.711
類型:Audio
制定者:ITU-T
所需頻寬:64Kbps
特性:算法復(fù)雜度小,音質(zhì)一般
優(yōu)點(diǎn):算法復(fù)雜度低,壓縮比小(CD音質(zhì)>400kbps),編解碼延時最短(相對其它技術(shù))缺點(diǎn):占用的帶寬較高
備注:70年代CCITT公布的G.711 64kb/s脈沖編碼調(diào)制PCM。
2G.721
制定者:ITU-T
所需帶寬:32Kbps
音頻頻寬:3.4KHZ
特性:相對于PCMA和PCMU,其壓縮比較高,可以提供2:1的壓縮比。
優(yōu)點(diǎn):壓縮比大
缺點(diǎn):聲音質(zhì)量一般
備注:子帶ADPCM(SB-ADPCM)技術(shù)。G.721標(biāo)準(zhǔn)是一個代碼轉(zhuǎn)換系統(tǒng)。它使用ADPCM轉(zhuǎn)換技術(shù),實現(xiàn)64 kb/s A律或μ律PCM速率和32 kb/s速率之間的相互轉(zhuǎn)換。
3G.722
制定者:ITU-T
所需帶寬:64Kbps
音頻寬度:7KHZ
特性:G722能提供高保真的語音質(zhì)量
優(yōu)點(diǎn):音質(zhì)好
缺點(diǎn):帶寬要求高
備注:子帶ADPCM(SB-ADPCM)技術(shù)
4G.721
制定者:ITU-T
所需帶寬:32Kbps/24Kbps
音頻寬度:7KHZ
特性:可實現(xiàn)比G.722 編解碼器更低的比特率以及更大的壓縮。目標(biāo)是以大約一半的比特率實現(xiàn)G.722 大致相當(dāng)?shù)馁|(zhì)量。
優(yōu)點(diǎn):音質(zhì)好
缺點(diǎn):帶寬要求高
備注:目前大多用于電視會議系統(tǒng)。
5G.721附錄C
制定者:ITU-T
所需帶寬:48Kbps/32Kbps/4Kbps
音頻寬度:14KHZ
特性:采用自Polycom 的Siren?14 專利算法,與早先的寬頻帶音頻技術(shù)相比具有突破性的優(yōu)勢,提供了低時延的14 kHz 超寬頻帶音頻,而碼率不到MPEG4 AAC-LD 替代編解碼器的一半,同時要求的運(yùn)算能力僅為十分之一到二十分之一,這樣就留出了更多的處理器周期來提高視頻質(zhì)量或者運(yùn)行因特網(wǎng)應(yīng)用程序,并且移動設(shè)備上的電池續(xù)航時間也可延長。
優(yōu)點(diǎn):音質(zhì)更為清晰,幾乎可與CD 音質(zhì)媲美,在視頻會議等應(yīng)用中可以降低聽者的疲勞程度。缺點(diǎn):是Polycom的專利技術(shù)。
備注:目前大多用于電視會議系統(tǒng)
6G.723(低碼率語音編碼算法)
制定者:ITU-T
所需帶寬:5.3Kbps/6.3Kbps
音頻寬度:3.4KHZ
特性:語音質(zhì)量接近良,帶寬要求低,高效實現(xiàn),便于多路擴(kuò)展,可利用C5402片內(nèi)16kRAM實現(xiàn)53coder。達(dá)到ITU-TG723要求的語音質(zhì)量,性能穩(wěn)定??捎糜贗P電話語音信源編碼或高效語音壓縮存儲。優(yōu)點(diǎn):碼率低,帶寬要求較小。并達(dá)到ITU-TG723要求的語音質(zhì)量,性能穩(wěn)定。
缺點(diǎn):聲音質(zhì)量一般
備注:G.723語音編碼器是一種用于多媒體通信,編碼速率為5.3kbits/s和6.3kbit/s的雙碼率編碼方案。G.723標(biāo)準(zhǔn)是國際電信聯(lián)盟(ITU)制定的多媒體通信標(biāo)準(zhǔn)中的一個組成部分,可以應(yīng)用于IP電話等系統(tǒng)中。其中,5.3kbits/s碼率編碼器采用多脈沖最大似然量化技術(shù)(MP-MLQ),6.3kbits/s碼率編碼器采用代數(shù)碼激勵線性預(yù)測技術(shù)。
7G.723.1(雙速率語音編碼算法)
制定者:ITU-T
所需帶寬:5.3Kbps(29)
音頻寬度:3.4KHZ
特性:能夠?qū)σ魳泛推渌纛l信號進(jìn)行壓縮和解壓縮,但它對語音信號來說是最優(yōu)的。G.723.1采用了執(zhí)行不連續(xù)傳輸?shù)撵o音壓縮,這就意味著在靜音期間的比特流中加入了人為的噪聲。除了預(yù)留帶寬之外,這種技術(shù)使發(fā)信機(jī)的調(diào)制解調(diào)器保持連續(xù)工作,并且避免了載波信號的時通時斷。
優(yōu)點(diǎn):碼率低,帶寬要求較小。并達(dá)到ITU-TG723要求的語音質(zhì)量,性能穩(wěn)定,避免了載波信號的時通時斷。缺點(diǎn):語音質(zhì)量一般
備注:G.723.1算法是ITU-T建議的應(yīng)用于低速率多媒體服務(wù)中語音或其它音頻信號的壓縮算法,其目標(biāo)應(yīng)用系統(tǒng)包括H.323、H.324等多媒體通信系統(tǒng)。目前該算法已成為IP電話系統(tǒng)中的必選算法之一。
8G.728
制定者:ITU-T
所需帶寬:16Kbps/8Kbps
音頻寬度:3.4KHZ
特性:用于IP電話、衛(wèi)星通信、語音存儲等多個領(lǐng)域。G.728是一種低時延編碼器,但它比其它的編碼器都復(fù)雜,這是因為在編碼器中必須重復(fù)做50階LPC分析。G.728還采用了自適應(yīng)后置濾波器來提高其性能。優(yōu)點(diǎn):后向自適應(yīng),采用自適應(yīng)后置濾波器來提高其性能
缺點(diǎn):比其它的編碼器都復(fù)雜
備注:G.728 16kb/s短延時碼本激勵線性預(yù)測編碼(LD-CELP)。1996年ITU公布了G.728 8kb/s的CS-ACELP算法,可以用于IP電話、衛(wèi)星通信、語音存儲等多個領(lǐng)域。16 kbps G.728低時延碼激勵線性預(yù)測。G.728是低比特線性預(yù)測合成分析編碼器(G.729和G.723.1)和后向ADPCM編碼器的混合體。G.728是LD-CELP編碼器,它一次只處理5個樣點(diǎn)。對于低速率(56~128 kbps)的綜合業(yè)務(wù)數(shù)字網(wǎng)(ISDN)可視電話,G.728是一種建議采用的語音編碼器。由于其后向自適應(yīng)特性,因此G.728是一種低時延編碼器,但它比其它的編碼器都復(fù)雜,這是因為在編碼器中必須重復(fù)做50階LPC分析。G.728還采用了自適應(yīng)后置濾波器來提高其性能。
9G.729
制定者:ITU-T
所需帶寬:8Kbps
音頻寬度:3.4KHZ
特性:在良好的信道條件下要達(dá)到長話質(zhì)量,在有隨機(jī)比特誤碼、發(fā)生幀丟失和多次轉(zhuǎn)接等情況下要有很好的穩(wěn)健性等。這種語音壓縮算法可以應(yīng)用在很廣泛的領(lǐng)域中,包括IP電話、無線通信、數(shù)字衛(wèi)星系統(tǒng)和數(shù)字專用線路。
G.729算法采用“共軛結(jié)構(gòu)代數(shù)碼本激勵線性預(yù)測編碼方案”(CS-ACELP)算法。這種算法綜合了波形編碼和參數(shù)編碼的優(yōu)點(diǎn),以自適應(yīng)預(yù)測編碼技術(shù)為基礎(chǔ),采用了矢量量化、合成分析和感覺加權(quán)等技術(shù)。
G.729編碼器是為低時延應(yīng)用設(shè)計的,它的幀長只有10ms,處理時延也是10ms,再加上5ms的前視,這就使得G.729產(chǎn)生的點(diǎn)到點(diǎn)的時延為25ms,比特率為8 kbps。
優(yōu)點(diǎn):語音質(zhì)量良,應(yīng)用領(lǐng)域很廣泛,采用了矢量量化、合成分析和感覺加權(quán),提供了對幀丟失和分組丟失的隱藏處理機(jī)制。
缺點(diǎn):在處理隨機(jī)比特錯誤方面性能不好。
備注:國際電信聯(lián)盟(ITU-T)于1995年11月正式通過了G.729。ITU-T建議G.729也被稱作“共軛結(jié)構(gòu)代數(shù)碼本激勵線性預(yù)測編碼方案”(CS-ACELP),它是當(dāng)前較新的一種語音壓縮標(biāo)準(zhǔn)。G.729是由美國、法國、日本和加拿大的幾家著名國際電信實體聯(lián)合開發(fā)的。
10G.729A
制定者:ITU-T
所需帶寬:8Kbps(34.4)
音頻寬度:3.4KHZ
特性:復(fù)雜性較G.729低,性能較G.729差。
優(yōu)點(diǎn):語音質(zhì)量良,降低了計算的復(fù)雜度以便于實時實現(xiàn),提供了對幀丟失和分組丟失的隱藏處理機(jī)制 缺點(diǎn):性能較G.729差
備注:96年ITU-T又制定了G.729的簡化方案G.729A,主要降低了計算的復(fù)雜度以便于實時實現(xiàn),因此目前使用的都是G.729A。MPEG-1 audio layer 1
制定者:MPEG
所需帶寬:384kbps(壓縮4倍)
音頻寬度:
特性:編碼簡單,用于數(shù)字盒式錄音磁帶,2聲道,VCD中使用的音頻壓縮方案就是MPEG-1層Ⅰ。
優(yōu)點(diǎn):壓縮方式相對時域壓縮技術(shù)而言要復(fù)雜得多,同時編碼效率、聲音質(zhì)量也大幅提高,編碼延時相應(yīng)增加??梢赃_(dá)到“完全透明”的聲音質(zhì)量(EBU音質(zhì)標(biāo)準(zhǔn))
缺點(diǎn):頻寬要求較高
備注:MPEG-1聲音壓縮編碼是國際上第一個高保真聲音數(shù)據(jù)壓縮的國際標(biāo)準(zhǔn),它分為三個層次:--層1(Layer 1):編碼簡單,用于數(shù)字盒式錄音磁帶
--層2(Layer 2):算法復(fù)雜度中等,用于數(shù)字音頻廣播(DAB)和VCD等
--層3(Layer 3):編碼復(fù)雜,用于互聯(lián)網(wǎng)上的高質(zhì)量聲音的傳輸,如MP3音樂壓縮10倍
12MPEG-1 audio layer 2,即MP2
制定者:MPEG
所需帶寬:256~192kbps(壓縮6~8倍)
音頻寬度:
特性:算法復(fù)雜度中等,用于數(shù)字音頻廣播(DAB)和VCD等,2聲道,而MUSICAM由于其適當(dāng)?shù)膹?fù)雜程度和優(yōu)秀的聲音質(zhì)量,在數(shù)字演播室、DAB、DVB等數(shù)字節(jié)目的制作、交換、存儲、傳送中得到廣泛應(yīng)用。優(yōu)點(diǎn):壓縮方式相對時域壓縮技術(shù)而言要復(fù)雜得多,同時編碼效率、聲音質(zhì)量也大幅提高,編碼延時相應(yīng)增加??梢赃_(dá)到“完全透明”的聲音質(zhì)量(EBU音質(zhì)標(biāo)準(zhǔn))
缺點(diǎn):
備注:同MPEG-1 audio layer 1
13MPEG-1 audio layer 3(MP3)
制定者:MPEG
所需帶寬:128~112kbps(壓縮10~12倍)
音頻寬度:
特性:編碼復(fù)雜,用于互聯(lián)網(wǎng)上的高質(zhì)量聲音的傳輸,如MP3音樂壓縮10倍,2聲道。MP3是在綜合MUSICAM和ASPEC的優(yōu)點(diǎn)的基礎(chǔ)上提出的混合壓縮技術(shù),在當(dāng)時的技術(shù)條件下,MP3的復(fù)雜度顯得相對較高,編碼不利于實時,但由于MP3在低碼率條件下高水準(zhǔn)的聲音質(zhì)量,使得它成為軟解壓及網(wǎng)絡(luò)廣播的寵兒。
優(yōu)點(diǎn):壓縮比高,適合用于互聯(lián)網(wǎng)上的傳播
缺點(diǎn):MP3在128KBitrate及以下時,會出現(xiàn)明顯的高頻丟失
備注:同MPEG-1 audio layer 1
14MPEG-2 audio layer
制定者:MPEG
所需帶寬:與MPEG-1層1,層2,層3相同
音頻寬度:
特性:MPEG-2的聲音壓縮編碼采用與MPEG-1聲音相同的編譯碼器,層1, 層2和層3的結(jié)構(gòu)也相同,但它能支持5.1聲道和7.1聲道的環(huán)繞立體聲。
優(yōu)點(diǎn):支持5.1聲道和7.1聲道的環(huán)繞立體聲
缺點(diǎn):
備注:MPEG-2的聲音壓縮編碼采用與MPEG-1聲音相同的編譯碼器,層1, 層2和層3的結(jié)構(gòu)也相同,但它能支持5.1聲道和7.1聲道的環(huán)繞立體聲。
15AAC-LD(dvanced Audio Coding,先進(jìn)音頻編碼)
制定者:MPEG
所需帶寬:48-64 kbps
音頻寬度:22KHZ
特性:提供高質(zhì)量的低延時的音頻編碼標(biāo)準(zhǔn),以其20ms的算法延時提供更高的比特率和各種聲音信號的高質(zhì)量音頻。
缺點(diǎn):
備注:超寬帶編解碼器技術(shù)支持高達(dá)48KHz采樣率的語音傳輸,與傳統(tǒng)的窄帶與寬帶語音編解碼器相比大幅提高了音質(zhì)。該技術(shù)可提供接近CD音質(zhì)的音頻,數(shù)據(jù)速率高達(dá)48–64kbps,不僅提高了IP語音與視頻應(yīng)用的清晰度,而且支持電話音樂傳輸功能。高清語音通道支持更高的采樣率,配合音頻編解碼器的高保真音效,顯著豐富并擴(kuò)展了頻譜兩端的音質(zhì)范圍,有效改善了語音回響性能,提高了清晰度。
第五篇:數(shù)字媒體處理技術(shù)綜述及學(xué)習(xí)心得
數(shù)字媒體處理技術(shù)綜述及學(xué)習(xí)心得
1、引言
隨著Internet與數(shù)字媒體技術(shù)的飛速發(fā)展,信息安全問題日益突出,主要表現(xiàn)在數(shù)字媒體被非法復(fù)制、篡改、傳播與攻擊等。因此,數(shù)字媒體的版權(quán)保護(hù)與信息完整性保證已逐漸成為人們迫切需要解決的一個重要問題,數(shù)字水印技術(shù)就是在這種需求下迅速發(fā)展起來的。
數(shù)字水印是一類信息隱藏技術(shù),其基本思想是通過一定的算法將一些標(biāo)志性信息嵌入到公開信息中,以達(dá)到隱匿信息的目的。其在知識產(chǎn)權(quán)保護(hù)、保密通信與內(nèi)容鑒別等領(lǐng)域都具有廣泛的應(yīng)用價值。數(shù)字水印技術(shù)最初由Van Schyndel等人在1994年的ICIP會議上提出,他們針對灰度圖像提出了兩種向圖像最低有效位嵌入水印的算法。1996年在英國劍橋召開了信息隱藏領(lǐng)域的第一次學(xué)術(shù)研討會,標(biāo)志著信息隱藏作為一個新學(xué)科的誕生。十多年來,數(shù)字水印技術(shù)得到了長足的發(fā)展,在水印的嵌入和檢測方面,都取得了較多的成果。
目前,國際上劍橋大學(xué)、IBM研究中心、NEC美國研究所、麻省理工學(xué)院等都對數(shù)字水印進(jìn)行了深入的研究。國內(nèi)在數(shù)字水印方面的研究起步稍晚,但發(fā)展迅速。1999年12月召開了第一屆全國信息隱藏學(xué)術(shù)會議。2000年1月,由國家863計劃智能計算機(jī)專家組織展開了“數(shù)字水印技術(shù)學(xué)術(shù)研討會”,體現(xiàn)了我國對這一領(lǐng)域研究的高度重視。目前,國內(nèi)清華大學(xué)、北京大學(xué)、北京郵電大學(xué)、中科院自動化所、浙江大學(xué)、國防科技大學(xué)等都在該領(lǐng)域取得了不菲的成果。
2、數(shù)字水印的研究現(xiàn)狀 2.1文本水印
文本水印就是將代表著作人身份的信息(水?。┣度氲诫娮映霭嫖镏?,在產(chǎn)生版權(quán)糾紛時來驗證版權(quán)的歸屬。其主要分為三大類:基于文檔結(jié)構(gòu)的水印方法、基于自然語言處理技術(shù)的水印方法、基于傳統(tǒng)圖像的水印方法。基于文檔結(jié)構(gòu)的各種水印方法都只是提留在文本的表層,無法抵抗對于文本結(jié)構(gòu)和格式的攻擊,簡單的重新錄入攻擊就能使之失效,因此這些水印方法普遍存在魯棒性差的缺點(diǎn)。自然語言文本水印方法相對提高了抗攻擊的能力,但普遍存在容量不足的問題?;趥鹘y(tǒng)圖像的文本水印普遍存在魯棒性不高、操作復(fù)雜的缺點(diǎn)。2.2圖像水印
根據(jù)水印的實現(xiàn)過程,圖像水印算法可分為空域算法和變換域算法??沼蛩惴ㄊ峭ㄟ^直接改變原始圖像的像素值來嵌入水印,通常具有較快的速度,但魯棒性差,且水印容量也會受到限制;變換域算法是通過改變某些變換系數(shù)來嵌入水印,通常具有很好的魯棒性和不可見性。其實現(xiàn)一般是基于圖像變換,如DCT、DFT、DWT等。重點(diǎn)介紹一下變換域算法。2.2.1離散傅里葉變換(DFT)
該方法是利用圖像的DFT來嵌入信息。通信理論中調(diào)相信號的抗干擾能力比調(diào)幅信號的抗干擾能力強(qiáng),同樣在圖像中利用相位信息嵌入的水印也比用幅值信息嵌入的水印更穩(wěn)健。實驗表明該方法的抗壓縮能力比較弱。2.2.2離散余弦變換(DCT)
DCT能把空間域的圖像轉(zhuǎn)換到變換域上進(jìn)行研究,從而能很容易了解到圖像的各空間頻域成分,進(jìn)行相應(yīng)處理。基于DCT的水印方法與基于DFT的水印方法相比有較好的魯棒性,但是無法做到對圖像信號內(nèi)容的自適應(yīng),因此往往會造成對圖像特征的明顯損害,不可感知性不是最佳。2.2.3離散小波變換(DWT)
DWT是一種時間-頻率信號的多分辨率分析方法,在時頻兩域都具有表征信號局部特征的能力。實驗表明,與DFT、DCT變換相比較,基于DWT的水印算法的魯棒性最優(yōu),且與JPEG2000,MPEG4壓縮標(biāo)準(zhǔn)兼容,利用DWT產(chǎn)生的水印具有良好的視覺效果和抵抗多種攻擊的能力,且不可感知性最好。2.3音頻水印
音頻水印利用音頻文件的冗余信息和人耳聽覺系統(tǒng)的特點(diǎn)來嵌入水印,其可以保護(hù)聲音數(shù)字產(chǎn)品不被隨意復(fù)制和篡改,如CD唱片,廣播電臺的節(jié)目內(nèi)容等。有學(xué)者提出了音頻水印的三種基本方法:擴(kuò)頻嵌入方法、回聲隱藏方法和相位編碼方法。2.4視頻水印
視頻水印是通過對視頻載體的時間和空間冗余來嵌入水印,其既不影響視頻質(zhì)量,又能達(dá)到保護(hù)節(jié)目制作者的合法權(quán)益和控制數(shù)字產(chǎn)品的復(fù)制。視頻水印從算法要求上同圖像水印有許多相似之處,但視頻水印也有一些獨(dú)特之處,如能夠在壓縮和未壓縮的格式下實時完成水印的檢測,對MPEG壓縮、串謀攻擊、A/D和D/A轉(zhuǎn)換等都有較好的穩(wěn)健性。
3、數(shù)字水印算法
從水印嵌入方式的角度來看,數(shù)字水印算法主要分為兩大類:空間域水印算法和變換域水印算法。3.1基于空間域的水印算法
空間域的水印算法將水印信息直接嵌入在圖像的灰度值中,該算法大都是基于最不顯著位LSB(Least Significant Bit)方法。這種水印算法的特點(diǎn)是對水印的嵌入和提取簡單、快速,嵌入的水印信息量大,但由于它位于圖像的LSB上,穩(wěn)健性較差,容易受到有損壓縮、量比、有噪信道傳輸?shù)挠绊?。比較典型的空間域算法包括Schyndel算法和Patchwork算法等。Schyndel算法把一個密鑰輸入一個m序列發(fā)生器來產(chǎn)生水印信號,然后將該序列重新排列成二維水印信號,并按像素點(diǎn)逐一插入到原始圖像像素值的最低位。Patchwork算法處理對象為256個亮度級和線性量化的圖像且所有的亮度級的概率相等,圖像中的任一像素值與其余的像素值是不相關(guān)的。該算法首先隨機(jī)選取N對像素點(diǎn),然后通過增加像素對中一個點(diǎn)的亮度值,而相應(yīng)降低另一個點(diǎn)的亮度值的調(diào)整來隱藏信息。李旭東等人分析了現(xiàn)有的抗幾何攻擊算法的不足,并提出了一個新的抗幾何攻擊的圖像數(shù)字水印算法。該算法在水印嵌入時,先對原始圖像進(jìn)行分塊,然后對各個子塊圖像根據(jù)量化策略重復(fù)嵌入相應(yīng)的1bit水印信息;在水印提取時,先將含水印圖像進(jìn)行分塊,然后對從各個子塊圖像中提取出的水印信息根據(jù)多數(shù)原則判定相應(yīng)子塊圖像所含的1bit水印信息。3.2基于變換域的數(shù)字水印算法
基于變換域的水印算法是目前應(yīng)用最廣泛的方法,這種方法是將圖像變換到頻域中,然后通過改變某些頻域系數(shù)來嵌入水印。頻域中能量分布較集中,且圖像像素點(diǎn)間有一定的相關(guān)性,這有利于保證水印的不可見性,魯棒性好。常用的變換有:離散余弦變換(Discrete Cosine Transform,DCT)、離散傅立葉變換(Discrete Fourier Transform,DFT)、離散小波變換(Discrete Wavelet Transform,DWT)。Cox算法是典型的離散余弦變換水印算法,該算法首先計算圖像DCT系數(shù),然后選擇那些視覺重要部分的系數(shù)嵌入水印。文獻(xiàn)[6]首先把圖像分成8×8的不重疊像素塊,經(jīng)過分塊DCT變換后,得到由DCT系數(shù)組成的頻率塊,然后隨機(jī)選取一些頻率塊,將水印信號嵌入到由密鑰控制選擇的一些DCT系數(shù)中,其特點(diǎn)是數(shù)據(jù)改變幅度小,透明性好,但抵抗幾何變換等攻擊的能力弱。C.T.Hsu等人提出了基于可視化模型的算法,在8×8圖像塊的DCT系數(shù)中,選擇4×4個中頻系數(shù)組成小塊,通過比較相鄰兩個小中頻系數(shù)塊中相應(yīng)位置上系數(shù)的大小,進(jìn)行水印的嵌入,由于采用了可視化模型,提高了水印的不可見性。黃繼武等人利用人類視覺系統(tǒng)的照度掩蔽特性和紋理掩蔽特性,將空域中的圖像塊(8×8)分成三類,然后將不同強(qiáng)度的偽隨機(jī)序列的水印分量自適應(yīng)地嵌入到不同類圖像塊的DCT低頻系數(shù)中,實現(xiàn)水印的嵌入。肖俊等人將多級離散小波變換的“多級”思想引入到離散余弦變換中,并對多級離散余弦變換的特性進(jìn)行了分析,在此基礎(chǔ)上提出了一種基于多級離散余弦變換的數(shù)字水印算法,該算法從多級離散余弦變換系數(shù)中選擇適當(dāng)?shù)奈恢们度胨⌒畔?。離散傅立葉變換可以很好地表達(dá)圖像的構(gòu)造分布,其平移、放縮和旋轉(zhuǎn)特性常常被用來構(gòu)造幾何變換的魯棒水印。V Solachdis等人構(gòu)造了一個環(huán)帶狀對稱水印,水印信息為(1,-1),將其嵌入到DFT的中頻子帶中,可以抵抗壓縮、旋轉(zhuǎn)、剪裁等操作。J.J.K.O.Ruanaidh等人在水印算法中使用Mellin-Fourier變換,將水印嵌入在只與傅立葉變換的振幅有關(guān)的子空間中。Jce Ruanaidh等人提出了一種基于相位調(diào)制的水印算法。赫明釗等人提出一種基于分?jǐn)?shù)傅里葉變換和隨機(jī)相位編碼的光學(xué)加密數(shù)字水印技術(shù),該數(shù)字水印技術(shù)對于噪音疊加和常見的圖像處理操作具有較強(qiáng)的穩(wěn)健性。
小波變換是一種比較特殊的變換方式,它具有多分辨率分析的特點(diǎn),而小波基和小波變換級數(shù)的選擇更是給小波變換域數(shù)字水印算法的設(shè)計帶來了很大的靈活性和優(yōu)越性。Hsu和Lwu提出了多分辨率分析的水印算法,首先對水印和原始圖像同時進(jìn)行多分辨率分析,然后將水印在分辨率下的分析系數(shù)嵌入到具有相應(yīng)分辨率的圖像塊中,這樣,即使含水印的圖像質(zhì)量受到了攻擊,丟失了部分信息,較低分辨率的水印仍然保存在較低分辨率的圖像塊中,因此水印具有較高的穩(wěn)健性。X.G.Xia等人選用滿足正態(tài)分布的偽隨機(jī)序列做水印,在整幅小波分解生成的圖像中,用由高分辨率到低分辨率、同一分辨率下由高頻到低頻逐個子帶添加水印的方法進(jìn)行嵌入。這種水印算法的優(yōu)點(diǎn)是水印檢測按子帶分級擴(kuò)充水印序列進(jìn)行,在水印圖像質(zhì)量破壞不大的情況下,水印檢測可以在搜索少數(shù)幾個子帶后終止,提高了水印檢測的效率。H.M.Wang等人在上述方法的基礎(chǔ)上進(jìn)一步利用漸進(jìn)編碼的思想進(jìn)行水印的嵌入和檢測。首先通過一定的閾值選擇一個小波分解的重要子帶,在子帶中從處于高位平面的系數(shù)到處于低位平面的系數(shù)上,添加水印直到所有水印點(diǎn)嵌入到圖像中,該算法給出了一種不使用原始圖像的盲檢測方案。Lu Jiang和ZhangRan采用基于2維離散小波變換的數(shù)字水印方法,可以在不影響圖像視覺效果的情況下,將水印信息嵌入到高通小波系數(shù)中,可以在一定程度上抵制壓縮攻擊和幾何攻擊。3.3基于融合的數(shù)字水印算法
圖像融合主要有兩種方式。一種是將兩幅圖像按照某種方式疊加生成一個新的圖像,使新圖像中包含兩個圖像的信息。采用較好的融合算法能保證恢復(fù)時無需原始公開圖像。另一種是利用數(shù)字圖像的自相關(guān)性,通過放大原始公開圖像來隱藏與公開圖像同樣大小的數(shù)字圖像。此方法對于彩色圖像的隱藏比較實用,尤其適用于BMP彩色圖像的加密隱藏,而且對所要隱藏的圖像進(jìn)行置亂處理后,安全性更高。
除了以上數(shù)字水印算法外,還有其他一些算法,比如分形水印、基于特征的水印算法等。
4、數(shù)字水印的應(yīng)用領(lǐng)域 4.1 版權(quán)保護(hù)
版權(quán)保護(hù)是數(shù)字水印的最主要應(yīng)用領(lǐng)域,其思想是數(shù)字作品的所有者通過密鑰產(chǎn)生水印,利用一定的嵌入方法,將水印嵌入原始數(shù)據(jù)(圖像、聲音、視頻等),然后公開發(fā)布嵌入水印的作品。當(dāng)該作品被盜版或出現(xiàn)版權(quán)糾紛時,所有者可利用水印提取、檢測、驗證等方法,使嵌入的水印成為鑒定、起訴非法侵權(quán)的證據(jù),從而保護(hù)所有者的權(quán)益。4.2 來源追蹤
為避免未經(jīng)授權(quán)的拷貝和發(fā)行,出品人可以將不同用戶的ID或序列號作為不同的水印(數(shù)字指紋)嵌入作品的合法拷貝中。如果發(fā)現(xiàn)未經(jīng)授權(quán)的拷貝,就可以根據(jù)此拷貝所恢復(fù)出的水印(數(shù)字指紋)來確定它的來源。4.3 信息標(biāo)注
數(shù)字作品具有很多屬性信息,如作品的標(biāo)題、創(chuàng)作者等,利用數(shù)字水印技術(shù)將這些信息嵌入到作品中,不但不需要額外的帶寬和存儲,而且不易丟失。另外,國防和情報部門還可以利用數(shù)字水印技術(shù)實現(xiàn)隱蔽通信。4.4 訪問控制
利用數(shù)字水印技術(shù)可以將訪問控制信息嵌入到媒體中,在使用媒體之前通過檢測嵌入到其中的訪問控制信息,以達(dá)到訪問控制的目的,它要求水印具有很高的魯棒性。DVD防拷貝系統(tǒng)是訪問控制的一個典型的應(yīng)用例子,它將數(shù)字水印信息加入DVD數(shù)據(jù)中,并在DVD播放機(jī)中增加驗證模塊,使用DVD播放機(jī)之前,可以事先檢測DVD數(shù)據(jù)中的水印信息來判斷其合法性和可拷貝性,從而保護(hù)制造商的商業(yè)利益。還可以通過計算使用次數(shù)和復(fù)制次數(shù)進(jìn)行控制,防止用戶無限制地復(fù)制使用。
4.5 認(rèn)證和完整性校驗
認(rèn)證和完整性校驗是為防止數(shù)據(jù)被非法篡改或偽造。通常采用脆弱水印,用惟一的與數(shù)據(jù)內(nèi)容相關(guān)的密鑰生成并嵌入水印。對嵌入水印的數(shù)字進(jìn)行檢驗時,再利用與數(shù)據(jù)內(nèi)容相關(guān)的密鑰提取出水印,然后通過檢驗提取出的水印完整性來檢驗作品的完整性。其優(yōu)點(diǎn)在于認(rèn)證同內(nèi)容密不可分,簡化了處理過程。