欧美色欧美亚洲高清在线观看,国产特黄特色a级在线视频,国产一区视频一区欧美,亚洲成a 人在线观看中文

  1. <ul id="fwlom"></ul>

    <object id="fwlom"></object>

    <span id="fwlom"></span><dfn id="fwlom"></dfn>

      <object id="fwlom"></object>

      第三代移動通信變速率語音編解碼AMR-WB 算法優(yōu)化概要[精選合集]

      時間:2019-05-13 16:58:44下載本文作者:會員上傳
      簡介:寫寫幫文庫小編為你整理了多篇相關(guān)的《第三代移動通信變速率語音編解碼AMR-WB 算法優(yōu)化概要》,但愿對你工作學(xué)習(xí)有幫助,當(dāng)然你在寫寫幫文庫還可以找到更多《第三代移動通信變速率語音編解碼AMR-WB 算法優(yōu)化概要》。

      第一篇:第三代移動通信變速率語音編解碼AMR-WB 算法優(yōu)化概要

      基金頒發(fā)部門:廣西科技廳 項目名稱:變速率語音編碼技術(shù)應(yīng)用研究 編號:0640167 基金申請人:黃冰

      第三代移動通信中的變速率語音編解碼 AMR-WB+算法優(yōu)化 李平安,黃冰,王濤,梁小朋

      (桂林電子科技大學(xué) 信息與通信學(xué)院,廣西桂林 541004 摘要:首先簡要介紹了 AMR-WB+語音壓縮算法的基本原理,描述了 AMR-WB+編解碼流 程;然后通過兩類優(yōu)化策略對 AMR-WB+算法進(jìn)行優(yōu)化;最后給出了優(yōu)化前后編解碼復(fù)雜度 比較,并對結(jié)果進(jìn)行了分析。

      關(guān)鍵詞:AMR-WB+;編解碼;算法優(yōu)化;復(fù)雜度 中圖分類號:TP393 文獻(xiàn)標(biāo)識碼:A The research and Optimization of variable-rate speech coding algorithm AMR-WB+ in the Third-generation mobile communications Li Ping an,Huang Bing,Wang Tao,Liang Xiao peng(Information & Communication College, Guilin University of electronic technology,Guangxi Guilin 541004,China Abstract :First,this paper briefly introduced to the basic principles about the algorithms of AMR-WB+,and described in the AMR-WB+ encoder/decoder processes.Then,the algorithms of AMR-WB+ was optimized by the two optimization strategies.Finally,the encoder/decoder complexity was compared, which was between before and after the optimization, and analyzed the results.Key words:AMR-WB+;encoder/decoder;algorithms optimization;complexity

      1.引言

      人們對通信的消費需求不再局限于傳統(tǒng)的話音業(yè)務(wù), 音樂、圖像以及視頻等其他多媒體 信息的介入使得移動通信的任務(wù)從單一的話音服務(wù)轉(zhuǎn)向更多元化、更豐富的信息媒體流服 務(wù), 3G 及以后的通信系統(tǒng)所要承載的速率會越來越大。因此,在所要處理的信息不再是純 粹的語音信號, 而系統(tǒng)容量和編碼質(zhì)量的矛盾依然存在時, 為了達(dá)到一個較好的折衷, 仍然 可以在進(jìn)行音頻編碼或圖像編碼時引入自適應(yīng)變速率的思想, 特別是將語音編碼和音樂編碼 相結(jié)合,這已經(jīng)在 3GPP 的 TS26.290標(biāo)準(zhǔn)即 AMR-WB+編碼器中得到體現(xiàn)。

      2.增強自適應(yīng)多速率寬帶 AMR-WB+的基本原理 [1] AMR-WB+包含了 AMR-WB 的所有模式,并增加了 TCX 模塊、帶寬擴展和立體聲編碼。AMR-WB+聲碼器的輸入幀有 2048個樣點,內(nèi)部采樣率 Fs 的范圍為 12800-38400Hz ,輸入幀 依低頻(LF 帶和高頻(HF 帶被分為 2個 1024個樣點的超級幀,每個超級幀又被分為 4個 256個樣點的子幀。

      2.1 AMR-WB+編碼流程

      AMR-WB+的輸入信號既可以是單聲道也可以是立體聲信號。首先信號經(jīng)過高通濾波和 分析濾波器組等預(yù)處理,被分解成高頻和低頻兩個子帶,各自保持 Fs/2的采樣率;此后兩 個子帶被分別用兩種不同方法處理, 低頻(LF 部分利用基于 ACELP/TCX[2]的核心編碼器, 高頻(HF 部分則經(jīng)過比特消耗相對較小的帶寬擴展(BWE 方法進(jìn)行處理。當(dāng)輸入為立 體聲信號時, 左右聲道信號首先被合并為一路單聲道, 并利用核心編碼器處理, 然后右聲道 信號和合并信號被用來構(gòu)建立體聲差信號, 這個差信號被輸入到立體聲編碼器進(jìn)行處理。需 要傳輸給解碼器的參數(shù)包括模式選擇比特、LF 的編碼參數(shù)、HF 的編碼參數(shù)、立體聲參數(shù)等。每一個超幀的參數(shù)被分解成 4個等尺寸的包存儲和傳輸。

      2.2混合的 ACELP/TCX的核心編碼器

      AMR-WB+編碼算法的核心部分是基于 ACELP/TCX的混合編碼模型。對于每一塊輸入 信號,編碼器可以按照用戶對復(fù)雜度要求的不同而選擇 ACELP 和 TCX 兩種方式,從而來

      決定選取其中的哪一個編碼模型。通常來說, ACELP 是一種時域預(yù)測編碼,比較適合語音 和暫態(tài)信號;而 TCX 是變換域編碼,較適合典型的音樂信號。ACELP 的編碼幀長固定為 20ms(通常為 256 樣點;TCX 的幀長則有 256, 512, 1024三種情況,根據(jù)模式選擇的 結(jié)果來決定使用哪一種幀長, 短時幀適合變化較快的信號, 而長幀則適合較穩(wěn)定的輸入信號。時域信號的分幀按照模式選擇的結(jié)果來確定, ACELP 的幀間無重疊,每 256個樣點單獨處 理;而 TCX 則根據(jù)幀長選擇不同的重疊長度,分別為 32, 64, 128樣點。

      2.3 AMR-WB+解碼流程

      解碼過程基本就是編碼過程的逆。解碼器從比特流中抽取 ISP 參數(shù)、自適應(yīng)碼本和代數(shù) 碼本索引及增益, 兩者合成完整的激勵信號, 經(jīng)過增益調(diào)整等后處理過程后, 通過合成濾波 器就能獲得合成信號。對應(yīng)于編碼端的預(yù)加重和重采樣等操作, 在解碼端的合成信號還需要 進(jìn)行去加重和上采樣操作來獲得最終的重建信號。

      3.變速率語音編解碼 AMR-WB+算法優(yōu)化

      為了達(dá)到代碼最高的執(zhí)行速率,本文通過兩類優(yōu)化策略對 AMR-WB+算法進(jìn)行優(yōu)化

      3.1 算法級優(yōu)化

      首先要對源程序進(jìn)行耗時分析, 確定運算量比較集中的函數(shù), 然后分析這些函數(shù)的特點, 在保證合成語音質(zhì)量的前提下,減少運算量。針對 AMR-WB+算法,使用了幾種有效的算法 級優(yōu)化算法。

      3.1.1 LSP系數(shù)算法的優(yōu)化

      AMR-WB+算法的一個主要傳輸參數(shù)為 LSP(線譜對。比如在 LP(線性預(yù)測 到 ISP(阻 抗頻譜對的轉(zhuǎn)換計算中,首先 LP 系數(shù)轉(zhuǎn)變?yōu)?LSP 系數(shù),再對 LSP 系數(shù)在頻率域進(jìn)行表示和 量化,即轉(zhuǎn)換為 ISP 矢量。而 ISP 矢量的使用在 AMR-WB+中是相當(dāng)廣泛的。目前計算 LSP 的 方法有很多種,其中絕大多數(shù)方法復(fù)雜、計算量大。針對該問題,本文采用了一種計算 LSP 的新算法, 首先利用埃特金迭代法求高階非線性方程的一個實根, 再采用多項式綜合除法降 階,最后運用費拉里算法求解一元四次方程的根,即可得到 LSP 系數(shù)。理論與實驗分析結(jié)果 表明,該算法不僅計算精度高、而且運算量小 [3]。

      3.1.2 ISP系數(shù)量化的優(yōu)化

      在 ISP 系數(shù)的量化過程中,使用了預(yù)測式二級分裂矢量量化技術(shù)。該矢量量化技術(shù)首先 根據(jù)均方誤差最小原則將量化范圍縮到某一小區(qū)域內(nèi), 再進(jìn)一步提高搜索精度, 縮小搜索范 圍,直到找到最終結(jié)果。為了降低算法的復(fù)雜度,可以在滿足精度要求的前提下,粗化第一 級量化的搜索過程,從而減小總的搜索時間。

      3.1.3 LSF系數(shù)搜尋的優(yōu)化

      在 LP 轉(zhuǎn)換為 LSP 和 ISP 系數(shù)的量化中,均要用到 chbeyshve 多項式來搜尋 LSF(線譜頻。搜尋時,將(0, π區(qū)間平均分成了 100個小區(qū)間,然后在每個小區(qū)間進(jìn)行 4次搜尋。對其 進(jìn)行優(yōu)化,可以將(0, π平均分成 80個小區(qū)間,每個小區(qū)間只進(jìn)行 2次搜尋。這樣就大大 減少了運算量。

      3.1.4 開環(huán)基音預(yù)測分析優(yōu)化

      方法 1:在 AMR-WB+編碼器的基音周期估計中,采用的是自相關(guān)函數(shù)求解的方法?;?音搜索范圍從 17到 115。由于基音周期較小時,基音頻率較高,對語音信號編碼質(zhì)量影響較 大;基音周期較大時,基音頻率較低,對語音信號編碼質(zhì)量影響較小。所以從 17到 57之間基 音周期的采用逐點計算搜索;從 58到 115之間采用隔點計算,這樣可以減少運算量。計算公 式為: 1280((((, 17, 57wd wd n c d s n s n d w d d ==

      ?=???∑

      1280((2(2(, 58, 115wd wd n c d s n s n d w d d ==?=???∑

      方法 2:由于相關(guān)系數(shù)的求解對每個 d 均獨立, 且上述相關(guān)系數(shù)求解的目的是為了進(jìn)行比 較,求出最大值,最后再將最大值歸一化,因此,適當(dāng)降低累加次數(shù)對最終結(jié)果影響不大。實際應(yīng)用中可以將累加次數(shù)從 128次降到 64次,粗化后的表達(dá)式如下: 640((2(2(, 17, 115wd wd n c d s n s n d w d d ==?=???∑

      實驗證明,對實際的結(jié)果影響并不大,但其運算量減少了一半。3.2 語言級優(yōu)化

      C 語言是一種高級編程語言,效率高,移植性好,使用范圍廣, AMR-WB+算法一般用 C 語言編程實現(xiàn)。以下針對 AMR-WB+算法中部分耗時大的函數(shù)進(jìn)行了 C 語言級代碼優(yōu)化 [4]工作。

      3.2.1 關(guān)于溢出判斷的優(yōu)化

      在 AMR-WB+的定點 C 語言程序中,在所有運算之后都要檢驗結(jié)果是否溢出,因此,所 需執(zhí)行的溢出檢驗的次數(shù)十分巨大, 耗費了大量的運算量。而在實際的運算過程中, 并不是 所有的運算都存在溢出, 我們只需要在程序運行當(dāng)中確實有可能出現(xiàn)溢出的地方加入溢出保 護(hù)。實驗證明,通過去除不必要的溢出處理,程序的計算量明顯降低,通過了 3GPP 提供的 全部測試序列的檢驗,并且對大量的語音信號測試的結(jié)果也表明這種處理是成功的。

      3.2.2 用指針操作代替數(shù)組更新

      程序中有很多有限沖激響應(yīng)濾波器(FIR 運算,如果對其優(yōu)化可以起到很好的效果。下面以 10階 FIR 為例: 101:(((out in k in k FIR h n h n a h n k ==+?∑

      每次循環(huán), FIR 濾波器要用新的輸入值更新。源碼中是用數(shù)組的更新來實現(xiàn)的,以 FIR 濾波 器為例,用 10階數(shù)組 FirD1[10]存放濾波器的輸出,每計算一個就要將該數(shù)組的前 9個元素向 后移一位, FirD1[0]存入當(dāng)前輸入值, 共需要更新 9次。現(xiàn)在將數(shù)組 FirD1[10]加大到 FirD1[70], 設(shè)一個指針 *FirD指向該數(shù)組,初始位置指向 FirD1[60],用指針的向前滑動代替數(shù)組的右移 更新,這樣信號每通過一次濾波器就可以減少 60×9=540次數(shù)據(jù)搬移。

      在 AMR-WB+算法中,存在著大量的濾波、卷積算法,除此之外,也會遇到每循環(huán)一次 濾波器的數(shù)組的值就需要更新的問題,可采用同樣方法來解決。

      3.2.3 循環(huán)優(yōu)化

      循環(huán)優(yōu)化時, 需要遵循一般的優(yōu)化法則:內(nèi)部循環(huán)盡可能的簡潔, 有時可以將內(nèi)部循環(huán) 展開,避免轉(zhuǎn)移判斷語句等等。另外在有多分支語句 if-else 時,將出現(xiàn)頻率高的情況先于出 現(xiàn)頻率低的情況進(jìn)行判斷,可以節(jié)省大量的判斷指令的執(zhí)行時間。

      3.2.4 使用宏定義

      在 AMR-WB+的定點 C 語言程序中,所有基本運算與指令較少的函數(shù)都是以調(diào)用子函數(shù) 的形式執(zhí)行, 這樣雖然對程序的規(guī)范化設(shè)計有好處, 但在很大程度上降低了程序的執(zhí)行效率。這些函數(shù)由于調(diào)用非常頻繁,如果采用直接插入,會使程序比較繁瑣,可讀性降低,如果改 為使用宏定義,將會在不改變程序可讀性的基礎(chǔ)上,節(jié)省函數(shù)調(diào)用的開銷,加快運算速度。

      4.測試結(jié)果與性能分析

      本實驗在 WindowsXP 環(huán)境下進(jìn)行仿真測試, CPU 為奔騰 4 2.66GHz,內(nèi)存為 1G。本實驗 選用的語料來源于自建的音樂庫以及 3GPP-Audio 語料庫 [5],其中包含各種語境的聲音樣本, 具有廣泛的代表性。

      下圖是一段壓縮格式為 PCM ,采樣大小為 16位,采樣級別為 48000Hz 的語音音樂混合片 段, WA V 格式。從上到下分別是原音頻的波形,編碼后音頻的波形,以及優(yōu)化了的算法編 碼后音頻的波形。從波形可以看出, 經(jīng)編碼后的音頻和原音頻相比有一定延時, 但是優(yōu)化前 后的波形相比并沒有太大的差異,也就是說,音質(zhì)在優(yōu)化后質(zhì)量并沒有下降。

      最后,對算法的復(fù)雜度進(jìn)行比較,復(fù)雜度是通過軟件耗時計算出來的,我們采用了 WMOPS(Weighted Million Operations Per Second 即加權(quán)百萬操作每秒 的測算標(biāo)準(zhǔn)。具體數(shù) 據(jù)如表 1和表 2所示: 表 1優(yōu)化前后的編碼復(fù)雜度

      平均 WMOPS 最大 WMOPS 音頻

      優(yōu)化前 優(yōu)化后 優(yōu)化前 優(yōu)化后 14kbps 單聲道 18kbps 立體聲 24kbps 單聲道 24kbps 立體聲

      表 2優(yōu)化前后的解碼復(fù)雜度 5.結(jié)論

      本文從算法和語言兩個角度對 AMR-WB+算法進(jìn)行了優(yōu)化, 并對優(yōu)化前后的性能進(jìn)行了 比較。不論是客觀還是主觀測試,優(yōu)化后的算法在語音質(zhì)量上依然達(dá)到了原來的要求 , 但同 時在復(fù)雜度方面卻有大大降低,平均降低有百分之二十五左右,說明優(yōu)化是成功的。

      本文作者創(chuàng)新點:在增強自適應(yīng)多速率寬帶 AMR-WB+算法的基礎(chǔ)上, 采用了兩類優(yōu)化 策略對 AMR-WB+算法進(jìn)行優(yōu)化,并給出測試結(jié)果。

      參考文獻(xiàn)

      [1]3GPP TS 26.290 v6.3.0,Extended Adaptive Multi-Rate Wideband(AMR-WB+codec.Release 6,2005,36-37 [2] B.Bessette,R.Lefebvre and R.Salami.Universal speech/audio coding using hybrid ACELP/TCX techniques.[3] N.Ssugamura,F.Itakura.Speech data Compression by LSP Speech Analysis and Synthesis Technique[J].IEICE J64-A.1981,J64-A(8:599-606 [4] 王偉,李劍雄,周廣祿等.G.723.1語音壓縮算法的分析及 DSP 實現(xiàn) [J].微計算機信息, 2008, 4-3:160-162.[5] 3GPP TS 26.274 v7.0.0, Speech codec speech processing functions, Extended Adaptive Multi-Rate Wideband(AMR-WB+speech codec,Conformance testing.Release 7,2007.3.作者簡介: 李平安(1976-,男(漢族,貴州遵義人,桂林電子科技大學(xué)信號與信息處理研究生,主要 從事語音信號編碼。

      Biography: Li Ping An(1946-,male(the Han nationality,guizhou province,Postgraduate,Guilin University of electronic technology,Field of Research:speech signal coding.黃冰(1946-,男(漢族,江西樟樹人,桂林電子科技大學(xué)信號與信息處理教授、博士、導(dǎo) 師,主要研究方向:信號處理、計算機網(wǎng)絡(luò)。

      Huang Bing(1946-,male(the Han nationality,JiangXi province,doctor,professor, instructor,Guilin University of electronic technology,Field of Research:signal processing、Computer Network.王濤(1982-,男(漢族,河南周口人,桂林電子科技大學(xué)信號與信息處理研究生,主要從 事語音信號編碼。

      梁小朋(1983-,男(漢族,江西贛州人,桂林電子科技大學(xué)信號與信息處理研究生,主要 從事語音信號處理、光網(wǎng)絡(luò)安全。

      平均 WMOPS 最大 WMOPS 音頻 優(yōu)化前

      優(yōu)化后 優(yōu)化前 優(yōu)化后 14kbps 單聲道 8.415 11.693 8.792 18kbps 立體聲 24kbps 單聲道 24kbps 立體聲

      下載第三代移動通信變速率語音編解碼AMR-WB 算法優(yōu)化概要[精選合集]word格式文檔
      下載第三代移動通信變速率語音編解碼AMR-WB 算法優(yōu)化概要[精選合集].doc
      將本文檔下載到自己電腦,方便修改和收藏,請勿使用迅雷等下載。
      點此處下載文檔

      文檔為doc格式


      聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻(xiàn)自行上傳,本網(wǎng)站不擁有所有權(quán),未作人工編輯處理,也不承擔(dān)相關(guān)法律責(zé)任。如果您發(fā)現(xiàn)有涉嫌版權(quán)的內(nèi)容,歡迎發(fā)送郵件至:645879355@qq.com 進(jìn)行舉報,并提供相關(guān)證據(jù),工作人員會在5個工作日內(nèi)聯(lián)系你,一經(jīng)查實,本站將立刻刪除涉嫌侵權(quán)內(nèi)容。

      相關(guān)范文推薦