第一篇:語音信號(hào)處理及加密課程總結(jié)
《語音信號(hào)處理及加密》課程總結(jié)
本學(xué)期,我選修了《語音信號(hào)處理及加密》這門課。在本門課程的學(xué)習(xí)中,我系統(tǒng)地學(xué)習(xí)了現(xiàn)代語音編碼技術(shù)的基本概念和基本知識(shí),如什么是語音編碼、對(duì)語音編碼的要求、現(xiàn)代語音編碼技術(shù)的作用和意義、現(xiàn)代語音編碼系統(tǒng)的構(gòu)成、分類以及主要性能指標(biāo)等等,使我對(duì)現(xiàn)代語音編碼有了初步的概要的了解。最近的二十幾年來,隨著數(shù)字通信、計(jì)算機(jī)、信號(hào)處理、微電子等相關(guān)技術(shù)的發(fā)展和廣泛應(yīng)用,語音編碼技術(shù)發(fā)展非常迅速,取得了一系列突破性的成果,極大地促進(jìn)了數(shù)字通信的發(fā)展和普及,是現(xiàn)代通信以及信息技術(shù)的一個(gè)亮點(diǎn)。所謂的現(xiàn)代語音編碼技術(shù),主要就是指最近二十幾年發(fā)展起來并得到廣泛應(yīng)用的語音編碼技術(shù)。
一、為什么要學(xué)習(xí)語音編碼技術(shù)?
由于PCM的編碼速率過高,不適應(yīng)通信和信息技術(shù)發(fā)展的需要,為了壓縮編碼速率,減少傳輸占用的帶寬,人們一直在致力于研究開發(fā)新的語音編碼技術(shù)。這種強(qiáng)烈的客觀需求是推動(dòng)語音編碼技術(shù)發(fā)展的巨大動(dòng)力。另一方面,最近二十幾年來,隨著計(jì)算機(jī)、微電子、信號(hào)處理等相關(guān)技術(shù)的迅速發(fā)展和廣泛應(yīng)用,尤其是隨著數(shù)字信號(hào)處理算法和器件(DSP芯片)的飛速發(fā)展和應(yīng)用,為中、低速率語音編碼器的發(fā)展和應(yīng)用準(zhǔn)備了必要條件。正是在這種情況下,從20世紀(jì)80年代以來的二十幾年間,語音編碼技術(shù)進(jìn)入了一個(gè)飛速發(fā)展的時(shí)期。
現(xiàn)代語音編碼技術(shù)就是指20世紀(jì)80年代以來發(fā)展起來的新的語音編碼技術(shù),這些新的語音編碼技術(shù)的出現(xiàn),極大地推動(dòng)了通信和信息技術(shù)的發(fā)展,是現(xiàn)代通信發(fā)展史中的一個(gè)閃光點(diǎn)。
學(xué)習(xí)和掌握現(xiàn)代語音編碼技術(shù)的基礎(chǔ)知識(shí)、分析方法、關(guān)鍵技術(shù)和算法十分重要,只有了解和掌握這些已經(jīng)成熟或基本成熟的方法和技術(shù),才能很好地適應(yīng)現(xiàn)代通信和信息技術(shù)發(fā)展的需要,才能研究開發(fā)新的方案和算法,提出具有自主知識(shí)產(chǎn)權(quán)的技術(shù)方案。
二、我學(xué)到了什么?
語音編碼為信源編碼,就是對(duì)模擬的語音信號(hào)進(jìn)行編碼,將模擬信號(hào)轉(zhuǎn)化成數(shù)字信號(hào),從而降低傳輸碼率并使之可以在數(shù)字信道中傳輸。語音編碼的目的是在保持一定得算法復(fù)雜程度和通信時(shí)延的前提下,占用盡可能少的通信容量,傳送盡肯能高質(zhì)量的語音。
語音編碼按照傳統(tǒng)的分類方法通常分為三類:波形編碼、參數(shù)編碼和混合編碼。(一)波形編碼
波形編碼是將時(shí)間域或頻率域或變換域信號(hào)直接編碼為數(shù)字信號(hào),力求使重建語音波形保持原始語音信號(hào)的波形形狀。波形編碼具有語音質(zhì)量好、抗噪聲性能強(qiáng)等優(yōu)點(diǎn)。其缺點(diǎn)是所需用的編碼速率高,一般在64~16Kb/s之間。波形編碼是應(yīng)用最早、人們最熟悉的語音編碼技術(shù)。波形編碼通常包括時(shí)域波形編碼、頻域波形編碼和變換域波形編碼三種類型。在課程學(xué)習(xí)中,我對(duì)這三種編碼技術(shù)有了初步的了解。1)時(shí)域波形編碼
課程中介紹了幾種常用的時(shí)域波形編碼,即脈沖編碼調(diào)制(PCM)、增量調(diào)制(DM或?M)、差分脈沖調(diào)制(DPCM)和自適應(yīng)差分脈沖調(diào)制(ADPCM)。PCM是應(yīng)用最早和最廣泛的語音編碼技術(shù),在很長(zhǎng)一段時(shí)間內(nèi),它一直在語音編碼中占據(jù)統(tǒng)治地位,對(duì)于通信的數(shù)字化起到過極為重要的推動(dòng)作用。近年來語音編碼技術(shù)取得一系列突破性進(jìn)展,出現(xiàn)了許多嶄新的編碼算法和技術(shù),已經(jīng)動(dòng)搖了PCM的統(tǒng)治地位,但在通信和信息系統(tǒng)中,PCM的應(yīng)用依然相當(dāng)普遍。其工作原理是:在譯碼端,輸入模擬信號(hào)經(jīng)過取樣、量化和編碼,實(shí)現(xiàn)模/數(shù)轉(zhuǎn)換,變換成為數(shù)字信號(hào);到了譯碼端,再將接收到的數(shù)字信號(hào)通過譯碼、低通平滑濾波實(shí)現(xiàn)數(shù)/模轉(zhuǎn)換,恢復(fù)為模擬信號(hào)。
DPCM是對(duì)相鄰樣值之間的差值進(jìn)行編碼,而不是對(duì)取樣值本身進(jìn)行編碼,這樣就能夠降低編碼速率。由于它是對(duì)預(yù)測(cè)誤差信號(hào)進(jìn)行編碼,而預(yù)測(cè)誤差信號(hào)的能量比輸入信號(hào)的能量小得多,因此量化限幅電平也可以小得多。這樣,在量化電平數(shù)不變的條件下,量化器的量化間隔就比輸入信號(hào)的量化間隔小得多,使得量化噪聲減少。而在保持信噪比不變的情況下,DPCM就可以通過減少量化比特?cái)?shù),降低編碼速率。
ADPCM是采用自適應(yīng)量化及高階自適應(yīng)預(yù)測(cè)技術(shù)的DPCM。自適應(yīng)線性預(yù)測(cè)以幀為單位進(jìn)行,根據(jù)本幀語音波形的時(shí)間相關(guān)性確定預(yù)測(cè)系數(shù),使得預(yù)測(cè)誤差信號(hào)的方差最小。
DM是DPCM的一種特殊形式。當(dāng)系統(tǒng)的取樣品率大于Nyquist頻率許多倍時(shí),相鄰取樣值之間的相關(guān)性很強(qiáng),差分信號(hào)的幅度值會(huì)在一個(gè)很小的范圍內(nèi)變化,于是就可以用正負(fù)兩個(gè)固定的電平來表示差分信號(hào)。因此,在DM中僅用1bit即可對(duì)差分信號(hào)進(jìn)行量化,也就是只需指示出極性即可。2)子帶編碼
子帶編碼是一種應(yīng)用比較廣泛的語音編碼技術(shù),也是一種典型的頻域波形編碼技術(shù)。它利用帶通濾波器(BPF)組首先將輸入信號(hào)分割成若干個(gè)不同的小的頻帶(稱為子帶),通過等效于單邊帶調(diào)幅的調(diào)制過程,將各子帶搬移到零頻率附近,形成低通信號(hào)后,再以Nyquist速率對(duì)各子帶輸出取樣,并對(duì)這些取樣值分別進(jìn)行通常的數(shù)字編碼。在接收端,將各子帶編碼信號(hào)進(jìn)行譯碼,并重新調(diào)制回原始位置,再將所有子帶輸出相加,恢復(fù)出原始信號(hào)。把語音信號(hào)分成若干子帶進(jìn)行編碼主要有三個(gè)優(yōu)點(diǎn)。首先,如果對(duì)不同的子帶合理的分配比特?cái)?shù),就可能分別控制各子帶的量化電平數(shù)目以及相應(yīng)的重建信號(hào)的量化誤差方差值,使誤碼率更精確地與各子帶的信源統(tǒng)計(jì)特性相匹配。其次,通過調(diào)整不同子帶的比特分配數(shù)值,可以控制總的重建誤差頻譜形狀,使誤差譜的形狀適應(yīng)人耳聽覺特性,獲得更好的主觀聽音質(zhì)量。第三,子帶編碼的另一個(gè)優(yōu)點(diǎn)是各子帶內(nèi)的量化噪聲相互獨(dú)立,被束縛在自己的子帶內(nèi),這樣就能避免輸入電平較低的子帶信號(hào)被其他子帶的量化噪聲所淹沒。這種情況在非子帶編碼中就會(huì)發(fā)生,除非專門采用噪聲譜形形成等技術(shù)來控制。3)變換域編碼。
變換域編碼又稱為變換域波形編碼,是語音編碼中經(jīng)常使用的編碼方式之一,尤其是在寬頻帶高音質(zhì)聲頻編碼中,變換編碼應(yīng)用更為廣泛。
變換域編碼是將通常在時(shí)域描寫的語音信號(hào)變換到另外一些變換域中描寫(這些變換通常采用正交變換),然后再對(duì)變換后的信號(hào)進(jìn)行量化和編碼。在接收端,首先對(duì)通過信道傳輸?shù)慕邮招盘?hào)進(jìn)行譯碼,然后進(jìn)行反變換以恢復(fù)出原始輸入的語音信號(hào)。在文獻(xiàn)資料中經(jīng)常介紹并在實(shí)際中獲得廣泛應(yīng)用的集中主要正交變換是:K-L變換(K-LT或KLT)、W-H變換(W-HT或WHT)、Haar變換(HT)、斜變換(ST)、離散余弦變換(DCT)和離散傅里葉變換(DFT)。(二)參數(shù)編碼
參數(shù)編碼又稱為聲源編碼或聲碼器,有時(shí)又成為分析-綜合編碼,它是將信源信號(hào)在頻域或其他變換與提取特征參數(shù),然后對(duì)這些特征參數(shù)進(jìn)行編碼或傳輸;在譯碼端再將收到的數(shù)字信號(hào)譯成特征參數(shù),根據(jù)這些特征參數(shù)重建語音信號(hào)。參數(shù)編碼是通過對(duì)語音信號(hào)特征參數(shù)的提取和編碼,力求使重建語音信號(hào)具有盡可能高的可懂度,即保持原語音信號(hào)的語意,但重建語音信號(hào)的波形語言語音信號(hào)波形卻相差甚遠(yuǎn)。參數(shù)編碼的有點(diǎn)是可實(shí)現(xiàn)低速率語音編碼,其編碼速率可低至2.4kb/s以下。其缺點(diǎn)是語音質(zhì)量差,自然度較低,即使是熟人一般也定不出來講話的人是誰。此外,參數(shù)編碼的堅(jiān)韌性也不夠好。
參數(shù)編碼的基礎(chǔ)是語音的產(chǎn)生模型。根據(jù)這一模型對(duì)語音信號(hào)進(jìn)行分析,就可以得到語音的譜包絡(luò)、基音周期以及清濁音判決等參數(shù)。然后就可以對(duì)這些參數(shù)進(jìn)行編碼和傳輸。譯碼中所使用的聲道濾波器的形式,與編碼器中的譜包絡(luò)分析器的形式必須相對(duì)應(yīng),才能夠在同樣的語音產(chǎn)生模型基礎(chǔ)上合成出發(fā)送端的語音信號(hào)。(三)混合編碼
語音混合編碼是在采用線性預(yù)測(cè)編碼(LPC)技術(shù)的語音參數(shù)編碼的基礎(chǔ)上,通過采用許多改進(jìn)措施,使用合成分析法而形成的一種新的編碼技術(shù),是最近二十幾年來在語音編碼技術(shù)上的一種突破性進(jìn)展,收到人們的普遍重視,發(fā)展迅速,應(yīng)用廣泛。它克服了波形編碼和參數(shù)編碼的缺點(diǎn),吸收了它們的長(zhǎng)處,在16~4kb/s速率上能夠得到高質(zhì)量的合成語音。多脈沖激勵(lì)線性預(yù)測(cè)(MPE-LP)編碼、規(guī)則脈沖激勵(lì)線性預(yù)測(cè)(RPE-LP)編碼和碼激勵(lì)線性預(yù)測(cè)(CELP)編碼等都屬于混合編碼。
多脈沖激勵(lì)線性預(yù)測(cè)(MPE-LP)編碼是一種高音質(zhì)語音編碼算法,是第一個(gè)實(shí)用、有效的ABS-LPC類型的算法。在MPELPC中,不論是清音還是濁音,都用一幀中的有限多個(gè)脈沖經(jīng)過最優(yōu)化估值后作為激勵(lì)信號(hào)。
規(guī)則脈沖激勵(lì)線性預(yù)測(cè)(RPE-LP)編碼是在MPELPC的基礎(chǔ)上進(jìn)一步改進(jìn)而得到的。RPE-LTP編碼方案的特點(diǎn)是算法簡(jiǎn)單,語音質(zhì)量好,MOS分為4.0分。它是利用預(yù)測(cè)殘差、感覺加權(quán)濾波器的單位沖擊響應(yīng)、位置脈沖模式等信息通過解線性方程組求得激勵(lì)脈沖序列的,因此其算法較簡(jiǎn)單。
碼激勵(lì)線性預(yù)測(cè)(CELP)編碼是目前應(yīng)用最多的混合編碼技術(shù)。CELPC采用分幀技術(shù)進(jìn)行編碼,幀長(zhǎng)一般為20~30ms。CELPC基于合成分析(ABS)法的搜索過程、感覺加權(quán)、矢量量化(VQ)和線性預(yù)測(cè)(LP)技術(shù)。它用從碼書中搜索出來的最佳碼矢量,乘以最佳增益,代替線性預(yù)測(cè)的殘差信號(hào)(余量信號(hào))作為激勵(lì)信號(hào)源。CELPC通常將每一語音幀分為2~5個(gè)子幀,在每個(gè)子幀內(nèi)搜索最佳的碼矢量最為激勵(lì)信號(hào)。
三.學(xué)習(xí)體會(huì)
在現(xiàn)代通信中,隨著科學(xué)技術(shù)的迅速發(fā)展,圖像、數(shù)據(jù)等非話音信息在通信信息中所占的比例大大提高,而且這種提高的趨勢(shì)仍然會(huì)繼續(xù)下去。但是,到目前為止,在大多數(shù)通信系統(tǒng)中,傳輸醉倒的信息仍然是語音信號(hào)。在可以預(yù)見的未來的通信中,盡管語音信號(hào)在通信信息總量中所占的比例會(huì)有所下降,但仍然會(huì)是傳輸最多的信息。
語音編碼技術(shù)在數(shù)字通信中的作用至關(guān)重要,現(xiàn)代語音編碼技術(shù)已經(jīng)成為通信技術(shù)中一個(gè)相當(dāng)重要的學(xué)科,在各種通信網(wǎng)絡(luò)中都得到廣泛應(yīng)用。在學(xué)習(xí)了這門課程之后,我對(duì)語音編碼技術(shù)有了粗略的概念性的了解,并通過實(shí)驗(yàn)深入理解了語音編碼及處理的基本原理,更加深刻地認(rèn)識(shí)到語音編碼的作用與意義。只有學(xué)習(xí)和掌握現(xiàn)代語音編碼技術(shù),我們才能更好地向著“降低編碼速率,減少傳輸占用的帶寬”的目標(biāo)前進(jìn),推動(dòng)語音編碼技術(shù)的發(fā)展。
第二篇:DSP語音信號(hào)處理
摘
要
語音信號(hào)處理是研究數(shù)字信號(hào)處理技術(shù)和語音信號(hào)進(jìn)行處理的一門學(xué)科,是一門新型的學(xué)科,是在多門學(xué)科基礎(chǔ)上發(fā)展起來的綜合性技術(shù),它涉及到數(shù)字信號(hào)處理、模式識(shí)別、語言學(xué)。語音信號(hào)處理是研究用數(shù)字信號(hào)處理技術(shù)對(duì)語音信號(hào)處理的一門學(xué)科。處理的目的是要得到一些語音參數(shù)以便高效的傳輸或存儲(chǔ);或者是通過處理的某種運(yùn)算以達(dá)到某種用途的要求。語音信號(hào)處理又是一門邊緣學(xué)科。如上所訴,它是“語言語音學(xué)”與“數(shù)字信號(hào)處理”兩個(gè)學(xué)科相結(jié)合的產(chǎn)物。
語音信號(hào)處理屬于信息科學(xué)的一個(gè)重要分支,大規(guī)模集成技術(shù)的高度發(fā)展和計(jì)算機(jī)技術(shù)的飛速前進(jìn),推動(dòng)了這一技術(shù)的發(fā)展。在數(shù)字音頻技術(shù)和多媒體技術(shù)迅速發(fā)展的今天,傳統(tǒng)的磁帶語音錄放系統(tǒng)因體積大、使用不便、放音不清晰而受到了巨大挑戰(zhàn)。本次課程設(shè)計(jì)提出的體積小巧,功耗低的數(shù)字化語音存儲(chǔ)與回放系統(tǒng),可以有效的解決傳統(tǒng)的語音錄放系統(tǒng)在電子與信息處理的使用中受到的限制。
本文提出了語音信號(hào)處理課程建設(shè)的實(shí)驗(yàn)環(huán)節(jié)中的一些考慮,作為專業(yè)課程的學(xué)習(xí),實(shí)驗(yàn)內(nèi)容不能僅僅停留在驗(yàn)證性實(shí)驗(yàn)上,還應(yīng)增加實(shí)驗(yàn)延伸的設(shè)計(jì)要求,是學(xué)生加深對(duì)理論分析認(rèn)識(shí)的同時(shí),強(qiáng)調(diào)培養(yǎng)學(xué)生的實(shí)際動(dòng)手能力和知識(shí)綜合運(yùn)用能力。從而提高語音信號(hào)的教學(xué)和實(shí)驗(yàn)的質(zhì)量。實(shí)驗(yàn)內(nèi)容采用MATLAB編程實(shí)現(xiàn),不僅易于語音信號(hào)處理的實(shí)現(xiàn),更易引導(dǎo)學(xué)生完成實(shí)驗(yàn)延伸的設(shè)計(jì)。
第一章 緒論
1.1選題背景
在我們的現(xiàn)實(shí)生活中從磁帶、錄像帶到CD、VCD、DVD;從黑白電視機(jī)、彩色電視機(jī)、高清晰度電視機(jī)到具有數(shù)字信號(hào)處理功能的電視機(jī);從留聲機(jī)、錄音機(jī)到語音信箱;現(xiàn)在正出在模擬信息到數(shù)字信息的變革之中,傳統(tǒng)的磁帶語音錄放系統(tǒng)因其體積大,使用不便,在電子與信息處理的使用中受到許多限制。
雖然,目前廣播電視系統(tǒng)尚未實(shí)現(xiàn)真正的數(shù)字化,相信在不久的將來,真正的數(shù)字電視、數(shù)字收音機(jī)、數(shù)字收錄機(jī)將進(jìn)入家庭。所以,研究音頻信號(hào)的數(shù)字化存儲(chǔ)、處理和回放系統(tǒng)有著很重要的現(xiàn)實(shí)意義。
通過設(shè)計(jì)語音信號(hào)實(shí)驗(yàn)箱可以對(duì)語音信號(hào)實(shí)現(xiàn)各種形式的變換,因此學(xué)會(huì)對(duì)語音信號(hào)的處理,也可自行研究將此語音處理技術(shù)應(yīng)用到現(xiàn)實(shí)生活中。
1.2課題意義
語音信號(hào)處理的一門比較實(shí)用的電子工程的專業(yè)課程,語音是人類獲取信息的重要來源和利用信息的重要手段,通過語言相互傳遞信息是人類最重要的基本功能之一,語音是人類特有的功能,它是創(chuàng)造和記載幾千年來人類文明史的根本手段,是人類最重要、最有效、最常用和最方便的交換信息的形式。
語音信號(hào)處理是研究用數(shù)字信號(hào)處理技術(shù)對(duì)語音信號(hào)進(jìn)行處理的一門學(xué)科,它是一門新興的學(xué)科,同時(shí)又是綜合性的多學(xué)科領(lǐng)域剛也涉及面很廣的交叉學(xué)科。
第二章 課程設(shè)計(jì)要求及系統(tǒng)原理
2.1 課程設(shè)計(jì)基本要求
(1)學(xué)會(huì)MATLAB的使用,掌握MATLAB的程序設(shè)計(jì)方法;
(2)掌握在windows環(huán)境下語音信號(hào)的采集方法;
(3)掌握數(shù)字信號(hào)處理的基本概念,基本理論和基本方法;
(4)掌握MATLAB設(shè)計(jì)方法;
(5)學(xué)會(huì)用MATLAB對(duì)信號(hào)進(jìn)行分析和處理。
2.2 系統(tǒng)基本原理
語音采集原理是,人耳能聽到的聲音是一種范圍為20Hz—20kHz,而一般語音頻率最高為3.4kHz。語音的采集是指語音聲波信號(hào)經(jīng)麥克風(fēng)和高頻放大器轉(zhuǎn)換成有一定幅度的模擬量電信號(hào),然后再轉(zhuǎn)換成數(shù)字量的全過程。
本次設(shè)計(jì)的基本原理是對(duì)語音的錄音和放音進(jìn)行數(shù)字化控制。其中,關(guān)鍵技術(shù)在于:為了增加語音存儲(chǔ)時(shí)間,提高存儲(chǔ)器的利用率,采用了非失真壓縮算法對(duì)語音信號(hào)進(jìn)行壓縮后再存儲(chǔ),而在回放時(shí)再進(jìn)行解壓縮;同時(shí),對(duì)輸入語音信號(hào)進(jìn)行數(shù)字濾波以抑制雜音和干擾,從而確保了語音回放的可靠質(zhì)量。
通過設(shè)計(jì)一個(gè)GUI實(shí)驗(yàn)箱,并添加相應(yīng)的控制控件,添加一個(gè)聲音文件,通過MATLAB編程,使其通過各種按鈕實(shí)現(xiàn)語音信號(hào)處理的各種功能,最后做成一個(gè)完整的語音信號(hào)處理實(shí)驗(yàn)箱。
第三章 設(shè)計(jì)方案論證
3.1 設(shè)計(jì)理論依據(jù)
3.1.1采樣定理:
在進(jìn)行模擬/數(shù)字信號(hào)的轉(zhuǎn)換過程中,當(dāng)采樣頻率fs.max大于信號(hào)中最高頻率fmax的2倍時(shí),則采樣之后的數(shù)字信號(hào)完整的保留了原始信號(hào)中的信號(hào),一般實(shí)際應(yīng)用中保證采樣頻率為信號(hào)最高頻率的5—10倍;采樣定理又稱奈奎斯特定理。
3.1.2采樣頻率:
采樣頻率是指計(jì)算機(jī)每秒鐘采集多少個(gè)聲音樣本,是描述聲音文件的音質(zhì)、音調(diào)、衡量聲卡、聲音文件的質(zhì)量標(biāo)準(zhǔn)。采樣頻率越高,即采樣的間隔時(shí)間越短,則在單位時(shí)間內(nèi)計(jì)算機(jī)得到的聲音樣本數(shù)據(jù)就越多,對(duì)聲音波形的表示也就越精確,采樣頻率與聲音頻率之間有一定的關(guān)系,根據(jù)奈奎斯特理論,只有采樣頻率高于聲音信號(hào)最高頻率的2倍的時(shí)候,才能把數(shù)字信號(hào)表示的聲音還原成為原來的聲音,這就是說采樣頻率是衡量聲卡采集、記錄和還原聲音文件的質(zhì)量標(biāo)準(zhǔn)。
3.1.3采樣位數(shù)與采樣頻率
采樣位數(shù)即采樣值或取樣值,用來衡量聲音波動(dòng)變化的參數(shù),是指聲卡在采集和播放聲音文件時(shí)候使用數(shù)字聲音信號(hào)的二進(jìn)制為數(shù)。采樣頻率是指錄音設(shè)備在一秒鐘內(nèi)對(duì)聲音信號(hào)的采樣次數(shù),采樣頻率越高聲音的還原就越真實(shí)越自然。
采樣位數(shù)和采樣頻率對(duì)于音頻接口來說是最為重要的兩個(gè)基本指標(biāo),也是選擇音頻接口的兩個(gè)重要標(biāo)準(zhǔn)。無論采樣頻率如何,理論上來說采樣的位數(shù)決定了音頻數(shù)據(jù)最大的力度范圍。每增加一個(gè)采樣位數(shù)相當(dāng)于力度范圍增加了6dB。采樣位數(shù)越多則捕捉到的信號(hào)越精確。對(duì)于采樣率來說你可以想象它類似于一個(gè)照相機(jī)。顯然采樣率越高,計(jì)算機(jī)提取的聲音越多,對(duì)于原始的還原也越加精確。
第四章 圖形用戶界面設(shè)計(jì)
4.1 圖形用戶界面概念
圖形用戶界面或圖形用戶接口是指采用圖形方式顯示的計(jì)算機(jī)操作環(huán)境由用戶接口。與早期計(jì)算機(jī)使用的命令行界面相比,圖形界面對(duì)于用戶來說更為簡(jiǎn)便易用。
GUI是MATLAB提供的圖形用戶界面開發(fā)環(huán)境,提供了一系列用于創(chuàng)建圖形用戶界面的工具,從而簡(jiǎn)化界面布局和編程工作。
4.2用戶界面設(shè)計(jì)
4.2.1 GUI設(shè)計(jì)模板
在MATLAB主窗口中,選擇File菜單中的New菜單項(xiàng),再選擇其中的GUI命令,就會(huì)顯示圖形用戶界面的設(shè)計(jì)模板。
MATLAB為GUI設(shè)計(jì)一共準(zhǔn)備了四個(gè)模板,分別是Blank GUI、GUI with Uicontrols、GUI with Axes and Menu、Modal Question Dialog。
當(dāng)用戶選擇不同的模板時(shí),在GUI設(shè)計(jì)模板界面的右邊就會(huì)顯示出與該模板對(duì)應(yīng)的GUI圖形。
4.2.2 GUI設(shè)計(jì)窗口
在GUI設(shè)計(jì)模板中選中一個(gè)模板,然后單擊OK按鈕,就會(huì)顯示GUI設(shè)計(jì)窗口,選擇不同的GUI設(shè)計(jì)模式時(shí),在GUI設(shè)計(jì)窗口中顯示的結(jié)果是不一樣的。
GUI設(shè)計(jì)窗口由菜單欄、工具欄、空間工具欄以及圖形對(duì)象設(shè)計(jì)區(qū)等部分組成。GUI設(shè)計(jì)窗口的菜單欄有File、Edit、View、Layout、Tools和Help六個(gè)菜單項(xiàng),使用其中的命令可以完成圖形用戶界面的設(shè)計(jì)操作。
4.2.3 GUI設(shè)計(jì)窗口的基本操作
(1)前面板的設(shè)計(jì):在GUI設(shè)計(jì)窗口創(chuàng)建圖形對(duì)象后,通過雙擊該對(duì)象,就會(huì)顯示該對(duì)象的屬性編輯器。如下圖所示。例如,創(chuàng)建一個(gè)Push Button對(duì)象,并設(shè)計(jì)該對(duì)象的屬性值。
圖4-1 按鈕屬性編輯器
通過以上的按鈕屬性編輯器可以根據(jù)個(gè)人情況對(duì)按鈕的名稱、顏色、大小等方面的屬性進(jìn)行修改,使按鈕在視覺上變的更加完美。
(2)按鈕功能的實(shí)現(xiàn):在GUI設(shè)計(jì)窗口創(chuàng)建按鈕后,通過右鍵單擊按鈕,選擇View callbacks下的callback對(duì)相應(yīng)的按鈕進(jìn)行編程,使按鈕實(shí)現(xiàn)相應(yīng)的功能,如下圖所示對(duì)按鈕的響應(yīng)功能進(jìn)行設(shè)置。
圖4-2 按鈕功能編輯器
進(jìn)入到按鈕程序編輯窗口,通過編程即可實(shí)現(xiàn)按鈕的相應(yīng)功能,如下圖:
圖4-3 按鈕的編程實(shí)現(xiàn)界面
通過對(duì)各個(gè)按鈕控件的修改,和對(duì)m文件程序的添加就完成對(duì)GUI窗口的設(shè)計(jì),最后得到的圖形化操作界面如下圖所示:
圖4-4 圖形化操作界面
4.2.4 語音的錄入與打開
在MATLAB中,[y,fa,bits]=wavread(‘Blip’,[N1 N2]);用于讀取語音,7
采樣值放在向y中,fs表示采樣頻率,bits表示采樣位數(shù)。[N1 N2]表示讀取從N1點(diǎn)到N2點(diǎn)的值。
Suond(x,fs,bits);用于對(duì)聲音的回放,向量y則就代表了一個(gè)信號(hào)也就是說可以像處理一個(gè)信號(hào)表達(dá)式一樣處理這個(gè)聲音信號(hào)。
第五章 課程設(shè)計(jì)的軟件實(shí)現(xiàn)
5.1 部分函數(shù)語法格式
讀wav文件: x=wavread(‘filename’)數(shù)組a及b中元素相乘: a.*b 創(chuàng)建圖形窗口命令: figure 繪圖函數(shù): plot(x)坐標(biāo)軸: axis([xmin xmax ymin ymax])坐標(biāo)軸注解: xlabel(‘?’)ylabel(‘?’)圖例注解: legend(‘?’)一階高通濾波器: y=filter([1-0.09375],1,x)分幀函數(shù): f=enframe(x,len,inc)x為輸入語音信號(hào),len指定了幀長(zhǎng),inc指定幀移,函數(shù)返回為nXlen的一個(gè)矩陣,每一行都是一幀數(shù)據(jù)。
5.2語音信號(hào)處理的相關(guān)函數(shù)
5.2.1語音信號(hào)的短時(shí)譜:
周期性聲門波可表示為:
(5-1)其中,g[n]是聲門波的單周期的波形,p[n]是間隔為P的周期采樣序列。當(dāng)u[n]通過線性非時(shí)變聲道,且該聲道的單位沖擊響應(yīng)為h[n]時(shí),聲道輸出為:
(5-2)為了觀察一段語音,需要降生到輸出乘以一個(gè)一時(shí)刻τ 為中心的窗函數(shù) w[n,τ] ,即得到:
(5-3)
這段語音信號(hào)的頻域表達(dá)式為:
(5-4)
即語音信號(hào)的譜包絡(luò)為
語譜圖就是現(xiàn)實(shí)時(shí)變頻譜幅度特征的圖形表達(dá)式為:
(5-5)
將語音信號(hào)短時(shí)譜程序?qū)懭氲組ATLAB中得到單色語譜圖的波形如下:
圖5-1 語音信號(hào)單色語譜圖
5.2.2 自相關(guān)方法估計(jì)語音信號(hào)的聲道參數(shù):
由均方預(yù)測(cè)誤差最小的得到正則方程:
(5-6)
其中,(5-7)
在最佳解時(shí)的誤差為
(5-8)
在自相關(guān)法中式5-6,式5-8變?yōu)?/p>
(5-9)
(5-10)由式5-9和式5-10可列出方程組式5-11
(5-11)
解方程組式5-9求出線性預(yù)測(cè)系數(shù),通過誤差式5-11可求出增益G
(5-12)
加窗后信號(hào)頻譜圖如下:
圖5-2 加窗后信號(hào)頻譜圖
通過以上的方法,改變參數(shù)分別求得4極點(diǎn)模型頻率響應(yīng)和6極點(diǎn)模型頻率響應(yīng),6極點(diǎn)波形如下圖所示:
圖5-3 六極點(diǎn)波形圖
最后通過以上方法用一個(gè)函數(shù)分別實(shí)現(xiàn)以上三個(gè)功能,三個(gè)波形顯示在一個(gè)界面,通過觀察圖形,查看它們之間的分別。三者比較所得到的波形如下:
圖5-4 三者比較波形圖
5.2.3 基音周期檢測(cè)
數(shù)據(jù)為濁音語音信號(hào)speech1_10k(10000樣點(diǎn)/秒)用25ms的漢明窗對(duì)語音信號(hào)speech1_10k進(jìn)行加窗處理,并畫出所得到的加窗信號(hào)的自相關(guān)函數(shù),再用根據(jù)中心消波法及三電平中心消波法原理改進(jìn)程序,最后對(duì)比中方法基音檢測(cè)的效果并分析結(jié)果。
實(shí)驗(yàn)原理及方法
(1)自相關(guān)檢測(cè)原理:對(duì)于離散的數(shù)字語音信號(hào)序列x(n),如果周期N,則自相關(guān)函數(shù)也是同周期的周期函數(shù)。即:x(n)=x(n+N)。清音信號(hào)沒有周期性,他的自相關(guān)函數(shù)也沒有周期。濁音新海具有準(zhǔn)周期性。自相關(guān)基音檢測(cè)正是利用這一性質(zhì)對(duì)語音信號(hào)進(jìn)行基音檢測(cè)的。
(2)中心消波法檢測(cè)原理:中心消波處理是使用如下圖所示的中心消波函數(shù)進(jìn)行處理的:
圖5-5 中心消波檢測(cè)圖
(3)三電平消波法原理:為了減少自相關(guān)計(jì)算中的乘法運(yùn)算,可以把上述中心消波以后的信號(hào)y(n)的自相關(guān)用兩個(gè)信號(hào)的互相關(guān)代替,其中一個(gè)信號(hào)是y(n)另一個(gè)信號(hào)是對(duì)y(n)進(jìn)行三電平量化產(chǎn)生的結(jié)果。且這個(gè)信號(hào)有三種可能的取值,因而這里的互相關(guān)計(jì)算只需要做加減法,而這個(gè)互相關(guān)序列的周期性與y(n)的自相關(guān)序列是近似相同的。
三電平法對(duì)語音信號(hào)處理得到的波形如下:
圖5-6 三電平法波形圖
中心消波法得到的波形如下圖:
圖5-7 中心消波法波形圖
5.3 GUI實(shí)驗(yàn)箱操作界面設(shè)計(jì)
通過對(duì)各個(gè)控件的編程和對(duì)參數(shù)的設(shè)計(jì),最后得到的GUI實(shí)驗(yàn)箱操作界
面如下圖所示,通過界面上的各個(gè)按鈕即可實(shí)現(xiàn)相應(yīng)的功能。
圖5-8 GUI實(shí)驗(yàn)箱操作界面
第六章 心得體會(huì)
通過本次課程設(shè)計(jì)完成了對(duì)語音信號(hào)的讀取與打開,與課題的要求十分相符;初略的完成了界面的設(shè)計(jì),但也存在相當(dāng)?shù)牟蛔?,達(dá)到了打開語音文件,顯示已定波形。語音信號(hào)處理時(shí)語音學(xué)與數(shù)字信號(hào)處理技術(shù)相結(jié)合的交叉學(xué)科,將語音當(dāng)做一種特殊的信號(hào),即一種“復(fù)雜向量”來看待。也就是說,體現(xiàn)了數(shù)字信號(hào)處理技術(shù)。
本次課程設(shè)計(jì)時(shí)希望將數(shù)字信號(hào)處理技術(shù)應(yīng)用與某一實(shí)際領(lǐng)域,這里就是指對(duì)語音的處理。作為存儲(chǔ)與計(jì)算機(jī)中的語音信號(hào),其本身就是離散化了的向量,我們只需要將這些離散的量提取出來美酒可以對(duì)其進(jìn)行處理了。
本次課設(shè),用到了處理數(shù)字信號(hào)的強(qiáng)有力工具M(jìn)ATLAB,通過MATLAB李的幾個(gè)命令函數(shù)的調(diào)用,很輕易的在實(shí)際化語音與數(shù)字信號(hào)的理論之間搭了一座橋。
最后,還利用了MATLAB的另一強(qiáng)大功能——GUI界面設(shè)計(jì)。設(shè)計(jì)出了一個(gè)建議的用戶應(yīng)用界面,可以讓人實(shí)現(xiàn)界面操作。
通過本次課程設(shè)計(jì)讓我更加了解了語音信號(hào)處理在現(xiàn)實(shí)中的強(qiáng)大的應(yīng)用空間,同時(shí)查閱了很多相關(guān)的資料,應(yīng)用MTALAB軟件來完成,熟練掌握了MATLAB軟件,本次課程設(shè)計(jì)要求用GUI設(shè)計(jì)模塊,查閱了很多資料,更加深刻的陸奧了了這方面知識(shí)。
本次課程設(shè)計(jì),我明白了理論的學(xué)習(xí)需要在實(shí)踐中才能得到鞏固。在課程設(shè)計(jì)中,只有動(dòng)手慢慢研究,才能真正了解MATLAB軟件平臺(tái)中可以直接設(shè)計(jì)數(shù)字濾波器的各個(gè)函數(shù)的調(diào)用,對(duì)設(shè)計(jì)GUI實(shí)驗(yàn)箱的所有函數(shù)的運(yùn)用有了比較好的認(rèn)識(shí)。
通過這個(gè)課程設(shè)計(jì),我學(xué)到了很多MATLAB和語音信號(hào)的知識(shí),提高了自己在語音信號(hào)設(shè)計(jì)方面的知識(shí)能力,動(dòng)手能力和思維能力都得到了一定的提升,希望自己以后可以更多的繼續(xù)學(xué)習(xí)這一門課程設(shè)計(jì)方面的知識(shí)。
附 錄
1.源程序代碼:
參考文獻(xiàn)
[1] 劉慶華 陳紫強(qiáng)《基于MATLAB和DSP的語音信號(hào)處理課程的建設(shè)》 電氣電子教學(xué)學(xué)報(bào) 2006 10(3):124-128 [2] 張力 《MATLAB在語音信號(hào)處理輔助教學(xué)中的應(yīng)用》 電氣電子教學(xué)學(xué)報(bào) 2005 27卷2期:96-99 [3] 鄧立新 楊震《信息技術(shù)融入“語音信號(hào)處理”課程的教學(xué)實(shí)踐》電氣電子教學(xué)學(xué)報(bào) 2005 27卷5期:13-16 [4] 胡航,《語音信號(hào)處理》 哈爾濱工業(yè)大學(xué)出版社 2005年2月,第二版:135-137 [5] 張平,《MATLAB基礎(chǔ)與應(yīng)用》 北京航空航天大學(xué)出版社 2007,第二版:85-92 [6] 謝德芳 《數(shù)字信號(hào)處理》 北京科學(xué)出版社 2005,第一版
[7] 張雄偉 《現(xiàn)代語音處理技術(shù)及應(yīng)用》 機(jī)械工業(yè)出版社 2006,第二版 [8] 吳家安 《語音編碼技術(shù)及應(yīng)用》 機(jī)械工業(yè)出版社 2006 第一版 [9] 劉幺和 宋庭新 《語音識(shí)別與控制應(yīng)用技術(shù)》 科學(xué)出版社 2008 第二版
[10] 李昌立 吳善培 《數(shù)字語音編碼實(shí)用教程》 人民郵電出版社 2004 第一版
[11] 姚天仁 《數(shù)字語音處理》 華中科技大學(xué)出版社 1992 第二版 [12] 朱敏雄 《計(jì)算機(jī)語音技術(shù)(修訂版)》 北京航空航天大學(xué)出版社 2002 第一版
[13] 王炳錫 《語音編碼》 西安電子科技大學(xué)出版社 2002 第一版
第三篇:語音信號(hào)處理實(shí)驗(yàn)報(bào)告要求
實(shí)驗(yàn)一:
1.簡(jiǎn)述本次試驗(yàn)的目的,關(guān)于基音周期的理論;
2.使用相關(guān)法的同學(xué),給出程序的同時(shí)要說明所使用語音段的長(zhǎng)度(短時(shí)平穩(wěn)性),解釋怎樣在matlab中實(shí)現(xiàn)三電平削波(for...end循環(huán)和if elseif else end判決的使用)。給出清濁音兩組截取后的語音信號(hào)波形圖、三電平削波后的信號(hào)圖、自相關(guān)計(jì)算后的信號(hào)圖。然后根據(jù)自相關(guān)信號(hào)圖上最大峰值和次峰值之間的間隔點(diǎn)數(shù),計(jì)算出基音周期和基音頻率;
3.使用倒譜法的同學(xué),要解釋分幀后加窗的方法,給出清濁音其中各一幀的語音信號(hào)波形圖,和計(jì)算后的倒譜圖。并根據(jù)倒譜圖上對(duì)應(yīng)基音周期處的峰值的位置,給出基音周期。4.使用簡(jiǎn)化逆濾波的同學(xué),要說明切比雪夫2型低通濾波器的使用方法(cheby2、freqz兩個(gè)函數(shù)的使用方法、參數(shù)意義),給出低通濾波后的信號(hào)波形圖、5倍抽取后的波形圖、自相關(guān)計(jì)算后信號(hào)波形圖、5倍插值后的信號(hào)波形圖,根據(jù)濁音內(nèi)插后的信號(hào)圖上最大峰值和次峰值之間的間隔點(diǎn)數(shù)計(jì)算基音周期;5.比較所選用的兩種方法的結(jié)果。
實(shí)驗(yàn)二:
1.給出倒譜法的程序,解釋漢明窗寬度的選取要求(書上有簡(jiǎn)單解釋),解釋怎樣實(shí)現(xiàn)倒譜窗的matlab編程方法和倒譜窗寬度的選取(男女生有一定的差別),給出加窗后的信號(hào)波形圖、對(duì)數(shù)譜圖、倒譜圖、加窗后的信號(hào)頻譜圖,給出三個(gè)共振峰的估值。
2.給出LPC譜估計(jì)程序,不同LPC階數(shù)時(shí)的LPC譜圖,在n=?時(shí),學(xué)生自己估計(jì)的前三個(gè)共振峰的值。
實(shí)驗(yàn)三:
給出錄音的內(nèi)容,判斷結(jié)果。解釋端點(diǎn)檢測(cè)的原理、MFCC系數(shù)的說明和DTW算法的簡(jiǎn)單原理(參考書上都有比較詳細(xì)的解釋)。識(shí)別的結(jié)果的表格和識(shí)別的結(jié)果正確率(正確的數(shù)目,錯(cuò)誤的數(shù)目,正確率)。考慮一下識(shí)別錯(cuò)誤的原因(錄音的效果?端點(diǎn)檢測(cè)算法的可靠性?DTW算法的可靠性?等)
第四篇:DSP語音信號(hào)處理
目 錄
第一章 緒
論.........................................................................................................1
1.1課程設(shè)計(jì)的目的及意義..................................................................................1 1.2設(shè)計(jì)要求..........................................................................................................1 1.3 研究?jī)?nèi)容.........................................................................................................1
第二章 語音信號(hào)處理理論基礎(chǔ)........................................................................3
第三章
系統(tǒng)方案論證.....................................................................................5 第四章
GUI設(shè)計(jì)實(shí)現(xiàn).....................................................................................6
4.1 圖形用戶界面概念.........................................................................................6 4.2用戶界面設(shè)計(jì)..................................................................................................6
4.2.1 GUI設(shè)計(jì)模板........................................................................................6 4.2.2 GUI設(shè)計(jì)窗口........................................................................................6 4.2.3 GUI設(shè)計(jì)窗口的基本操作....................................................................6 4.2.4 語音的錄入與打開................................................................................9 4.3課程設(shè)計(jì)的軟件實(shí)現(xiàn)....................................................................................9
4.3.1語音信號(hào)的短時(shí)譜.................................................................................9 4.3.2 自相關(guān)方法估計(jì)語音信號(hào)的聲道參數(shù)..............................................10 4.3.3 基音周期檢測(cè)......................................................................................12 4.4 GUI實(shí)驗(yàn)箱操作界面設(shè)計(jì)............................................................................14 第五章 心得體會(huì)..................................................................................................15 參考文獻(xiàn)...................................................................................................................16
摘
要
語音信號(hào)處理是研究數(shù)字信號(hào)處理技術(shù)和語音信號(hào)進(jìn)行處理的一門學(xué)科,是一門新型的學(xué)科,是在多門學(xué)科基礎(chǔ)上發(fā)展起來的綜合性技術(shù),它涉及到數(shù)字信號(hào)處理、模式識(shí)別、語言學(xué)。語音信號(hào)處理是研究用數(shù)字信號(hào)處理技術(shù)對(duì)語音信號(hào)處理的一門學(xué)科。處理的目的是要得到一些語音參數(shù)以便高效的傳輸或存儲(chǔ);或者是通過處理的某種運(yùn)算以達(dá)到某種用途的要求。語音信號(hào)處理又是一門邊緣學(xué)科。如上所訴,它是“語言語音學(xué)”與“數(shù)字信號(hào)處理”兩個(gè)學(xué)科相結(jié)合的產(chǎn)物。
語音信號(hào)處理屬于信息科學(xué)的一個(gè)重要分支,大規(guī)模集成技術(shù)的高度發(fā)展和計(jì)算機(jī)技術(shù)的飛速前進(jìn),推動(dòng)了這一技術(shù)的發(fā)展。在數(shù)字音頻技術(shù)和多媒體技術(shù)迅速發(fā)展的今天,傳統(tǒng)的磁帶語音錄放系統(tǒng)因體積大、使用不便、放音不清晰而受到了巨大挑戰(zhàn)。本次課程設(shè)計(jì)提出的體積小巧,功耗低的數(shù)字化語音存儲(chǔ)與回放系統(tǒng),可以有效的解決傳統(tǒng)的語音錄放系統(tǒng)在電子與信息處理的使用中受到的限制。
本文提出了語音信號(hào)處理課程建設(shè)的實(shí)驗(yàn)環(huán)節(jié)中的一些考慮,作為專業(yè)課程的學(xué)習(xí),實(shí)驗(yàn)內(nèi)容不能僅僅停留在驗(yàn)證性實(shí)驗(yàn)上,還應(yīng)增加實(shí)驗(yàn)延伸的設(shè)計(jì)要求,是學(xué)生加深對(duì)理論分析認(rèn)識(shí)的同時(shí),強(qiáng)調(diào)培養(yǎng)學(xué)生的實(shí)際動(dòng)手能力和知識(shí)綜合運(yùn)用能力。從而提高語音信號(hào)的教學(xué)和實(shí)驗(yàn)的質(zhì)量。實(shí)驗(yàn)內(nèi)容采用MATLAB編程實(shí)現(xiàn),不僅易于語音信號(hào)處理的實(shí)現(xiàn),更易引導(dǎo)學(xué)生完成實(shí)驗(yàn)延伸的設(shè)計(jì)。
第一章 緒
論
1.1課程設(shè)計(jì)的目的及意義
在我們的現(xiàn)實(shí)生活中從磁帶、錄像帶到CD、VCD、DVD;從黑白電視機(jī)、彩色電視機(jī)、高清晰度電視機(jī)到具有數(shù)字信號(hào)處理功能的電視機(jī);從留聲機(jī)、錄音機(jī)到語音信箱;現(xiàn)在正出在模擬信息到數(shù)字信息的變革之中,傳統(tǒng)的磁帶語音錄放系統(tǒng)因其體積大,使用不便,在電子與信息處理的使用中受到許多限制。
雖然,目前廣播電視系統(tǒng)尚未實(shí)現(xiàn)真正的數(shù)字化,相信在不久的將來,真正的數(shù)字電視、數(shù)字收音機(jī)、數(shù)字收錄機(jī)將進(jìn)入家庭。所以,研究音頻信號(hào)的數(shù)字化存儲(chǔ)、處理和回放系統(tǒng)有著很重要的現(xiàn)實(shí)意義。
通過設(shè)計(jì)語音信號(hào)實(shí)驗(yàn)箱可以對(duì)語音信號(hào)實(shí)現(xiàn)各種形式的變換,因此學(xué)會(huì)對(duì)語音信號(hào)的處理,也可自行研究將此語音處理技術(shù)應(yīng)用到現(xiàn)實(shí)生活中。
語音信號(hào)處理的一門比較實(shí)用的電子工程的專業(yè)課程,語音是人類獲取信息的重要來源和利用信息的重要手段,通過語言相互傳遞信息是人類最重要的基本功能之一,語音是人類特有的功能,它是創(chuàng)造和記載幾千年來人類文明史的根本手段,是人類最重要、最有效、最常用和最方便的交換信息的形式。
語音信號(hào)處理是研究用數(shù)字信號(hào)處理技術(shù)對(duì)語音信號(hào)進(jìn)行處理的一門學(xué)科,它是一門新興的學(xué)科,同時(shí)又是綜合性的多學(xué)科領(lǐng)域剛也涉及面很廣的交叉學(xué)科。
1.2設(shè)計(jì)要求
(1)學(xué)會(huì)MATLAB的使用,掌握MATLAB的程序設(shè)計(jì)方法;(2)掌握在windows環(huán)境下語音信號(hào)的采集方法;(3)掌握數(shù)字信號(hào)處理的基本概念,基本理論和基本方法;(4)掌握MATLAB設(shè)計(jì)方法;
(5)學(xué)會(huì)用MATLAB對(duì)信號(hào)進(jìn)行分析和處理。
1.3 研究?jī)?nèi)容
1.理論依據(jù)
根據(jù)設(shè)計(jì)要求分析系統(tǒng)功能,掌握設(shè)計(jì)中所需理論(采樣頻率、采樣位數(shù)的
概念,采樣定理; 時(shí)域信號(hào)的FFT分析;數(shù)字濾波器設(shè)計(jì)原理和方法,各種不同類型濾波器的性能比較),闡明設(shè)計(jì)原理。2.信號(hào)采集
采集語音信號(hào),并對(duì)其進(jìn)行FFT頻譜分析,畫出信號(hào)的時(shí)域波形圖和頻譜圖。3.構(gòu)造受干擾信號(hào)并對(duì)其進(jìn)行FFT頻譜分析
對(duì)所采集的語音信號(hào)加入干擾噪聲,對(duì)語音信號(hào)進(jìn)行回放,感覺加噪前后聲音的變化,分析原因,得出結(jié)論。并對(duì)其進(jìn)行FFT頻譜分析,比較加噪前后語音信號(hào)的波形及頻譜,對(duì)所得結(jié)果進(jìn)行分析,闡明原因,得出結(jié)論。4.?dāng)?shù)字濾波器設(shè)計(jì)
根據(jù)待處理信號(hào)特點(diǎn),設(shè)計(jì)合適數(shù)字濾波器,繪制所設(shè)計(jì)濾波器的幅頻和相頻特性。5.信號(hào)處理
用所設(shè)計(jì)的濾波器對(duì)含噪語音信號(hào)進(jìn)行濾波。對(duì)濾波后的語音信號(hào)進(jìn)行FFT頻譜分析。畫出處理過程中所得各種波形及頻譜圖。
對(duì)語音信號(hào)進(jìn)行回放,感覺濾波前后聲音的變化。比較濾波前后語音信號(hào)的波形及頻譜,對(duì)所得結(jié)果和濾波器性能進(jìn)行頻譜分析,闡明原因,得出結(jié)論。6.設(shè)計(jì)圖形用戶界面
設(shè)計(jì)處理系統(tǒng)的用戶界面,在所設(shè)計(jì)的系統(tǒng)界面上可以選擇濾波器的參數(shù),顯示濾波器的頻率響應(yīng),選擇信號(hào)等。
第二章 語音信號(hào)處理理論基礎(chǔ)
語音采集原理是,人耳能聽到的聲音是一種范圍為20Hz—20kHz,而一般語音頻率最高為3.4kHz。語音的采集是指語音聲波信號(hào)經(jīng)麥克風(fēng)和高頻放大器轉(zhuǎn)換成有一定幅度的模擬量電信號(hào),然后再轉(zhuǎn)換成數(shù)字量的全過程。
本次設(shè)計(jì)的基本原理是對(duì)語音的錄音和放音進(jìn)行數(shù)字化控制。其中,關(guān)鍵技術(shù)在于:為了增加語音存儲(chǔ)時(shí)間,提高存儲(chǔ)器的利用率,采用了非失真壓縮算法對(duì)語音信號(hào)進(jìn)行壓縮后再存儲(chǔ),而在回放時(shí)再進(jìn)行解壓縮;同時(shí),對(duì)輸入語音信號(hào)進(jìn)行數(shù)字濾波以抑制雜音和干擾,從而確保了語音回放的可靠質(zhì)量。
通過設(shè)計(jì)一個(gè)GUI實(shí)驗(yàn)箱,并添加相應(yīng)的控制控件,添加一個(gè)聲音文件,通過MATLAB編程,使其通過各種按鈕實(shí)現(xiàn)語音信號(hào)處理的各種功能,最后做成一個(gè)完整的語音信號(hào)處理實(shí)驗(yàn)箱。
語音檢測(cè)算法是現(xiàn)在語音信號(hào)處理研究的一個(gè)熱點(diǎn)。近些年來,語音信號(hào)處理技術(shù)伴隨著人們對(duì)通訊技術(shù)升級(jí)的需求得到了迅猛的發(fā)展。IP電話已經(jīng)走向大規(guī)模產(chǎn)業(yè)化應(yīng)用,并以其低廉的成本和滿意的話音質(zhì)量成為通訊供應(yīng)商競(jìng)爭(zhēng)的利器,大有取代傳統(tǒng)電話的趨勢(shì)。語音識(shí)別技術(shù)也已經(jīng)實(shí)現(xiàn)了與說話者無關(guān)的大詞匯量連續(xù)語音識(shí)別,并試圖從試驗(yàn)研究走向商用。說話者識(shí)別技術(shù)作為一個(gè)新一代的門禁安防技術(shù)也已經(jīng)出現(xiàn)商業(yè)應(yīng)用。很多單工的通訊設(shè)備可以通過語音檢測(cè)技術(shù)的應(yīng)用實(shí)現(xiàn)收發(fā)狀態(tài)的自動(dòng)轉(zhuǎn)換而以比較小的代價(jià)達(dá)到雙工設(shè)備的功能。語音檢測(cè)技術(shù)作為這些語音處理算法中的核心預(yù)處理單元,成為這些技術(shù)能否走向成熟商業(yè)應(yīng)用的關(guān)鍵技術(shù)之一。實(shí)際通訊環(huán)境中會(huì)遇到各種不同類型、不同強(qiáng)度的噪聲。它們各自在時(shí)域或頻域中有互不相同的特點(diǎn),沒有一致的統(tǒng)計(jì)參數(shù)。語音信號(hào)本身也是一個(gè)時(shí)變的復(fù)雜信號(hào)。不同的語言,不同的音位(語音中的最小發(fā)聲單位)各不相同。
總之,實(shí)際中的噪聲和語音信號(hào)都是復(fù)雜的時(shí)變信號(hào)。如果不是面向特定背景噪聲的應(yīng)用,通過尋找噪聲的共同特征以構(gòu)建一個(gè)噪聲信號(hào)與語音信號(hào)的區(qū)分函數(shù)是不現(xiàn)實(shí)的。語音信號(hào)處理本身是一個(gè)涉及到傳統(tǒng)數(shù)字信號(hào)處理、統(tǒng)計(jì)信號(hào)處理、模式識(shí)別與建模、發(fā)聲學(xué)、語音語言學(xué)等多學(xué)科的綜合技術(shù)。論文在前人研究的基礎(chǔ)上,從語音信號(hào)的形制機(jī)理出發(fā),對(duì)語音信號(hào)中的基本成分—輕音和濁音的特征進(jìn)行了深入的研究。Source-Filter模型在語音信號(hào)建模中有著廣泛的應(yīng)用,論文在基于Source-Filter模型求取語音信號(hào)的LPC譜中發(fā)現(xiàn),語音的短時(shí)穩(wěn)定性(short time stationary)在LPC譜中有著不同于噪聲信號(hào)的鮮明體現(xiàn),從而提出了基于音位共振峰軌跡跟蹤的語音檢測(cè)新方法。論文對(duì)新算法與國(guó)際電信聯(lián)盟(ITU)的G729B推薦語音檢測(cè)標(biāo)準(zhǔn)算法進(jìn)行了對(duì)比驗(yàn)證,證明在強(qiáng)背景噪聲環(huán)境下新算法的性能有20%左右的提高。同時(shí)新算法也體現(xiàn)出比G729B更
強(qiáng)的背景噪聲適應(yīng)能力。在算法的實(shí)現(xiàn)中,局部大能量的噪聲會(huì)形成LPC譜中的局部極大值點(diǎn),它具有類似語音共振峰的特征。為了消除噪聲極大值點(diǎn)對(duì)音位共振峰軌跡跟蹤的不良影響,論文提出了一個(gè)共振峰的形態(tài)判別標(biāo)準(zhǔn)—音位共振峰的幅值峰谷比原則,并通過大量的試驗(yàn)研究確定了峰谷比的優(yōu)化量值。試驗(yàn)證明,此方法是剔除局部噪聲極值點(diǎn)的有效方法。論文工作將新算法在一個(gè)基于TI TMS320C6711的數(shù)字信號(hào)處理器平臺(tái)上實(shí)時(shí)實(shí)現(xiàn)。在實(shí)現(xiàn)過程中,使用了幅值、步長(zhǎng)的分段擬合和插值算法,大大降低了復(fù)雜數(shù)學(xué)函數(shù)的運(yùn)算時(shí)間,滿足了算法了實(shí)時(shí)性要求。
第三章
系統(tǒng)方案論證
在進(jìn)行模擬/數(shù)字信號(hào)的轉(zhuǎn)換過程中,當(dāng)采樣頻率fs.max大于信號(hào)中最高頻率fmax的2倍時(shí),則采樣之后的數(shù)字信號(hào)完整的保留了原始信號(hào)中的信號(hào),一般實(shí)際應(yīng)用中保證采樣頻率為信號(hào)最高頻率的5—10倍;采樣定理又稱奈奎斯特定理。
一、采樣頻率是指計(jì)算機(jī)每秒鐘采集多少個(gè)聲音樣本,是描述聲音文件的音質(zhì)、音調(diào)、衡量聲卡、聲音文件的質(zhì)量標(biāo)準(zhǔn)。采樣頻率越高,即采樣的間隔時(shí)間越短,則在單位時(shí)間內(nèi)計(jì)算機(jī)得到的聲音樣本數(shù)據(jù)就越多,對(duì)聲音波形的表示也就越精確,采樣頻率與聲音頻率之間有一定的關(guān)系,根據(jù)奈奎斯特理論,只有采樣頻率高于聲音信號(hào)最高頻率的2倍的時(shí)候,才能把數(shù)字信號(hào)表示的聲音還原成為原來的聲音,這就是說采樣頻率是衡量聲卡采集、記錄和還原聲音文件的質(zhì)量標(biāo)準(zhǔn)。
二、采樣位數(shù)即采樣值或取樣值,用來衡量聲音波動(dòng)變化的參數(shù),是指聲卡在采集和播放聲音文件時(shí)候使用數(shù)字聲音信號(hào)的二進(jìn)制為數(shù)。采樣頻率是指錄音設(shè)備在一秒鐘內(nèi)對(duì)聲音信號(hào)的采樣次數(shù),采樣頻率越高聲音的還原就越真實(shí)越自然。
三、采樣位數(shù)和采樣頻率對(duì)于音頻接口來說是最為重要的兩個(gè)基本指標(biāo),也是選擇音頻接口的兩個(gè)重要標(biāo)準(zhǔn)。無論采樣頻率如何,理論上來說采樣的位數(shù)決定了音頻數(shù)據(jù)最大的力度范圍。每增加一個(gè)采樣位數(shù)相當(dāng)于力度范圍增加了6dB。采樣位數(shù)越多則捕捉到的信號(hào)越精確。對(duì)于采樣率來說你可以想象它類似于一個(gè)照相機(jī)。顯然采樣率越高,計(jì)算機(jī)提取的聲音越多,對(duì)于原始的還原也越加精確。
第四章
GUI設(shè)計(jì)實(shí)現(xiàn)
4.1 圖形用戶界面概念
圖形用戶界面或圖形用戶接口是指采用圖形方式顯示的計(jì)算機(jī)操作環(huán)境由用戶接口。與早期計(jì)算機(jī)使用的命令行界面相比,圖形界面對(duì)于用戶來說更為簡(jiǎn)便易用。
GUI是MATLAB提供的圖形用戶界面開發(fā)環(huán)境,提供了一系列用于創(chuàng)建圖形用戶界面的工具,從而簡(jiǎn)化界面布局和編程工作。
4.2用戶界面設(shè)計(jì)
4.2.1 GUI設(shè)計(jì)模板
在MATLAB主窗口中,選擇File菜單中的New菜單項(xiàng),再選擇其中的GUI命令,就會(huì)顯示圖形用戶界面的設(shè)計(jì)模板。
MATLAB為GUI設(shè)計(jì)一共準(zhǔn)備了四個(gè)模板,分別是Blank GUI、GUI with Uicontrols、GUI with Axes and Menu、Modal Question Dialog。
當(dāng)用戶選擇不同的模板時(shí),在GUI設(shè)計(jì)模板界面的右邊就會(huì)顯示出與該模板對(duì)應(yīng)的GUI圖形。
4.2.2 GUI設(shè)計(jì)窗口
在GUI設(shè)計(jì)模板中選中一個(gè)模板,然后單擊OK按鈕,就會(huì)顯示GUI設(shè)計(jì)窗口,選擇不同的GUI設(shè)計(jì)模式時(shí),在GUI設(shè)計(jì)窗口中顯示的結(jié)果是不一樣的。
GUI設(shè)計(jì)窗口由菜單欄、工具欄、空間工具欄以及圖形對(duì)象設(shè)計(jì)區(qū)等部分組成。GUI設(shè)計(jì)窗口的菜單欄有File、Edit、View、Layout、Tools和Help六個(gè)菜單項(xiàng),使用其中的命令可以完成圖形用戶界面的設(shè)計(jì)操作。
4.2.3 GUI設(shè)計(jì)窗口的基本操作
(1)前面板的設(shè)計(jì):在GUI設(shè)計(jì)窗口創(chuàng)建圖形對(duì)象后,通過雙擊該對(duì)象,就會(huì)顯示該對(duì)象的屬性編輯器。如下圖所示。例如,創(chuàng)建一個(gè)Push Button對(duì)象,并設(shè)計(jì)該對(duì)象的屬性值。
圖4-1 按鈕屬性編輯器
通過以上的按鈕屬性編輯器可以根據(jù)個(gè)人情況對(duì)按鈕的名稱、顏色、大小等方面的屬性進(jìn)行修改,使按鈕在視覺上變的更加完美。
(2)按鈕功能的實(shí)現(xiàn):在GUI設(shè)計(jì)窗口創(chuàng)建按鈕后,通過右鍵單擊按鈕,選擇View callbacks下的callback對(duì)相應(yīng)的按鈕進(jìn)行編程,使按鈕實(shí)現(xiàn)相應(yīng)的功能,如下圖所示對(duì)按鈕的響應(yīng)功能進(jìn)行設(shè)置。
圖4-2 按鈕功能編輯器
進(jìn)入到按鈕程序編輯窗口,通過編程即可實(shí)現(xiàn)按鈕的相應(yīng)功能,如下圖:
圖4-3 按鈕的編程實(shí)現(xiàn)界面
通過對(duì)各個(gè)按鈕控件的修改,和對(duì)m文件程序的添加就完成對(duì)GUI窗口的設(shè)計(jì),最后得到的圖形化操作界面如下圖所示:
圖4-4 圖形化操作界面
4.2.4 語音的錄入與打開
在MATLAB中,[y,fa,bits]=wavread(‘Blip’,[N1 N2]);用于讀取語音,采樣值放在向y中,fs表示采樣頻率,bits表示采樣位數(shù)。[N1 N2]表示讀取從N1點(diǎn)到N2點(diǎn)的值。
Suond(x,fs,bits);用于對(duì)聲音的回放,向量y則就代表了一個(gè)信號(hào)也就是說可以像處理一個(gè)信號(hào)表達(dá)式一樣處理這個(gè)聲音信號(hào)。
4.3課程設(shè)計(jì)的軟件實(shí)現(xiàn)
4.3.1語音信號(hào)的短時(shí)譜
周期性聲門波可表示為:
(4-1)其中,g[n]是聲門波的單周期的波形,p[n]是間隔為P的周期采樣序列。當(dāng)u[n]通過線性非時(shí)變聲道,且該聲道的單位沖擊響應(yīng)為h[n]時(shí),聲道輸出為:
(4-2)為了觀察一段語音,需要降生到輸出乘以一個(gè)一時(shí)刻τ 為中心的窗函數(shù) w[n,τ] ,即得到:
(4-3)
這段語音信號(hào)的頻域表達(dá)式為:
即語音信號(hào)的譜包絡(luò)為
(4-4)
語譜圖就是現(xiàn)實(shí)時(shí)變頻譜幅度特征的圖形表達(dá)式為:
(4-5)
將語音信號(hào)短時(shí)譜程序?qū)懭氲組ATLAB中得到單色語譜圖的波形如下:
圖4-5 語音信號(hào)單色語譜圖
4.3.2 自相關(guān)方法估計(jì)語音信號(hào)的聲道參數(shù)
由均方預(yù)測(cè)誤差最小的得到正則方程:
其中,在最佳解時(shí)的誤差為
在自相關(guān)法中式4-6,式4-8變?yōu)?/p>
(4-10)由式4-9和式4-10可列出方程組式4-11 10
(4-6)(4-7)(4-8)(4-9)
(4-11)
解方程組式4-9求出線性預(yù)測(cè)系數(shù),通過誤差式4-11可求出增益G
(4-12)
加窗后信號(hào)頻譜圖如下:
圖4-6 加窗后信號(hào)頻譜圖
通過以上的方法,改變參數(shù)分別求得4極點(diǎn)模型頻率響應(yīng)和6極點(diǎn)模型頻率響應(yīng),6極點(diǎn)波形如下圖所示:
圖4-7 六極點(diǎn)波形圖
最后通過以上方法用一個(gè)函數(shù)分別實(shí)現(xiàn)以上三個(gè)功能,三個(gè)波形顯示在一個(gè)界面,通過觀察圖形,查看它們之間的分別。三者比較所得到的波形如下:
圖4-8 三者比較波形圖
4.3.3 基音周期檢測(cè)
數(shù)據(jù)為濁音語音信號(hào)speech1_10k(10000樣點(diǎn)/秒)用25ms的漢明窗對(duì)語音信號(hào)speech1_10k進(jìn)行加窗處理,并畫出所得到的加窗信號(hào)的自相關(guān)函數(shù),再用根據(jù)中心消波法及三電平中心消波法原理改進(jìn)程序,最后對(duì)比中方法基音檢測(cè)的效果并分析結(jié)果。
實(shí)驗(yàn)原理及方法
相關(guān)檢測(cè)原理:對(duì)于離散的數(shù)字語音信號(hào)序列x(n),如果周期N,則自相關(guān)函數(shù)也是同周期的周期函數(shù)。即:x(n)=x(n+N)。清音信號(hào)沒有周期性,他的自相關(guān)函數(shù)也沒有周期。濁音新海具有準(zhǔn)周期性。自相關(guān)基音檢測(cè)正是利用這一性質(zhì)對(duì)語音信號(hào)進(jìn)行基音檢測(cè)的。
中心消波法檢測(cè)原理:中心消波處理是使用如下圖所示的中心消波函數(shù)進(jìn)行處理的:
圖4-9 中心消波檢測(cè)圖
三電平消波法原理:為了減少自相關(guān)計(jì)算中的乘法運(yùn)算,可以把上述中心消
波以后的信號(hào)y(n)的自相關(guān)用兩個(gè)信號(hào)的互相關(guān)代替,其中一個(gè)信號(hào)是y(n)另一個(gè)信號(hào)是對(duì)y(n)進(jìn)行三電平量化產(chǎn)生的結(jié)果。且這個(gè)信號(hào)有三種可能的取值,因而這里的互相關(guān)計(jì)算只需要做加減法,而這個(gè)互相關(guān)序列的周期性與y(n)的自相關(guān)序列是近似相同的。
三電平法對(duì)語音信號(hào)處理得到的波形如下:
圖4-10 三電平法波形圖
中心消波法得到的波形如下圖:
圖4-11 中心消波法波形圖
4.4 GUI實(shí)驗(yàn)箱操作界面設(shè)計(jì)
通過對(duì)各個(gè)控件的編程和對(duì)參數(shù)的設(shè)計(jì),最后得到的GUI實(shí)驗(yàn)箱操作界面如下圖所示,通過界面上的各個(gè)按鈕即可實(shí)現(xiàn)相應(yīng)的功能。
圖4-12 GUI實(shí)驗(yàn)箱操作界面
第五章 心得體會(huì)
通過本次課程設(shè)計(jì)完成了對(duì)語音信號(hào)的讀取與打開,與課題的要求十分相符;初略的完成了界面的設(shè)計(jì),但也存在相當(dāng)?shù)牟蛔?,達(dá)到了打開語音文件,顯示已定波形。語音信號(hào)處理時(shí)語音學(xué)與數(shù)字信號(hào)處理技術(shù)相結(jié)合的交叉學(xué)科,將語音當(dāng)做一種特殊的信號(hào),即一種“復(fù)雜向量”來看待。也就是說,體現(xiàn)了數(shù)字信號(hào)處理技術(shù)。
本次課程設(shè)計(jì)時(shí)希望將數(shù)字信號(hào)處理技術(shù)應(yīng)用與某一實(shí)際領(lǐng)域,這里就是指對(duì)語音的處理。作為存儲(chǔ)與計(jì)算機(jī)中的語音信號(hào),其本身就是離散化了的向量,我們只需要將這些離散的量提取出來美酒可以對(duì)其進(jìn)行處理了。
本次課設(shè),用到了處理數(shù)字信號(hào)的強(qiáng)有力工具M(jìn)ATLAB,通過MATLAB李的幾個(gè)命令函數(shù)的調(diào)用,很輕易的在實(shí)際化語音與數(shù)字信號(hào)的理論之間搭了一座橋。
最后,還利用了MATLAB的另一強(qiáng)大功能——GUI界面設(shè)計(jì)。設(shè)計(jì)出了一個(gè)建議的用戶應(yīng)用界面,可以讓人實(shí)現(xiàn)界面操作。
通過本次課程設(shè)計(jì)讓我更加了解了語音信號(hào)處理在現(xiàn)實(shí)中的強(qiáng)大的應(yīng)用空間,同時(shí)查閱了很多相關(guān)的資料,應(yīng)用MTALAB軟件來完成,熟練掌握了MATLAB軟件,本次課程設(shè)計(jì)要求用GUI設(shè)計(jì)模塊,查閱了很多資料,更加深刻的陸奧了了這方面知識(shí)。
本次課程設(shè)計(jì),我明白了理論的學(xué)習(xí)需要在實(shí)踐中才能得到鞏固。在課程設(shè)計(jì)中,只有動(dòng)手慢慢研究,才能真正了解MATLAB軟件平臺(tái)中可以直接設(shè)計(jì)數(shù)字濾波器的各個(gè)函數(shù)的調(diào)用,對(duì)設(shè)計(jì)GUI實(shí)驗(yàn)箱的所有函數(shù)的運(yùn)用有了比較好的認(rèn)識(shí)。
通過這個(gè)課程設(shè)計(jì),我學(xué)到了很多MATLAB和語音信號(hào)的知識(shí),提高了自己在語音信號(hào)設(shè)計(jì)方面的知識(shí)能力,動(dòng)手能力和思維能力都得到了一定的提升,希望自己以后可以更多的繼續(xù)學(xué)習(xí)這一門課程設(shè)計(jì)方面的知識(shí)。
參考文獻(xiàn)
[1]陳懷琛.MATLAB及在電子信息課程中的應(yīng)用【M】.北京電子工業(yè)出版社.2008.1 [2]張文.基于MATLAB的語音信號(hào)的濾波域?qū)崿F(xiàn)【M】.山西電子技術(shù).2008.2 [3]徐靖濤.基于MATLAB的語音信號(hào)分析與處理【M】.重慶科技學(xué)院學(xué)報(bào).2008.1 [4]張威.MATLAB基礎(chǔ)與編程入門【M】.西安電子科技大學(xué)出版社,2006. [5]周淵,王炳和,劉斌勝.基于MATLAB的噪聲信號(hào)采集和分析系統(tǒng)的設(shè)計(jì)【J】.噪聲控制.2004(7):52-54.
[6]張雄偉,陳量,楊吉斌.現(xiàn)代語音處理技術(shù)及應(yīng)用【M】.北京:機(jī)械工業(yè)出版社.2003
第五篇:專業(yè)英語7語音信號(hào)處理
1、演講的目的是溝通。有幾種方法表征語音通信的潛力。一個(gè)高度量化的方法是香農(nóng)信息論思想的引入。根據(jù)信息變換理論,語音可以表示其消息內(nèi)容或信息。語音特征的另一種表征方式是信號(hào)承載的消息信息,i.e.(注:i.e.意思是:即,也就是),如聲波。雖然信息論思路在先進(jìn)的通信系統(tǒng)中發(fā)揮了重要作用,但它是基于波形的語音表示,或一些在實(shí)際應(yīng)用中一直是最有用的參數(shù)模型。
2、在考慮語音通信的過程中,開始在大腦中思考消息在揚(yáng)聲器中的一些抽象的表示形式是有幫助的。雖然產(chǎn)生語音的過程是復(fù)雜的,但該消息中的信息最終被轉(zhuǎn)換成聲學(xué)信號(hào)。在言語產(chǎn)生的過程中消息的信息可以被認(rèn)為存在許多不同的表示方式。例如,該消息信息首先被轉(zhuǎn)換成一組能控制發(fā)音機(jī)制的神經(jīng)信號(hào)(即,運(yùn)動(dòng)舌頭,嘴唇,聲帶等)。發(fā)音器官的運(yùn)動(dòng)響應(yīng)于這些神經(jīng)信號(hào)來完成一系列的手勢(shì),其結(jié)果是在原始消息中包含的信息的音響波形。
3、信息雖然連通但講話本質(zhì)上是一個(gè)離散的性質(zhì)的信息,i.e.,即,它可以被有限集合中元素串聯(lián)的符號(hào)表示,每一個(gè)聲音的符號(hào)可以被分類,被稱為音素。每種語言都有它自己的獨(dú)特的音素,編號(hào)通常在30至50之間。例如英語可以表示為一組約42個(gè)編號(hào)的音素。
4、信息理論關(guān)注的中心問題是傳達(dá)信息的速率。講話的信息率可以通過發(fā)音器官物理上的運(yùn)動(dòng)速度粗略估計(jì),人類講話的平均速率每秒約10個(gè)音素。如果每個(gè)音素表示一個(gè)二進(jìn)制數(shù),那么6位數(shù)字代碼足以代表所有的英語音素,設(shè)平均增長(zhǎng)率為每秒10音素,并且忽略任何相鄰音素的組合,我們得到了一個(gè)大約60比特/秒的平均信息語速。換句話說,書面講話包含的信息相當(dāng)于60位/秒正常講話率。當(dāng)然一個(gè)“真正”的語音信息內(nèi)容的下界是大大高于這個(gè)速度的,上述估計(jì)確實(shí)需要考慮一些因素,如說話者的身份和情感狀態(tài),說話的速率,聲音的響度,等。
5、在語音通信系統(tǒng)中,語音信號(hào)的傳輸、存儲(chǔ)、和處理有許多方法。技術(shù)問題導(dǎo)致各種表示形式的語音信號(hào)的產(chǎn)生。一般來說,有兩個(gè)主要的問題存在于任何一個(gè)系統(tǒng)中:一是保護(hù)消息內(nèi)容的語音信號(hào)。另一個(gè)是語音信號(hào)便于傳輸和存儲(chǔ)的表示形式。或者以一種靈活的形式表示,這樣修改后不會(huì)對(duì)語音信號(hào)所表示的消息內(nèi)容產(chǎn)生嚴(yán)重退化的影響。
6、語言信號(hào)必須這樣表示,信息內(nèi)容能被聽眾容易的提取,或自動(dòng)被機(jī)器提取。
語音信號(hào)的表示形式(而不是消息的內(nèi)容)可能需要從500到1百萬比特每秒以上的提取速度。這些表示形式的設(shè)計(jì)和實(shí)現(xiàn),信號(hào)處理的方法發(fā)揮基礎(chǔ)性作用。
7、一般的信息處理問題可用圖3-22描繪的框圖表示。在語音信號(hào)的情況下,說話者就是信源。一般測(cè)量或觀察聲波的尺寸。
8、涉及信號(hào)處理,首先根據(jù)一個(gè)給定的模型獲得信號(hào),利用運(yùn)用程序?qū)π盘?hào)進(jìn)行一些更高層次的變換,以便把該信號(hào)轉(zhuǎn)換成一個(gè)更方便的形式。在這個(gè)過程中的最后一步是報(bào)文信息的提取和利用。本步驟可以由人類聽眾或由機(jī)器自動(dòng)進(jìn)行。例如,一個(gè)系統(tǒng),其功能是自動(dòng)識(shí)別揚(yáng)聲器從一個(gè)給定的發(fā)言者發(fā)出的語音信號(hào),該語音信號(hào)可能使用一個(gè)隨時(shí)間變化的頻譜表示。
9、因此,語音信號(hào)處理涉及兩個(gè)任務(wù)。一,這是語音信號(hào)的波形或參數(shù)一般表示形式的獲取手段;二,信號(hào)處理在轉(zhuǎn)換的過程中提供函數(shù)幫助,這是信號(hào)一般性質(zhì)的替代形式,但更適合特定的應(yīng)用程序。
10、我們將探索數(shù)字技術(shù)在語音信號(hào)處理中的作用。數(shù)字信號(hào)處理涉及離散信號(hào)的獲取與表示,伴隨變換理論,涉及和數(shù)控程序的實(shí)施用來處理離散信號(hào)的表示。數(shù)字信號(hào)的處理目的類似于模擬信號(hào)的處理。因此,在語音通信的上下文中單獨(dú)挑出數(shù)字信號(hào)處理技術(shù)做特別考慮是合理的??梢粤信e一些很重要的原因。首先,最重要的大概是一些極其復(fù)雜的信號(hào)處理功能可以用數(shù)字技術(shù)來實(shí)施的事實(shí)。此外,語音信號(hào)處理中常用的算法本質(zhì)上是離散時(shí)間信號(hào)處理系統(tǒng)。它們大多不適合作為近似的模擬系統(tǒng)來觀察,的確在許多情況下沒有可用的模擬實(shí)施方案。
11、數(shù)字信號(hào)處理技術(shù)在語音處理問題中被首次運(yùn)用,仿真復(fù)雜的模擬系統(tǒng)。最初的觀點(diǎn)來看,模擬系統(tǒng)可以在計(jì)算機(jī)上進(jìn)行模擬,避免為了試驗(yàn)參數(shù)選擇和其他設(shè)計(jì)考慮系統(tǒng)建設(shè)的必要性。數(shù)字仿真模擬系統(tǒng)的首次應(yīng)用,需要大量的處理時(shí)間。在1960年代中期,一次數(shù)字信號(hào)處理的革命發(fā)生了。主要的主要催化劑是發(fā)展快速的計(jì)算機(jī)和突飛猛進(jìn)的數(shù)字信號(hào)處理技術(shù)理論。因此,數(shù)字信號(hào)處理系統(tǒng)具有的優(yōu)點(diǎn)使得年輕一代有能力來模擬模擬系統(tǒng)的情況變得明朗。目前計(jì)算機(jī)語音處理系統(tǒng)在實(shí)驗(yàn)室中實(shí)現(xiàn),他們作為一個(gè)數(shù)字系統(tǒng),可以作為實(shí)施特殊用途的數(shù)字硬件或?qū)S玫挠?jì)算機(jī)系統(tǒng)進(jìn)行精確模擬。
12、除理論發(fā)展外,伴隨數(shù)字硬件的發(fā)展數(shù)字處理技術(shù)的優(yōu)點(diǎn)進(jìn)一步加強(qiáng)以致于超過模擬系統(tǒng)。數(shù)字系統(tǒng)非常可靠和緊湊。集成電路技術(shù)已經(jīng)發(fā)展到可以把極其
復(fù)雜的系統(tǒng)實(shí)現(xiàn)在單個(gè)芯片上。邏輯運(yùn)算的速度足以滿足許多信號(hào)處理功能所需的巨大數(shù)量的計(jì)算,可以實(shí)現(xiàn)實(shí)時(shí)語音采樣率。
13、在語音通信系統(tǒng)中使用數(shù)字技術(shù)有另外的原因。如,如果使用合適的編碼,在非常嘈雜的信道,數(shù)字形式的語音信號(hào)能可靠地傳輸。語音信號(hào)的數(shù)字形式與其他形式的數(shù)據(jù)的相同。因此,可以使用一個(gè)通信網(wǎng)絡(luò)同時(shí)傳輸話音和數(shù)據(jù),除解碼外沒有必要區(qū)分它們。在安全方面語音信號(hào)的傳輸需要數(shù)字表示,它具有明顯的優(yōu)勢(shì)超過了模擬系統(tǒng)。為了保密,對(duì)信息比特進(jìn)行加擾,最終能在接收器解讀。這些和許多其他的原因,數(shù)字技術(shù)正在被越來越多地應(yīng)用于語音通信問題。
14、考慮應(yīng)用數(shù)字信號(hào)處理技術(shù)來處理語音通信問題,專注于三個(gè)主題它是非常有幫助的:語音信號(hào)的數(shù)字表示形式,實(shí)施先進(jìn)的處理技術(shù)和很大程度上依賴于數(shù)字信號(hào)處理的應(yīng)用程序類。