第一篇:DSP語(yǔ)音信號(hào)處理
目 錄
第一章 緒
論.........................................................................................................1
1.1課程設(shè)計(jì)的目的及意義..................................................................................1 1.2設(shè)計(jì)要求..........................................................................................................1 1.3 研究?jī)?nèi)容.........................................................................................................1
第二章 語(yǔ)音信號(hào)處理理論基礎(chǔ)........................................................................3
第三章
系統(tǒng)方案論證.....................................................................................5 第四章
GUI設(shè)計(jì)實(shí)現(xiàn).....................................................................................6
4.1 圖形用戶(hù)界面概念.........................................................................................6 4.2用戶(hù)界面設(shè)計(jì)..................................................................................................6
4.2.1 GUI設(shè)計(jì)模板........................................................................................6 4.2.2 GUI設(shè)計(jì)窗口........................................................................................6 4.2.3 GUI設(shè)計(jì)窗口的基本操作....................................................................6 4.2.4 語(yǔ)音的錄入與打開(kāi)................................................................................9 4.3課程設(shè)計(jì)的軟件實(shí)現(xiàn)....................................................................................9
4.3.1語(yǔ)音信號(hào)的短時(shí)譜.................................................................................9 4.3.2 自相關(guān)方法估計(jì)語(yǔ)音信號(hào)的聲道參數(shù)..............................................10 4.3.3 基音周期檢測(cè)......................................................................................12 4.4 GUI實(shí)驗(yàn)箱操作界面設(shè)計(jì)............................................................................14 第五章 心得體會(huì)..................................................................................................15 參考文獻(xiàn)...................................................................................................................16
摘
要
語(yǔ)音信號(hào)處理是研究數(shù)字信號(hào)處理技術(shù)和語(yǔ)音信號(hào)進(jìn)行處理的一門(mén)學(xué)科,是一門(mén)新型的學(xué)科,是在多門(mén)學(xué)科基礎(chǔ)上發(fā)展起來(lái)的綜合性技術(shù),它涉及到數(shù)字信號(hào)處理、模式識(shí)別、語(yǔ)言學(xué)。語(yǔ)音信號(hào)處理是研究用數(shù)字信號(hào)處理技術(shù)對(duì)語(yǔ)音信號(hào)處理的一門(mén)學(xué)科。處理的目的是要得到一些語(yǔ)音參數(shù)以便高效的傳輸或存儲(chǔ);或者是通過(guò)處理的某種運(yùn)算以達(dá)到某種用途的要求。語(yǔ)音信號(hào)處理又是一門(mén)邊緣學(xué)科。如上所訴,它是“語(yǔ)言語(yǔ)音學(xué)”與“數(shù)字信號(hào)處理”兩個(gè)學(xué)科相結(jié)合的產(chǎn)物。
語(yǔ)音信號(hào)處理屬于信息科學(xué)的一個(gè)重要分支,大規(guī)模集成技術(shù)的高度發(fā)展和計(jì)算機(jī)技術(shù)的飛速前進(jìn),推動(dòng)了這一技術(shù)的發(fā)展。在數(shù)字音頻技術(shù)和多媒體技術(shù)迅速發(fā)展的今天,傳統(tǒng)的磁帶語(yǔ)音錄放系統(tǒng)因體積大、使用不便、放音不清晰而受到了巨大挑戰(zhàn)。本次課程設(shè)計(jì)提出的體積小巧,功耗低的數(shù)字化語(yǔ)音存儲(chǔ)與回放系統(tǒng),可以有效的解決傳統(tǒng)的語(yǔ)音錄放系統(tǒng)在電子與信息處理的使用中受到的限制。
本文提出了語(yǔ)音信號(hào)處理課程建設(shè)的實(shí)驗(yàn)環(huán)節(jié)中的一些考慮,作為專(zhuān)業(yè)課程的學(xué)習(xí),實(shí)驗(yàn)內(nèi)容不能僅僅停留在驗(yàn)證性實(shí)驗(yàn)上,還應(yīng)增加實(shí)驗(yàn)延伸的設(shè)計(jì)要求,是學(xué)生加深對(duì)理論分析認(rèn)識(shí)的同時(shí),強(qiáng)調(diào)培養(yǎng)學(xué)生的實(shí)際動(dòng)手能力和知識(shí)綜合運(yùn)用能力。從而提高語(yǔ)音信號(hào)的教學(xué)和實(shí)驗(yàn)的質(zhì)量。實(shí)驗(yàn)內(nèi)容采用MATLAB編程實(shí)現(xiàn),不僅易于語(yǔ)音信號(hào)處理的實(shí)現(xiàn),更易引導(dǎo)學(xué)生完成實(shí)驗(yàn)延伸的設(shè)計(jì)。
第一章 緒
論
1.1課程設(shè)計(jì)的目的及意義
在我們的現(xiàn)實(shí)生活中從磁帶、錄像帶到CD、VCD、DVD;從黑白電視機(jī)、彩色電視機(jī)、高清晰度電視機(jī)到具有數(shù)字信號(hào)處理功能的電視機(jī);從留聲機(jī)、錄音機(jī)到語(yǔ)音信箱;現(xiàn)在正出在模擬信息到數(shù)字信息的變革之中,傳統(tǒng)的磁帶語(yǔ)音錄放系統(tǒng)因其體積大,使用不便,在電子與信息處理的使用中受到許多限制。
雖然,目前廣播電視系統(tǒng)尚未實(shí)現(xiàn)真正的數(shù)字化,相信在不久的將來(lái),真正的數(shù)字電視、數(shù)字收音機(jī)、數(shù)字收錄機(jī)將進(jìn)入家庭。所以,研究音頻信號(hào)的數(shù)字化存儲(chǔ)、處理和回放系統(tǒng)有著很重要的現(xiàn)實(shí)意義。
通過(guò)設(shè)計(jì)語(yǔ)音信號(hào)實(shí)驗(yàn)箱可以對(duì)語(yǔ)音信號(hào)實(shí)現(xiàn)各種形式的變換,因此學(xué)會(huì)對(duì)語(yǔ)音信號(hào)的處理,也可自行研究將此語(yǔ)音處理技術(shù)應(yīng)用到現(xiàn)實(shí)生活中。
語(yǔ)音信號(hào)處理的一門(mén)比較實(shí)用的電子工程的專(zhuān)業(yè)課程,語(yǔ)音是人類(lèi)獲取信息的重要來(lái)源和利用信息的重要手段,通過(guò)語(yǔ)言相互傳遞信息是人類(lèi)最重要的基本功能之一,語(yǔ)音是人類(lèi)特有的功能,它是創(chuàng)造和記載幾千年來(lái)人類(lèi)文明史的根本手段,是人類(lèi)最重要、最有效、最常用和最方便的交換信息的形式。
語(yǔ)音信號(hào)處理是研究用數(shù)字信號(hào)處理技術(shù)對(duì)語(yǔ)音信號(hào)進(jìn)行處理的一門(mén)學(xué)科,它是一門(mén)新興的學(xué)科,同時(shí)又是綜合性的多學(xué)科領(lǐng)域剛也涉及面很廣的交叉學(xué)科。
1.2設(shè)計(jì)要求
(1)學(xué)會(huì)MATLAB的使用,掌握MATLAB的程序設(shè)計(jì)方法;(2)掌握在windows環(huán)境下語(yǔ)音信號(hào)的采集方法;(3)掌握數(shù)字信號(hào)處理的基本概念,基本理論和基本方法;(4)掌握MATLAB設(shè)計(jì)方法;
(5)學(xué)會(huì)用MATLAB對(duì)信號(hào)進(jìn)行分析和處理。
1.3 研究?jī)?nèi)容
1.理論依據(jù)
根據(jù)設(shè)計(jì)要求分析系統(tǒng)功能,掌握設(shè)計(jì)中所需理論(采樣頻率、采樣位數(shù)的
概念,采樣定理; 時(shí)域信號(hào)的FFT分析;數(shù)字濾波器設(shè)計(jì)原理和方法,各種不同類(lèi)型濾波器的性能比較),闡明設(shè)計(jì)原理。2.信號(hào)采集
采集語(yǔ)音信號(hào),并對(duì)其進(jìn)行FFT頻譜分析,畫(huà)出信號(hào)的時(shí)域波形圖和頻譜圖。3.構(gòu)造受干擾信號(hào)并對(duì)其進(jìn)行FFT頻譜分析
對(duì)所采集的語(yǔ)音信號(hào)加入干擾噪聲,對(duì)語(yǔ)音信號(hào)進(jìn)行回放,感覺(jué)加噪前后聲音的變化,分析原因,得出結(jié)論。并對(duì)其進(jìn)行FFT頻譜分析,比較加噪前后語(yǔ)音信號(hào)的波形及頻譜,對(duì)所得結(jié)果進(jìn)行分析,闡明原因,得出結(jié)論。4.?dāng)?shù)字濾波器設(shè)計(jì)
根據(jù)待處理信號(hào)特點(diǎn),設(shè)計(jì)合適數(shù)字濾波器,繪制所設(shè)計(jì)濾波器的幅頻和相頻特性。5.信號(hào)處理
用所設(shè)計(jì)的濾波器對(duì)含噪語(yǔ)音信號(hào)進(jìn)行濾波。對(duì)濾波后的語(yǔ)音信號(hào)進(jìn)行FFT頻譜分析。畫(huà)出處理過(guò)程中所得各種波形及頻譜圖。
對(duì)語(yǔ)音信號(hào)進(jìn)行回放,感覺(jué)濾波前后聲音的變化。比較濾波前后語(yǔ)音信號(hào)的波形及頻譜,對(duì)所得結(jié)果和濾波器性能進(jìn)行頻譜分析,闡明原因,得出結(jié)論。6.設(shè)計(jì)圖形用戶(hù)界面
設(shè)計(jì)處理系統(tǒng)的用戶(hù)界面,在所設(shè)計(jì)的系統(tǒng)界面上可以選擇濾波器的參數(shù),顯示濾波器的頻率響應(yīng),選擇信號(hào)等。
第二章 語(yǔ)音信號(hào)處理理論基礎(chǔ)
語(yǔ)音采集原理是,人耳能聽(tīng)到的聲音是一種范圍為20Hz—20kHz,而一般語(yǔ)音頻率最高為3.4kHz。語(yǔ)音的采集是指語(yǔ)音聲波信號(hào)經(jīng)麥克風(fēng)和高頻放大器轉(zhuǎn)換成有一定幅度的模擬量電信號(hào),然后再轉(zhuǎn)換成數(shù)字量的全過(guò)程。
本次設(shè)計(jì)的基本原理是對(duì)語(yǔ)音的錄音和放音進(jìn)行數(shù)字化控制。其中,關(guān)鍵技術(shù)在于:為了增加語(yǔ)音存儲(chǔ)時(shí)間,提高存儲(chǔ)器的利用率,采用了非失真壓縮算法對(duì)語(yǔ)音信號(hào)進(jìn)行壓縮后再存儲(chǔ),而在回放時(shí)再進(jìn)行解壓縮;同時(shí),對(duì)輸入語(yǔ)音信號(hào)進(jìn)行數(shù)字濾波以抑制雜音和干擾,從而確保了語(yǔ)音回放的可靠質(zhì)量。
通過(guò)設(shè)計(jì)一個(gè)GUI實(shí)驗(yàn)箱,并添加相應(yīng)的控制控件,添加一個(gè)聲音文件,通過(guò)MATLAB編程,使其通過(guò)各種按鈕實(shí)現(xiàn)語(yǔ)音信號(hào)處理的各種功能,最后做成一個(gè)完整的語(yǔ)音信號(hào)處理實(shí)驗(yàn)箱。
語(yǔ)音檢測(cè)算法是現(xiàn)在語(yǔ)音信號(hào)處理研究的一個(gè)熱點(diǎn)。近些年來(lái),語(yǔ)音信號(hào)處理技術(shù)伴隨著人們對(duì)通訊技術(shù)升級(jí)的需求得到了迅猛的發(fā)展。IP電話已經(jīng)走向大規(guī)模產(chǎn)業(yè)化應(yīng)用,并以其低廉的成本和滿(mǎn)意的話音質(zhì)量成為通訊供應(yīng)商競(jìng)爭(zhēng)的利器,大有取代傳統(tǒng)電話的趨勢(shì)。語(yǔ)音識(shí)別技術(shù)也已經(jīng)實(shí)現(xiàn)了與說(shuō)話者無(wú)關(guān)的大詞匯量連續(xù)語(yǔ)音識(shí)別,并試圖從試驗(yàn)研究走向商用。說(shuō)話者識(shí)別技術(shù)作為一個(gè)新一代的門(mén)禁安防技術(shù)也已經(jīng)出現(xiàn)商業(yè)應(yīng)用。很多單工的通訊設(shè)備可以通過(guò)語(yǔ)音檢測(cè)技術(shù)的應(yīng)用實(shí)現(xiàn)收發(fā)狀態(tài)的自動(dòng)轉(zhuǎn)換而以比較小的代價(jià)達(dá)到雙工設(shè)備的功能。語(yǔ)音檢測(cè)技術(shù)作為這些語(yǔ)音處理算法中的核心預(yù)處理單元,成為這些技術(shù)能否走向成熟商業(yè)應(yīng)用的關(guān)鍵技術(shù)之一。實(shí)際通訊環(huán)境中會(huì)遇到各種不同類(lèi)型、不同強(qiáng)度的噪聲。它們各自在時(shí)域或頻域中有互不相同的特點(diǎn),沒(méi)有一致的統(tǒng)計(jì)參數(shù)。語(yǔ)音信號(hào)本身也是一個(gè)時(shí)變的復(fù)雜信號(hào)。不同的語(yǔ)言,不同的音位(語(yǔ)音中的最小發(fā)聲單位)各不相同。
總之,實(shí)際中的噪聲和語(yǔ)音信號(hào)都是復(fù)雜的時(shí)變信號(hào)。如果不是面向特定背景噪聲的應(yīng)用,通過(guò)尋找噪聲的共同特征以構(gòu)建一個(gè)噪聲信號(hào)與語(yǔ)音信號(hào)的區(qū)分函數(shù)是不現(xiàn)實(shí)的。語(yǔ)音信號(hào)處理本身是一個(gè)涉及到傳統(tǒng)數(shù)字信號(hào)處理、統(tǒng)計(jì)信號(hào)處理、模式識(shí)別與建模、發(fā)聲學(xué)、語(yǔ)音語(yǔ)言學(xué)等多學(xué)科的綜合技術(shù)。論文在前人研究的基礎(chǔ)上,從語(yǔ)音信號(hào)的形制機(jī)理出發(fā),對(duì)語(yǔ)音信號(hào)中的基本成分—輕音和濁音的特征進(jìn)行了深入的研究。Source-Filter模型在語(yǔ)音信號(hào)建模中有著廣泛的應(yīng)用,論文在基于Source-Filter模型求取語(yǔ)音信號(hào)的LPC譜中發(fā)現(xiàn),語(yǔ)音的短時(shí)穩(wěn)定性(short time stationary)在LPC譜中有著不同于噪聲信號(hào)的鮮明體現(xiàn),從而提出了基于音位共振峰軌跡跟蹤的語(yǔ)音檢測(cè)新方法。論文對(duì)新算法與國(guó)際電信聯(lián)盟(ITU)的G729B推薦語(yǔ)音檢測(cè)標(biāo)準(zhǔn)算法進(jìn)行了對(duì)比驗(yàn)證,證明在強(qiáng)背景噪聲環(huán)境下新算法的性能有20%左右的提高。同時(shí)新算法也體現(xiàn)出比G729B更
強(qiáng)的背景噪聲適應(yīng)能力。在算法的實(shí)現(xiàn)中,局部大能量的噪聲會(huì)形成LPC譜中的局部極大值點(diǎn),它具有類(lèi)似語(yǔ)音共振峰的特征。為了消除噪聲極大值點(diǎn)對(duì)音位共振峰軌跡跟蹤的不良影響,論文提出了一個(gè)共振峰的形態(tài)判別標(biāo)準(zhǔn)—音位共振峰的幅值峰谷比原則,并通過(guò)大量的試驗(yàn)研究確定了峰谷比的優(yōu)化量值。試驗(yàn)證明,此方法是剔除局部噪聲極值點(diǎn)的有效方法。論文工作將新算法在一個(gè)基于TI TMS320C6711的數(shù)字信號(hào)處理器平臺(tái)上實(shí)時(shí)實(shí)現(xiàn)。在實(shí)現(xiàn)過(guò)程中,使用了幅值、步長(zhǎng)的分段擬合和插值算法,大大降低了復(fù)雜數(shù)學(xué)函數(shù)的運(yùn)算時(shí)間,滿(mǎn)足了算法了實(shí)時(shí)性要求。
第三章
系統(tǒng)方案論證
在進(jìn)行模擬/數(shù)字信號(hào)的轉(zhuǎn)換過(guò)程中,當(dāng)采樣頻率fs.max大于信號(hào)中最高頻率fmax的2倍時(shí),則采樣之后的數(shù)字信號(hào)完整的保留了原始信號(hào)中的信號(hào),一般實(shí)際應(yīng)用中保證采樣頻率為信號(hào)最高頻率的5—10倍;采樣定理又稱(chēng)奈奎斯特定理。
一、采樣頻率是指計(jì)算機(jī)每秒鐘采集多少個(gè)聲音樣本,是描述聲音文件的音質(zhì)、音調(diào)、衡量聲卡、聲音文件的質(zhì)量標(biāo)準(zhǔn)。采樣頻率越高,即采樣的間隔時(shí)間越短,則在單位時(shí)間內(nèi)計(jì)算機(jī)得到的聲音樣本數(shù)據(jù)就越多,對(duì)聲音波形的表示也就越精確,采樣頻率與聲音頻率之間有一定的關(guān)系,根據(jù)奈奎斯特理論,只有采樣頻率高于聲音信號(hào)最高頻率的2倍的時(shí)候,才能把數(shù)字信號(hào)表示的聲音還原成為原來(lái)的聲音,這就是說(shuō)采樣頻率是衡量聲卡采集、記錄和還原聲音文件的質(zhì)量標(biāo)準(zhǔn)。
二、采樣位數(shù)即采樣值或取樣值,用來(lái)衡量聲音波動(dòng)變化的參數(shù),是指聲卡在采集和播放聲音文件時(shí)候使用數(shù)字聲音信號(hào)的二進(jìn)制為數(shù)。采樣頻率是指錄音設(shè)備在一秒鐘內(nèi)對(duì)聲音信號(hào)的采樣次數(shù),采樣頻率越高聲音的還原就越真實(shí)越自然。
三、采樣位數(shù)和采樣頻率對(duì)于音頻接口來(lái)說(shuō)是最為重要的兩個(gè)基本指標(biāo),也是選擇音頻接口的兩個(gè)重要標(biāo)準(zhǔn)。無(wú)論采樣頻率如何,理論上來(lái)說(shuō)采樣的位數(shù)決定了音頻數(shù)據(jù)最大的力度范圍。每增加一個(gè)采樣位數(shù)相當(dāng)于力度范圍增加了6dB。采樣位數(shù)越多則捕捉到的信號(hào)越精確。對(duì)于采樣率來(lái)說(shuō)你可以想象它類(lèi)似于一個(gè)照相機(jī)。顯然采樣率越高,計(jì)算機(jī)提取的聲音越多,對(duì)于原始的還原也越加精確。
第四章
GUI設(shè)計(jì)實(shí)現(xiàn)
4.1 圖形用戶(hù)界面概念
圖形用戶(hù)界面或圖形用戶(hù)接口是指采用圖形方式顯示的計(jì)算機(jī)操作環(huán)境由用戶(hù)接口。與早期計(jì)算機(jī)使用的命令行界面相比,圖形界面對(duì)于用戶(hù)來(lái)說(shuō)更為簡(jiǎn)便易用。
GUI是MATLAB提供的圖形用戶(hù)界面開(kāi)發(fā)環(huán)境,提供了一系列用于創(chuàng)建圖形用戶(hù)界面的工具,從而簡(jiǎn)化界面布局和編程工作。
4.2用戶(hù)界面設(shè)計(jì)
4.2.1 GUI設(shè)計(jì)模板
在MATLAB主窗口中,選擇File菜單中的New菜單項(xiàng),再選擇其中的GUI命令,就會(huì)顯示圖形用戶(hù)界面的設(shè)計(jì)模板。
MATLAB為GUI設(shè)計(jì)一共準(zhǔn)備了四個(gè)模板,分別是Blank GUI、GUI with Uicontrols、GUI with Axes and Menu、Modal Question Dialog。
當(dāng)用戶(hù)選擇不同的模板時(shí),在GUI設(shè)計(jì)模板界面的右邊就會(huì)顯示出與該模板對(duì)應(yīng)的GUI圖形。
4.2.2 GUI設(shè)計(jì)窗口
在GUI設(shè)計(jì)模板中選中一個(gè)模板,然后單擊OK按鈕,就會(huì)顯示GUI設(shè)計(jì)窗口,選擇不同的GUI設(shè)計(jì)模式時(shí),在GUI設(shè)計(jì)窗口中顯示的結(jié)果是不一樣的。
GUI設(shè)計(jì)窗口由菜單欄、工具欄、空間工具欄以及圖形對(duì)象設(shè)計(jì)區(qū)等部分組成。GUI設(shè)計(jì)窗口的菜單欄有File、Edit、View、Layout、Tools和Help六個(gè)菜單項(xiàng),使用其中的命令可以完成圖形用戶(hù)界面的設(shè)計(jì)操作。
4.2.3 GUI設(shè)計(jì)窗口的基本操作
(1)前面板的設(shè)計(jì):在GUI設(shè)計(jì)窗口創(chuàng)建圖形對(duì)象后,通過(guò)雙擊該對(duì)象,就會(huì)顯示該對(duì)象的屬性編輯器。如下圖所示。例如,創(chuàng)建一個(gè)Push Button對(duì)象,并設(shè)計(jì)該對(duì)象的屬性值。
圖4-1 按鈕屬性編輯器
通過(guò)以上的按鈕屬性編輯器可以根據(jù)個(gè)人情況對(duì)按鈕的名稱(chēng)、顏色、大小等方面的屬性進(jìn)行修改,使按鈕在視覺(jué)上變的更加完美。
(2)按鈕功能的實(shí)現(xiàn):在GUI設(shè)計(jì)窗口創(chuàng)建按鈕后,通過(guò)右鍵單擊按鈕,選擇View callbacks下的callback對(duì)相應(yīng)的按鈕進(jìn)行編程,使按鈕實(shí)現(xiàn)相應(yīng)的功能,如下圖所示對(duì)按鈕的響應(yīng)功能進(jìn)行設(shè)置。
圖4-2 按鈕功能編輯器
進(jìn)入到按鈕程序編輯窗口,通過(guò)編程即可實(shí)現(xiàn)按鈕的相應(yīng)功能,如下圖:
圖4-3 按鈕的編程實(shí)現(xiàn)界面
通過(guò)對(duì)各個(gè)按鈕控件的修改,和對(duì)m文件程序的添加就完成對(duì)GUI窗口的設(shè)計(jì),最后得到的圖形化操作界面如下圖所示:
圖4-4 圖形化操作界面
4.2.4 語(yǔ)音的錄入與打開(kāi)
在MATLAB中,[y,fa,bits]=wavread(‘Blip’,[N1 N2]);用于讀取語(yǔ)音,采樣值放在向y中,fs表示采樣頻率,bits表示采樣位數(shù)。[N1 N2]表示讀取從N1點(diǎn)到N2點(diǎn)的值。
Suond(x,fs,bits);用于對(duì)聲音的回放,向量y則就代表了一個(gè)信號(hào)也就是說(shuō)可以像處理一個(gè)信號(hào)表達(dá)式一樣處理這個(gè)聲音信號(hào)。
4.3課程設(shè)計(jì)的軟件實(shí)現(xiàn)
4.3.1語(yǔ)音信號(hào)的短時(shí)譜
周期性聲門(mén)波可表示為:
(4-1)其中,g[n]是聲門(mén)波的單周期的波形,p[n]是間隔為P的周期采樣序列。當(dāng)u[n]通過(guò)線性非時(shí)變聲道,且該聲道的單位沖擊響應(yīng)為h[n]時(shí),聲道輸出為:
(4-2)為了觀察一段語(yǔ)音,需要降生到輸出乘以一個(gè)一時(shí)刻τ 為中心的窗函數(shù) w[n,τ] ,即得到:
(4-3)
這段語(yǔ)音信號(hào)的頻域表達(dá)式為:
即語(yǔ)音信號(hào)的譜包絡(luò)為
(4-4)
語(yǔ)譜圖就是現(xiàn)實(shí)時(shí)變頻譜幅度特征的圖形表達(dá)式為:
(4-5)
將語(yǔ)音信號(hào)短時(shí)譜程序?qū)懭氲組ATLAB中得到單色語(yǔ)譜圖的波形如下:
圖4-5 語(yǔ)音信號(hào)單色語(yǔ)譜圖
4.3.2 自相關(guān)方法估計(jì)語(yǔ)音信號(hào)的聲道參數(shù)
由均方預(yù)測(cè)誤差最小的得到正則方程:
其中,在最佳解時(shí)的誤差為
在自相關(guān)法中式4-6,式4-8變?yōu)?/p>
(4-10)由式4-9和式4-10可列出方程組式4-11 10
(4-6)(4-7)(4-8)(4-9)
(4-11)
解方程組式4-9求出線性預(yù)測(cè)系數(shù),通過(guò)誤差式4-11可求出增益G
(4-12)
加窗后信號(hào)頻譜圖如下:
圖4-6 加窗后信號(hào)頻譜圖
通過(guò)以上的方法,改變參數(shù)分別求得4極點(diǎn)模型頻率響應(yīng)和6極點(diǎn)模型頻率響應(yīng),6極點(diǎn)波形如下圖所示:
圖4-7 六極點(diǎn)波形圖
最后通過(guò)以上方法用一個(gè)函數(shù)分別實(shí)現(xiàn)以上三個(gè)功能,三個(gè)波形顯示在一個(gè)界面,通過(guò)觀察圖形,查看它們之間的分別。三者比較所得到的波形如下:
圖4-8 三者比較波形圖
4.3.3 基音周期檢測(cè)
數(shù)據(jù)為濁音語(yǔ)音信號(hào)speech1_10k(10000樣點(diǎn)/秒)用25ms的漢明窗對(duì)語(yǔ)音信號(hào)speech1_10k進(jìn)行加窗處理,并畫(huà)出所得到的加窗信號(hào)的自相關(guān)函數(shù),再用根據(jù)中心消波法及三電平中心消波法原理改進(jìn)程序,最后對(duì)比中方法基音檢測(cè)的效果并分析結(jié)果。
實(shí)驗(yàn)原理及方法
相關(guān)檢測(cè)原理:對(duì)于離散的數(shù)字語(yǔ)音信號(hào)序列x(n),如果周期N,則自相關(guān)函數(shù)也是同周期的周期函數(shù)。即:x(n)=x(n+N)。清音信號(hào)沒(méi)有周期性,他的自相關(guān)函數(shù)也沒(méi)有周期。濁音新海具有準(zhǔn)周期性。自相關(guān)基音檢測(cè)正是利用這一性質(zhì)對(duì)語(yǔ)音信號(hào)進(jìn)行基音檢測(cè)的。
中心消波法檢測(cè)原理:中心消波處理是使用如下圖所示的中心消波函數(shù)進(jìn)行處理的:
圖4-9 中心消波檢測(cè)圖
三電平消波法原理:為了減少自相關(guān)計(jì)算中的乘法運(yùn)算,可以把上述中心消
波以后的信號(hào)y(n)的自相關(guān)用兩個(gè)信號(hào)的互相關(guān)代替,其中一個(gè)信號(hào)是y(n)另一個(gè)信號(hào)是對(duì)y(n)進(jìn)行三電平量化產(chǎn)生的結(jié)果。且這個(gè)信號(hào)有三種可能的取值,因而這里的互相關(guān)計(jì)算只需要做加減法,而這個(gè)互相關(guān)序列的周期性與y(n)的自相關(guān)序列是近似相同的。
三電平法對(duì)語(yǔ)音信號(hào)處理得到的波形如下:
圖4-10 三電平法波形圖
中心消波法得到的波形如下圖:
圖4-11 中心消波法波形圖
4.4 GUI實(shí)驗(yàn)箱操作界面設(shè)計(jì)
通過(guò)對(duì)各個(gè)控件的編程和對(duì)參數(shù)的設(shè)計(jì),最后得到的GUI實(shí)驗(yàn)箱操作界面如下圖所示,通過(guò)界面上的各個(gè)按鈕即可實(shí)現(xiàn)相應(yīng)的功能。
圖4-12 GUI實(shí)驗(yàn)箱操作界面
第五章 心得體會(huì)
通過(guò)本次課程設(shè)計(jì)完成了對(duì)語(yǔ)音信號(hào)的讀取與打開(kāi),與課題的要求十分相符;初略的完成了界面的設(shè)計(jì),但也存在相當(dāng)?shù)牟蛔?,達(dá)到了打開(kāi)語(yǔ)音文件,顯示已定波形。語(yǔ)音信號(hào)處理時(shí)語(yǔ)音學(xué)與數(shù)字信號(hào)處理技術(shù)相結(jié)合的交叉學(xué)科,將語(yǔ)音當(dāng)做一種特殊的信號(hào),即一種“復(fù)雜向量”來(lái)看待。也就是說(shuō),體現(xiàn)了數(shù)字信號(hào)處理技術(shù)。
本次課程設(shè)計(jì)時(shí)希望將數(shù)字信號(hào)處理技術(shù)應(yīng)用與某一實(shí)際領(lǐng)域,這里就是指對(duì)語(yǔ)音的處理。作為存儲(chǔ)與計(jì)算機(jī)中的語(yǔ)音信號(hào),其本身就是離散化了的向量,我們只需要將這些離散的量提取出來(lái)美酒可以對(duì)其進(jìn)行處理了。
本次課設(shè),用到了處理數(shù)字信號(hào)的強(qiáng)有力工具M(jìn)ATLAB,通過(guò)MATLAB李的幾個(gè)命令函數(shù)的調(diào)用,很輕易的在實(shí)際化語(yǔ)音與數(shù)字信號(hào)的理論之間搭了一座橋。
最后,還利用了MATLAB的另一強(qiáng)大功能——GUI界面設(shè)計(jì)。設(shè)計(jì)出了一個(gè)建議的用戶(hù)應(yīng)用界面,可以讓人實(shí)現(xiàn)界面操作。
通過(guò)本次課程設(shè)計(jì)讓我更加了解了語(yǔ)音信號(hào)處理在現(xiàn)實(shí)中的強(qiáng)大的應(yīng)用空間,同時(shí)查閱了很多相關(guān)的資料,應(yīng)用MTALAB軟件來(lái)完成,熟練掌握了MATLAB軟件,本次課程設(shè)計(jì)要求用GUI設(shè)計(jì)模塊,查閱了很多資料,更加深刻的陸奧了了這方面知識(shí)。
本次課程設(shè)計(jì),我明白了理論的學(xué)習(xí)需要在實(shí)踐中才能得到鞏固。在課程設(shè)計(jì)中,只有動(dòng)手慢慢研究,才能真正了解MATLAB軟件平臺(tái)中可以直接設(shè)計(jì)數(shù)字濾波器的各個(gè)函數(shù)的調(diào)用,對(duì)設(shè)計(jì)GUI實(shí)驗(yàn)箱的所有函數(shù)的運(yùn)用有了比較好的認(rèn)識(shí)。
通過(guò)這個(gè)課程設(shè)計(jì),我學(xué)到了很多MATLAB和語(yǔ)音信號(hào)的知識(shí),提高了自己在語(yǔ)音信號(hào)設(shè)計(jì)方面的知識(shí)能力,動(dòng)手能力和思維能力都得到了一定的提升,希望自己以后可以更多的繼續(xù)學(xué)習(xí)這一門(mén)課程設(shè)計(jì)方面的知識(shí)。
參考文獻(xiàn)
[1]陳懷琛.MATLAB及在電子信息課程中的應(yīng)用【M】.北京電子工業(yè)出版社.2008.1 [2]張文.基于MATLAB的語(yǔ)音信號(hào)的濾波域?qū)崿F(xiàn)【M】.山西電子技術(shù).2008.2 [3]徐靖濤.基于MATLAB的語(yǔ)音信號(hào)分析與處理【M】.重慶科技學(xué)院學(xué)報(bào).2008.1 [4]張威.MATLAB基礎(chǔ)與編程入門(mén)【M】.西安電子科技大學(xué)出版社,2006. [5]周淵,王炳和,劉斌勝.基于MATLAB的噪聲信號(hào)采集和分析系統(tǒng)的設(shè)計(jì)【J】.噪聲控制.2004(7):52-54.
[6]張雄偉,陳量,楊吉斌.現(xiàn)代語(yǔ)音處理技術(shù)及應(yīng)用【M】.北京:機(jī)械工業(yè)出版社.2003
第二篇:DSP語(yǔ)音信號(hào)處理
摘
要
語(yǔ)音信號(hào)處理是研究數(shù)字信號(hào)處理技術(shù)和語(yǔ)音信號(hào)進(jìn)行處理的一門(mén)學(xué)科,是一門(mén)新型的學(xué)科,是在多門(mén)學(xué)科基礎(chǔ)上發(fā)展起來(lái)的綜合性技術(shù),它涉及到數(shù)字信號(hào)處理、模式識(shí)別、語(yǔ)言學(xué)。語(yǔ)音信號(hào)處理是研究用數(shù)字信號(hào)處理技術(shù)對(duì)語(yǔ)音信號(hào)處理的一門(mén)學(xué)科。處理的目的是要得到一些語(yǔ)音參數(shù)以便高效的傳輸或存儲(chǔ);或者是通過(guò)處理的某種運(yùn)算以達(dá)到某種用途的要求。語(yǔ)音信號(hào)處理又是一門(mén)邊緣學(xué)科。如上所訴,它是“語(yǔ)言語(yǔ)音學(xué)”與“數(shù)字信號(hào)處理”兩個(gè)學(xué)科相結(jié)合的產(chǎn)物。
語(yǔ)音信號(hào)處理屬于信息科學(xué)的一個(gè)重要分支,大規(guī)模集成技術(shù)的高度發(fā)展和計(jì)算機(jī)技術(shù)的飛速前進(jìn),推動(dòng)了這一技術(shù)的發(fā)展。在數(shù)字音頻技術(shù)和多媒體技術(shù)迅速發(fā)展的今天,傳統(tǒng)的磁帶語(yǔ)音錄放系統(tǒng)因體積大、使用不便、放音不清晰而受到了巨大挑戰(zhàn)。本次課程設(shè)計(jì)提出的體積小巧,功耗低的數(shù)字化語(yǔ)音存儲(chǔ)與回放系統(tǒng),可以有效的解決傳統(tǒng)的語(yǔ)音錄放系統(tǒng)在電子與信息處理的使用中受到的限制。
本文提出了語(yǔ)音信號(hào)處理課程建設(shè)的實(shí)驗(yàn)環(huán)節(jié)中的一些考慮,作為專(zhuān)業(yè)課程的學(xué)習(xí),實(shí)驗(yàn)內(nèi)容不能僅僅停留在驗(yàn)證性實(shí)驗(yàn)上,還應(yīng)增加實(shí)驗(yàn)延伸的設(shè)計(jì)要求,是學(xué)生加深對(duì)理論分析認(rèn)識(shí)的同時(shí),強(qiáng)調(diào)培養(yǎng)學(xué)生的實(shí)際動(dòng)手能力和知識(shí)綜合運(yùn)用能力。從而提高語(yǔ)音信號(hào)的教學(xué)和實(shí)驗(yàn)的質(zhì)量。實(shí)驗(yàn)內(nèi)容采用MATLAB編程實(shí)現(xiàn),不僅易于語(yǔ)音信號(hào)處理的實(shí)現(xiàn),更易引導(dǎo)學(xué)生完成實(shí)驗(yàn)延伸的設(shè)計(jì)。
第一章 緒論
1.1選題背景
在我們的現(xiàn)實(shí)生活中從磁帶、錄像帶到CD、VCD、DVD;從黑白電視機(jī)、彩色電視機(jī)、高清晰度電視機(jī)到具有數(shù)字信號(hào)處理功能的電視機(jī);從留聲機(jī)、錄音機(jī)到語(yǔ)音信箱;現(xiàn)在正出在模擬信息到數(shù)字信息的變革之中,傳統(tǒng)的磁帶語(yǔ)音錄放系統(tǒng)因其體積大,使用不便,在電子與信息處理的使用中受到許多限制。
雖然,目前廣播電視系統(tǒng)尚未實(shí)現(xiàn)真正的數(shù)字化,相信在不久的將來(lái),真正的數(shù)字電視、數(shù)字收音機(jī)、數(shù)字收錄機(jī)將進(jìn)入家庭。所以,研究音頻信號(hào)的數(shù)字化存儲(chǔ)、處理和回放系統(tǒng)有著很重要的現(xiàn)實(shí)意義。
通過(guò)設(shè)計(jì)語(yǔ)音信號(hào)實(shí)驗(yàn)箱可以對(duì)語(yǔ)音信號(hào)實(shí)現(xiàn)各種形式的變換,因此學(xué)會(huì)對(duì)語(yǔ)音信號(hào)的處理,也可自行研究將此語(yǔ)音處理技術(shù)應(yīng)用到現(xiàn)實(shí)生活中。
1.2課題意義
語(yǔ)音信號(hào)處理的一門(mén)比較實(shí)用的電子工程的專(zhuān)業(yè)課程,語(yǔ)音是人類(lèi)獲取信息的重要來(lái)源和利用信息的重要手段,通過(guò)語(yǔ)言相互傳遞信息是人類(lèi)最重要的基本功能之一,語(yǔ)音是人類(lèi)特有的功能,它是創(chuàng)造和記載幾千年來(lái)人類(lèi)文明史的根本手段,是人類(lèi)最重要、最有效、最常用和最方便的交換信息的形式。
語(yǔ)音信號(hào)處理是研究用數(shù)字信號(hào)處理技術(shù)對(duì)語(yǔ)音信號(hào)進(jìn)行處理的一門(mén)學(xué)科,它是一門(mén)新興的學(xué)科,同時(shí)又是綜合性的多學(xué)科領(lǐng)域剛也涉及面很廣的交叉學(xué)科。
第二章 課程設(shè)計(jì)要求及系統(tǒng)原理
2.1 課程設(shè)計(jì)基本要求
(1)學(xué)會(huì)MATLAB的使用,掌握MATLAB的程序設(shè)計(jì)方法;
(2)掌握在windows環(huán)境下語(yǔ)音信號(hào)的采集方法;
(3)掌握數(shù)字信號(hào)處理的基本概念,基本理論和基本方法;
(4)掌握MATLAB設(shè)計(jì)方法;
(5)學(xué)會(huì)用MATLAB對(duì)信號(hào)進(jìn)行分析和處理。
2.2 系統(tǒng)基本原理
語(yǔ)音采集原理是,人耳能聽(tīng)到的聲音是一種范圍為20Hz—20kHz,而一般語(yǔ)音頻率最高為3.4kHz。語(yǔ)音的采集是指語(yǔ)音聲波信號(hào)經(jīng)麥克風(fēng)和高頻放大器轉(zhuǎn)換成有一定幅度的模擬量電信號(hào),然后再轉(zhuǎn)換成數(shù)字量的全過(guò)程。
本次設(shè)計(jì)的基本原理是對(duì)語(yǔ)音的錄音和放音進(jìn)行數(shù)字化控制。其中,關(guān)鍵技術(shù)在于:為了增加語(yǔ)音存儲(chǔ)時(shí)間,提高存儲(chǔ)器的利用率,采用了非失真壓縮算法對(duì)語(yǔ)音信號(hào)進(jìn)行壓縮后再存儲(chǔ),而在回放時(shí)再進(jìn)行解壓縮;同時(shí),對(duì)輸入語(yǔ)音信號(hào)進(jìn)行數(shù)字濾波以抑制雜音和干擾,從而確保了語(yǔ)音回放的可靠質(zhì)量。
通過(guò)設(shè)計(jì)一個(gè)GUI實(shí)驗(yàn)箱,并添加相應(yīng)的控制控件,添加一個(gè)聲音文件,通過(guò)MATLAB編程,使其通過(guò)各種按鈕實(shí)現(xiàn)語(yǔ)音信號(hào)處理的各種功能,最后做成一個(gè)完整的語(yǔ)音信號(hào)處理實(shí)驗(yàn)箱。
第三章 設(shè)計(jì)方案論證
3.1 設(shè)計(jì)理論依據(jù)
3.1.1采樣定理:
在進(jìn)行模擬/數(shù)字信號(hào)的轉(zhuǎn)換過(guò)程中,當(dāng)采樣頻率fs.max大于信號(hào)中最高頻率fmax的2倍時(shí),則采樣之后的數(shù)字信號(hào)完整的保留了原始信號(hào)中的信號(hào),一般實(shí)際應(yīng)用中保證采樣頻率為信號(hào)最高頻率的5—10倍;采樣定理又稱(chēng)奈奎斯特定理。
3.1.2采樣頻率:
采樣頻率是指計(jì)算機(jī)每秒鐘采集多少個(gè)聲音樣本,是描述聲音文件的音質(zhì)、音調(diào)、衡量聲卡、聲音文件的質(zhì)量標(biāo)準(zhǔn)。采樣頻率越高,即采樣的間隔時(shí)間越短,則在單位時(shí)間內(nèi)計(jì)算機(jī)得到的聲音樣本數(shù)據(jù)就越多,對(duì)聲音波形的表示也就越精確,采樣頻率與聲音頻率之間有一定的關(guān)系,根據(jù)奈奎斯特理論,只有采樣頻率高于聲音信號(hào)最高頻率的2倍的時(shí)候,才能把數(shù)字信號(hào)表示的聲音還原成為原來(lái)的聲音,這就是說(shuō)采樣頻率是衡量聲卡采集、記錄和還原聲音文件的質(zhì)量標(biāo)準(zhǔn)。
3.1.3采樣位數(shù)與采樣頻率
采樣位數(shù)即采樣值或取樣值,用來(lái)衡量聲音波動(dòng)變化的參數(shù),是指聲卡在采集和播放聲音文件時(shí)候使用數(shù)字聲音信號(hào)的二進(jìn)制為數(shù)。采樣頻率是指錄音設(shè)備在一秒鐘內(nèi)對(duì)聲音信號(hào)的采樣次數(shù),采樣頻率越高聲音的還原就越真實(shí)越自然。
采樣位數(shù)和采樣頻率對(duì)于音頻接口來(lái)說(shuō)是最為重要的兩個(gè)基本指標(biāo),也是選擇音頻接口的兩個(gè)重要標(biāo)準(zhǔn)。無(wú)論采樣頻率如何,理論上來(lái)說(shuō)采樣的位數(shù)決定了音頻數(shù)據(jù)最大的力度范圍。每增加一個(gè)采樣位數(shù)相當(dāng)于力度范圍增加了6dB。采樣位數(shù)越多則捕捉到的信號(hào)越精確。對(duì)于采樣率來(lái)說(shuō)你可以想象它類(lèi)似于一個(gè)照相機(jī)。顯然采樣率越高,計(jì)算機(jī)提取的聲音越多,對(duì)于原始的還原也越加精確。
第四章 圖形用戶(hù)界面設(shè)計(jì)
4.1 圖形用戶(hù)界面概念
圖形用戶(hù)界面或圖形用戶(hù)接口是指采用圖形方式顯示的計(jì)算機(jī)操作環(huán)境由用戶(hù)接口。與早期計(jì)算機(jī)使用的命令行界面相比,圖形界面對(duì)于用戶(hù)來(lái)說(shuō)更為簡(jiǎn)便易用。
GUI是MATLAB提供的圖形用戶(hù)界面開(kāi)發(fā)環(huán)境,提供了一系列用于創(chuàng)建圖形用戶(hù)界面的工具,從而簡(jiǎn)化界面布局和編程工作。
4.2用戶(hù)界面設(shè)計(jì)
4.2.1 GUI設(shè)計(jì)模板
在MATLAB主窗口中,選擇File菜單中的New菜單項(xiàng),再選擇其中的GUI命令,就會(huì)顯示圖形用戶(hù)界面的設(shè)計(jì)模板。
MATLAB為GUI設(shè)計(jì)一共準(zhǔn)備了四個(gè)模板,分別是Blank GUI、GUI with Uicontrols、GUI with Axes and Menu、Modal Question Dialog。
當(dāng)用戶(hù)選擇不同的模板時(shí),在GUI設(shè)計(jì)模板界面的右邊就會(huì)顯示出與該模板對(duì)應(yīng)的GUI圖形。
4.2.2 GUI設(shè)計(jì)窗口
在GUI設(shè)計(jì)模板中選中一個(gè)模板,然后單擊OK按鈕,就會(huì)顯示GUI設(shè)計(jì)窗口,選擇不同的GUI設(shè)計(jì)模式時(shí),在GUI設(shè)計(jì)窗口中顯示的結(jié)果是不一樣的。
GUI設(shè)計(jì)窗口由菜單欄、工具欄、空間工具欄以及圖形對(duì)象設(shè)計(jì)區(qū)等部分組成。GUI設(shè)計(jì)窗口的菜單欄有File、Edit、View、Layout、Tools和Help六個(gè)菜單項(xiàng),使用其中的命令可以完成圖形用戶(hù)界面的設(shè)計(jì)操作。
4.2.3 GUI設(shè)計(jì)窗口的基本操作
(1)前面板的設(shè)計(jì):在GUI設(shè)計(jì)窗口創(chuàng)建圖形對(duì)象后,通過(guò)雙擊該對(duì)象,就會(huì)顯示該對(duì)象的屬性編輯器。如下圖所示。例如,創(chuàng)建一個(gè)Push Button對(duì)象,并設(shè)計(jì)該對(duì)象的屬性值。
圖4-1 按鈕屬性編輯器
通過(guò)以上的按鈕屬性編輯器可以根據(jù)個(gè)人情況對(duì)按鈕的名稱(chēng)、顏色、大小等方面的屬性進(jìn)行修改,使按鈕在視覺(jué)上變的更加完美。
(2)按鈕功能的實(shí)現(xiàn):在GUI設(shè)計(jì)窗口創(chuàng)建按鈕后,通過(guò)右鍵單擊按鈕,選擇View callbacks下的callback對(duì)相應(yīng)的按鈕進(jìn)行編程,使按鈕實(shí)現(xiàn)相應(yīng)的功能,如下圖所示對(duì)按鈕的響應(yīng)功能進(jìn)行設(shè)置。
圖4-2 按鈕功能編輯器
進(jìn)入到按鈕程序編輯窗口,通過(guò)編程即可實(shí)現(xiàn)按鈕的相應(yīng)功能,如下圖:
圖4-3 按鈕的編程實(shí)現(xiàn)界面
通過(guò)對(duì)各個(gè)按鈕控件的修改,和對(duì)m文件程序的添加就完成對(duì)GUI窗口的設(shè)計(jì),最后得到的圖形化操作界面如下圖所示:
圖4-4 圖形化操作界面
4.2.4 語(yǔ)音的錄入與打開(kāi)
在MATLAB中,[y,fa,bits]=wavread(‘Blip’,[N1 N2]);用于讀取語(yǔ)音,7
采樣值放在向y中,fs表示采樣頻率,bits表示采樣位數(shù)。[N1 N2]表示讀取從N1點(diǎn)到N2點(diǎn)的值。
Suond(x,fs,bits);用于對(duì)聲音的回放,向量y則就代表了一個(gè)信號(hào)也就是說(shuō)可以像處理一個(gè)信號(hào)表達(dá)式一樣處理這個(gè)聲音信號(hào)。
第五章 課程設(shè)計(jì)的軟件實(shí)現(xiàn)
5.1 部分函數(shù)語(yǔ)法格式
讀wav文件: x=wavread(‘filename’)數(shù)組a及b中元素相乘: a.*b 創(chuàng)建圖形窗口命令: figure 繪圖函數(shù): plot(x)坐標(biāo)軸: axis([xmin xmax ymin ymax])坐標(biāo)軸注解: xlabel(‘?’)ylabel(‘?’)圖例注解: legend(‘?’)一階高通濾波器: y=filter([1-0.09375],1,x)分幀函數(shù): f=enframe(x,len,inc)x為輸入語(yǔ)音信號(hào),len指定了幀長(zhǎng),inc指定幀移,函數(shù)返回為nXlen的一個(gè)矩陣,每一行都是一幀數(shù)據(jù)。
5.2語(yǔ)音信號(hào)處理的相關(guān)函數(shù)
5.2.1語(yǔ)音信號(hào)的短時(shí)譜:
周期性聲門(mén)波可表示為:
(5-1)其中,g[n]是聲門(mén)波的單周期的波形,p[n]是間隔為P的周期采樣序列。當(dāng)u[n]通過(guò)線性非時(shí)變聲道,且該聲道的單位沖擊響應(yīng)為h[n]時(shí),聲道輸出為:
(5-2)為了觀察一段語(yǔ)音,需要降生到輸出乘以一個(gè)一時(shí)刻τ 為中心的窗函數(shù) w[n,τ] ,即得到:
(5-3)
這段語(yǔ)音信號(hào)的頻域表達(dá)式為:
(5-4)
即語(yǔ)音信號(hào)的譜包絡(luò)為
語(yǔ)譜圖就是現(xiàn)實(shí)時(shí)變頻譜幅度特征的圖形表達(dá)式為:
(5-5)
將語(yǔ)音信號(hào)短時(shí)譜程序?qū)懭氲組ATLAB中得到單色語(yǔ)譜圖的波形如下:
圖5-1 語(yǔ)音信號(hào)單色語(yǔ)譜圖
5.2.2 自相關(guān)方法估計(jì)語(yǔ)音信號(hào)的聲道參數(shù):
由均方預(yù)測(cè)誤差最小的得到正則方程:
(5-6)
其中,(5-7)
在最佳解時(shí)的誤差為
(5-8)
在自相關(guān)法中式5-6,式5-8變?yōu)?/p>
(5-9)
(5-10)由式5-9和式5-10可列出方程組式5-11
(5-11)
解方程組式5-9求出線性預(yù)測(cè)系數(shù),通過(guò)誤差式5-11可求出增益G
(5-12)
加窗后信號(hào)頻譜圖如下:
圖5-2 加窗后信號(hào)頻譜圖
通過(guò)以上的方法,改變參數(shù)分別求得4極點(diǎn)模型頻率響應(yīng)和6極點(diǎn)模型頻率響應(yīng),6極點(diǎn)波形如下圖所示:
圖5-3 六極點(diǎn)波形圖
最后通過(guò)以上方法用一個(gè)函數(shù)分別實(shí)現(xiàn)以上三個(gè)功能,三個(gè)波形顯示在一個(gè)界面,通過(guò)觀察圖形,查看它們之間的分別。三者比較所得到的波形如下:
圖5-4 三者比較波形圖
5.2.3 基音周期檢測(cè)
數(shù)據(jù)為濁音語(yǔ)音信號(hào)speech1_10k(10000樣點(diǎn)/秒)用25ms的漢明窗對(duì)語(yǔ)音信號(hào)speech1_10k進(jìn)行加窗處理,并畫(huà)出所得到的加窗信號(hào)的自相關(guān)函數(shù),再用根據(jù)中心消波法及三電平中心消波法原理改進(jìn)程序,最后對(duì)比中方法基音檢測(cè)的效果并分析結(jié)果。
實(shí)驗(yàn)原理及方法
(1)自相關(guān)檢測(cè)原理:對(duì)于離散的數(shù)字語(yǔ)音信號(hào)序列x(n),如果周期N,則自相關(guān)函數(shù)也是同周期的周期函數(shù)。即:x(n)=x(n+N)。清音信號(hào)沒(méi)有周期性,他的自相關(guān)函數(shù)也沒(méi)有周期。濁音新海具有準(zhǔn)周期性。自相關(guān)基音檢測(cè)正是利用這一性質(zhì)對(duì)語(yǔ)音信號(hào)進(jìn)行基音檢測(cè)的。
(2)中心消波法檢測(cè)原理:中心消波處理是使用如下圖所示的中心消波函數(shù)進(jìn)行處理的:
圖5-5 中心消波檢測(cè)圖
(3)三電平消波法原理:為了減少自相關(guān)計(jì)算中的乘法運(yùn)算,可以把上述中心消波以后的信號(hào)y(n)的自相關(guān)用兩個(gè)信號(hào)的互相關(guān)代替,其中一個(gè)信號(hào)是y(n)另一個(gè)信號(hào)是對(duì)y(n)進(jìn)行三電平量化產(chǎn)生的結(jié)果。且這個(gè)信號(hào)有三種可能的取值,因而這里的互相關(guān)計(jì)算只需要做加減法,而這個(gè)互相關(guān)序列的周期性與y(n)的自相關(guān)序列是近似相同的。
三電平法對(duì)語(yǔ)音信號(hào)處理得到的波形如下:
圖5-6 三電平法波形圖
中心消波法得到的波形如下圖:
圖5-7 中心消波法波形圖
5.3 GUI實(shí)驗(yàn)箱操作界面設(shè)計(jì)
通過(guò)對(duì)各個(gè)控件的編程和對(duì)參數(shù)的設(shè)計(jì),最后得到的GUI實(shí)驗(yàn)箱操作界
面如下圖所示,通過(guò)界面上的各個(gè)按鈕即可實(shí)現(xiàn)相應(yīng)的功能。
圖5-8 GUI實(shí)驗(yàn)箱操作界面
第六章 心得體會(huì)
通過(guò)本次課程設(shè)計(jì)完成了對(duì)語(yǔ)音信號(hào)的讀取與打開(kāi),與課題的要求十分相符;初略的完成了界面的設(shè)計(jì),但也存在相當(dāng)?shù)牟蛔?,達(dá)到了打開(kāi)語(yǔ)音文件,顯示已定波形。語(yǔ)音信號(hào)處理時(shí)語(yǔ)音學(xué)與數(shù)字信號(hào)處理技術(shù)相結(jié)合的交叉學(xué)科,將語(yǔ)音當(dāng)做一種特殊的信號(hào),即一種“復(fù)雜向量”來(lái)看待。也就是說(shuō),體現(xiàn)了數(shù)字信號(hào)處理技術(shù)。
本次課程設(shè)計(jì)時(shí)希望將數(shù)字信號(hào)處理技術(shù)應(yīng)用與某一實(shí)際領(lǐng)域,這里就是指對(duì)語(yǔ)音的處理。作為存儲(chǔ)與計(jì)算機(jī)中的語(yǔ)音信號(hào),其本身就是離散化了的向量,我們只需要將這些離散的量提取出來(lái)美酒可以對(duì)其進(jìn)行處理了。
本次課設(shè),用到了處理數(shù)字信號(hào)的強(qiáng)有力工具M(jìn)ATLAB,通過(guò)MATLAB李的幾個(gè)命令函數(shù)的調(diào)用,很輕易的在實(shí)際化語(yǔ)音與數(shù)字信號(hào)的理論之間搭了一座橋。
最后,還利用了MATLAB的另一強(qiáng)大功能——GUI界面設(shè)計(jì)。設(shè)計(jì)出了一個(gè)建議的用戶(hù)應(yīng)用界面,可以讓人實(shí)現(xiàn)界面操作。
通過(guò)本次課程設(shè)計(jì)讓我更加了解了語(yǔ)音信號(hào)處理在現(xiàn)實(shí)中的強(qiáng)大的應(yīng)用空間,同時(shí)查閱了很多相關(guān)的資料,應(yīng)用MTALAB軟件來(lái)完成,熟練掌握了MATLAB軟件,本次課程設(shè)計(jì)要求用GUI設(shè)計(jì)模塊,查閱了很多資料,更加深刻的陸奧了了這方面知識(shí)。
本次課程設(shè)計(jì),我明白了理論的學(xué)習(xí)需要在實(shí)踐中才能得到鞏固。在課程設(shè)計(jì)中,只有動(dòng)手慢慢研究,才能真正了解MATLAB軟件平臺(tái)中可以直接設(shè)計(jì)數(shù)字濾波器的各個(gè)函數(shù)的調(diào)用,對(duì)設(shè)計(jì)GUI實(shí)驗(yàn)箱的所有函數(shù)的運(yùn)用有了比較好的認(rèn)識(shí)。
通過(guò)這個(gè)課程設(shè)計(jì),我學(xué)到了很多MATLAB和語(yǔ)音信號(hào)的知識(shí),提高了自己在語(yǔ)音信號(hào)設(shè)計(jì)方面的知識(shí)能力,動(dòng)手能力和思維能力都得到了一定的提升,希望自己以后可以更多的繼續(xù)學(xué)習(xí)這一門(mén)課程設(shè)計(jì)方面的知識(shí)。
附 錄
1.源程序代碼:
參考文獻(xiàn)
[1] 劉慶華 陳紫強(qiáng)《基于MATLAB和DSP的語(yǔ)音信號(hào)處理課程的建設(shè)》 電氣電子教學(xué)學(xué)報(bào) 2006 10(3):124-128 [2] 張力 《MATLAB在語(yǔ)音信號(hào)處理輔助教學(xué)中的應(yīng)用》 電氣電子教學(xué)學(xué)報(bào) 2005 27卷2期:96-99 [3] 鄧立新 楊震《信息技術(shù)融入“語(yǔ)音信號(hào)處理”課程的教學(xué)實(shí)踐》電氣電子教學(xué)學(xué)報(bào) 2005 27卷5期:13-16 [4] 胡航,《語(yǔ)音信號(hào)處理》 哈爾濱工業(yè)大學(xué)出版社 2005年2月,第二版:135-137 [5] 張平,《MATLAB基礎(chǔ)與應(yīng)用》 北京航空航天大學(xué)出版社 2007,第二版:85-92 [6] 謝德芳 《數(shù)字信號(hào)處理》 北京科學(xué)出版社 2005,第一版
[7] 張雄偉 《現(xiàn)代語(yǔ)音處理技術(shù)及應(yīng)用》 機(jī)械工業(yè)出版社 2006,第二版 [8] 吳家安 《語(yǔ)音編碼技術(shù)及應(yīng)用》 機(jī)械工業(yè)出版社 2006 第一版 [9] 劉幺和 宋庭新 《語(yǔ)音識(shí)別與控制應(yīng)用技術(shù)》 科學(xué)出版社 2008 第二版
[10] 李昌立 吳善培 《數(shù)字語(yǔ)音編碼實(shí)用教程》 人民郵電出版社 2004 第一版
[11] 姚天仁 《數(shù)字語(yǔ)音處理》 華中科技大學(xué)出版社 1992 第二版 [12] 朱敏雄 《計(jì)算機(jī)語(yǔ)音技術(shù)(修訂版)》 北京航空航天大學(xué)出版社 2002 第一版
[13] 王炳錫 《語(yǔ)音編碼》 西安電子科技大學(xué)出版社 2002 第一版
第三篇:語(yǔ)音信號(hào)處理實(shí)驗(yàn)報(bào)告要求
實(shí)驗(yàn)一:
1.簡(jiǎn)述本次試驗(yàn)的目的,關(guān)于基音周期的理論;
2.使用相關(guān)法的同學(xué),給出程序的同時(shí)要說(shuō)明所使用語(yǔ)音段的長(zhǎng)度(短時(shí)平穩(wěn)性),解釋怎樣在matlab中實(shí)現(xiàn)三電平削波(for...end循環(huán)和if elseif else end判決的使用)。給出清濁音兩組截取后的語(yǔ)音信號(hào)波形圖、三電平削波后的信號(hào)圖、自相關(guān)計(jì)算后的信號(hào)圖。然后根據(jù)自相關(guān)信號(hào)圖上最大峰值和次峰值之間的間隔點(diǎn)數(shù),計(jì)算出基音周期和基音頻率;
3.使用倒譜法的同學(xué),要解釋分幀后加窗的方法,給出清濁音其中各一幀的語(yǔ)音信號(hào)波形圖,和計(jì)算后的倒譜圖。并根據(jù)倒譜圖上對(duì)應(yīng)基音周期處的峰值的位置,給出基音周期。4.使用簡(jiǎn)化逆濾波的同學(xué),要說(shuō)明切比雪夫2型低通濾波器的使用方法(cheby2、freqz兩個(gè)函數(shù)的使用方法、參數(shù)意義),給出低通濾波后的信號(hào)波形圖、5倍抽取后的波形圖、自相關(guān)計(jì)算后信號(hào)波形圖、5倍插值后的信號(hào)波形圖,根據(jù)濁音內(nèi)插后的信號(hào)圖上最大峰值和次峰值之間的間隔點(diǎn)數(shù)計(jì)算基音周期;5.比較所選用的兩種方法的結(jié)果。
實(shí)驗(yàn)二:
1.給出倒譜法的程序,解釋漢明窗寬度的選取要求(書(shū)上有簡(jiǎn)單解釋?zhuān)忉屧鯓訉?shí)現(xiàn)倒譜窗的matlab編程方法和倒譜窗寬度的選取(男女生有一定的差別),給出加窗后的信號(hào)波形圖、對(duì)數(shù)譜圖、倒譜圖、加窗后的信號(hào)頻譜圖,給出三個(gè)共振峰的估值。
2.給出LPC譜估計(jì)程序,不同LPC階數(shù)時(shí)的LPC譜圖,在n=?時(shí),學(xué)生自己估計(jì)的前三個(gè)共振峰的值。
實(shí)驗(yàn)三:
給出錄音的內(nèi)容,判斷結(jié)果。解釋端點(diǎn)檢測(cè)的原理、MFCC系數(shù)的說(shuō)明和DTW算法的簡(jiǎn)單原理(參考書(shū)上都有比較詳細(xì)的解釋?zhuān)?。識(shí)別的結(jié)果的表格和識(shí)別的結(jié)果正確率(正確的數(shù)目,錯(cuò)誤的數(shù)目,正確率)??紤]一下識(shí)別錯(cuò)誤的原因(錄音的效果?端點(diǎn)檢測(cè)算法的可靠性?DTW算法的可靠性?等)
第四篇:專(zhuān)業(yè)英語(yǔ)7語(yǔ)音信號(hào)處理
1、演講的目的是溝通。有幾種方法表征語(yǔ)音通信的潛力。一個(gè)高度量化的方法是香農(nóng)信息論思想的引入。根據(jù)信息變換理論,語(yǔ)音可以表示其消息內(nèi)容或信息。語(yǔ)音特征的另一種表征方式是信號(hào)承載的消息信息,i.e.(注:i.e.意思是:即,也就是),如聲波。雖然信息論思路在先進(jìn)的通信系統(tǒng)中發(fā)揮了重要作用,但它是基于波形的語(yǔ)音表示,或一些在實(shí)際應(yīng)用中一直是最有用的參數(shù)模型。
2、在考慮語(yǔ)音通信的過(guò)程中,開(kāi)始在大腦中思考消息在揚(yáng)聲器中的一些抽象的表示形式是有幫助的。雖然產(chǎn)生語(yǔ)音的過(guò)程是復(fù)雜的,但該消息中的信息最終被轉(zhuǎn)換成聲學(xué)信號(hào)。在言語(yǔ)產(chǎn)生的過(guò)程中消息的信息可以被認(rèn)為存在許多不同的表示方式。例如,該消息信息首先被轉(zhuǎn)換成一組能控制發(fā)音機(jī)制的神經(jīng)信號(hào)(即,運(yùn)動(dòng)舌頭,嘴唇,聲帶等)。發(fā)音器官的運(yùn)動(dòng)響應(yīng)于這些神經(jīng)信號(hào)來(lái)完成一系列的手勢(shì),其結(jié)果是在原始消息中包含的信息的音響波形。
3、信息雖然連通但講話本質(zhì)上是一個(gè)離散的性質(zhì)的信息,i.e.,即,它可以被有限集合中元素串聯(lián)的符號(hào)表示,每一個(gè)聲音的符號(hào)可以被分類(lèi),被稱(chēng)為音素。每種語(yǔ)言都有它自己的獨(dú)特的音素,編號(hào)通常在30至50之間。例如英語(yǔ)可以表示為一組約42個(gè)編號(hào)的音素。
4、信息理論關(guān)注的中心問(wèn)題是傳達(dá)信息的速率。講話的信息率可以通過(guò)發(fā)音器官物理上的運(yùn)動(dòng)速度粗略估計(jì),人類(lèi)講話的平均速率每秒約10個(gè)音素。如果每個(gè)音素表示一個(gè)二進(jìn)制數(shù),那么6位數(shù)字代碼足以代表所有的英語(yǔ)音素,設(shè)平均增長(zhǎng)率為每秒10音素,并且忽略任何相鄰音素的組合,我們得到了一個(gè)大約60比特/秒的平均信息語(yǔ)速。換句話說(shuō),書(shū)面講話包含的信息相當(dāng)于60位/秒正常講話率。當(dāng)然一個(gè)“真正”的語(yǔ)音信息內(nèi)容的下界是大大高于這個(gè)速度的,上述估計(jì)確實(shí)需要考慮一些因素,如說(shuō)話者的身份和情感狀態(tài),說(shuō)話的速率,聲音的響度,等。
5、在語(yǔ)音通信系統(tǒng)中,語(yǔ)音信號(hào)的傳輸、存儲(chǔ)、和處理有許多方法。技術(shù)問(wèn)題導(dǎo)致各種表示形式的語(yǔ)音信號(hào)的產(chǎn)生。一般來(lái)說(shuō),有兩個(gè)主要的問(wèn)題存在于任何一個(gè)系統(tǒng)中:一是保護(hù)消息內(nèi)容的語(yǔ)音信號(hào)。另一個(gè)是語(yǔ)音信號(hào)便于傳輸和存儲(chǔ)的表示形式?;蛘咭砸环N靈活的形式表示,這樣修改后不會(huì)對(duì)語(yǔ)音信號(hào)所表示的消息內(nèi)容產(chǎn)生嚴(yán)重退化的影響。
6、語(yǔ)言信號(hào)必須這樣表示,信息內(nèi)容能被聽(tīng)眾容易的提取,或自動(dòng)被機(jī)器提取。
語(yǔ)音信號(hào)的表示形式(而不是消息的內(nèi)容)可能需要從500到1百萬(wàn)比特每秒以上的提取速度。這些表示形式的設(shè)計(jì)和實(shí)現(xiàn),信號(hào)處理的方法發(fā)揮基礎(chǔ)性作用。
7、一般的信息處理問(wèn)題可用圖3-22描繪的框圖表示。在語(yǔ)音信號(hào)的情況下,說(shuō)話者就是信源。一般測(cè)量或觀察聲波的尺寸。
8、涉及信號(hào)處理,首先根據(jù)一個(gè)給定的模型獲得信號(hào),利用運(yùn)用程序?qū)π盘?hào)進(jìn)行一些更高層次的變換,以便把該信號(hào)轉(zhuǎn)換成一個(gè)更方便的形式。在這個(gè)過(guò)程中的最后一步是報(bào)文信息的提取和利用。本步驟可以由人類(lèi)聽(tīng)眾或由機(jī)器自動(dòng)進(jìn)行。例如,一個(gè)系統(tǒng),其功能是自動(dòng)識(shí)別揚(yáng)聲器從一個(gè)給定的發(fā)言者發(fā)出的語(yǔ)音信號(hào),該語(yǔ)音信號(hào)可能使用一個(gè)隨時(shí)間變化的頻譜表示。
9、因此,語(yǔ)音信號(hào)處理涉及兩個(gè)任務(wù)。一,這是語(yǔ)音信號(hào)的波形或參數(shù)一般表示形式的獲取手段;二,信號(hào)處理在轉(zhuǎn)換的過(guò)程中提供函數(shù)幫助,這是信號(hào)一般性質(zhì)的替代形式,但更適合特定的應(yīng)用程序。
10、我們將探索數(shù)字技術(shù)在語(yǔ)音信號(hào)處理中的作用。數(shù)字信號(hào)處理涉及離散信號(hào)的獲取與表示,伴隨變換理論,涉及和數(shù)控程序的實(shí)施用來(lái)處理離散信號(hào)的表示。數(shù)字信號(hào)的處理目的類(lèi)似于模擬信號(hào)的處理。因此,在語(yǔ)音通信的上下文中單獨(dú)挑出數(shù)字信號(hào)處理技術(shù)做特別考慮是合理的??梢粤信e一些很重要的原因。首先,最重要的大概是一些極其復(fù)雜的信號(hào)處理功能可以用數(shù)字技術(shù)來(lái)實(shí)施的事實(shí)。此外,語(yǔ)音信號(hào)處理中常用的算法本質(zhì)上是離散時(shí)間信號(hào)處理系統(tǒng)。它們大多不適合作為近似的模擬系統(tǒng)來(lái)觀察,的確在許多情況下沒(méi)有可用的模擬實(shí)施方案。
11、數(shù)字信號(hào)處理技術(shù)在語(yǔ)音處理問(wèn)題中被首次運(yùn)用,仿真復(fù)雜的模擬系統(tǒng)。最初的觀點(diǎn)來(lái)看,模擬系統(tǒng)可以在計(jì)算機(jī)上進(jìn)行模擬,避免為了試驗(yàn)參數(shù)選擇和其他設(shè)計(jì)考慮系統(tǒng)建設(shè)的必要性。數(shù)字仿真模擬系統(tǒng)的首次應(yīng)用,需要大量的處理時(shí)間。在1960年代中期,一次數(shù)字信號(hào)處理的革命發(fā)生了。主要的主要催化劑是發(fā)展快速的計(jì)算機(jī)和突飛猛進(jìn)的數(shù)字信號(hào)處理技術(shù)理論。因此,數(shù)字信號(hào)處理系統(tǒng)具有的優(yōu)點(diǎn)使得年輕一代有能力來(lái)模擬模擬系統(tǒng)的情況變得明朗。目前計(jì)算機(jī)語(yǔ)音處理系統(tǒng)在實(shí)驗(yàn)室中實(shí)現(xiàn),他們作為一個(gè)數(shù)字系統(tǒng),可以作為實(shí)施特殊用途的數(shù)字硬件或?qū)?zhuān)用的計(jì)算機(jī)系統(tǒng)進(jìn)行精確模擬。
12、除理論發(fā)展外,伴隨數(shù)字硬件的發(fā)展數(shù)字處理技術(shù)的優(yōu)點(diǎn)進(jìn)一步加強(qiáng)以致于超過(guò)模擬系統(tǒng)。數(shù)字系統(tǒng)非??煽亢途o湊。集成電路技術(shù)已經(jīng)發(fā)展到可以把極其
復(fù)雜的系統(tǒng)實(shí)現(xiàn)在單個(gè)芯片上。邏輯運(yùn)算的速度足以滿(mǎn)足許多信號(hào)處理功能所需的巨大數(shù)量的計(jì)算,可以實(shí)現(xiàn)實(shí)時(shí)語(yǔ)音采樣率。
13、在語(yǔ)音通信系統(tǒng)中使用數(shù)字技術(shù)有另外的原因。如,如果使用合適的編碼,在非常嘈雜的信道,數(shù)字形式的語(yǔ)音信號(hào)能可靠地傳輸。語(yǔ)音信號(hào)的數(shù)字形式與其他形式的數(shù)據(jù)的相同。因此,可以使用一個(gè)通信網(wǎng)絡(luò)同時(shí)傳輸話音和數(shù)據(jù),除解碼外沒(méi)有必要區(qū)分它們。在安全方面語(yǔ)音信號(hào)的傳輸需要數(shù)字表示,它具有明顯的優(yōu)勢(shì)超過(guò)了模擬系統(tǒng)。為了保密,對(duì)信息比特進(jìn)行加擾,最終能在接收器解讀。這些和許多其他的原因,數(shù)字技術(shù)正在被越來(lái)越多地應(yīng)用于語(yǔ)音通信問(wèn)題。
14、考慮應(yīng)用數(shù)字信號(hào)處理技術(shù)來(lái)處理語(yǔ)音通信問(wèn)題,專(zhuān)注于三個(gè)主題它是非常有幫助的:語(yǔ)音信號(hào)的數(shù)字表示形式,實(shí)施先進(jìn)的處理技術(shù)和很大程度上依賴(lài)于數(shù)字信號(hào)處理的應(yīng)用程序類(lèi)。
第五篇:語(yǔ)音信號(hào)處理與識(shí)別
信號(hào)系統(tǒng)課程設(shè)計(jì)報(bào)告
歐陽(yáng)光亮
2012029020025
語(yǔ)音信號(hào)處理與識(shí)別
目的:理解時(shí)域和頻域尺度變換基本概念,掌握信號(hào)時(shí)頻域分析方法,正確理解采樣定理,準(zhǔn)確理解濾波器的概念。內(nèi)容:
(1)使用Matlab中wavrecord命令錄制一段3秒的語(yǔ)音信號(hào),使用wavplay命令播放,錄制命令和播放命令中的采樣頻率設(shè)置成相同和不同兩種情況,對(duì)觀察到的現(xiàn)象進(jìn)行分析并結(jié)合課本中的知識(shí)對(duì)該現(xiàn)象進(jìn)行解釋?zhuān)唬?)使用不同的采樣頻率錄制一段3秒的語(yǔ)音信號(hào),畫(huà)出信號(hào)的時(shí)域波形和頻譜;找到語(yǔ)音信號(hào)的主要頻譜成分所在的帶寬;觀察并分析不同采樣頻率對(duì)波形和頻譜的影響;尋找聲音信號(hào)不出現(xiàn)明顯失真的最低采樣頻率;(3)錄制一段男生的語(yǔ)音信號(hào)和一段女生的語(yǔ)音信號(hào),對(duì)兩段音頻信號(hào)進(jìn)行混合,設(shè)計(jì)濾波器將混合的語(yǔ)音信號(hào)分開(kāi)成單獨(dú)的男聲和女聲信號(hào),如果分離效果不好,對(duì)原因進(jìn)行解釋。
Matlab命令:wavrecord, wavplay, wavwrite, wavread, save, load, fft, fftshift, filter, plot, subplot, figure.過(guò)程:(1)相同:
fs1=16000;
%取樣頻率 fs2=16000;
%播放頻率 duration=5;
%錄音時(shí)間
fprintf('Press any key to start %g seconds of recording...n',duration);
pause;
fprintf('Recording...n');
y=wavrecord(duration*fs1,fs1);
%duration*fs 是總的采樣點(diǎn)數(shù)
fprintf('Finished recording.n');
fprintf('Press any key to play the recording...n');
pause;
wavplay(y,fs2);wavwrite(y,fs1,'E:matlabrecord3.wav
不同:
fs1=16000;
%取樣頻率 fs2=8000;
%播放頻率 duration=5;
%錄音時(shí)間
fprintf('Press any key to start %g seconds of recording...n',duration);
pause;
fprintf('Recording...n');
y=wavrecord(duration*fs1,fs1);
%duration*fs 是總的采樣點(diǎn)數(shù)
fprintf('Finished recording.n');
fprintf('Press any key to play the recording...n');
pause;
wavplay(y,fs2);wavwrite(y,fs1,'E:matlabrecord3.wav');現(xiàn)象:第二次播放時(shí),聲音明顯失真。
理由:采樣頻率和播放頻率不一樣時(shí)聲音信號(hào)會(huì)失真。(2)
fs1=16000;
%取樣頻率 fs2=16000;
%播放頻率 duration=5;
%錄音時(shí)間
fprintf('Press any key to start %g seconds of recording...n',duration);
pause;
fprintf('Recording...n');
y=wavrecord(duration*fs1,fs1);
%duration*fs 是總的采樣點(diǎn)數(shù)
fprintf('Finished recording.n');
fprintf('Press any key to play the recording...n');
pause;
wavplay(y,fs2);wavwrite(y,fs1,'E:matlabrecord3.wav');
wav=wavread('E:matlabrecord3.wav');Fs=16000;n=length(wav);f=(0:n-1)*16000/n;mag=abs(fft(wav));subplot(2,1,1);plot(wav);subplot(2,1,2);plot(f,mag)
采樣頻率為1600010.5y/幅度0-0.5-101234x/t采樣頻率為16000567x 1084600500400y/幅度***400060008000x/f***16000
fs1=8000;
%取樣頻率 fs2=8000;
%播放頻率 duration=5;
%錄音時(shí)間
fprintf('Press any key to start %g seconds of recording...n',duration);
pause;
fprintf('Recording...n');
y=wavrecord(duration*fs1,fs1);
%duration*fs 是總的采樣點(diǎn)數(shù)
fprintf('Finished recording.n');
fprintf('Press any key to play the recording...n');
pause;wavplay(y,fs2);wavwrite(y,fs1,'E:matlabrecord3.wav');
wav=wavread('E:matlabrecord3.wav');Fs=8000;n=length(wav);f=(0:n-1)*16000/n;mag=abs(fft(wav));subplot(2,1,1);plot(wav);subplot(2,1,2);plot(f,mag)wavplay(wav,8000)
采樣頻率為8000hz1 0.5y/幅度0-0.5-1 00.511.52x/s采樣頻率為8000hz2.533.5x ***0500y/幅度***00x/hz***16000
由圖可知:語(yǔ)音信號(hào)的主要頻譜成分所在的帶寬為(0—1200hz),帶寬為1200hz。
當(dāng)采樣頻率較小時(shí),頻譜圖上顯示帶寬較大,波形較稀松。
最低采樣頻率應(yīng)為,聲音信號(hào)的最高頻率的兩倍,由圖可知為2400hz。(3)女聲:
wav1=wavread('E:matlabrecord1.wav');wav2=wavread('E:matlabrecord2.wav');wav=wav1+wav2;fp1=800;fp2=1500;fp=[fp1,fp2];fr1=650;fr2=1900;fr=[fr1,fr2];Fs=16000;ap=1;as=40;[n,fn]= buttord(fp/(Fs/2),fr/(Fs/2),ap,as,'z');[b,a]=butter(n,fn);Y1=filter(b,a,wav);Y=fft(Y1);mag=abs(Y);n=length(wav);f=(0:n-1)*16000/n;subplot(3,1,1);mag1=abs(fft(wav));plot(f,mag1)subplot(3,1,2);plot(f,mag);subplot(3,1,3);plot(Y1);wavplay(Y1,16000)
混合400300y/幅度***060008000x/頻率女聲***16000400300y/幅度 2001000 ***00f/hz***160000.20.1y/幅度0-0.1-0.201234x/t567x 1084
男聲:
wav1=wavread('E:matlabrecord1.wav');wav2=wavread('E:matlabrecord2.wav');wav=wav1+wav2;fp1=200;fp2=600;fp=[fp1,fp2];fr1=100;fr2=1000;fr=[fr1,fr2];Fs=16000;ap=3;as=40;[n,fn]= buttord(fp/(Fs/2),fr/(Fs/2),ap,as,'z');[b,a]=butter(n,fn);Y1=filter(b,a,wav);Y=fft(Y1);mag=abs(Y);n=length(wav);f=(0:n-1)*16000/n;subplot(3,1,1);mag1=abs(fft(wav));plot(f,mag1)subplot(3,1,2);plot(f,mag);subplot(3,1,3);plot(Y1);wavplay(Y1,16000)
混合頻譜圖200150y/幅度***30004000x/hz男聲頻譜圖***040y/幅度***8000x/hz男聲時(shí)域圖***160000.040.02y/幅度0-0.02-0.0401234x/s567x 1084
分離效果不佳,原因:男女聲頻率有很多重疊的地方。