九九热最新网址,777奇米四色米奇影院在线播放,国产精品18久久久久久久久久,中文有码视频,亚洲一区在线免费观看,国产91精品在线,婷婷丁香六月天

語音清晰度客觀評測

上傳人:lx****y 文檔編號:253405752 上傳時間:2024-12-14 格式:PPT 頁數(shù):29 大?。?25KB
收藏 版權(quán)申訴 舉報 下載
語音清晰度客觀評測_第1頁
第1頁 / 共29頁
語音清晰度客觀評測_第2頁
第2頁 / 共29頁
語音清晰度客觀評測_第3頁
第3頁 / 共29頁

下載文檔到電腦,查找使用更方便

30 積分

下載資源

還剩頁未讀,繼續(xù)閱讀

資源描述:

《語音清晰度客觀評測》由會員分享,可在線閱讀,更多相關(guān)《語音清晰度客觀評測(29頁珍藏版)》請在裝配圖網(wǎng)上搜索。

1、單擊此處編輯母版文本樣式,第二級,第三級,第四級,第五級,*,單擊此處編輯母版標(biāo)題樣式,LOGO,單擊此處編輯母版文本樣式,第二級,第三級,第四級,第五級,單擊此處編輯母版標(biāo)題樣式,*,語音清晰度的客觀評測,2010.5.21,1,主要內(nèi)容,1,語音清晰度評測的發(fā)展概況,2,混響作用下,STIPA,與清晰度的關(guān)系,3,噪聲環(huán)境下,STIPA,與清晰度的關(guān)系,4,總結(jié)與展望,2,1.,語音清晰度的評測,語音的清晰度或可懂度是音質(zhì)評價的重要指標(biāo),反映廳堂或擴(kuò)聲系統(tǒng)的聲音傳輸質(zhì)量,主觀評價:,組織測試隊伍實地測試,(,articulation test,),優(yōu)點:,直接、真實,缺點:,耗費人力物力,

2、GB-T 15508-1995,聲學(xué) 語言清晰度測試方法,3,語音清晰度的客觀評價方法,STI,%ALcon,AI,主觀,測試,盡可能反映真實的清晰度水平,4,清晰度指數(shù),AI (Articulation Index),French&Steinberg(1947),Fletcher(1953),Kryter(1962),1),測量或估計語言頻譜和聽音人處的噪聲有效掩蔽譜計算得到各頻帶的“有效信噪比”;,2),對各頻帶信噪比進(jìn)行線性轉(zhuǎn)化至,0,1,得“貢獻(xiàn)值”;,3),基于不同頻帶對清晰度的貢獻(xiàn)率加權(quán)平均得,AI;,ANSI Std.S3.5-196919861997,特點,:特別適用于評價諸如

3、,噪聲干擾、有限帶通,等頻域失真引起的語音清晰度惡化程度,不能反映,混響、回聲,或,削峰,等時域或非線性失真的影響。,5,輔音損失率,%ALcon,(articulation loss of consonants),能不能根據(jù)測量房間內(nèi)的某些物理量估計語音清晰度?,Knudsen(1932),Peutz(1971),Klein(1971),根據(jù),大量的實地測量和,清晰度,主觀評價測試,的結(jié)果,,Peutz,發(fā)現(xiàn),%ALcon,與房間的聲學(xué)特性相關(guān)。,6,Peutz,公式(經(jīng)驗推導(dǎo)),D,聽音處距聲源的距離。單位,m,。,T,60,混響時間,(1400Hz),。單位,s,。,V,房間的體積。單位

4、,m,3,。,校準(zhǔn)值。針對不同水平的聽者。,1.5%12.5%,。,D,c,臨界距離。單位,m,。,注意:,SNR25dB,;,單個無指向性的點聲源,(Q=1),;,7,Klein,對,Peutz,公式的補充,當(dāng)房間聲學(xué)特性難以改善時,采用電聲手段提高語音清晰度。,聲源個數(shù),n,;聲源指向性因子,Q,;,雖然提高揚聲器的,Q,值有助于改善語音清晰度,但,Q,值與清晰度之間是否成簡單的線性關(guān)系并沒有實際的實驗數(shù)據(jù)支持。,Jacob(1985),認(rèn)為語音清晰度與,Q,并無直接的關(guān)聯(lián)。,8,輔音損失率,%ALcon,的不足,根據(jù)實驗結(jié)果的經(jīng)驗推導(dǎo),物理基礎(chǔ)不夠;,對于信噪比低于,25dB,的情況估計

5、不足,不能充分反映噪聲和混響聯(lián)合作用時的影響;,沒有考慮早期反射聲,單次回響的作用,且結(jié)果僅給出某個頻帶的清晰度水平,未考慮參數(shù)的頻率特性的影響;,Jacob(1985),9,Hougast&Steeneken(197319801985),IEC Std.60268-16,充分反映聲傳遞系統(tǒng)性能質(zhì)量的優(yōu)劣,輸入端:,說話人發(fā)音,語言傳輸指數(shù),STI(,speech transmission index,),輸出端:,聽者耳朵,語言傳輸系統(tǒng):,充分考慮傳遞過程中噪聲、混響、回響、系統(tǒng)失真等各種干擾因素的影響,Black Box,10,調(diào)制轉(zhuǎn)移函數(shù),MTF(,modulation transfer

6、 function,),連續(xù)的語音可以看成一系列語音碎片,(,音位,),的組合。音位又可以看成是發(fā)音器官對某種窄帶噪聲調(diào)制的結(jié)果。音位的時域包絡(luò)中包含了所傳遞的信息。,傳輸過程中,噪聲、混響、系統(tǒng)失真等會使得包絡(luò)發(fā)生變化,從而導(dǎo)致清晰度惡化,利用,MTF,描述量化包絡(luò)波動性能的變化程度。,11,MTF,的計算,函數(shù)定義為聲信號經(jīng)傳輸后接收信號強度包絡(luò)的,調(diào)制度,相對于原信號強度包絡(luò)調(diào)制度的降低,它隨調(diào)制頻率不同而變化。,12,STI,的計算,14,種調(diào)制頻率;,7,種倍頻帶噪聲 作為測試信號,計算,98,個,MTF,結(jié)果,類似,AI,計算中的加權(quán)平均最終得,STI 0,1,根據(jù)房間脈沖響應(yīng)可以

7、直接計算,MTF,13,STI與語音清晰度,Steeneken(1980),不論是噪聲、帶通限制、削峰、混響等干擾因素,,STI,與語音清晰度得分之間始終有著良好的一致性。,客觀可測的物理參量,STI,能良好的反映和預(yù)測真實的語音清晰度水平。,14,語言傳輸指數(shù),STI,的簡化算法,限制條件:,無明顯非線性失真;環(huán)境噪聲無脈沖;混響時間頻率特性平滑;寬帶語言傳輸系統(tǒng);,1,),RASTI(Rapid STI or Room acoustic STI),適用于不包括擴(kuò)聲系統(tǒng)的廳堂語音傳輸質(zhì)量的評價,選取了語言譜中比較有代表性的頻帶和調(diào)制頻率,15,2,),STIPA(STI for public

8、 address),適用于包括擴(kuò)聲系統(tǒng)的廳堂或電聲系統(tǒng)的語音傳輸質(zhì)量評價,選取了,7,種倍頻帶載波,每種載波對應(yīng),2,中調(diào)制頻率,125Hz,250Hz,500Hz,1KHz,2KHz,4KHz,8KHz,1.0Hz,1.0Hz,0.63Hz,2.0Hz,1.25Hz,0.8Hz,2.5Hz,5.0Hz,5.0Hz,3.15Hz,1.0Hz,6.25Hz,4.0Hz,12.5Hz,16,公共廣播系統(tǒng)工程技術(shù)規(guī)范,STIPA,作為評價公共廣播語言傳輸質(zhì)量的重要指標(biāo),分類,STIPA,分類,STIPA,業(yè)務(wù)廣播,(一級),0.55,緊急廣播,(一級),0.55,業(yè)務(wù)廣播,(二級),0.45,緊急廣

9、播,(二級),0.45,業(yè)務(wù)廣播,(三級),0.35,緊急廣播,(三級),0.40,17,2.混響作用下STIPA與漢語清晰度的關(guān)系,對于“聲韻調(diào)”結(jié)構(gòu)語言,漢語,情況是怎樣的?,目的:,在實驗室條件下對無噪聲純混響作用下,STI-PA,與普通話單音節(jié)清晰度之間的關(guān)系進(jìn)行實驗研究。以期對搞清楚在純混響作用下普通話單音節(jié)清晰度與語言傳輸指數(shù),STI-PA,的具體關(guān)系有所貢獻(xiàn)和幫助。對漢語語音清晰度客觀評測方法的發(fā)展有著積極的意義。,18,實驗方法,實驗室錄音、模擬測試的方法,參照,聲學(xué) 語言清晰度測試方法,GB-T 15508-1995,19,混響時間:0.5 s6.0 s,步長0.5 s,共1

10、2種混響條件;,發(fā)音人2名,聽音人11名;聲場中心聲壓級65dBA;,中、后音節(jié)受混響作用更明顯;,20,實驗結(jié)果,混響時間與清晰度、,STIPA,的關(guān)系,21,STIPA,與普通話單音節(jié)清晰度的關(guān)系,22,在實驗結(jié)果的基礎(chǔ)上歸納導(dǎo)出了,STI-PA,與普通話單音節(jié)清晰度之間的關(guān)系,此關(guān)系對制定擴(kuò)聲系統(tǒng)的,STI-PA,指標(biāo)具有實用意義。,實驗結(jié)果也揭示出漢語普通話單音節(jié)清晰度受混響的影響與英語清晰度受混響的影響程度有明顯的不同。啟示我們在實際工程應(yīng)用中,在涉及到普通話語音清晰度的評測問題時,對直接引用已有的國際標(biāo)準(zhǔn)或基于外語的研究結(jié)果要十分慎重。,23,3.噪聲條件下STIPA與漢語清晰度的

11、關(guān)系,在實驗室條件下分析了不同頻帶范圍、不同信噪比的噪聲環(huán)境下語音清晰度、,STI-PA,與信噪比的關(guān)系,并根據(jù)單音節(jié)清晰度與語言可懂度的關(guān)系,估計了在滿足一定可懂度條件下的最低信噪比及相應(yīng)的,STI-PA,。,實驗室錄音、模擬測試的方法,參照,聲學(xué) 語言清晰度測試方法,GB-T 15508-1995,采用了全頻帶白噪聲和中心頻率為,250Hz,,,500Hz,,,1KHZ,,,2KHz,,,4KHz,,,8KHz,的倍頻帶噪聲作為干擾噪聲,各頻帶噪聲分別設(shè)置,45,種信噪比。,24,實驗結(jié)果,1),信噪比與清晰度、,STIPA,的關(guān)系,(,以白噪聲為例,),25,2),等清晰度曲線,不同的噪

12、聲條件可能有著相同清晰度水平,26,工作是在實驗室條件下進(jìn)行的,考慮到實際的應(yīng)用情況,可能還有一些不完善的地方,比如房間沖擊響應(yīng)的結(jié)構(gòu)是否會對,STI-PA,與清晰度的關(guān)系有明顯的影響還需要探討。實際環(huán)境中的噪聲種類多樣,頻率范圍豐富,由于條件限制無法一一進(jìn)行測試。每個頻帶噪聲的信噪比取值區(qū)間可以更加細(xì)致以獲得更為全面的結(jié)果。另外本次實驗只是在,65dBA(,標(biāo)準(zhǔn)說話聲壓級,),的噪聲水平下進(jìn)行的,其它噪聲水平下的語言清晰度和,STI-PA,、信噪比的關(guān)系是否同本次實驗結(jié)果一致還需要進(jìn)一步的研究。,27,4.,展望,STI for Chinese,?,STI,%ALcon,AI,主觀,測試,28,Thank You!,29,

展開閱讀全文
溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

相關(guān)資源

更多
正為您匹配相似的精品文檔

相關(guān)搜索

關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

copyright@ 2023-2025  zhuangpeitu.com 裝配圖網(wǎng)版權(quán)所有   聯(lián)系電話:18123376007

備案號:ICP2024067431-1 川公網(wǎng)安備51140202000466號


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務(wù)平臺,本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私,請立即通知裝配圖網(wǎng),我們立即給予刪除!