《語音清晰度客觀評測》由會員分享,可在線閱讀,更多相關《語音清晰度客觀評測(29頁珍藏版)》請在裝配圖網上搜索。
1、單擊此處編輯母版文本樣式,第二級,第三級,第四級,第五級,*,單擊此處編輯母版標題樣式,LOGO,單擊此處編輯母版文本樣式,第二級,第三級,第四級,第五級,單擊此處編輯母版標題樣式,*,語音清晰度的客觀評測,2010.5.21,1,主要內容,1,語音清晰度評測的發(fā)展概況,2,混響作用下,STIPA,與清晰度的關系,3,噪聲環(huán)境下,STIPA,與清晰度的關系,4,總結與展望,2,1.,語音清晰度的評測,語音的清晰度或可懂度是音質評價的重要指標,反映廳堂或擴聲系統(tǒng)的聲音傳輸質量,主觀評價:,組織測試隊伍實地測試,(,articulation test,),優(yōu)點:,直接、真實,缺點:,耗費人力物力,
2、GB-T 15508-1995,聲學 語言清晰度測試方法,3,語音清晰度的客觀評價方法,STI,%ALcon,AI,主觀,測試,盡可能反映真實的清晰度水平,4,清晰度指數,AI (Articulation Index),French&Steinberg(1947),Fletcher(1953),Kryter(1962),1),測量或估計語言頻譜和聽音人處的噪聲有效掩蔽譜計算得到各頻帶的“有效信噪比”;,2),對各頻帶信噪比進行線性轉化至,0,1,得“貢獻值”;,3),基于不同頻帶對清晰度的貢獻率加權平均得,AI;,ANSI Std.S3.5-196919861997,特點,:特別適用于評價諸如
3、,噪聲干擾、有限帶通,等頻域失真引起的語音清晰度惡化程度,不能反映,混響、回聲,或,削峰,等時域或非線性失真的影響。,5,輔音損失率,%ALcon,(articulation loss of consonants),能不能根據測量房間內的某些物理量估計語音清晰度?,Knudsen(1932),Peutz(1971),Klein(1971),根據,大量的實地測量和,清晰度,主觀評價測試,的結果,,Peutz,發(fā)現,%ALcon,與房間的聲學特性相關。,6,Peutz,公式(經驗推導),D,聽音處距聲源的距離。單位,m,。,T,60,混響時間,(1400Hz),。單位,s,。,V,房間的體積。單位
4、,m,3,。,校準值。針對不同水平的聽者。,1.5%12.5%,。,D,c,臨界距離。單位,m,。,注意:,SNR25dB,;,單個無指向性的點聲源,(Q=1),;,7,Klein,對,Peutz,公式的補充,當房間聲學特性難以改善時,采用電聲手段提高語音清晰度。,聲源個數,n,;聲源指向性因子,Q,;,雖然提高揚聲器的,Q,值有助于改善語音清晰度,但,Q,值與清晰度之間是否成簡單的線性關系并沒有實際的實驗數據支持。,Jacob(1985),認為語音清晰度與,Q,并無直接的關聯。,8,輔音損失率,%ALcon,的不足,根據實驗結果的經驗推導,物理基礎不夠;,對于信噪比低于,25dB,的情況估計
5、不足,不能充分反映噪聲和混響聯合作用時的影響;,沒有考慮早期反射聲,單次回響的作用,且結果僅給出某個頻帶的清晰度水平,未考慮參數的頻率特性的影響;,Jacob(1985),9,Hougast&Steeneken(197319801985),IEC Std.60268-16,充分反映聲傳遞系統(tǒng)性能質量的優(yōu)劣,輸入端:,說話人發(fā)音,語言傳輸指數,STI(,speech transmission index,),輸出端:,聽者耳朵,語言傳輸系統(tǒng):,充分考慮傳遞過程中噪聲、混響、回響、系統(tǒng)失真等各種干擾因素的影響,Black Box,10,調制轉移函數,MTF(,modulation transfer
6、 function,),連續(xù)的語音可以看成一系列語音碎片,(,音位,),的組合。音位又可以看成是發(fā)音器官對某種窄帶噪聲調制的結果。音位的時域包絡中包含了所傳遞的信息。,傳輸過程中,噪聲、混響、系統(tǒng)失真等會使得包絡發(fā)生變化,從而導致清晰度惡化,利用,MTF,描述量化包絡波動性能的變化程度。,11,MTF,的計算,函數定義為聲信號經傳輸后接收信號強度包絡的,調制度,相對于原信號強度包絡調制度的降低,它隨調制頻率不同而變化。,12,STI,的計算,14,種調制頻率;,7,種倍頻帶噪聲 作為測試信號,計算,98,個,MTF,結果,類似,AI,計算中的加權平均最終得,STI 0,1,根據房間脈沖響應可以
7、直接計算,MTF,13,STI與語音清晰度,Steeneken(1980),不論是噪聲、帶通限制、削峰、混響等干擾因素,,STI,與語音清晰度得分之間始終有著良好的一致性。,客觀可測的物理參量,STI,能良好的反映和預測真實的語音清晰度水平。,14,語言傳輸指數,STI,的簡化算法,限制條件:,無明顯非線性失真;環(huán)境噪聲無脈沖;混響時間頻率特性平滑;寬帶語言傳輸系統(tǒng);,1,),RASTI(Rapid STI or Room acoustic STI),適用于不包括擴聲系統(tǒng)的廳堂語音傳輸質量的評價,選取了語言譜中比較有代表性的頻帶和調制頻率,15,2,),STIPA(STI for public
8、 address),適用于包括擴聲系統(tǒng)的廳堂或電聲系統(tǒng)的語音傳輸質量評價,選取了,7,種倍頻帶載波,每種載波對應,2,中調制頻率,125Hz,250Hz,500Hz,1KHz,2KHz,4KHz,8KHz,1.0Hz,1.0Hz,0.63Hz,2.0Hz,1.25Hz,0.8Hz,2.5Hz,5.0Hz,5.0Hz,3.15Hz,1.0Hz,6.25Hz,4.0Hz,12.5Hz,16,公共廣播系統(tǒng)工程技術規(guī)范,STIPA,作為評價公共廣播語言傳輸質量的重要指標,分類,STIPA,分類,STIPA,業(yè)務廣播,(一級),0.55,緊急廣播,(一級),0.55,業(yè)務廣播,(二級),0.45,緊急廣
9、播,(二級),0.45,業(yè)務廣播,(三級),0.35,緊急廣播,(三級),0.40,17,2.混響作用下STIPA與漢語清晰度的關系,對于“聲韻調”結構語言,漢語,情況是怎樣的?,目的:,在實驗室條件下對無噪聲純混響作用下,STI-PA,與普通話單音節(jié)清晰度之間的關系進行實驗研究。以期對搞清楚在純混響作用下普通話單音節(jié)清晰度與語言傳輸指數,STI-PA,的具體關系有所貢獻和幫助。對漢語語音清晰度客觀評測方法的發(fā)展有著積極的意義。,18,實驗方法,實驗室錄音、模擬測試的方法,參照,聲學 語言清晰度測試方法,GB-T 15508-1995,19,混響時間:0.5 s6.0 s,步長0.5 s,共1
10、2種混響條件;,發(fā)音人2名,聽音人11名;聲場中心聲壓級65dBA;,中、后音節(jié)受混響作用更明顯;,20,實驗結果,混響時間與清晰度、,STIPA,的關系,21,STIPA,與普通話單音節(jié)清晰度的關系,22,在實驗結果的基礎上歸納導出了,STI-PA,與普通話單音節(jié)清晰度之間的關系,此關系對制定擴聲系統(tǒng)的,STI-PA,指標具有實用意義。,實驗結果也揭示出漢語普通話單音節(jié)清晰度受混響的影響與英語清晰度受混響的影響程度有明顯的不同。啟示我們在實際工程應用中,在涉及到普通話語音清晰度的評測問題時,對直接引用已有的國際標準或基于外語的研究結果要十分慎重。,23,3.噪聲條件下STIPA與漢語清晰度的
11、關系,在實驗室條件下分析了不同頻帶范圍、不同信噪比的噪聲環(huán)境下語音清晰度、,STI-PA,與信噪比的關系,并根據單音節(jié)清晰度與語言可懂度的關系,估計了在滿足一定可懂度條件下的最低信噪比及相應的,STI-PA,。,實驗室錄音、模擬測試的方法,參照,聲學 語言清晰度測試方法,GB-T 15508-1995,采用了全頻帶白噪聲和中心頻率為,250Hz,,,500Hz,,,1KHZ,,,2KHz,,,4KHz,,,8KHz,的倍頻帶噪聲作為干擾噪聲,各頻帶噪聲分別設置,45,種信噪比。,24,實驗結果,1),信噪比與清晰度、,STIPA,的關系,(,以白噪聲為例,),25,2),等清晰度曲線,不同的噪
12、聲條件可能有著相同清晰度水平,26,工作是在實驗室條件下進行的,考慮到實際的應用情況,可能還有一些不完善的地方,比如房間沖擊響應的結構是否會對,STI-PA,與清晰度的關系有明顯的影響還需要探討。實際環(huán)境中的噪聲種類多樣,頻率范圍豐富,由于條件限制無法一一進行測試。每個頻帶噪聲的信噪比取值區(qū)間可以更加細致以獲得更為全面的結果。另外本次實驗只是在,65dBA(,標準說話聲壓級,),的噪聲水平下進行的,其它噪聲水平下的語言清晰度和,STI-PA,、信噪比的關系是否同本次實驗結果一致還需要進一步的研究。,27,4.,展望,STI for Chinese,?,STI,%ALcon,AI,主觀,測試,28,Thank You!,29,