当前位置: 首页 > 期刊 > 《航天医学与医学工程》 > 1999年第1期
编号:10240625
噪声对说话人语音的影响
http://www.100md.com 《航天医学与医学工程》 1999年第1期
     作者:高慧 周笃强 黄端生

    单位:航天医学工程研究所,北京 100094

    关键词:噪声;语言通讯;影响

    航天医学与医学工程990117

    摘要:在航天和军事领域,噪声是影响语言通讯的重要因素,主要影响到通讯中的听话和送话。本文从语音特征、语音清晰度、面对面通讯的交谈可持续时间三方面综述环境噪声对送话的影响。

    中图分类号:R852 文献标识码:A 文章编号:1002-0837(1999)01-0072-04

    Effects of Noise on Speaker's Voice

    GAO Hui
, 百拇医药
    (Institute of Space Medico-Engineering,Beijing 100094,China)

    ZHOU Du-qiang HUANG Duan-sheng

    Abstract:Noise is one of the important factors which influence communication in aerospace and military environment.It influences listenning and speaking of the talkers during voice communication.The paper introduced the changes of acoustic-phonetic characteristics and intelligibilities of speech production under noise,and also introduced speaking duration in face-to-face communication under noise.
, 百拇医药
    Key words:noise;language communication;influence

    在航天和军事领域中,语言通讯常碰到一些特殊情况,说话人往往处在各种复杂环境中,如噪声、振动、低气压、超重、失重等,这使语音发生变化,从而影响语言通讯的质量。在环境因素对语音影响的研究中,由于噪声对通讯的影响最直接和显著,因而国内外学者对该问题进行了深入探索。研究主要从噪声对听话人和说话人两方面进行,对听话人影响主要以噪声掩蔽作用为主,而对说话人研究在四、五十年代研究重点集中在语音清晰度方面,从主观听觉感受进行探索;之后随着语音技术的发展,声码技术和语音识别技术在各个领域广泛应用,噪声环境下语音特征的改变影响语音技术的应用,因而70年代以后,研究人员将目光转向更为细微的语音特征的影响上,为语音技术在多领域的应用奠定理论基础。本文从语音特征、语音清晰度、面对面通讯的交谈可持续时间三方面综述环境噪声对说话人的影响。

    噪声作用下的语音特征变化
, 百拇医药
    噪声不但在听觉感知上可产生掩蔽效应,同时对语音生成也会产生影响。早在1911年,法国医生Etienne Lombard便定性描述了听与说之间的某种动态关系。他做了一个实验,让病人在通常安静情况下对话,然后在谈话场所引入强的背景噪声,此时发现病人会立即提高声音,当停放噪声时,病人说话音量又会恢复到从前。同时他还发现在有神经性耳聋的病人中说话嗓音也很高。Lombard认为说话噪音的提高由环境噪声强度的提高引起,该现象后被称作Lombard效应。

    此后研究人员对Lombard效应进行了广泛研究,发现当讲者和听者间的距离增加和背景噪声强度提高时,说话人的语音强度都会自动提高。Kryter[1]和Pickett[2] 的研究发现在有较强的背景噪声下,面对面通讯,环境噪声每上升10 dB时,语言信号强度提高3 dB。Webster和Klumpp[3] 则报道每10 dB的噪声强度提高带来了语言信号5 dB的改变。Pearsons和他的同事[4] 在研究距离1 m的面对面直接通讯中发现背景噪声在48~70 dB间变化,每上升10 dB,语言声级提高6 dB。在Summers[5]等人的研究中采用80 dB、90 dB、100 dB三种强度的白噪声作为环境噪声,实验结果表明,发音的平均能量值在有环境噪声下均有提高,提高的程度因人而异,但方差分析表明都具有非常显著的变异性;在Bond.Z.S[6]等人的研究中,采用95 dB的粉红噪声作为环境因素,为模拟航空通讯环境,在实验中他们让被试者佩戴AF标准飞行头盔和供氧面罩,以研究噪声对发音的影响。实验结果表明在粉红噪声背景下,不佩戴供氧面罩时,语音总的平均能量仍有明显提高; 佩戴供氧面罩条件下,背景噪声的影响与安静时相比,语言声能量变化不显著。从上述结论可以看出尽管各研究学者由于实验条件各不相同,语言强度的提高程度也有差异,但背景噪声的出现促使说话人自动提高发声用力程度(vocal effort),造成语言信号强度的提高是不容质疑的。
, 百拇医药
    随着Lombard效应的深入研究,还发现背景噪声除了改变发声的强度外,还对语音的其它特征参数有影响。如时长、基频等参数。在Webster和Klumpp的研究中发现说话时背景噪声强度提高会使说话速度放慢; Summers等人及其他一些学者 (Land和Tranel[7,8])发现噪声中产生的单词发音的时长及元音时长都有所增加,但同时也有一些研究没有得到类似结果,如Bond.Z.S等[6]人的研究只得到了在第二个音节的元音时长有显著加长的结果。对于基频变化的研究,各学者间的研究结果是一致的。 Draegert[9]、Lane和Tranel及Summers等人的研究中都证实噪声环境中发音会使基频提高。Shulaman[10]提出基频F0的显著提高是由于努力发声时声门下压和喉肌紧张程度造成,从生理变化的机理高度对F0提高进行了解释。

    在对Lombard效应的几十年研究中注意力多集中在上述语音强度、时程、基频这些韵律特征上,对于语音频谱特性,及更细微的元音共振峰特性的研究很少,随着近几年来语音技术的发展,主要是针对自动语言识别系统在航天航空及军事领域的应用为目的,人们开始对语言声学特征进行更为全面的研究。在研究韵律特征的同时,也在探寻共振峰频率、谱的能量分布的变化规律。Pearsons指出尽力发声时,能量向高频段移动;在Shulaman的研究中得到了共振峰F1提高的结果。在Summers的研究中不但验证了在背景噪声下强度、时长及基频特征的改变,同时也研究了共振峰及能量谱分布的变化。文中指出元音共振峰的改变受发音人的个体差异影响大,发音人MD的发音平均共振峰F1、F2 都有轻微下降,另一发音人SC的平均F1显著提高,F2的变化与发音内容有关,具有较低的F2的发音在100 dB背景噪声下提高,而具有较高F2值的发音会降低;此外还得到了对谱的倾斜趋势有显著减弱的结果,而且在100 dB下谱倾斜趋势明显低于80 dB,即噪声的出现使说话人的语言频谱变得平坦,能量在高频部分分布的增加使得谱倾斜趋势减弱。Bond.Z.S等[6]人对四个元音/i,ae,a,u/的共振峰进行了研究,其结果表示在图1上,从图中可以看出在 95 dB的粉红噪声下四个发音的F1提高,F2的变化与单词有关,只有元音/i/和/u/的F2发生变化,/i/的F2下降,/u/的F2上升,而/a/和/ae/的F2变化不大。由于/i/的F2的标准值大,/u/的F2 的标准值小,因而也体现了高的F2降低,低的F2提高的规律,这与Summers 的研究结果是一致的。由上述研究结果可知,共振峰F1,F2在噪声下的改变不像韵律特征那样明显,它们的变化与发音人及发音内容有关。
, 百拇医药
    图1 F1.F2元音图

    Fig.1 F1.F2 vowel

    注::安静状态;---:噪声状态

    Note::quiet condition;---:noise condition

    噪声作用下语音清晰度的变化

    对噪声下生成语音的清晰度的研究,也是人们非常关注的。在Draegert、Dreher 、Summers等多人的研究中皆得到了噪声环境可显著提高语音清晰度的结论,同时噪声环境影响与测试清晰度实验的环境信噪比有关,随着信噪比的降低,背景噪声对语音清晰度的影响会突出体现出来; 噪声对清晰度的影响与说话人也有一定的关系,在Summers的研究报告中,在同样的信噪比下,其中一名说话人的清晰度得分皆高于另一发音人。由此可见,噪声引起的语音特征的变化会反应到对生成语音的主观感知上。这是由于当说话环境中出现噪声时,混杂噪声的话音通过体外反馈到人的中枢神经系统,使人意识到自己的话音已被干扰,从而会影响到他人对自已所说言语的感受与理解,因此发音人会自动调节自己的发音,提高发声努力程度,尽力保证发音清晰,以使噪声环境下也能听懂他的语言。
, 百拇医药
    上述清晰度的改善及有关声学特征的变化与清晰发音的研究结果有相似的地方。在清晰发音(clear speech)方面,Picheny[11]等人作了研究,所谓清晰发音,是给说话人以指令,要求其在通讯中清晰吐字,发音更慢声音更大些,这种说话人有准备的调整使发音的时长、平均能量、F0都提高,语音清晰度被改善,这些变化与噪声的影响是一致的。但其清晰度的提高比噪声下语音的清晰度提高程度更为显著,Mosko[12]曾对两者进行了对比,指出清晰度在清晰发音条件下提高16%至18%,而噪声环境下只有6%至8%的改善。同时共振峰的变化是有区别的,Chen指出F1、F2 的变化使元音空间扩大,因而使不同发音的共振峰差别更为显著。这说明噪声的影响并不等同于清晰指令的作用。但可以预见,若在噪声环境下要求讲者保证清晰发音,对通讯效果是会有改善的。

    另一方面,噪声下的发音并不总能带来令人满意的结果。由于上述发音人的主观努力,会使得清晰度提高。但是,在发音人竭力呼喊时,情况就会发生变化。当发音程度达到喊叫声时,清晰度反而下降。这在Pickett[13]和Pollack[14]及Rostolland[15]等多人的研究结果中证实了这点。在Pollack和Pickett的研究中,在没有引入环境噪声的安静情况下,高达130 dB 的喊叫声清晰度得分没有下降(100%),可是一旦引入环境噪声,即使信噪比为15 dB,90 dB以上的语言声其清晰度都有明显降低。由此可见,由于环境噪声对语言声的清晰度影响是双方面的,语言声强度提高不大时,其清晰度随之提高,当语言声强度达到喊叫声时,其清晰度反而会下降。Rostolland指出清晰度降低是由于发音肌肉过于紧张,使得生成的语言波出现偏差和波动,从而影响这些语言的被感知。Pickett指出在面对面通讯中,说话强度(距嘴边1 m处的声压级)非常强(大于78 dB)和非常弱(小于55 dB)的情况下,清晰度都会下降。因此尽管环境噪声使语音清晰度有提高的可能,但总的来说,噪声的出现仍是弊大于利,它使研究人员必须首先面对语音增强、消除噪声的技术研究,同时也要面对噪声环境中由于竭力发音造成的疲劳等问题。
, 百拇医药
    噪声作用下的交谈可持续时间

    在噪声环境下高声交谈的时间是有限的。Pickett指出若不考虑疲劳,发音强度可维持在90 dB,但是Webster和Klumpp都认为要发出高于78 dB的嗓音,说话人只能勉强维持很短的时间。Rupf[16]对声音变嘶哑前噪声中交谈可持续时间进行研究,该研究通过5 min在噪声环境交谈预试,有一半人认为他们能够在75 dB(A)下交谈1 h,80 dB(A)下30 min,85 dB(A)15 min,90 dB(A)交谈7 min,但当具体实施时,持续时间远没有这样长。而且长时高声交谈还会给说话人带来病理性影响,Klingholz在1978年报告在90 dB(A)下交谈的被试者,有70%以上会产生发音病理性反应,当环境噪声为95 dB(A)时几乎全部被试者都产生了发音病理性变化。此外有研究报道,长时间在噪声中需要高声说话的工人,在3至7年间,发声都发生异常,并可能出现声带机能障碍等疾病。因而在高噪声环境中,不时或偶尔提高语音或叫喊是可以忍受的,但在需要长时间高声交谈的通讯场合,就需要考虑使用一定技术手段以保障通讯人员的健康和舒适,防止噪声的干扰。
, 百拇医药
    小 结

    在对噪声对语音影响的研究中,国外研究较为广泛,国内在有关清晰度方面进行探索得到与国外相同的结论。综上所述,当说话人在噪声环境中发音时,生成语音的特征参数发生了改变,其清晰度也随之变化,面对面通讯时,交谈时间也会受到限制。从产生机理来看,在环境出现背景噪声时,混杂噪声的话音反馈传至人的中枢神经系统,于是发音人会自动努力调节发音,以尽可能表达清晰。于是,喉肌和胸肌紧张度增强,这些生理反应使生成语音音调提高、音量增大,即基频提高、能量加强。时长的增大是由于说话人为保证自己话音被听懂而放慢语速的结果。这样的语音在未达到喊叫声时,它的清晰度是提高的;当语言声过高发生畸变时,则会使清晰度下降。同时由于噪声环境下交谈,喉肌紧张度增强,声带易于疲劳,使得交谈持续时间不能过长。上述结果表明在研究环境因素对语言通讯的研究中,噪声是一个首要考虑的重要因素,它对说话人的语音带来多方面影响,有关语音特征变化的研究对在噪声环境下应用语音识别技术有重要意义;有关清晰度方面的影响研究有助于从主观听觉感受上对特因下通讯效果的好坏进行评价;而有关可持续时间的研究对噪声工效的研究很有价值。上述研究结果表明,在噪声问题较为显著的军事和航天领域,一方面在噪声防护上采取措施,减弱噪声对说话人和听话人的影响;另一方面,也要针对噪声下语言声的具体改变作出相应的考虑,这对研究在噪声环境中改善语言通信效果,以及完善航天和军事环境下语音识别系统性能有重要参考价值。
, 百拇医药
    [参考文献]

    [1] Kryter KD.Effects of ear protective devices on the intelligibility of speech in noise[J].J Acoust Soc Am,1946,18:413~417

    [2] Pickett JM,Limits of direct speech communication in noise[J].J Acoust Soc Am,1958,30:278~281

    [3] Webster JC,Klumpp RG.Effects of ambient noise and nearby talkers on a face-to-face communication task[J].J Acoust Soc Am,1962,34:936~941
, http://www.100md.com
    [4] Pearson KS,Bennett RL,Fidell S.Speech levels in various noise environment[S].EPA-600/1-77-025.U.S.Environmental Protection Agency,1977

    [5] Summers WV et al.Effects of noise on speech production: Acoustic and perceptual analyses[J].J Acoust Soc Am,1988,84(3): 917~928

    [6] Bond ZS,Moore TJ,Gable B.Acoustic-phonetic characteristics of speech production in noise and while wearing an oxygen mask[J].J Acoust Soc Am,1989,85(2):907~912
, 百拇医药
    [7] Lane HL,Tranel B.The Lomband sign and the roles hearing in speech[J].J Speech and Hear Res,1971,14:677~709

    [8] Lane HL Wet al.Regulation of voice communication by sensory dynamics[J].J Acoust Soc Am,1970,47:618~624

    [9] Draegert GL.Relationships between voice variables and speech intelligibility in high level noise[J].Speech Monogr,1951,18:272~278

    [10] Schulman R.Dynamic and perceptual constraints of loud speech[J].J Acoust Soc Am,1985,Suppl.1,78
, http://www.100md.com
    [11] Picheny MA,Durlach NI,Braida LD.Speaking clearly for the hard of hearing Ⅱ: Acoustic characteristics of clear and conversational speech[J].J Sp and Hear Res,1985,28: 92~103

    [12] Mosko JD.“clear speech",NATO,Adviory Group for Aerospace Research Development[S].AGARD-CP-311,1981

    [13] Pickett JM.Effects of vocal force on the intelligibility of speech sounds[J].J Acoust Soc Am,1956,28:902~905

, 百拇医药     [14] Pollack I,Pickett JM.Masking of speech by noise at high sound levels[J].J Acoust Soc Am,1958,30:127~130

    [15] Rostolland D.Intelligibility of shouted Voice[J].Acustica,1985,57: 103~121

    [16] Rupf JA.Noise effects on passenger communication in light aircraft[R].Paper No.770446,Soc.Automot.Eng.,Warrendale,PA,1977

    收稿日期:1998-03-19, 百拇医药