当前位置: 首页 > 期刊 > 《中华口腔医学杂志》 > 1999年第5期
编号:10243675
腭裂儿童鼻化元音的频谱特点研究
http://www.100md.com 《中华口腔医学杂志》 1999年第5期
     作者:朱洪平 孙勇刚 王光和 马莲 张震康

    单位:100081北京医科大学口腔医学院

    关键词:腭裂;声学;语音;鼻化元音

    中华口腔医学杂志990516 【摘要】 目的 研究鼻化元音的频谱特点,建立有效反映其特点的观察指标。方法 应用通用语音频谱分析系统(universal speech spectrum analyse,USSA)对40例腭裂术前和28例腭裂术后腭咽闭合不全儿童的典型腭裂语音及32名健康儿童的语音进行声学分析。结果 鼻化元音的固有共振峰频率无明显改变,低频区均有各自位置相对固定的额外峰出现,高频区能量明显衰减。结论 鼻化元音的频谱与正常元音相比较有明显特点,鼻腔共振指数和能量衰减指数可有效反映鼻化元音声学特征。

    Studies on the spectrum features of nasalized vowels
, 百拇医药
    ZHU Hongping, SUN Yonggang, WANG Guanghe, et al.

    School of Stomatology, Beijing Medical University, Beijing 100081

    【Abstract】 Objective To study the spectrum features of nasalized vowels and set up effective indexes to reflect the features. Methods The acoustic features of 100 children's speech, aged 5 to 12 years old, consisted of 40 unrepaired cleft palate children, 28 VPI children and 32 normal children, were studied by the application of digital spectrograph.Results No significant changes in the frequency of inherent formants of each vowel, appearance of one relatively fixed extra formant in the low frequency area, and the energy of high frequency area being damped obviously were the main spectrum features of nasalized vowels. Conclusion There are three main features on the spectrums of nasalized vowels compared to that of oral vowels. Nasal resonance index (NRI) can effectively distinguish the extra formant in low frequency area of oral vowel /a/ from nasalized vowel /a/. Energy damping index (EDI) can effectively reflect that the energy of high frequency area of each nasalized vowel is damped obviously.
, 百拇医药
    【Key words】 Cleft palate Acoustics Voice Nasalized vowel

    过高鼻音即元音鼻音化是腭裂语音的最重要特征之一,过高鼻音及其程度是腭裂语音评价和治疗的核心[1]。目前对鼻化元音声学特点的认识仍是在模拟条件下描述个别单发鼻化元音的频谱特性[2,3],因研究方法及观察对象不同,对鼻化元音的频谱特点缺乏共同的认识,一直未能建立有效的观察指标,限制了声学分析技术在腭裂语音评价中的应用。本研究对典型腭裂语音与正常语音的声学特性比较分析,研究鼻化元音的频谱特点,建立观察指标,为应用语音声学分析技术评价腭裂患者的语音状况提供理论基础。

    材料和方法

    1.研究对象:

    (1)腭裂40例,年龄5~12岁,平均8.50岁,其中单侧完全性腭裂21例,不完全性腭裂19例。
, http://www.100md.com
    (2)腭裂术后经鼻咽纤维镜检查证实腭咽闭合不全患者28例,年龄5~12岁,平均8.25岁;术后时间为5个月~8年,平均2.68年。

    (3)健康儿童32名,年龄5~12岁,平均8.70岁。研究对象符合以下要求:①无明显智力及听力障碍;②无重度咬合异常;③无明显不良代偿性发音习惯;④无明显地方口音,可顺利进行语音样本采集。

    2.研究仪器及方法:

    (1)仪器:USSA语音频谱分析系统(北京邮电大学研制),配合于AST486微机使用行语音声学分析,并应用PhilipAS30/32高保真录音机及Toshiba麦克风进行语音信号采集。

    (2)方法:①录音;麦克风距受试者唇10cm,由实验者领读,语速自然,语调稳定,音量适中。②声学分析;将语音信号经麦克风或线性输入USSA语音频谱分析系统,利用线性预测技术(line predictive code,LPC)获得各元音的频谱,自动显示元音前3个共振峰的频率、振幅、带宽参数值。采样频率为9000Hz,LPC的阶数P为12。
, http://www.100md.com
    (3)语音样本:语句“taquwuxishi”和单元音a、i、u。

    (4)统计分析:应用SPSS6.0统计软件进行描述性分析及不同组间t检验。

    3.研究内容:

    (1)比较3组儿童元音a、i、u在语句中及单发时的前3个固有共振峰频率值(F1、F2、F3)。

    (2)观察3组儿童的元音频谱上是否有额外峰出现,并应用元音a的鼻腔共振指数(nasal resornance index,NRI)[4],研究正常和鼻化元音a频谱上低频区额外峰的特点。

    (3)应用能量衰减指数(energy damping index,EDI)[4]研究腭裂患者的语音能量分布特点。
, 百拇医药
    结果

    1.3组儿童语句元音及单元音a、i、u前3个共振峰频率比较:各组之间差异均无显著性,各组儿童的3个元音在语句中及单发时差异无显著性(P>0.05)(表1)。

    表1 各组儿童发单元音a、i、u前3个

    共振峰频率(Hz,±s) 元音

    组别*

    F1

    F2

, http://www.100md.com     F3

    a

    NOR

    1199±152

    1633±189

    3246±215

    CP

    1103±82

    1651±164

    3239±215

    VPI

    1089±120

, http://www.100md.com     1565±145

    3160±260

    i

    NOR

    341±35

    3203±139

    3513±137

    CP

    347±50

    2601±247**

    3239±295**

    VPI
, http://www.100md.com
    340±38

    2620±260**

    3380±345**

    u

    NOR

    319±37

    679±84

    2992±312

    CP

    326±47

    696±96

    2974±213
, 百拇医药
    VPI

    310±35

    667±87

    3024±240

    *:NOR、CP、VPI分别为正常组、腭裂术前组、腭咽闭合不全组

    **:明显小于相应正常值,P>0.05

    2.元音频谱上额外峰出现情况及特性分析:所有腭裂患者的元音频谱上在低频区均有一明显的额外共振峰。所有健康儿童元音i、u频谱的低频区均无额外峰出现,29/32名健康儿童元音a频谱的低频区有一额外峰出现,但其能量值明显小于第一共振峰能量值,其NDI值明显大于两组腭裂儿童(P<0.05)(表2)。

    表2 各组儿童所发元音a的鼻腔
, http://www.100md.com
    共振指数(NRI)(±s) 组别

    发音

    ta*

    a

    NOR

    107.13±3.81

    109.71±3.25

    CP

    73.64±3.74**
, 百拇医药
    74.37±3.47**

    VPI

    72.69±3.45**

    73.12±4.20**

    *:ta指语句中元音a**:均与正常组相比,P<0.05

    3.3组儿童元音的能量分布特点:健康儿童元音a、i的EDI值明显大于两组腭裂儿童(P<0.05),各组中语句元音和单元音的指数差异无显著性(P>0.05)(表3)。表3 各组儿童所发单元音的能量衰减

    指数(EDI)(±s) 元音
, 百拇医药
    NOR

    CP

    VPI

    a

    87.74±6.34

    75.40±8.32*

    77.12±6.33*

    i

    77.35±8.96

    61.85±6.56*

    61.52±4.43*
, http://www.100md.com
    u

    53.74±10.99

    54.68±9.46

    55.06±6.20

    *:P<0.05讨论

    Courtis[5]通过模拟声道等方法研究了鼻化元音的声学特性,认为其固有共振峰的频率发生漂移,一般是上移。虽然每个元音有其固定的共振峰模式但Peterson和Barney认为发音人因声道长短、形状存在差异,正常元音的前3个共振峰频率值之间的差异可在数百Hz以上而不影响元音的音色判断。故考察共振峰频率的漂移难以有效反映元音鼻音化的特性。文抑西、刘建华等[6]研究结果显示腭裂患者的所有元音的共振峰模式相接近,与健康人有明显不同,这一结论和腭裂语音的判听结果显然不符。本研究结果表明,腭裂患者各元音的固有共振峰频率值和健康儿童的区别不明显。腭裂患者元音i的F2明显低于正常值的原因可能与腭裂患者发音时普遍存在的舌后缩习惯有关[7],或是F2与高频区额外峰难以区分的结果。与正常元音比较,鼻化元音频谱的主要特点是低频区存在额外共振峰及高频区能量明显衰减。
, 百拇医药
    由于鼻腔共振的介入,鼻化元音频谱上会出现异常的零极对(zero-pole pairs),即存在额外峰和反共振峰[8,9]。但目前常用于分析元音共振特性的LPC技术是一全极模型,难以反映反共振峰的位置[9]。本研究发现腭裂术前不同裂型的患者及腭裂术后VPI患者的语音声学特性基本一致。不同的鼻化元音,频谱低频区有位置相对固定的额外峰出现。鼻化元音a的额外峰在300~500Hz区域,鼻化元音i的额外峰在F1以上位置,位于600~1100Hz,平均750Hz区域,鼻化元音u的额外峰在F2以上位置,位于850~1300Hz,平均1000Hz区域。这与Watterson、Emanuel[10]观察到的模拟鼻化元音声学特点相符。

    鼻化元音频谱上额外峰可能有多个,但鼻音的声学能量主要集中于低频区[8,9]。Fant和Gauttin[11]认为只要在后低元音的F1以下位置,前高元音的F1以上位置,附加一额外峰时,即可模拟出鼻化元音。由此可见,过高鼻音的主要声学感知基础在于元音频谱低频区出现的额外峰。
, 百拇医药
    正常声学语音学研究中很少提及元音a频谱低频区的额外峰,一般认为只在鼻化元音a的频谱上才出现,并称为鼻音共振峰(Fn)[3,9]。本研究发现,90%的健康儿童元音a频谱的低频区也存在一额外峰,可用元音a的发音机制及儿童语音的声学特点解释之。有研究表明,50%~70%的健康人发元音a时存在生理性腭咽闭合不全[2,12]。其次,儿童语音的基频高、第一谐波能量强的特点使儿童元音a频谱的低频区更易出现额外峰[9]。本研究观察到正常元音的频谱上此峰的能量明显弱于第一共振峰的能量,而在鼻化元音a的频谱上,二峰的关系正好相反。通过鼻腔共振指数(NRI)这一指标,表明正常元音a和鼻化元音a的额外峰有明显区别(P<0.05)。当额外峰的能量值大于第一共振峰的能量时,即可认为元音明显鼻音化。

    与正常元音相比,鼻化元音频谱上高频区能量明显减弱。因元音频谱上显示各共振峰的能量是相对值,且各元音的第三共振峰频率值相差不大,故将各元音的第三共振峰能量与低频区最强共振峰能量值的比率作为能量衰减指数(EDI),可反映高频能量的衰减情况[4]。结果表明正常元音a、i的EDI值与鼻化元音a、i的值相比差异显著(P<0.05)。因元音u为圆唇后高元音,在正常发音情况下其高频能量衰减就十分明显,故鼻化元音u和正常元音u的EDI值无明显差异。但近一半鼻化元音u的频谱上难以检测到第三共振峰。结果同时表明EDI是一有效的观察指标。
, 百拇医药
    参考文献

    1 Kent RD, Liss JM, Philips BJ. Acoustic analysis of velopharyngeal dysfunction in speech. In:Bzoch KR, ed. Communicative disorders related cleft lip and palate. 3rd ed. Bostone: Little, Brown, 1989. 258-270.

    2 Witzel MA, Stringer DA. Methods of assessing velopharyngeal function.In: Bardach KJ, Morris H. eds. Multidisplinary management to cleft lip and palate. 1st ed. Philadephia: WB Saunders,1990.763-777.
, http://www.100md.com
    3 Schwart MF. Acoustic measures of nasalization and nasality. In: Bzoch KR, ed. Communicative disorders related to cleft lip and palate. 2nd ed. Bostone: Little,Brown, 1979.263-276.

    4 朱洪平, 孙勇刚, 王光和, 等. 边缘性腭咽闭合的语音声学特点研究. 中华口腔医学杂志, 1998, 33:178-180.

    5 Courtis JF. The acoustic of nasalized speech. Cleft Palte J, 1970, 7:380-384.

    6 文抑西,刘建华.应用计算机语音分析技术对腭裂语音音素的初步分析.华西口腔医学杂志,1994,12:175-179.
, 百拇医药
    7 马莲,王光和.腭裂患者发音时舌及下颌运动特点研究.现代口腔医学杂志, 1989,3:144-145.

    8 吴宗济, 林贸灿, 主编. 实验语音学概要. 第1版. 北京:高等教育出版社,1989. 80-120.

    9 Kent RD, Read C. The acoustic analysis of speech. 1st ed. California:Singular Publishing Group, 1992.1-87.

    10 Watterson T, Emanuel F. Effects of oral-nasal coupling on whispered vowel spectra. Cleft Palate J, 1981,18:24-38.

    11 Fant G, Gauttin J. 言语科学与言语技术. 张家译.第1版. 北京:商务印书馆, 1994.58-59.

    12 刘晖,刘善学, 袁文化. 应用鼻咽内窥镜对健康人腭咽闭合功能的观察研究. 中华口腔医学杂志, 1989, 24:134-137.

    (收稿:1998-07-23 修回:1999-04-03), 百拇医药