荔园在线

荔园之美,在春之萌芽,在夏之绽放,在秋之收获,在冬之沉淀

[回到开始] [上一篇][下一篇]


发信人: sume (麋鹿的呼唤), 信区: Original
标  题: 语音合成技术与汉字传统音韵学
发信站: 荔园晨风BBS站 (Tue May 20 12:21:22 2003), 站内信件

汉字和西方文字是很不同的。这注定实现汉字语音合成与实现拼音文字合成在技术
上的不同。但是很大程度了,今天所有的语音技术(波形编码合成法、参数合成法
和按规则合成法)都是模仿西方的语音合成而来的。
本人觉得,中国人要加深对汉字特点的理解,当然这样理解要建立的科学的理论上
,不能建立的感情上。回顾汉字音韵学方面的发展历史,有帮助我们看清汉字的特
点。
印度佛教在东汉时候大规模传入汉土,同时带来了大量佛经。佛经大多数是用拼音
文字写出的。古代的中国人从此知道了汉字在语音上也可以分为两部分相拼,即是
声母和韵母。此后两千年来,中国学者孜孜不倦地在这一领域求索着,大体上弄清
楚了中国历史的时间和空间上语音流变,也为唐诗的韵律、宋词的节拍奠定了基础
。近代以来,西学东渐,从要废除汉字到简化汉字,从清末罗马拼音到中华人民共
和国汉语拼音方案,语音学的领域大大扩展了。声母韵母之间引进了介音,声调用
调值来衡量。但是在语音合成技术方面却一直落后于欧美,也落后于使用汉字的日
本。
西方文字的每个单词一般都是由不定个音节组成的,而每个汉字却总是有声母和韵
母组成(包括零声母),这在技术是非常值得利用的特征。可以考虑在频带考虑声
母和韵母的相拼肌理,进而设计系统,只要输入一个时代的声母和韵母就可以合成
出所有汉字的语音出来了。当然完善系统还有考虑声调、多音字。
声调也是汉字一个鲜明的特征。这是学西方拼音文字的语言合成技术所学不到的,
必须考中国人自己的探索。声调在不同方言中有不同的数量,比如北京话四声,广
州话九声。声母、韵母、声调构成了一个立体坐标结构,也构成了汉字系统。而西
文却平面结构的,只有复音和元音。
多音字在语音合成的时候往往是一个难题。但是它却是一个更加值得利用的特征。
考察汉字从甲骨文到现代文的变化过程历史,学者得出这样的结论:古代文字只要
音相同或者相近,它们的意思就相同或者相近;即使汉字演化现代,这一特征也还
存在着,只是没有那么明显而已。因此在自然语言识别的研究中应该充分重视多音
字与其意义的联系。字的多音,一般都是因为意义的不同,因此在语音合成的过程
中,可以考虑用汉字替代的方法来解决这一问题。
汉字语音合成系统的研究,一般都着眼于现代化的使用上,比如电话自动应答、无
人售票系统等等。有些领域却几乎没有去碰。比如两千年来,中国学者前继后仆,
对历代语音的流变弄得很清楚了,但是却没有科学家助他们一臂之力,用软件系统
实现一个系统,使得他们只要输入一个时代和特定地区的声母和韵母,就可以还原
该时空的语言状貌。也没有人研究唐诗宋词的韵律节奏在语音合成上的表达。其实
中国的诗歌,一般都是对仗极工整的,特别适合于用语音合成来制定它的节奏和韵
律。


--
※ 修改:·sume 於 May 20 12:22:50 修改本文·[FROM: 192.168.32.35]
※ 来源:·荔园晨风BBS站 bbs.szu.edu.cn·[FROM: 192.168.32.35]


[回到开始] [上一篇][下一篇]

荔园在线首页 友情链接:深圳大学 深大招生 荔园晨风BBS S-Term软件 网络书店