第一章前言
计算机技术己成为当今信息科学研究和发展的重要领域之一,它的广泛应用对人们的生活方式带来了巨大变化。信息是计算机处理的基础,它在计算机技术中的地位越来越重要,同时它的处理方式也越来越多样化,信息交换和加工是计算机应用系统的基本功能,也是开放式智能系统获取知识、不断完善自身功能的重要前提。在人们处理信息手段增多的同时,信息的表现形式也随人们认识的深入不断变化。今天人类认识并加以利用的信息主要包括声音、文字、图形图象甚至表情、手势等。计算机对这些信息理解和处理能力的不足已成为制约计算机应用的主要因素之一。
在信息科学和计算机科学迅速发展的信息时代,言语工程技术受到了前所未有的重视。它和通讯、计算机、人工智能等技术,与语言学、语音学、生理学、心理学、声学等基础学科都有密切的联系,因此受到广泛的关注,它己成为当今科学技术发展的一个热点。围绕这个主题,许多国家都建立了国家资助项目,以促进言语工程技术的发展。日本“第五代计算机计划”的目标就是研制能够说话,并能把一种语言翻译为另一种语言的计算机,虽然这个计划本身失败了,但它对言语工程技术的发展起了重要的推动作用。美国的“DARPA计划”和西欧的“尤里卡计划”都是以发展言语技术科学为中心内容的。著名的国际联合性组织C一STAR就是以口语翻译为基本目标的研究组织,它的初步研究成果已经开始进入实用阶段。此外,一些大的计算机公司和研究单位,如IBM,Apple,AT&T,Motorola等,也都有自己的从事言语工程研究的计划,由此可见言语工程的市场前景是非常可观的。
.............
第二章文语转换系统的研究背景
2.1概述
文语转换系统作为计算机技术和语音学技术的结合,已经受到国内外的广泛关注,国外许多大的研究机构和公司投入了大量的人力、物力和财力从事这方面的研究,它的研究成功不仅可以有效地改善人机交互方式,而且还可以带来信息产业革命性的变化。随着计算机技术的发展、语音合成方法和自然语言处理能力的增强,文语转换技术的研究己经取得了一系列成果,系统性能有了明显的改善。文语转换系统的研究包括了从视觉的文字符号到听觉的语音信号转换处理的全过程,其中语音合成技术是文语转换的核心。我们根据合成方式的不同,将文语转换系统的发展历程分为机械式语音合成,电子管式语音合成和用计算机进行语音合成三大阶段〕。文语转换不仅涉及到语言学处理,语音信号处理等问题,而且还涉及到声学,心理学,计算机和人工智能等学科。因此文语转换系统同其它的学科相比更加复杂和庞大,它研究的问题也就更加地广泛。总起来说,文语转换技术的研究主要包含自然语言处理和语音信号处理等内容,在这中间存在许多有待于进一步研究和解决的课题。近年来,由于多媒体技术和网络通讯的发展,对文语转换系统的要求越来越迫切,同时提出了越来越高的要求,语音接口己经成为当今应用系统的一个不可缺少的一部分。文语转换技术的出现有助于方便使用计算机系统,同时对网络通讯中带宽拥挤的现象也得到了部分解决。目前语音合成系统的研制和开发已经接近实用目标,它己经应用到信息发布、电子邮件和辅助教学等领域。
2.2文语转换技术发展现状
语音合成技术是文语转换系统的一部分,是实现文语转换系统的关键技术,它历来是一个研究重点。语音合成技术不包含语言学的处理,因此可以将某个语音合成技术方便的移植到另一个系统中去,语音合成技术有时也称为文语转换系统的引擎。对语音合成技术的研究可以追溯到二百多年前十八世纪的欧洲,那时人们就开始设法模拟人的声音了。下面将介绍语音合成技术的发展。
2.2.1国外文语转换技术现状
已知最早的实验是1779年Kxateznsetm的研究,他使用一些材料制作成具有各种特殊形状的共鸣腔,用这种共鸣腔来做实验。他的目的是研究如何用管形气管模型来模拟五个元音“A、E、U、O、I”,他的设计当时获得圣彼特堡皇家科学院奖。
...........
第三章HJ一TTS的语言学处理技术...........26
3.1概述....................26
3.2文本正则化............26
3.3J一TTS中多音字处理策略..............40
3.4小结...................................48
第四章HJ一TTS系统韵律处理技术......................49
4.1现有汉语韵律特征研究成果.......................49
4.2HJ一TTS系统中呼吸群划分算法.....................52
4.3韵律标注语言SSML和韵律分配策略..........63
4.4总结..................................87
第五章HJ一TTS的关键实现技术
5.1HJ-ST系统简介
语音翻译系统是一个庞大的系统集成过程,它涉及到语音识别、机器翻译和文语转换三个大的系统,目前各个单独的系统已经逐步进入实用阶段,但是成熟的商品化语音翻译软件还不多见。华建语音翻译系统(HJ-ST)是以中国科学院华建集团机器翻译系统为核心,同时集成了BIM的ViaVoice语音识别系统,L&H的英语语音合成系统和汉语语音合成软件(HJ一TTS)而开发出的语音翻译软件。它的目的是实现不同语种的人们之间无语台‘障碍的交流,真正实现信息的完全共享。华建语音翻译系统的性能在现阶段已基本能满足用户的使用要求,这些要求包括:
①语音识别的准确率至少为90%,而且识别的速度可以满足实时性要求。
②能够把国标GB2312一80中的任意汉字转化为语音输出。
③翻译模块的准确率(能正确表达语义)达到80%
④合成的速度能满足实时性的要求
............
第六章结束语
汉语文语转换系统作为语音翻译系统的最后一个环节,起着非常重要的作用。本文针对文语转换系统的不足,对它的语言学处理方法进行了改进;深入探讨了语音合成的韵律特征和韵律控制,并在此基础上提出了相应的改进策略,最后作者还指出了进一步要做的工作。作者总结和分析了近年来国内外在文语转换领域出现的新方法和新技术,比较了各种文语转换技术的特点并对它们的优缺点进行深入讨论。在此基础上对汉语文语转换系统的语言学处理和韵律控制两方面进行了研究和探讨,并最终构建了HJ一TTS系统。在汉语自动分词的研究中,作者提出了用于语音合成的语音分词算法,该算法有效地改善了语音合成的自然度,同时该分词算法还在一定程度上解决了分词歧义问题。在对多音字读音辨析的研究中,作者改进了多音字词库的组织,提出了解决多音字问题的筛选算法。本文总结了前人对韵律特征的研究成果,探讨了句子长度和句法结构与呼吸群边界划分之间的关系,在此基础上提出了基于句子长度和句法结构的呼吸群边界划分算法;本文从认知科学的角度探讨了建立韵律标注语言SSML的必要性,阐述了SSML的具体实现方法,并用SSML描述了基于语言理解的韵律规则,最后用实验验证了语言学层面的韵律标注对系统自然度的影响。在HJ一TTS的实现部分,为了提高合成的实时性,改进了语音数据库的结构并用基于地址映射的算法实现了基元地址的查找过程。作者研制的汉语文语转换系统HJ一TTS在语言学处理、韵律表示与控制调节等方面都取得了比较大的研究进展,该系统验证了本文提出的多种算法的可行性,也为我们对文语转换技术的继续研究提供了实验平台。本文试图运用自然语言理解的方法,探讨提高文语转换系统性能的新途径,在文语转换的模型描述、语一言学处理和韵律特征控制与调节等方面进行了深入研究。但是,由于自然语言的复杂性和语音信号的时变性等原因,文语转换技术在多方面还有待于进一步深入研究。作者计划在如下几个问题上继续开展相关工作:
参考文献(略)