XML Schema For TTS :: Bordern 随笔
来源: BlogBus 原始链接: http://www.blogbus.com:80/blogbus/blog/diary.php?diaryid=118711 存档链接: https://web.archive.org/web/20040927232707id_/http://www.blogbus.com:80/blogbus/blog/diary.php?diaryid=118711
Bordern 随笔 边看、边做、边想、边写 <<<XML Schema For SR | 首页 | 第一次看立体电影>>> XML Schema For TTS 时间:2004-03-10 吸取了昨天的教训,今天着手看文档前,对文档结构进行了比较全面的浏览,总体上把握住整个联机文档的结构,找到了描述TTS XML的文档部分。果然,今天看这部分文档的时候,感觉很容易明白,毕竟这段时间对TTS有了一定程度上的了解了。总结一下今天的收获^^ 首先, 对声音状态的控制,主要是对合成语音的声音、速度、重音、语调等特性进行设置。应该注意的是这些控制特性的设置,对提高合成语音的自然度与感情色彩的体现具有至关重要的意义。 这句话将被以当前设定值50%的声音强度进行合成输出。 在到达下一个同属性控制标签前,这里开始以后的内容将被以当前设定值80%的声音强度进行合成输出。 这句话将被以绝对速度为5的速度合成。 后面的内容将被以绝对速度为10的速度合成输出。 这句的内容将被以相对-5的速度合成。 这句内容将被以绝对5的语调合成输出 这里的内容将被以相对5的语调合成输出 这里将被强调合成输出 其次,是一些指示项插入标签。如下。 500ms停顿开始500ms停顿结束。 该标签可以让合成输出按照指定音标输出语音。 该标签可以在合成语音流中插入一个书签,而这个书签用作可以被程序检测,也可以向程序报告标签事件,以实现一些同步造作。 从上面的介绍上可以看出,这些插入式指示标签对提高合成语音的自然度与感情色彩的体现,扮演着重要的补充角色。 再次,根据上下文的声音控制。 Did you record that record ? 这个标签的示例使用这句英语句子更加明显。很显然,"record"既可以作动词,也可以作名次,而且作为动词与作为名次的时候的发音也不相同。使用标签就可以实现这样子的情况的正确合成输出。当然,这样子的情况在普通话中不能采用类似的解决方法,也就是普通话中的多音字问题,不可以这样使用一个标签就可以解决的。 再一个标签, 03/04/01 根据标签指示,这句应该被读成2001年4月3日,而 03/04/01 这句就应该读成2003年4月1日。当然,这样子的情况也可以通过事先对文本进行标准化来解决。 还有,语音选择标签,应该说是对具有不同音色的声音的选择。 这里的内容要求引擎以一个女性小孩子的声音合成输出。 这里的内容要求引擎以英语合成输出。 最后,还有一个自定义发音标签,没有看明白,在Microsoft的XML Schema中没有提到,只是在XML TTS指南中最后提到了。根据功能说明,估计对合成效果没有决定性影响^^ 下午在网上碰到mokaiyu,他说明天早上到合肥来看女朋友,然后一起黄山游玩。黄山好啊,听去过的同学们说绝对不感到枉次一行。什么时候也能着个伴儿去看看。 bordern 发表于 2004-03-10 00:01 引用Trackback(0) | 编辑 评论 发表评论 最后更新 郁闷 回收内存 版本升级快、动作大 时间冲淡一切 ASP.net 之 Html 控件 VB.net 初探 MCI的使用 VC中标注控件属性修改 孤单的暑假 离别的日子