嘟嘟虾变态传奇网

语音文件拼接算法的设计与实现

    本文作者: 张广渊, 李晶皎, 王显巍
  第169第4期2004年8月沈阳大学学.报01.16,o.4ug.2004文章编号:1008.9225(2004)04?0012?03张广渊1,李晶皎2,王显巍2(1.沈阳大学信息工程学院,辽宁沈阳1100442.东北大学信息科学与工程学院,辽宁沈阳110004)摘要:在文本语音转换的过程中,两个或多个声音文件的无缝拼接是经常需要处理的操作.从分析微软通用声音文件的内部格式着手,以8bit位长,8z采样率声音文件为例,设计了对多个文件的拼接算法,避免了实时拼接过程中产生的语音迟滞现象,为实现在文本语音转换中应用波形拼接技术奠定了良好的基础.本算法已实现并已在满文语音合成系统中成功应用.关键词:下rs语音波形文件拼接中图分类号:206文献标识码:语音技术在计算机中的应用越来越广泛,语音合成作为语音信号处理领域中的一个热点,越来越受到人们的广泛关注.目前很多语音合成研究的课题都集中在文本语音转换部分,简称为1vr(text.t.o-speech)技术,其功能模块通常可分为文本分析、韵律建模和语音合成三大模块.其中,语音合成是丁rs系统中最基本、最重要的模块.概括起来说,语音合成的主要功能是:根据韵律建模的结果,从原始语音库中取出相应的语音基元玩这个网游,利用特定的语音合成技术对语音基元进行韵律特性的调整和修改,最终合成出符合要求的语音l.语音合成技术目前的基本方法包括参数合成和拼接合成,也有两者的结合.目前,常用的语音合成技术主要有:共振峰合成、合成、拼接合成和声道模型技术.它们各有优缺点,人们在应用过程中往往将多种技术有机地结合在一起,或将一种技术的优点运用到另一种技术上,以克服另一种技术的不足.不论采用什么合成方法,最终都需要把指定的多个音素文件拼接播放,实现单词或语句的连续播出.如果采用对音素文件依次播放的方法,对于如汉语这样的单音节发音语言来说是可行的,但是对于像英语等多音节发音语言则不适用,会产生明显的音素间停顿,使合成的语音自然度和流畅度都大大降低.如果采用算法事先对语音文件进行拼接,拼接后以单词或短语为单位进行播放,则可以消除多音节语音在音素之间产生的停顿,提高语音合成的整体自然度和流畅度.下面以微软通用声音格式v文件为例,设计实现语音文件拼接算法.1文件格式w文件是以格式为标准的.是英文esourcenterchangeileormat的缩写,“”也作为文件的标志位于文件的前四个字节.w文件由文件头和数据两大部分组成.其中文件头又分为文件标识段和声音数据格式说明段两部分.文件头各部分内容及格式如表l所示.表1文件头格式说明表偏移量字节数数据类型内容在表l中,偏移量为开始是音频格式描述内容,包括数据格式类别、采样率、数据传输速收稿日期:2004.07.05作者简介:张广渊(1974一),男,山西大同人,沈阳大学讲师,东北大学博士研究生李晶姣(1964一),女,辽宁沈阳人,东北大学教授.第4期张广渊等:13率、数据块的调整数以及每传奇样本数据位数等内容偏移量为04和偏移量为28使用双字表示的长整形值都是长度值,前者表示整个文件的长度,后者表示存储的实际数据的长度.。常见的声音文件主要有两种,分别对应于单声道(典型参数为:11.025kz采样率、8bit的采样值)和双声道(典型参数为:44.1kz采样率、16bit的采样值).在这里采样率指声音信号在从模拟信号到数字信号的转换过程中单位时间内采样的次数.采样值指每一次采样周期内声音模拟00h:lh:20h:0l信号的积分值.对于单声道声音文件,采样数据为八位的整数而对于双声道立体声声音文件,每次采样数据为一个16位的整数,高八位和低八位分别代表左右两个声道.w文件数据块包含以脉冲编码调制格式表示的样本.文件是由样本组织而成的.在单声道文件中,声道0代表左声道,声道1代表右声道.在多声道文件中,样本是交替出现的.图1给出了一个w文件头信息描述.57100000000100010040000传奇040l00002算法设计标志图1文件头信息描述为了算法与描述的统一性,在这里以8z采样率、8bit采样值相同音频格式的文件为描述对象.从前面的介绍可以看出,wv文件分为文件头和数据两大部分,拼接流程图如图2所示.在拼接过程中,涉及到对三个文件的操作.第一个文件是拼接来源文件1,在流程图里被称为原始文件.第二个文件是拼接来源文件2,在流程图里被称为拼接文件.第三个文件是拼接结果文件,用来存放拼接后的结果.算法开始时首先判断入参数是否有效。即判断是否有文件需要拼接.如果有,则确定了原始文件和拼接文件.接下来判断拼接结果文件是否存在,如果不存在,就设置原始文件为拼接文件,如果存在则设置拼接结果文件为原始文件.这里主要考虑了连续拼接发生的情况,所以在程序中会控制拼接结果文件与原始文件保持一致.这样,在这个判断结束后,拼接结果文件的内容为原始文件.此时,将拼接文件的数据追加到拼接结果文件的数据区,并同时计算修改相应的拼接结果文件的“数据长度”和“文件长度”这两个属性.最后得到的拼接结果文件即是算法最终输出的结果.在本算法中完美国际,由于采用的入数据具有相同的音频格式,所以对于结果文件的音频属性参数只需要复制其中一个拼接来源文件的音频参数即可.如果是不同音频格式的来源文件,则需要通过:.fmt:.:.data7.召君8e数据相应的参数值和设定的输出结果条件来重新组合数据区的数据.r丽[复制原始文件为拼接结果文件匙件需岁适》f接结果文件是否存在互.?设置拼接结果文件为原始文件读取原始文件的数据长度dl1读取拼接文件的数据长度d12设置拼接结果文件的数据长度d13=dll+d12按d12顺序读取拼接文件的数据追加给拼接结果文件按拼接结果文件的实际长度计算并设置拼接结果文件的文件长度属性接结果文件是否存在~、f.i:.~输出拼接结果文件l结束图2文件拼接算法流程图如果需要多个文件的拼接则需要在本算法之沈阳大学学报第16卷外再嵌套一个循环,用来将热血传奇多个文件的拼接分解成两个文件拼接的组合.3结论本算法使用语言编程实现,经过测试达到了设计要求,可以对提供的多个语音波形文件实现拼接21.由于在拼接后调用playsound函数实现对拼接文件的播放,所以拼接后的文件长度不宜过大.对于在语音合成中单词级的播放完全可以达到设计要求.通过在拼接过程中对拼接数据长度的修改,还可以控制播放的语速.该算法经过改进后,已成功地应用于满文信息平台中满文语音合成模块.参考文献:[1萨其荣贵,高光来。何敏.蒙古语文与转换系统的研究与实现[.见:鲍怀翘,金星华,宗成庆主编.少数民族语言信息技术研究进展:中国少数民族语言信息技术与语言资源库建设学术研讨会论文集[.北京,2004.[2飞恩科技.编程指南[.北京:电子工业出版社,2002.95一09.esignandrealizationofsoundwavefileconnectionalgorithmuang-yuan1,ing-jia02,ian?wei2(1.choolofnformationngineering,henyangniversity,henyang110044,hina2.choolofnformationcienceandngineering,ortheasternniversity,henyang110004,hina.)bstract:heseamlessconnectionoperationbetweentwosoundwavefilesisabsolutelynecessarilyoperationduringthetext.to-speechprocess.nalysesthedetailformatofwavefilewhichisicrosoftgeneralsoundfiletype,thentakesthesoundfilewhichparametersvalueis8bitand8zasanexampleanddesignstheconnectionalgorithmbetweent该网络游戏对于这推荐了wosoundwavefiles.hismethodavoidsthedelayphenomenonofreal?timesoundconnectionandlaysafoundationforrealizationoftext?to-speech.hisalgorithmhasbeenrealizedandappliedinanchutext.to-speechsystem.eywords:1vrvoicewavefileconnection责任编辑李艳。
  本文《语音文件拼接算法的设计与实现》 --- 作者: 张广渊, 李晶皎, 王显巍

上一篇:中职学校计算机专业教学改革之我见
下一篇:没有了

  声明:本站文章是嘟嘟虾传奇游戏网站长编辑亲自完成。有的文章来源于网络请勿转载。

相关文章推荐导读:

  • 传奇-网游的神话
  • 脑血管病恢复期健康教育效果评价
  • 关于制造企业竞争力的思考好传奇
  • 电脑三维动画制作技术
  • Delphi数据库应用技术
  • 流媒体我也用
  • 这是不是甜肉计
  • 28区八卦杂谈
  • 谈UNIX系统下的侵权和防御
  • 职高计算机教育实验教学创新探讨
  • 在高职教育中培养学生创业能力
  • 21非人格化:犯罪实施与犯罪控制

  • 2006-2010 变态传奇私服-WWW.DODOXIA.COM (注:本站只投放官方区域代理的合法授权的私服游戏) 京ICP备06082393号
    联系方式 - 电话:010-46554121 手机:15900021547 邮箱:yuxi@dodoxia.com