字符语音库是一个单字发音语音数据的集合,中段数据之间相互独立,不具有相关性。语音库包含了国标一、二级字库中的所有6763个汉字、10个阿拉伯数字和26个英文字符的标准普通话语音数据。每个汉字或字符发音时长为0.65s,采用8KHz抽样频率,使用了G.729A语音编码算法对上述的语音数据进行压缩,压缩后数据速率为8Kbps,相当于具有8:1的高压缩率。在汉字中,同音字占了相当大的比例,而在语音合成中对于同音字的处理是没有区别的,故近7000个汉字,我们只存储1123个不同的发音。经过同音字处理和采用G.729标准压缩字符语音数据,则最终建立的语音库文件大小为729 950字节,完全符合本PDA系统的数据存储要求;否则,语音库数据量太大,本PDA系统不能接受!
建立一个语音压缩数据库的具体步骤如下:
*将数字和常用汉字的标准发音独立地录入到数据文件中,作为基础数据。使用cooledit2000软件完成语音的录入。
*对于输入数据,按照每帧10ms(80个样点)的长度,将A_law语音通过简单换算变成16bit PCM数据,作为编码算法的输入。
*按照G.一体电感器729A算法标准,对数据进行编码。
*将编码后的数据转换为二进制比特流,写入语音库文件中。压缩后数据速率为8Kbps,具有相当于8:1的高压缩率。
用C语言实现这一过程的程序流程如图1所示。
字符语音库的建立是在Windows平台及Visual C++编程环境下实现的,最终压缩处理后数据量的大小为729 950字节,每个字符语音数据的大小是650字节。
2.2 语音合成
当收到个人传呼信息时,语音合成程序首先从指定位置获取传呼信息数据,然后在语音库中查找每个汉字、阿拉伯数字或者英文字符的发音,重组一个数据文件。解码程序对该文件进行解码并且输出原始语音。语音合成流程如图2所示。
语音合成过程首先是当前字符在语音库的定位。对于10个阿拉伯数字和26个英文字符,将其放在语音库开头。这些字符的查找比较方便。汉字是2字节存储,我们依居其区位码来作为语音库中的定位索引。字符语音检索结束后的语音压缩数据作为该字符解码过程的输入。
数据解码过程可以分为参数解码和重构信号后处理2部分。首先要从输入的数据中提取参数符号,对这些符号解码之后,可以获得相应于10ms话音帧的编码器参数。这些参数包括线性预测系数、自适应码本矢量、固定码本矢量以及它们的增益。解码之后的参数用来计算重建语音信号。得到重构语音信号只有通过后处理过程来对该信号进行放大,包括后向滤波、高通滤波以及按比例因子扩大,最后得到原始的语音数据。
字符解码器原理如图3所示。
2.3 PDA系统的体系结构
PDA系统中嵌入式处理器EP7211进行数据处理,传呼解码芯接收传呼信息并进行解码,LCD提供数据输出显示,触摸屏提供用户输入接口,Flash用来存储应用程序和数据,SRAM为程序运行提供内存空间,电源电路为嵌入式处理器和外围设备提供所需要工作电压。
嵌入式处理器EP7211是Cirrus Lo一体成型电感器gic公司专门为低成本、超塑封电感低功耗的嵌入式应用设计的,包含ARM7TDMI处理器内核和丰富的外围接口。外围接口有CODEC音频接口、SPI串行A/D接口、单色LCD接口、DRAM接口、红外接口、2个PWM接口、电感器的测量实时时钟RTC以及电源检测接口。EP7211的内核电路工作在2.5V,而外围电路工作在3.3V;可根据具体情况对内核的时钟进行动态编程控制,可工作在18、36、49和74MHz。另外EP7211还有3种基本供电模式:正常操作(operating)、空闲(idle)和等待(standby)。在等待模式,主时钟被关断,整个CPU及相关外围(除中断和RTC)也关断,但可通过中断或按钮来唤醒。
BTS660及其在电池智能检测与充电装置中的应用充电电池广泛应用于工农业生产、国防科技等领域,而充电电池的检测与充电是在充电电池使用过程中必须解决的问题。电池智能检测与充电装置就是针对充电电池的检测与充电而专门研发的一套装备。在设计过程中,充分利用
让智能电表更加省电为了提高能源效率,各国都在加快智能电网建设,大力推广智能电表,以满足电力需求的不断攀升。在快速推进智能电表应用的同时,电表开发商、为他们提供元器件的厂商,乃至最终用户也在关注能让智能电表更加省电的技术
数字式电能质量在线监测系统在电力系统中的运用电能质量在线监测设备是电网电能质量监督检测网络最基本也是最主要的设备,目前市场上销售和使用的国内外生产的电能质量部分指标(如谐波、不平衡度等)的监测设备,大都不能完全适应我国电网电能质量监督管理的实际