XX财富金融集团

新闻中心

快速通道FAST TRACK

GT平台/NEWS

一种基于嵌入式系统的语音口令识别系统的设计

2019-05-29 08:16

  随着计算机技术和信息技术的迅速发展,语音口令识别已经成为了人机交互的一个重要方式之一。语音口令识别系统将根据人发出的声音、音节或短语给出响应,如通过语音口令控制一些执行机构、控制家用电器的运行或做出回答等。在数字信号处理芯片上已经实现了语音口令识别系统或语音口令识别系统的部分功能,然而随着嵌入式微处理器处理能力的大幅度提高,计算量大的语音口令识别算法已经能够通过嵌入式微处理器来完成,将语音口令识别系统与嵌入式系统相结合,发挥

  采用隐马尔克夫模型(Hidden Markov MODEL,HMM) 描述语音信号的非平稳和局部平稳,HMM中的状态与语音信号的某个平稳段相对应,平稳段之间以转移概率相联系。由于HMM建模对语音信号长度和模型的混合度的要求都比较低,因此在现有的非特定人语音口令识别系统中,多采用状态输出具有连续概率分布的连续隐马尔可夫模型(ConTInuous Density Hidden Markov MODEL,CDHMM)。

  论文给出一种基于嵌入式系统的语音口令识别系统的设计方案,硬件系统的核心芯片是嵌入式微处理器,语音口令识别算法采用CDHMM。语音口令首先经过预处理,提取MFCC(Mel-Frequency Ceptral Coefficients)特征参数,然后建立此口令的CDHMM模型,把所有语音口令的模型放在模型库中,在识别阶段,通过概率输出*分,取*分最大的一个作为识别出的口令。将语音识别系统与嵌入式系统相结合,可以使语音口令识别系统广泛应用于便携式设备中。

  基于嵌入式系统的语音口令识别系统需要有接收语音信号的输入芯片配合麦克风实现将模拟语音信号转换成数字信号的功能,然后由嵌入式微处理器对输入的语音口令信号进行处理。完成语音口令信号输入功能的芯片采用的是PHILIPS公司的低功耗芯片UDAl341TS,供电电源电压为3V,该音频处理芯片由模数/数模转换(ADC)、控制逻辑电路、可编程增益放大器(PGA)和数字自动增益控制器(DAGC)以及数字信号处理器等部分组成,能进行数字语音处理。

  芯片UDAl341TS采用标准的内部集成电路声音总线IIS(Inter IC Sound Bus),该总线是由PHILIPS等公司共同提出的数字音频总线协议,专门用于音频设备之间的数据传输,目前很多音频芯片和微处理器都提供了对IIS总线的支持。

  IIS总线有三根信号线,分别是位时钟信号BCK(Bit Clock)、字选择控制信号WS(Word Select)和串行数据信号Data,由主设备提供串行时钟信号和字选择控制信号,IIS总线 基于CDHMM的口令识别的软件设计

  语音口令识别的软件系统分别由特征参数提取、语音模型库和概率输出*分三大模块组成,如图3所示:1)语音口令特征参数的提取,输入不同的语音口令,首先要进行特征参数提取,采用Mel频率参数作为CDHMM的建模参数,Mel频率参数是根据人耳的听觉特将语音信号的频谱转化为基于Mel频率的非线频谱,然后转换到倒谱域上。2)在训练阶段,对不同的语音口令建立CDHMM模型。3)在口令识别阶段,通过概率输出*分对待测语音口令做出识别。

  在许多较早期的系统中,代码存储使用ROM或者OTP-EPROM,它们是非易失的且不能在系统中进行修...