文档下载
网盘链接: https://pan.baidu.com/s/11DKWmkbXqoVgFZ9491Fyfg
提取码: vukw
部分内容展示
语言是人与人之间开展沟通及交流便捷、有效的手段之一,也是人类应用最早、最广泛的交流方式,音频信号就是指承载了语言表现出来的音频的波动。现在进入了现代高度发达社会,人们仍然希望信息的沟通能采用最方便的方式进行,需要我们用现代的新技术对语言进行某种处理,达到现代人们希望实现的存储、人与人远距离多形式沟通、人与终端交互,终端与终端交互等多种新式沟通。
Dudley在1939年发明了声码器,在此之后“波形原则”,的处理技术逐步转变为基于通道的声码处理技术,声码器的理论基础是:认为声音的产生是首先人的声带产生振动,声带振动引起空气振动从而发出声音,也就是声带的振动是声源 (可以理解为传统意义上的载波),而声道控制声源振动不同(调制),通过不断变化声道就会发出了不同的声音,声码器的理论提出来以后就迅速地发展了起来,现在声码器理论己经广泛地应用到了广泛的基础理论研究和大量的实际工程研究过程,广大技术人员应用这一理论进行声音模型建模,并开展语音信号的合成、压缩、编码等技术的研究。
数字音频处理技术最早的应用实例是在二十世纪六十、七十年代日本科研人员对调频立体声广播系统的研究,在对系统地研究、试验发现,在模拟信号条件线,不管采用什么优化及改进技术,语音信号的音质没有明显改变,不能满足人们日益提高的视听需求,研究人员提出了采用数字技术来进行语音信号处理的方案以替代老式磁带式模拟信号录音,1977年成功推出世界上第一台数字化处理技术录音机PCM-1。从此数字化处理技术在声音处理上的应用得到突飞猛进的进步,而作为声音的载体(存储)也发生了翻天覆地的变化,包括磁带、唱片、磁介质、广播、网络等都逐步走向数字化[l]。1982年激光唱盘问世一第一种数字化存储的唱片,1987年数字化录音磁带问世,1987年通过卫星电视直播的B模式立体声伴音也标志着广播实现了数字化传输,这一系列成果的研究成功及广泛应用标志着数字音频处理技术逐步达到了从试验室走向市场的道路。
更多范文
目前就国内市场而言,伴随着互联网技术的发展,语音识别技术也得以不断突破,其相关的研究成果也投入到了产品的研发当中。在充分调研国内主流语音技术应用的场景之后,我们发现最贴近大众生活的应用场景都离不开手机,例如在手机上进行语音搜索(如淘宝、京东与苹果公司的Siri),以及语音输入法(如搜狗输入法与科大讯飞的语音输入),还有语音导航(高德地图)等等。以上这些应用场景有如下两个特点:
1.以语音为媒介,参与或代替了传统的人工交互方式;2.充分地与人工智能技术相结合。这两个特点基本奠定了语音识别技术在人机交互研究发展中不可忽视的地位。当然,这些应用场景也存在如下两个问题:1.依赖于网络;2.识别率随环境噪声提高而降低。针对第一个问题,当网络环境不佳时,这些依赖于网络的语音识别的相关功能都是无法使用的。很多厂商也尝试做本地语音识别,但在对于存储空间有限的手机而言,将语音数据训练出的模型放在服务器上显然比放到用户的手机上更为合理。因此,大多数的语音识别软件都要依赖于网络。第二个问题凡乎是所有语音识别软件必须要处理的一个问题。因为用户手机的使用环境是随时变化的,噪音干扰成了无法回避的一大因素。那么,如何提高在噪音环境中的识别率显然就成为了非常有价值的研究内容。
本课题的研究目的主要集中在提高噪音环境中语音识别的准确率。这是由于在现实的环境中,噪音几乎是无法避免的。在这样一个大环境下,研巧语音识别相关技术,研究关键算法优缺点。研究如何进一步提高在噪音环境中语音识别的准确率显然具备一定的研究价值、社会价值以及现实意义。