语音识别

用手机看条目

出自 MBA智库百科(https://wiki.mbalib.com/)

语言识别(Speech Recognition/Voice Recognition)

目录

什么是语言识别[1]

  语言识别是指计算机用有限的特征或规则对我们日常生活中使用的语言符号进行运算,以辨认出它们是哪些字或词的过程。

  语音识别是一门交叉学科。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。 语音识别听写机在一些领域的应用被美国新闻界评为1997年计算机发展十件大事之一。很多专家都认为语音识别技术是2000年至2010年间信息技术领域十大重要的科技发展技术之一。 语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。

  中国物联网校企联盟形象得把语音识别比做为“机器的听觉系统”。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。语音识别技术车联网也得到了充分的应用,例如在翼卡车联网中,只需按一键通客服人员口述即可设置目的地直接导航,安全、便捷。

语言识别的发展

  1952年贝尔研究所Davis等人研究成功了世界上第一个能识别10个英文数字发音的实验系统。

  1960年英国的Denes等人研究成功了第一个计算机语音识别系统。

  大规模的语音识别研究是在进入了70年代以后,在小词汇量、孤立词的识别方面取得了实质性的进展。

  进入80年代以后,研究的重点逐渐转向大词汇量、非特定人连续语音识别。在研究思路上也发生了重大变化,即由传统的基于标准模板匹配的技术思路开始转向基于统计模型 (HMM)的技术思路。此外,再次提出了将神经网络技术引入语音识别问题的技术思路。

  进入90年代以后,在语音识别的系统框架方面并没有什么重大突破。但是,在语音识别技术的应用及产品化方面出现了很大的进展。

  DARPA(Defense Advanced Research Projects Agency)是在70年代由美国国防部远景研究计划局资助的一项10年计划,其旨在支持语言理解系统的研究开发工作。

  到了80年代,美国国防部远景研究计划局又资助了一项为期10年的DARPA战略计划,其中包括噪声下的语音识别和会话(口语)识别系统,识别任务设定为“(1000单词)连续语音数据库管理”。

  到了90年代,这一DARPA计划仍在持续进行中。其研究重点已转向识别装置中的自然语言处理部分,识别任务设定为“航空旅行信息检索”。

  日本也在1981年的第五代计算机计划中提出了有关语音识别输入-输出自然语言的宏伟目标,虽然没能实现预期目标,但是有关语音识别技术的研究有了大幅度的加强和进展。

  1987年起,日本又拟出新的国家项目---高级人机口语接口和自动电话翻译系统。

  中国发展

  中国的语音识别研究起始于1958年,由中国科学院声学所利用电子管电路识别10个元音。直至1973年才由中国科学院声学所开始计算机语音识别。由于当时条件的限制,中国的语音识别研究工作一直处于缓慢发展的阶段。

  进入80年代以后,随着计算机应用技术在中国逐渐普及和应用以及数字信号技术的进一步发展,国内许多单位具备了研究语音技术的基本条件。与此同时,国际上语音识别技术在经过了多年的沉寂之后重又成为研究的热点,发展迅速。就在这种形式下,国内许多单位纷纷投入到这项研究工作中去。

  1986年3月,语音识别作为智能计算机系统研究的一个重要组成部分而被专门列为研究课题。这一年1起,中国开始了有组织的语音识别技术的研究,并决定了每隔两年召开一次语音识别的专题会议。从此中国的语音识别技术进入了一个前所未有的发展阶段。

语言识别的分类

  语言识别可根据词汇大小,讲活人范围,发音方式和环境等情况分作很多类。例如:

  1、词汇量大小

  可分词汇量小(1~20个词),中等(20~l00个词),大(100词以上);

  2、讲话人范围

  分特定某个人、某些人;非特定的,男、女或儿童等;

  3、发音方式

  孤立字发音,连续发音;

  4、讲话环境

  例如隔声问、机房、公共场所;

  5、系统学习方式

  不学习,离线学习,不断地学习。

  可见对语言识别系统的要求可以有很大的出入,因此系统的规模、大小、复杂性等出入也很大。

语言识别的应用

  1、语言打字机

  现在微计算机已普遍应用,多种文字的输入、输出,打印非常成功。如果装上口语输入设备,就可实现语言打字机等,将人们从手指操作中解放出来。

  2、控制机器人

  利用有限词汇的语音识别系统就能达到声控机器人的目的。例如在机器人搬运重物的场合,如果给机器人接上语音识别器,使机器人能听懂诸如“向前”、“左转”、“右转”、“提起”、“放下”等一些有关的命令,那么人们可以坐在一边,用口令控制机器人完成重物的搬运

参考文献

  1. 林成滔编著.字里乾坤:汉字文化畅谈二十三章.中国档案出版社,2004年08月第1版.
本条目对我有帮助9
MBA智库APP

扫一扫,下载MBA智库APP

分享到:
  如果您认为本条目还有待完善,需要补充新内容或修改错误内容,请编辑条目投诉举报

本条目由以下用户参与贡献

方小莉,赵先生,陈cc.

评论(共0条)

提示:评论内容为网友针对条目"语音识别"展开的讨论,与本站观点立场无关。

发表评论请文明上网,理性发言并遵守有关规定。

打开APP

以上内容根据网友推荐自动排序生成

闽公网安备 35020302032707号