全球专业中文经管百科,由121,994位网友共同编写而成,共计436,015个条目

語音識別

用手机看条目

出自 MBA智库百科(https://wiki.mbalib.com/)

(重定向自语音识别技术)

語言識別(Speech Recognition/Voice Recognition)

目錄

什麼是語言識別[1]

  語言識別是指電腦用有限的特征或規則對我們日常生活中使用的語言符號進行運算,以辨認出它們是哪些字或詞的過程。

  語音識別是一門交叉學科。近二十年來,語音識別技術取得顯著進步,開始從實驗室走向市場。人們預計,未來10年內,語音識別技術將進入工業、家電、通信、汽車電子、醫療、家庭服務、消費電子產品等各個領域。 語音識別聽寫機在一些領域的應用被美國新聞界評為1997年電腦發展十件大事之一。很多專家都認為語音識別技術是2000年至2010年間信息技術領域十大重要的科技發展技術之一。 語音識別技術所涉及的領域包括:信號處理、模式識別、概率論和資訊理論、發聲機理和聽覺機理、人工智慧等等。

  中國物聯網校企聯盟形象得把語音識別比做為“機器的聽覺系統”。語音識別技術就是讓機器通過識別和理解過程把語音信號轉變為相應的文本或命令的高技術。語音識別技術主要包括特征提取技術、模式匹配準則及模型訓練技術三個方面。語音識別技術車聯網也得到了充分的應用,例如在翼卡車聯網中,只需按一鍵通客服人員口述即可設置目的地直接導航,安全、便捷。

語言識別的發展

  1952年貝爾研究所Davis等人研究成功了世界上第一個能識別10個英文數字發音的實驗系統。

  1960年英國的Denes等人研究成功了第一個電腦語音識別系統。

  大規模的語音識別研究是在進入了70年代以後,在小辭彙量、孤立詞的識別方面取得了實質性的進展。

  進入80年代以後,研究的重點逐漸轉向大辭彙量、非特定人連續語音識別。在研究思路上也發生了重大變化,即由傳統的基於標準模板匹配的技術思路開始轉向基於統計模型 (HMM)的技術思路。此外,再次提出了將神經網路技術引入語音識別問題的技術思路。

  進入90年代以後,在語音識別的系統框架方面並沒有什麼重大突破。但是,在語音識別技術的應用及產品化方面出現了很大的進展。

  DARPA(Defense Advanced Research Projects Agency)是在70年代由美國國防部遠景研究計劃局資助的一項10年計劃,其旨在支持語言理解系統的研究開發工作。

  到了80年代,美國國防部遠景研究計劃局又資助了一項為期10年的DARPA戰略計劃,其中包括雜訊下的語音識別和會話(口語)識別系統,識別任務設定為“(1000單詞)連續語音資料庫管理”。

  到了90年代,這一DARPA計劃仍在持續進行中。其研究重點已轉向識別裝置中的自然語言處理部分,識別任務設定為“航空旅行信息檢索”。

  日本也在1981年的第五代電腦計劃中提出了有關語音識別輸入-輸出自然語言的巨集偉目標,雖然沒能實現預期目標,但是有關語音識別技術的研究有了大幅度的加強和進展。

  1987年起,日本又擬出新的國家項目---高級人機口語介面和自動電話翻譯系統。

  中國發展

  中國的語音識別研究起始於1958年,由中國科學院聲學所利用電子管電路識別10個母音。直至1973年才由中國科學院聲學所開始電腦語音識別。由於當時條件的限制,中國的語音識別研究工作一直處於緩慢發展的階段。

  進入80年代以後,隨著電腦應用技術在中國逐漸普及和應用以及數字信號技術的進一步發展,國內許多單位具備了研究語音技術的基本條件。與此同時,國際上語音識別技術在經過了多年的沉寂之後重又成為研究的熱點,發展迅速。就在這種形式下,國內許多單位紛紛投入到這項研究工作中去。

  1986年3月,語音識別作為智能電腦系統研究的一個重要組成部分而被專門列為研究課題。這一年1起,中國開始了有組織的語音識別技術的研究,並決定了每隔兩年召開一次語音識別的專題會議。從此中國的語音識別技術進入了一個前所未有的發展階段。

語言識別的分類

  語言識別可根據辭彙大小,講活人範圍,發音方式和環境等情況分作很多類。例如:

  1、辭彙量大小

  可分辭彙量小(1~20個詞),中等(20~l00個詞),大(100詞以上);

  2、講話人範圍

  分特定某個人、某些人;非特定的,男、女或兒童等;

  3、發音方式

  孤立字發音,連續發音;

  4、講話環境

  例如隔聲問、機房、公共場所;

  5、系統學習方式

  不學習,離線學習,不斷地學習。

  可見對語言識別系統的要求可以有很大的出入,因此系統的規模、大小、複雜性等出入也很大。

語言識別的應用

  1、語言打字機

  現在微電腦已普遍應用,多種文字的輸入、輸出,列印非常成功。如果裝上口語輸入設備,就可實現語言打字機等,將人們從手指操作中解放出來。

  2、控制機器人

  利用有限辭彙的語音識別系統就能達到聲控機器人的目的。例如在機器人搬運重物的場合,如果給機器人接上語音識別器,使機器人能聽懂諸如“向前”、“左轉”、“右轉”、“提起”、“放下”等一些有關的命令,那麼人們可以坐在一邊,用口令控制機器人完成重物的搬運

參考文獻

  1. 林成滔編著.字里乾坤:漢字文化暢談二十三章.中國檔案出版社,2004年08月第1版.
本條目對我有幫助9
MBA智库APP

扫一扫,下载MBA智库APP

分享到:
  如果您認為本條目還有待完善,需要補充新內容或修改錯誤內容,請編輯條目投訴舉報

本条目由以下用户参与贡献

方小莉,赵先生,陈cc.

評論(共0條)

提示:評論內容為網友針對條目"語音識別"展開的討論,與本站觀點立場無關。

發表評論請文明上網,理性發言並遵守有關規定。

打开APP

以上内容根据网友推荐自动排序生成

下载APP

闽公网安备 35020302032707号