午夜亚洲国产日本电影一区二区三区,九九久久99综合一区二区,国产一级毛片视频,草莓视频在线观看精品最新

加急見刊

語音識別系統使用的聲學模型

來源:投稿網 時間:2023-08-18 10:00:07

語音識別是一門交叉學科。語音識別研究經歷了50多年的研究過程,經過50多年的積累研究,取得了巨大的進展。特別是在過去的20年里,語音識別技術取得了顯著的進展,并逐漸進入市場。在未來,語音識別技術將得到更廣泛的應用。本文簡要闡述了語音識別的發展和趨勢。

語音技術的發展歷史。

20世紀50年代,大多數研究人員致力于聲學和語音學的基本概念。1952年,在AT&TBell實驗室,實現了10個英文數字的語音識別系統,單個發音人孤立發音,主要用于測量每個數字的元音段的共振峰。1956年,RCAlab進行了另一項獨立研究,試圖識別10個不同音節的單個發音,也采用了測量共振峰的方法。1959年,英國UniversityCollege的研究人員開始嘗試另一個想法,通過譜分析和模板匹配構建音素識別器,用于識別4個元音和9個輔音。20世紀60年代,語音識別的幾個重要思想相繼出現和發表。1962年,東京大學嘗試實現另一個音素識別器的硬件。它使用零率方法分離語音信號的不同部分。1963年,日本NECLab嘗試數字語音識別是最值得注意的工作,因為它不僅是NEC語音識別研究的開始,也導致了一個長期而有效的研究計劃。20世紀60年代,三個研究項目的發展對未來20年的語音識別研究和發展產生了重大影響。第一個研究項目始于20世紀60年代末研究項目始于20世紀60年代末,旨在研究語音事件時間不均勻性的實際解決方案。在可靠檢測語音事件開始和結束的基礎上,開發了一套時間糾正的基本方法。

2.語音識別技術的發展現狀。

通過全球科學家的共同努力,經過半個多世紀的研究,語音識別技術已經發展到接近實踐的階段。在實驗室環境中,寬帶語音信號的平均識別率可達90%以上。在正式獲得如此高的識別率后,語音識別技術逐漸從實驗室演示系統轉向實用商品。以IBMViavoice和Dragondictation為代表的兩個聽寫機系統的出現,使語音識別逐漸進入公眾視野,引起了廣泛的社會關注。

由于校對和糾正識別錯誤是非常麻煩和浪費時間,因此降低了語音識別的優勢。同時,由于使用環境或口音習慣等因素的影響,語音識別的內容大大降低,識別的內容無法達到100%正確。因此,許多人認為目前的語音識別系統不能滿足實際要求。

目前,AT&T和MIT將語音識別技術應用于電話自動轉接、電話查詢、數字串識別等一些有限詞匯的特定任務中。當演講內容存儲在系統中,使用環境的聲學特性與訓練數據的聲學特性差異不大時,語音識別的正確識別率可接近100%。然而,如果這些條件在實際使用中被破壞,將對識別系統產生一定的影響。

3.語音識別技術的發展趨勢。

雖然過去20年語音識別有了很大的發展,但仍有許多不足需要進一步探索,可分為以下幾個方面:

1)提高可靠性。語音識別技術需要能夠消除各種聲學環境因素的影響。在嘈雜的公共環境中,人們的意識會有意識地排除不必要的聲學環境因素,這對語音識別系統來說是困難的。此外,在日常生活中,人類語言往往具有很大的不確定性、隨機性和明顯的語言習慣。這也會給語音識別系統帶來很大的識別麻煩。目前,在提高語音系統在不同環境中的可靠性的同時,應用現代技術使語音識別系統更加智能化,掌握人們語言隨機性的一些規律,以達到最佳的識別效果。

2)增加詞匯量。系統能識別的詞匯量是系統能做什么的重要測量。如果語音識別系統使用的聲學模型和語音模型過于有限,當用戶說的詞匯超出系統已知范圍時,語音識別系統無法準確識別相應的內容。例如,當它突然從中文變成英文、法語和俄語時,計算機經常輸出混亂和奇怪的結果。然而,隨著系統建模方法的不斷改進、搜索算法效率的提高和硬件資源的發展,未來的語音識別系統可能會實現無限詞匯和各種語言的混合,使用戶無需在語言之間來回切換,從而大大降低詞匯對語音識別系統的限制。

3)應用程序擴展。語音識別技術可以用來使大腦、費力、費時的機器操作成為一件非常容易和有趣的事情,例如,當人們忙碌,手和無知的場景,通過語音識別系統模型結構,可以在駕駛室、危險的工業場合、遠程信息獲取、家電控制等方面,語音識別技術可以推動一系列新的或更方便的功能設備,更方便人們的工作和生活。它的應用范圍和前景都非常廣泛。它不僅可以應用于日常生活,而且可以帶來生產模式的革命,是下一代智能控制的基礎。

4)降低成本,減少體積。微型化是語音識別技術商業應用的另一種重要途徑,其推廣程度取決于語音識別技術本身的進步,與微電子芯片技術的進一步發展密切相關。語音識別應用系統具有先進的功能和性能固化到更小的芯片或模塊,可以大大降低產品成本和體積,產品必須受到消費者的青睞,語音識別系統和微電子芯片技術的發展將引領我們的信息技術革命達到一個新的水平。

21世紀是信息和網絡的時代。網絡上可以實現一系列人類活動,如自然口語對話、電子商務、信息索取、數字圖書館、語音翻譯、遠程教育等。語音識別系統的出現將使人們在任何地方、任何時間、任何事情上都能輕松地享受到更多的社會信息資源和現代服務。這必將成為語音識別技術研究和應用的重要發展趨勢。