HOME 首頁
SERVICE 服務(wù)產(chǎn)品
XINMEITI 新媒體代運營
CASE 服務(wù)案例
NEWS 熱點資訊
ABOUT 關(guān)于我們
CONTACT 聯(lián)系我們
創(chuàng)意嶺
讓品牌有溫度、有情感
專注品牌策劃15年

    語音識別技術(shù)包括哪些(語音識別技術(shù)包括哪些方面)

    發(fā)布時間:2023-06-14 04:26:37     稿源: 創(chuàng)意嶺    閱讀: 98        

    大家好!今天讓創(chuàng)意嶺的小編來大家介紹下關(guān)于語音識別技術(shù)包括哪些的問題,以下是小編對此問題的歸納整理,讓我們一起來看看吧。vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    開始之前先推薦一個非常厲害的Ai人工智能工具,一鍵生成原創(chuàng)文章、方案、文案、工作計劃、工作報告、論文、代碼、作文、做題和對話答疑等等vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    只需要輸入關(guān)鍵詞,就能返回你想要的內(nèi)容,有小程序、在線網(wǎng)頁版、PC客戶端和批量生成器vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    官網(wǎng):https://ai.de1919.com。vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    本文目錄:vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    語音識別技術(shù)包括哪些(語音識別技術(shù)包括哪些方面)vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    英語語音識別是什么?vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    英語語音識別是用英語與機器進行語音交流,讓機器明白你說什么。vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    語音識別技術(shù)讓機器通過識別和理解過程把語音信號轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的高技術(shù)?!≌Z音識別技術(shù)主要包括特征提取技術(shù)、模式匹配準則及模型訓(xùn)練技術(shù)三個方面。vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    語音識別技術(shù)車聯(lián)網(wǎng)也得到了充分的引用,例如在翼卡車聯(lián)網(wǎng)中,只需按一鍵通客服人員口述即可設(shè)置目的地直接導(dǎo)航,安全、便捷。vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    語音識別主要有以下五個問題:
    vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    ⒈對自然語言的識別和理解。首先必須將連續(xù)的講話分解為詞、音素等單位,其次要建立一個理解語義的規(guī)則。vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    ⒉語音信息量大。語音模式不僅對不同的說話人不同,對同一說話人也是不同的,例如,一個說話人在隨意說話和認真說話時的語音信息是不同的。一個人的說話方式隨著時間變化。vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    ⒊語音的模糊性。說話者在講話時,不同的詞可能聽起來是相似的。這在英語和漢語中常見。vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    ⒋單個字母或詞、字的語音特性受上下文的影響,以致改變了重音、音調(diào)、音量和發(fā)音速度等。vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    ⒌環(huán)境噪聲和干擾對語音識別有嚴重影響,致使識別率低。vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    語音識別技術(shù)包括哪些(語音識別技術(shù)包括哪些方面)vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    語音識別的過程是什么?語音識別的方法有哪幾種?vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    語音識別的過程和方法具體如下:vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    語音識別過程vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    1、語音信號采集vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    語音信號采集是語音信號處理的前提。語音通常通過話筒輸入計算機。話筒將聲波轉(zhuǎn)換為電壓信號,然后通過A/D裝置(如聲卡)進行采樣,從而將連續(xù)的電壓信號轉(zhuǎn)換為計算機能夠處理的數(shù)字信號。vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    目前多媒體計算機已經(jīng)非常普及,聲卡、音箱、話筒等已是個人計算機的基本設(shè)備。其中聲卡是計算機對語音信進行加工的重要部件,它具有對信號濾波、放大、A/D和D/A轉(zhuǎn)換等功能。而且,現(xiàn)代操作系統(tǒng)都附帶錄音軟件,通過它可以驅(qū)動聲卡采集語音信號并保存為語音文件。vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    對于現(xiàn)場環(huán)境不好,或者空間受到限制,特別是對于許多專用設(shè)備,目前廣泛采用基于單片機、DSP芯片的語音信號采集與處理系統(tǒng)。vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    2、語音信號預(yù)處理vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    語音信號號在采集后首先要進行濾波、A/D變換,預(yù)加重(Preemphasis)和端點檢測等預(yù)處理,然后才能進入識別、合成、增強等實際應(yīng)用。vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    濾波的目的有兩個:一是抑制輸入信號中頻率超出//2的所有分量(/:為采樣頻率),以防止混疊干擾;二是抑制50Hz的電源工頻干擾。因此,濾波器應(yīng)該是一個帶通濾波器。vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    A/D變換是將語音模擬信號轉(zhuǎn)換為數(shù)字信號。A/D變換中要對信號進行量化,量化后的信號值與原信號值之間的差值為量化誤差,又稱為量化噪聲。vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    預(yù)加重處理的目的是提升高頻部分,使信號的頻譜變得平坦,保持在低頻到高頻的整個頻帶中,能用同樣的信噪比求頻譜,便于頻譜分析。vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    端點檢測是從包含語音的一段信號中確定出語音的起點和終點。有效的端點檢測不僅能減少處理時間,而且能排除無聲段的噪聲干擾。目前主要有兩類方法:時域特征方法和頻域特征方法。vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    時域特征方法是利用語音音量和過零率進行端點檢測,計算量小,但對氣音會造成誤判,不同的音量計算也會造成檢測結(jié)果不同。頻域特征方法是用聲音的頻譜的變異和熵的檢測進行語音檢測,計算量較大。vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    3、語音信號的特征參數(shù)提取vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    人說話的頻率在10kHz以下。根據(jù)香農(nóng)采樣定理,為了使語音信號的采樣數(shù)據(jù)中包含所需單詞的信息,計算機的采樣頻率應(yīng)是需要記錄的語音信號中包含的最高語音頻率的兩倍以上。vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    一般將信號分割成若干塊,信號的每個塊稱為幀,為了保證可能落在幀邊緣的重要信息不會丟失,應(yīng)該使幀有重疊。例如,當使用20kH的采樣面率時,標準的一幀為10ms,包含200個采樣值。vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    話筒等語音輸入設(shè)備可以采集到聲波波形,雖然這些聲音的波形包含了所需單詞的信息,但用肉眼觀察這些波形卻得不到多少信息因此,需要從采樣數(shù)據(jù)中抽取那些能夠幫助辨別單詞的特征信息。在語音識別中,常用線性預(yù)測編碼技術(shù)抽取語音特征。vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    線性預(yù)測編碼的基本思想是:語音信號采樣點之間存在相關(guān)性,可用過去的若干采樣點的線性組合預(yù)測當前和將來的采樣點值。線性預(yù)測系數(shù)埽以通過使預(yù)測信號和實際信號之間的均方誤差最小來唯一確定。vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    語音線性預(yù)測系數(shù)作為語音信號的一種特征參數(shù),已經(jīng)廣泛應(yīng)用于語音處理各個領(lǐng)域。vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    4、向置量化vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    向量量化(Vector Quantization,VQ)技術(shù)是20世紀W年代后期發(fā)展起來的一種數(shù)據(jù)壓縮和編碼技術(shù)。經(jīng)過向量量化的特征向量也可以作為后面隱馬爾可夫模型中的輸入觀察符號。vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    在標量量化中整個動態(tài)范圍被分成若干個小區(qū)間,每個小區(qū)間有一個代表值,對于一個輸入的標量信號,量化時落入小區(qū)間的值就用這個代表值>[戈替。因為這時的信號量是一維的標量,所以稱為標量量化。vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    向量量化的概念是用線性空間的觀點,把標量改為一維的向量,對向量進行量化。和標量量化一樣,向量量化是把向量空間分成若干個小區(qū)域,每個小區(qū)域?qū)ふ乙粋€代表向量,量化時落入小區(qū)域的向量就用這個代表向量代替。vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    向量量化的基本原理是將若干個標量數(shù)據(jù)組成一個向量(或者是從一幀語音數(shù)據(jù)中提取的特征向量)在多維空間給予整體量化,從而可以在信息量損失較小的情況下壓縮數(shù)據(jù)量。vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    語音識別vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    1、模板(template)匹配法vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    在訓(xùn)練階段,用戶將詞匯表中的每一個詞依次說一遍,并且將其特征向量作為模板存入模板庫。在識別階段,將輸入語音的特征向量序列,依次與模板庫中的每個模板進行相似度比較,將相似度最高者作為識別結(jié)果輸出。vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    2、隨機模型法vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    隨機模型法是目前語音識別研究的主流。其突出的代表是隱馬爾可夫模型。語音信號在足夠短的時間段上的信號特征近似于穩(wěn)定,而總的過程可看成是依次相對穩(wěn)定的某一特性過渡到另一特性。隱馬爾可夫模型則用概率統(tǒng)計的方法來描述這樣一種時變的過程。vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    3、概率語法分析法vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    這種方法是用于大長度范圍的連續(xù)語音識別。語音學(xué)家通過研究不同的語音語譜圖及其變化發(fā)現(xiàn),雖然不同的人說同一些語音時,相應(yīng)的語譜及其變化有種種差異,但是總有一些共同的特點足以使他們區(qū)別于其他語音,也即語音學(xué)家提出的“區(qū)別性特征”。vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    另一方面,人類的語言要受詞法、語法、語義等約束,人在識別語音的過程中充分應(yīng)用了這些約束以及對話環(huán)境的有關(guān)信息。vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    于是,將語音識別專家提出的“區(qū)別性特征”與來自構(gòu)詞、句法、語義等語用約束相互結(jié)合,就可以構(gòu)成一個“自底向上”或“自頂向下”的交互作用的知識系統(tǒng),不同層次的知識可以用若干規(guī)則來描述。vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    語音識別體現(xiàn)了什么技術(shù)vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司

    語音識別技術(shù),也被稱為自動語音識別(AutomaticSpeechRecognition,ASR),其目標是將人類的語音中的詞匯內(nèi)容轉(zhuǎn)換為計算機可讀的輸入,例如按鍵、二進制編碼或者字符序列。與說話人識別及說話人確認不同,后者嘗試識別或確認發(fā)出語音的說話人而非其中所包含的詞匯內(nèi)容。語音識別技術(shù)屬于人工智能方向的一個重要分支,涉及許多學(xué)科,如信號處理、計算機科學(xué)、語言學(xué)、聲學(xué)、生理學(xué)、心理學(xué)等,是人機自然交互技術(shù)中的關(guān)鍵環(huán)節(jié)。語音識別較語音合成而言,技術(shù)上要復(fù)雜,但應(yīng)用卻更加廣泛。語音識別ASR的最大優(yōu)勢在于使得人機用戶界面更加自然和容易使用。語音識別技術(shù)所涉及的領(lǐng)域包括:信號處理、模式識別、概率論和信息論、發(fā)聲機理和聽覺機理、人工智能等等。

    以上就是關(guān)于語音識別技術(shù)包括哪些相關(guān)問題的回答。希望能幫到你,如有更多相關(guān)問題,您也可以聯(lián)系我們的客服進行咨詢,客服也會為您講解更多精彩的知識和內(nèi)容。vli創(chuàng)意嶺 - 安心托付、值得信賴的品牌設(shè)計、營銷策劃公司


    推薦閱讀:

    人工語音朗讀在線(人工語音朗讀在線播放)

    門店宣傳廣告語(門店宣傳廣告語音)

    下載小v語音功能(下載小v語音功能官方版)

    簡約煙臺vi設(shè)計公司(煙臺純設(shè)計公司)

    梁子湖小程序開發(fā)公司哪家好(梁子湖小程序開發(fā)公司哪家好一點)