當前位置：首頁 > 新聞資訊 > 機器人知識 > 機器人的語音的生成、音響特征及語音分析,語音識別

機器人的語音的生成、音響特征及語音分析,語音識別

來源：機器人[李明] 編輯：創澤時間：2026/5/20 主題：其他 [加盟]

機器人的語音輸入輸出內容如圖3-9所示。語音輸入過程是一種模式識別過程，先對空氣振動引起的語音聲波進行分析，然后抽取聲波里的音響特征，模式識別以及限定語音之間的連接關系。正確無誤地對連續的發音進行一個一個語音識別是一件非常困難的事情，所以只能從不是那么準確的語音序列或單詞的識別去理解人的說話內容。因此，在機器人系統中所使用的語音識別方法、韻律規則和語法規則等語言學方面的規則都是綜合了各種知識形成的，只有這樣才能理解人說話表達的意思。可以把這種系統稱為語音理解系統。但是人的說話有時不那么明確，或者表達不那么清楚，這時機器人就要通過語音合成裝置在人說話內容不明確或不清楚的地方提出疑問并請求解答，或對人的說話內容多次加以確認，采用這種方式構成的系統稱為語音對話系統。在語音對話系統中，雖然對人所發出的語音或單詞的識別并不十分準確，但通過對話和理解過程就能把人說話的內容傳達給機器人。

一般來說，語音的生成過程分為三個階段：聲道內音源的發音；到聲道出口為止的聲波的傳遞；從聲道出口到語音接受點的聲波輻射。發音的音源也有三種：通過聲帶的振動引起聲道內呼出的氣流所產生具有近似周期性的斷續氣流量的變化；當呼出的氣流通過聲道時，由于聲道變窄而產生的聲壓變化；把閉鎖的聲道突然開放而產生的階躍型的音壓變化。對元音而言，聲道由咽喉、口咽和口腔組成，并具有全極點的傳遞函數特性，每個極點的頻率稱為共振峰頻率，把這些共振峰頻率依次編號為D一共振峰頻率、第二共振峰頻率、第三共振峰頻率等。

語音的特征有分節特征和韻律特征兩種。在語音分節特征中，可以把元音或輔音等每個單音作為語音的一個特征單位，因此可以根據聲道的傳遞函數和音源的種類對這些特征單位進行描述。在語音的韻律特征中可以把語音的抑揚、強度、節奏和速度作為語音的一種特征單位。語音的抑揚可以用振動的基頻來描述，語音的強度可以用音源的強弱來描述，而語音的節奏和速度則可以用單音或停頓的持續時間來描述。

通過傅里葉變換對頻率函數進行分析是一種基本的語音分析方法。這種方法得出的結果是一種頻譜特性，包括振幅頻譜和相位頻譜，但相位特性對語音影響不大，所以一般僅用振幅頻譜(簡稱頻譜)來表示。因為語音特征是隨時間變化的，所以使用傅里葉變換對語音分析時，應截取有限長度的語音信號進行分析。

孤立單呼語音識別系統的基本構成。該圖所示系統只能識別預先指定的有限個孤立單詞，這種系統不是進行組成單詞的音素的識別，而是把單詞整體作為一個單位來進行識別。輸入系統的孤立單詞語音用隨時間變化的函數來描述，通過某些數學運算把單詞語音信號變換為語音特征更為明確的參數序列，進行音響分析。經過變換后的單詞語音通常用十幾維的向量序列來描述，即使同一說話者對同一單詞進行發音，每次發音時的向量序列長度也有可能不同。對單詞整體而言，向量序列長度的伸縮不是線性變化的，元音的穩定發音部分的長度容易引起伸縮，輔音部分和各個過渡部分則保持相對的固有長度，因而描述單詞的整個向量序列長度的伸縮呈非線性的。

在單呼語音識別系統中，被識別對象的單詞，都預先準備好其標準的特征向量序列。這些特征向量序列叫做標準模式。所謂單呼語音識別，是把經過變換后的輸入單詞的特征向量序列與各單詞的標準模式之間的相似性(或距離)逐一進行比較，Z后把相似性Z高的單詞作為識別結果進行輸出。把被識別單詞的特征向量序列與標準單詞模式進行比較，計算兩者的相似性的操作過程稱為“對照”或“匹配”。輸入的單詞和標準單詞的模式的向量序列長度一般有差異，兩者進行匹配時不能單純的線性伸縮把兩者湊齊，需要根據在時間軸上的非線性特點采用時間規整技術進行復雜的數學計算。

單呼語音識別系統有兩種類型：以特定人為前提并隨時進行語音調整的系統和以非特定人為前提且不對語音進行特別調整的系統。前者叫做特定人的單呼語音識別系統，后者叫做非特定人的單呼語音識別系統。在特定人的單呼語音識別系統中，大多數情況下是把特定人所說的單詞語音進行音響分析再變換為特征向量序列，然后原封不動地將這個特征向量序列句作為標準模式來使用。在特定人的單呼語音識別系統中，選擇幾個典型的單詞特征向量序列作為標準單詞模式，或從多個標準單詞模式中求出概率分布，Z后進行統計判別。

成人开心网|春暖花开有你|日本可脱身服全去掉的手游|99久久久国产精品免费动|日韩av一区二区三区人|B站的欧美妹子|重庆女员工洗澡

機器人的語音的生成、音響特征及語音分析,語音識別

機器人圖像匹配的常用方法：極線約束,唯一性約束,視差連續性約束,順序一致性約束

機器人的視覺技術：單目視覺、雙目視覺和全景視覺

足式移動機器人獨特的優勢：適應能力，隔振能力，能耗較少

不同類型的機器人手臂的運動形式和特點：直線，伸縮、升降及橫向，回轉，上下擺動

機器人的手臂機構的要求：剛度要大、導向性要好、偏重力矩要小

迎賓機器人的低層控制的三種關鍵控制策略：阻抗柔順控制,力/位混合控制,高頻伺服與 PID 控制

迎賓機器人的動作的生成與運動學的三項核心技術：時序軌跡規劃,逆運動學解算,動力學一致性

智能服務機器人動作表征體系的三種形式：任務空間表征,關節空間表征,肌群協同表征

導引指路機器人的觸覺感知技術：觸覺陣列、加速度/振動傳感器以及光學觸覺傳感器

仿人機器人路徑規劃：滾動路徑規劃的方法

移動機器人路徑規劃：局部路徑規劃，全局路徑規劃

仿人機器人復雜運動規劃:上下樓梯、跨越臺階、跑步、翻滾、爬行、守門、起立、跳舞

服務機器人(迎賓、講解、導診...)

智能消毒機器人

機器人開發平臺

機器人的 語音的生成、音響特征及語音分析,語音識別

服務機器人(迎賓、講解、導診...)

智能消毒機器人

機器人開發平臺

機器人的語音的生成、音響特征及語音分析,語音識別