彩票投注兑奖机器:新聞中心

車載語音交互的技術原理及方案

作者:華一汽車科技 ?? 來源:彩票投注工具 www.ncbmwy.com.cn ?? 發布時間:2019-08-20 11:21 ?? 閱讀:次

彩票投注工具 www.ncbmwy.com.cn

語音識別

首先介紹一下語言識別的原理,語音識別由四個部分組成,一是解碼器,二是聲學模型,三是語言模型,最后就是特征提取的一個過程。
 
語音識別原理
 
語音識別是如何實現的呢?首先一段聲音進入之后,語音識別系統會做聲音的特征提取,把一段聲音分成一幀一幀的狀態,幾個狀態組成一個因素,這個因素就是聲學模型。舉個例子,我要去天安門,這個“我”其實被拆分成很多幀,幾幀組成一個狀態,這個狀態翻譯成“我”這個拼音,這就是聲學模型轉移的過程。
 
語音識別聲學模型
 
聲學模型就是把剛剛轉成的因素,比如“你現在在干什么”,通過聲學模型轉成拼音,但是哪個“你”,哪個“現”,哪個“在”,是由語言模型來控制的,下圖中可以看出“你現在在干什么”有很多不同的路線,每個路線都有不同的概率,這個是通過模型訓練出來的,算出一個總的概率,取一個概率最高的路線,就是機器會顯示的結果。
 
 
語音交互語言模型
 
語音交互方案
 
車里的語音方案,第一步不管做語音識別還是采集都是麥克風,現在如果在車里有兩個麥克風,就可以做左邊或右邊的聲學定位,聲學定位的功能是什么呢?比如在車里我要說一句話,比如說“我要開窗”,但是其實你不知道它要開哪個窗,但是車里如果三到四個麥克風就可以做空間的立體定位,它會做一個區分,開對應的窗戶。
 
車載語音交互方案
 
麥克風采集完成之后就是做降噪,車內并不是很好的語音識別的環境,必須要做一個降噪芯片,主要功能是降噪和去回聲,降噪就是把胎噪,發動機噪聲,風噪,空調噪音以及其它一些路面的噪音消除。對于這些比較穩態的噪音,用一個降噪芯片就可以把這些噪音全部消除。
 
降噪之后就是去回聲,不管是打電話還是做語音識別都需要去回聲的功能,因為打電話的時候會聽到對面說的話,不做去回聲會被收錄進麥克風。給喇叭的同時會給去回聲芯片一段聲音,當它比對這兩段聲音一樣,就不會收錄進麥克風,這就是去回聲的功能。
 
智能語音
 
當聲音進入之后就可以做語音識別的動作,語音識別分兩塊,離線的語音識別和在線的語音識別,目前汽車聯網率并不高,但肯定比離線要準,離線是把語言模型和聲學模型放到本地去做,而車機本身的配置是受到局限的,不能把太多東西放到本地,所以在云端的配置肯定要高很多,服務器配置肯定比本地的高很多,這時候就需要加一個判斷???,能聯網的時候自動走云端,不能聯網的時候走本地。

 

文章轉載請保留原文網址://www.ncbmwy.com.cn/news/hyzx/880.html


?