嵌入式語音識別
嵌入式語音識別
相關(guān)文章 : 0篇
瀏覽 : 次
嵌入式語音識別系統(tǒng)分為封閉域識別和開放域識別,封閉域識別范圍圍繞指定的字/詞語集合,也就是說在開發(fā)系統(tǒng)的時候會設(shè)定好應(yīng)識別的字或詞語,對范圍外的詞語語音系統(tǒng)不會識別。而這樣設(shè)定識別字或詞的識別方式可通過聲學(xué)模型和語音模型的裁剪,有利于識別引擎的運算量減小,再將引擎封到嵌入式芯片中,這樣識別的過程便可完全脫離云端,無需連網(wǎng)便可以識別。如智能家居中的“打開窗簾”、“打開中央臺”。開放域識別無需指定識別詞集合,算法會在整個語音中大集合范圍的在其中進(jìn)行識別。為適應(yīng)場景聲學(xué)模型和語音模型一般會比較大,引擎運算量也比較大。如果將其封裝到嵌入式芯片中,耗能會較高相對的也會影響識別效果。典型的就是,在手機(jī)瀏覽器的搜索框中錄入語音,會根據(jù)用戶發(fā)布的語音進(jìn)行識別,搜索出相關(guān)的信息。
推薦產(chǎn)品
列表欄目