高性能語音識別
高性能語音識別
相關文章 : 0篇
瀏覽 : 次
提出了一個高性能的漢語數(shù)碼語音識別 (MDSR)系統(tǒng)。 MDSR系統(tǒng)使用 Mel頻標倒譜系數(shù) (MFCC)作為主要的語音特征參數(shù) ,同時提取共振峰軌跡和鼻音特征以區(qū)分一些易混語音對 ,并提出一個基于語音特征的實時端點檢測算法 ,以減少系統(tǒng)資源需求 ,提高抗干擾能力。采用了兩級識別框架來提高語音的區(qū)分能力 ,其中第一級識別用于確定識別候選結果 ,第二級識別用于區(qū)分易混語音對。由于采用了以上改進 ,MDSR系統(tǒng)識別率達到了 98.8% .
推薦產(chǎn)品
列表欄目