唇語識別

唇語識別是一項集機器視覺與自然語言處理於一體的技術,可以直接從有人講話的圖像中識別出講話內容。
唇語識別系統使用機器視覺技術,從圖像中連續識別出人臉,判斷其中正在說話的人,提取此人連續的口型變化特徵;隨即將連續變化的特徵輸入到唇語識別模型中,識別出講話人口型對應的發音;隨後根據識別出的發音,計算出可能性最大的自然語言語句。
在唇語識別過程中,口型與發音,發音與文字之間,並不是唯一對應的關係,常常有多個可能的備選結果,需要實時計算出可能性最大的結果。

相關詞條

熱門詞條

聯絡我們