一種基於圖像識別和語音識別的聲源定位方法及裝置

一種基於圖像識別和語音識別的聲源定位方法及裝置

《一種基於圖像識別和語音識別的聲源定位方法及裝置》是思必馳科技股份有限公司於2018年12月29日申請的專利,該專利公布號為CN109506568B,專利公布日為2021年6月18日,發明人是雷玉雄、雷雄國、劉寒英、黃海艷、程棟樑、曾勛、陳慶安。

基本介紹

  • 中文名:一種基於圖像識別和語音識別的聲源定位方法及裝置
  • 授權公告號:CN109506568B
  • 授權公告日:2021年6月18日
  • 申請號:2018116415417
  • 申請日:2018.12.29
  • 地址:215123江蘇省蘇州市蘇州工業園區新平街388號騰飛創新園14棟
  • 發明人:雷玉雄; 雷雄國; 劉寒英; 黃海艷; 程棟樑; 曾勛; 陳慶安
  • Int. Cl.:G01B11/00(2006.01)I; G01S11/14(2006.01)I; G10L17/00(2013.01)I; G10L25/51(2013.01)I
  • 專利代理機構:北京商專永信智慧財產權代理事務所(普通合夥)11400
  • 代理人:李彬彬; 張麗
  • 專利權人:思必馳科技股份有限公司
對比檔案,專利摘要,

對比檔案

CN 104748764 A,2015.07.01;  CN 104748764 A,2015.07.01;  CN 106679651 A,2017.05.17;  CN 105116994 A,2015.12.02;  CN 108089152 A,2018.05.29;  CN 108089153 A,2018.05.29;  CN 108597263 A,2018.09.28;  CN 109089087 A,2018.12.25;  CN 108957392 A,2018.12.07

專利摘要

本發明公開一種基於圖像識別和語音識別的聲源定位方法,包括,實時捕捉圖像信息,進行圖像識別,並根據圖像識別結果確定第一坐標位置;實時採集聲源信息,進行語音識別,並根據語音識別結果確定第二坐標位置;根據第一坐標位置和第二坐標位置確定目標聲源位置。本發明還公開了一種基於圖像識別和語音識別的聲源定位裝置,根據本發明公開的方法和裝置可以通過圖像識別技術和麥克風陣列實現對聲源的方向位置的精確定位,並且還可以通過圖像識別技術和麥克風陣列對聲源的方向位置的距離測量,這樣可以達到更加精準的定位效果,實用性較高。

相關詞條

熱門詞條

聯絡我們