行車環境聽覺模型及聲音處理關鍵技術

項目摘要

課題將圍繞本重大研究計畫的總體目標，根據本年度項目指南中的研究方向，開展行駛中無人駕駛車輛對車內外聲音的自動檢測、實時識別及理解方面的關鍵技術研究，為無人車的智慧型行為決策提供輔助的聽覺信息。課題擬重點解決如下關鍵問題：環境變化複雜情況下聲音信號的有效拾取、噪聲消除及聲源定位；基於聽覺認知的魯棒聲音特徵提取及有效聲音感知與環境狀況理解；交通廣播語音識別和信息抽取；並在此基礎上構建行車環境下的聽覺模型。通過課題的研究，擬提出一系列行車環境下普適的自動聲音感知與理解的理論與方法；並藉助無人車這一典型套用背景，探索特定場景和特定目標下聽覺信息的認知機理。力爭使研究成果達到國際先進水平，提升我國在視聽覺信息處理領域的整體研究實力。

結題摘要

本項目圍繞重大研究計畫的總體目標，按照研究計畫書設定的研究內容，開展了無人車行車環境下車內外聲音的自動檢測、實時識別及理解方面的關鍵技術研究。為無人車的智慧型行為決策提供輔助的聽覺信息。在項目的實施過程中，不僅解決了計畫書中所提出的關鍵問題，而且還在具體研究過程中擴展了相關的研究。在基於麥克風陣列的聲源定位和信號分離方面，首先設計並製作了多通道麥克風陣列硬體設備；其次提出了基於變換域分析的聲源定位算法；接著提出了基於隱馬爾科夫隨機場關聯建模的信號分離方法。在基於麥克風陣列的噪聲消除和信號增強方面，提出了基於深度神經網路後濾波的麥克風陣列噪聲消除框架，能在消除噪聲的同時，有效控制信號畸變。在基於耳蝸非線性與主動增益特性的魯棒特徵提取方面，提出了一種能有效仿真耳蝸非線性處理機制的聲學特徵提取方法，其魯棒性明顯優於傳統的聲學特徵。在車輛周邊及車內聲學事件檢測方面，首先提出了基於基頻的聲音分割方法；其次對基於高斯混合模型的建模方法進行了改進，提出了偽高斯混合模型方法；接著提出了異質混合模型方法，以適應實際套用中多種不同數據分布的建模問題。最後，提出了一種基於多尺度RBF核SVM的聲學事件檢測方法。在基於聲音事件序列的場景識別方面，首先提出了基於低秩矩陣的特徵表示方法和基於低秩張量的特徵表示方法；其次提出了基於低秩支持向量機的音頻場景識別方法；接著，提出了基於背景聲的最小噪聲統計量來識別音頻場景的方法。在交通廣播提示語音的識別與信息抽取方面，設計並實現了一個服務於無人車的交通廣播語音識別與抽取系統。在無人車聲音感知和理解系統構建方面，提出了一般化的無人車聽覺能力模型和實現該聽覺能力的技術框架。同時，構建了行車環境下的聲音感知和理解原型系統，並在實際無人車平台上進行了測試，各項功能指標和性能指標達到要求。項目組共發表或錄用學術論文66篇，其中18篇進入SCI檢索源，64篇進入EI檢索源，申請專利11項，與多個國家的學者開展了學術交流與合作。培養博士研究生17名，碩士研究生20名。由2013年清華出版社出書一部。另一本專門討論聲學事件檢測理論與方法的專著即將在2016年由科學出版社出版。

行車環境聽覺模型及聲音處理關鍵技術

基本介紹

項目摘要

結題摘要

相關詞條

熱門詞條