行車環境聽覺模型及聲音處理關鍵技術研究

《行車環境聽覺模型及聲音處理關鍵技術研究》是依託北京大學,由吳璽宏擔任負責人的重大研究計畫。

基本介紹

  • 中文名:行車環境聽覺模型及聲音處理關鍵技術研究
  • 項目負責人:吳璽宏
  • 依託單位:北京大學
  • 項目類別:重大研究計畫
項目摘要,結題摘要,

項目摘要

本項目將以聽感知和言語知覺機理的最新研究成果為基礎,基於心理聲學、語音學、語音識別、語言理解等相關理論和方法,開展跨學科研究,具體研究包括:1、聽覺掩蔽機理及抗噪方法研究;2、雙耳目標定位及增強計算模型;3、行車環境下鳴笛聲檢測定位與識別;4、限定領域說話人無關漢語語音識別和理解方法的研究。項目預期取得若干具有自主智慧財產權的技術成果,對我國無人駕駛汽車領域相關技術的發展將會起到促進作用,並推動其實用化、產業化進程。對聽知覺機理基礎研究以及聲音信號處理、語音識別、自然語言理解等相關技術領域的發展起到積極的推動作用。

結題摘要

本項目以聽感知和言語知覺機理的最新研究成果為基礎,開展跨學科研究。以開發具有較高準確率及魯棒性的鳴笛和語音的檢測、定位和識別系統為目標,圍繞所涉及的關鍵科學問題:a、行駛車流中周圍車輛的各種鳴笛的識別、理解和定位,b、噪聲信號分離以及交通信息提示語音的自動檢測、識別和理解,展開深入研究,取得一系列重要進展,主要包括: 1、基於涉身認知的頭傳遞函式學習和複雜聲場多聲源定位:探索了蝙蝠回聲定位若干機理,提出了新的基於頭傳遞函式的雙耳加工模型及聲源定位抗混響雙耳模型,以及基於動態濾波器組調頻諧波的主動聽覺檢測方法。於2012年發布了目前國際上最完整的包括近場和遠場的Kemar頭傳遞函式館PKU-IOA,並於2013年9月在愛爾蘭召開的第16屆數字音效國際會議上作拓導報告。 2、漢語大辭彙量連續語音識別、廣播語音數據自動切分及對話系統:在分析“啟動效應”在語音知覺中的作用基礎上,提出了基於潛說話人模型的語音識別,及語音/音樂的自動切分方法。提出的DNN-HMM語音聲學模型學習新方法,獲2014年ISCSLP2014國際學術會議最佳論文獎。 3、基於大規模非標註數據的語音合成:採用句法標註替代傳統的韻律結構標記,提出融合句法結構線索的韻律建模方法,突破了傳統方法必須依賴耗時又費力的韻律標註過程。在2013年Blizzard2013國際語音合成評測終獲全球第一的成績。 4、基於增強學習的仿人機器人運動技能的自主學習:為探索無人駕駛車輛涉及的移動車輛智慧型控制技術, 研究了仿人機器人移動控制策略的建模及學習問題。在軌跡層次化建模的基礎上,研究了仿人機器人基本運動技能的自主學習及已有知識的遷移學習,獲2013年國際人工智慧聯合會IJCAI2013舉辦的國際機器人技能大賽一等獎。 本項目搭建了一套車輛聲源定向與增強系統平台,在實際路面行車環境中對所取得的研究成果加以驗證,表現出很好的性能。本項目研究發表學術論文42篇,其中國際期刊論文10篇,國內期刊4篇,國際會議27篇,國內會議1篇;申請國家發明專利3項;主辦國際學術會議5次,累計參會人數達320人次;先後邀請境外4名學者在京開設研究生課程1門,暑期課程1門;參加國際學術交流30餘次。 項目所取得成果對我國無人駕駛汽車領域相關技術的發展將會起到促進作用,對聽知覺機理基礎研究以及聲音信號處理、語音識別等相關技術領域的發展起到積極作用

相關詞條

熱門詞條

聯絡我們