《基於深度神經網路的噪聲魯棒性語音識別方法研究》是依託中國科學技術大學,由杜俊擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:基於深度神經網路的噪聲魯棒性語音識別方法研究
- 項目類別:青年科學基金項目
- 項目負責人:杜俊
- 依託單位:中國科學技術大學
《基於深度神經網路的噪聲魯棒性語音識別方法研究》是依託中國科學技術大學,由杜俊擔任項目負責人的青年科學基金項目。
《基於深度神經網路的噪聲魯棒性語音識別方法研究》是依託中國科學技術大學,由杜俊擔任項目負責人的青年科學基金項目。中文摘要提高語音識別系統在實際環境下的噪聲魯棒性是語音識別實用化的關鍵難點和研究熱點之一。但由於語音和噪聲信...
《異質噪聲場景語音識別中的結構化深度學習研究》是依託上海交通大學,由錢彥旻擔任項目負責人的青年科學基金項目。項目摘要 複雜噪聲場景下的魯棒語音識別是語音識別領域尚未解決的關鍵技術之一。本課題著眼於真實噪聲數據“異質性”所引起的“訓練與測試失配”現象,從噪聲模型的建模和聲學模型的建模入手,均採用結構化的...
《語音識別中的稀疏性深度學習》是依託清華大學,由王東擔任項目負責人的面上項目。項目摘要 基於深度學習(Deep Learning)的深層貝葉斯網路技術(Deep Bayesian Network, DBN)為語音識別帶來極為顯著的性能提高,被認為是語音領域的又一次革命。然而,當前的DBN方法只有在大數據集上才能發揮其效能,並容易受到噪聲和信道...
《噪聲環境下基於深度學習的圖像自動標註方法研究》是依託福州大學,由柯逍擔任項目負責人的青年科學基金項目。項目摘要 圖像自動標註是模式識別與計算機視覺等領域的前沿課題。目前,真實圖像標註環境大多含有各類噪聲,而現有幾乎還未出現圍繞噪聲環境的圖像標註研究,因此,本課題針對噪聲環境下的圖像自動標註,開展以下三...
《人工智慧:語音識別理解與實踐》是全面且深入介紹語音識別及理解相關技術細節的專著。與我們在2014年出版的《解析深度學習:語音識別實踐》相比,本書在它的基礎上做了大量改寫,並對內容有大幅補充,詳細總結了最新的語音識別算法及套用技術以及在口語對話系統研究中基於深度學習的自然語言處理技術。全書首先概要介紹語音...
研究基於空間線索的雙耳語音分離和識別中分離線索模型、分離機制等關鍵問題,具體內容包括:1、研究基於疊代結構的感知單元同時組織過程;2、將深度神經網路DNN作為分離線索的生成機率模型,研究基於隱馬爾科夫模型HMM-DNN框架下的感知單元序列組織過程;3、針對語音識別,研究基於浮值掩蔽重構和丟失感知單元的分離目標語音...
全書首先概要介紹了傳統語音識別理論和經典的深度神經網路核心算法。接著全面而深入地介紹了深度學習在語音識別中的套用,包括“深度神經網路-隱馬爾可夫混合模型”的訓練和最佳化,特徵表示學習、模型融合、自適應,以及以循環神經網路為代表的若干先進深度學習技術。本書適合有一定機器學習或語音識別基礎的學生、研究者或從業...
2018年,科大訊飛提出深度全序列卷積神經網路(DFCNN),使用大量的卷積直接對整句語音信號進行建模。同年,阿里提出LFR-DFSMN模型,將低幀率算法和DFSMN算法進行融合,語音識別錯誤率相比上一代技術降低20%,解碼速度提升3倍。2019年,百度提出了流式多級的截斷注意力模型SMLTA,該模型在LSTM和CTC的基礎上引入了注意力...
《聽覺神經網路模型理論與套用研究》是依託南京大學,由徐柏齡擔任項目負責人的面上項目。項目摘要 語音增強、語音識別系統的魯棒性和混合盲信號的分離被認為是當前和今後一段時期內信息處理學科中最富挑戰性的前沿課題。人耳可以有效地解決這些難題。本課題從實際聽覺數據和現象出發,利用神經網路非線性、自適應反饋控制...
對。例如,對於圖像識別任務來說,像素的部分平移、縮放、旋轉操作並不會改變圖片中物體對語義表達,因而我們可以使用這些操作來生存新對訓練數據。數據集增強對於語音識別任務也是有效的。另一種數據集增強的方法是向網路的輸入層注入噪聲。神經網路已被證明對噪聲不是非常健壯。簡單地將隨機噪聲施加到輸入再進行訓練可以...
《非線性主元神經網路的魯棒性理論及其實現技術研究》是依託清華大學,由夏紹瑋擔任項目負責人的面上項目。項目摘要 本項目分別選取30、60、90日齡的粵黃雞,捕殺取脾臟,採用勻漿透析法提取脾臟小分子活性物質,通過SephadexG-25柱層析得到三個組份。採用胺基酸分析儀和薄層層析分析了三個組份的胺基酸組成、含量及核苷酸...
為了解決這一問題,本項目擬基於稀疏編碼的基本理論和方法,研究語音特徵增強的有效方法,以提高語音識別系統的噪聲魯棒性。稀疏編碼在稀疏性準則下表示信號,不對噪聲作平穩性假設,符合人類聽覺系統處理信息的特點,為語音特徵增強提供了新途徑。本課題圍繞稀疏編碼中的字典構建、稀疏分解和信號重構這三個基本問題展開研究...
課題組基於聲學人工頭和多通道採集設備,搭建了硬體測試平台,雙耳空間感知算法的驗證提供了實驗條件。課題組開展的研究工作實現了混響、噪聲複雜聲學環境下,基於雙耳聲信號的目標聲源空間感知和識別,為提高語音信號處理系統魯棒性提供了新的途徑,研究成果可廣泛用於語音識別、說話人識別、語音通信、機器人聽覺等領域。
[1] 李長濤, 萬伊, 楊飛然, 楊軍. 基於深度自注意力神經網路分類器的合成語音檢測方法. 202210401440.2, 2022-04-18.[2] 王勁夫, 楊飛然, 孫國華, 楊軍. 一種多通道語音信號增強方法及系統. 2022103848638, 2022-04-13.[3] 王泰輝, 楊飛然, 楊軍. 一種低時延音頻信號超定盲源分離方法及分離裝置. ...
複雜性測度技術可以較好的實現在動態噪聲環境下對語音端點的檢測,它將有助於提高孤立字語音識別的準確率,同時也將極大地降低語音處理的計算量和複雜性。.基於複雜性測度的檢測技術將滿足語音處理中的可靠性、魯棒性、自適應性以及實時處理的要求,無需預先給出背景噪聲或語音的先驗知識,
以開發具有較高準確率及魯棒性的鳴笛和語音的檢測、定位和識別系統為目標,圍繞所涉及的關鍵科學問題:a、行駛車流中周圍車輛的各種鳴笛的識別、理解和定位,b、噪聲信號分離以及交通信息提示語音的自動檢測、識別和理解,展開深入研究,取得一系列重要進展,主要包括: 1、基於涉身認知的頭傳遞函式學習和複雜聲場多聲源定位:...
並建立了平均速率為2.4Kbps的可變速率聲碼系統。在每幀最多24個參數並採用幀間平滑技術的條件下,合成語音完全可懂 ,除自然度有所下降外,合成語音仍保持較高的清晰度。在語音識別與語音編碼的實驗中,新的特徵參數比傳統LPC參數在語音表征能力、魯棒性及抗噪性等方面均表現了更好的性能。
目前他的研究興趣集中在發展深度學習模型和方法,特別是開發機率模型和新穎的推斷方法。Aaron Courville主要專注於計算機視覺套用,在其他領域,如自然語言處理、音頻信號處理、語音理解和其他AI相關任務方面也有所研究。 中文版審校者簡介 張志華,北京大學數學科學學院統計學教授,北京大學大數據研究中心和北京大數據研究院...
韻律情感模型語音信號中基頻、能量、非周期信號等特徵通常包含了主要的韻律信息,傳統的信號處理方式提取的韻律特徵往往噪聲魯棒性不夠,我們運用深度學習模型來提取這些特徵,可以大幅提升提取的準確率和魯棒性。聲碼器模型選擇上,雖然深度學習模型較傳統 dsp 方法有了絕對的優勢,但依然存在以下不足,斷音,顫音,電音...
說話人標記旨在解決語音流中誰在什麼時候(Who speak when)說話的問題,在自動語音檢索、多人會議場景和說話人相關的自動語音識別等方面具有廣泛套用。 本項目圍繞說話人標記問題,在理論層面,對信息幾何、變分貝葉斯估計、潛在類別分析和深度神經網路進行研究,提出了PRISM框架、鑑別式局部信息距離保持映射、潛在類別...
《基於信號盲估計和盲辨識的圖象處理方法研究》是依託東南大學,由鄒采榮擔任項目負責人的面上項目。中文摘要 將高性能的一維信號盲估計和系統盲辨識方法推廣到二維圖象處理中,並結合圖象數據的特點和約束條件,提出更有效的圖象盲復原方法,使其對噪聲具有魯棒性,能較好地克服局部極小問題,並具有較廣的適用範圍,又...
提出了基於深度語義排序的哈希編碼方法,解決了多標籤圖像中如何保留複雜的多級語義結構的難題;提出多尺度上下文深度卷積神經網路的前景分割算法,提升了複雜圖像目標分割的精確度和魯棒性;除了步態識別、個體/群體行為識別、圖像分類與分割等套用研究外,還針對大規模、多模態數據分析和深度學習及套用等方面開展一系列理論...
4 “多信道自適應濾波技術研究”(.獲1997年度廣西高校科技進步三等獎)5 “特徵分析的神經網路方法研究” (國家自然科學基金)6 “微型麥克風陣語音增強方法研究”(國家自然科學基金)7 “特徵子空間快速跟蹤技術及其套用研究”(全國優秀博士學位論文作者專項)8 “短波通信中非線性自適應均衡技術”(預研基金項目)9...
(2)國家自然科學基金委員會,青年項目,62201002,面向複雜場景的高魯棒性生成語音檢測方法研究,2023-01至2025-12,主持 (3)之江實驗室, 之江實驗室開放課題, 2021KH0AB06, 融合情景信息的個性化多模態生理信號複雜情感識別研究, 2021-12 至 2023-11, 主持 (4)模式識別國家重點實驗室開放課題,202200014,...
課題擬重點解決如下關鍵問題:環境變化複雜情況下聲音信號的有效拾取、噪聲消除及聲源定位;基於聽覺認知的魯棒聲音特徵提取及有效聲音感知與環境狀況理解;交通廣播語音識別和信息抽取;並在此基礎上構建行車環境下的聽覺模型。通過課題的研究,擬提出一系列行車環境下普適的自動聲音感知與理解的理論與方法;並藉助無人車這...
5. 2019 廣東省自然科學基金面上項目,基於關聯化張量分解的知識圖譜補全方法研究,已結題,項目負責人 6. 2018 廣東省科技創新戰略專項,基於張量耦合分解的多源數據融合模型及高性能算法研究,已結題,項目負責人 7. 2023 廣州市基礎與套用基礎研究專項,面向圖神經網路的魯棒性框架研究,執行中,項目負責人 ...
2、多尺度類腦神經網路計算模型研究 人工神經網路伴隨著人工智慧學科的成長取得了長足的發展,以深度學習為代表神經網路方法在各種視聽覺套用中取得突破。但深度神經網路與人 腦的架構、機制、功能等各方面存在顯著差異。如何借鑑和模仿人腦,構建多尺度的類腦神經網路,對不同功能區進行模組化整合,突破深度神經網路 ...
國家自然科學基金委員會, 國家重大科研儀器研製項目,面向神經外科腫瘤切除的高靈敏性智慧型顯微精準導航操作儀, 2021-01-01 至 2025-12-31, 在研, 參與 國家自然科學基金委員會, 面上項目,基於深度學習的心臟MR圖像雙心室量化方法研究,2020-01-01 至 2023-12-31, 在研, 參與 國家自然科學基金委員會, 青年科學...