《代價敏感的主動學習研究》是依託南京航空航天大學,由黃聖君擔任項目負責人的面上項目。
基本介紹
- 中文名:代價敏感的主動學習研究
- 項目類別:面上項目
- 項目負責人:黃聖君
- 依託單位:南京航空航天大學
《代價敏感的主動學習研究》是依託南京航空航天大學,由黃聖君擔任項目負責人的面上項目。
《代價敏感的主動學習研究》是依託南京航空航天大學,由黃聖君擔任項目負責人的面上項目。項目摘要傳統監督學習往往基於大量已標記數據進行模型訓練,導致高昂的人工標註代價。主動學習選擇性地向專家查詢部分最有價值信息,可有效減少學...
代價敏感學習 代價敏感學習(cost-sensitive learning)是2018年公布的計算機科學技術名詞,出自《計算機科學技術名詞 》第三版。定義 機器學習中解決一類判別問題的理論與方法。該類問題中不同類型的判別錯誤往往會導致顯著不同的損失。出處 《計算機科學技術名詞 》第三版。
(1)提出了決策粗糙集的非單調正域屬性約簡,給出了非單調屬性約簡的定義,分析了該約簡的性質,並研究了求解非單調約簡獲取代價敏感知識的搜尋算法。(2)結合屬性約簡與代價敏感學習,提出一種基於決策粗糙集的代價敏感序貫決策方法。(3)提出了基於決策粗糙集的下近似-代價聯合保持的屬性約簡方法,並基於遺傳...
《面向不平衡數據和代價敏感學習的圖像隱寫分析》是依託上海大學,由馮國瑞擔任項目負責人的聯合基金項目。中文摘要 實用隱寫分析面臨有效特徵提取速度慢、含密圖像不易獲得,虛警和漏檢造成的後果不同等關鍵問題。為此,項目研究面向不平衡數據處理和代價敏感學習的隱寫檢測新方法,研究內容包括:(1)提取低複雜度特徵,...
在不確定性與非平衡性條件下,構建考慮穩態與隨機態關聯性的貝葉斯網路學習模型;分析決策代價敏感性對推理效率與品質的影響,針對不同條件提出降低誤判率、漏判的措施。通過實證研究對模型進行驗證,將理論與仿真結果套用於醫療決策分析中。結題摘要 醫療決策系統主要是運用智慧型算法與推理機制模擬醫生臨床診斷,基於規則/案例...
主要研究內容包括:(1)建立面向微博數據的反語識別多模態、層次化特徵體系;(2)針對具有不平衡特性的微博數據設計相應的反語識別層次化分類模型;(3)三支決策代價敏感學習研究。本項目的主要研究結果包括:(1)對於反語識別特徵體系,提出了建立包括基本辭彙情感、標點符號、諧音詞、微博長度、動詞被動化和文本情感...
針對數據分布的非均衡和大數據特徵,本項目系統研究了大數據非均衡挖掘問題。主要研究內容和重要結果包括: 1. 針對非均衡環境下代價敏感主動學習和半監督特徵選擇,研究發現分類器輸出的不確定性與分類器泛化能力之間存在統計關係,通過理論分析和數值實驗的方法證明了利用這個統計關係可明顯減少誤分類代價,顯著改進半監...
借鑑機器學習中分類學習的套用經驗,提出基於代價敏感學習的排序算法來解決第一個問題,提高排序的性能(序的準確性);提出用於排序學習的半監督學習方法和主動學習方法來解決第二個問題,降低標註代價。研究成果除用於信息檢索外,在其他需要排序學習的相關領域,如經濟學、社會科學等領域都有著廣泛套用。
研究目標是,得到能夠解決大規模垃圾郵件過濾的,具有高效、代價敏感和延遲適應等特點的增量學習機制、模型及算法。本研究可望對統計學習方法的基礎理論、模型和算法有所促進,且為大規模垃圾郵件過濾、手機垃圾簡訊過濾、網路不良信息過濾等套用提供理論和技術支持。結題摘要 本項目以大規模垃圾郵件過濾為研究背景,探索並...
本項目將在機率關係模型的基礎上,提出處理不完備關係數據的方法;提出處理關係數據中的具有代價敏感和類別不平衡問題的方法;從結構學習、參數學習和屬性選擇三個方面提出基於廣義機率關係模型進行不確定性推理的方法。在此基礎上,將關係學習的方法和技術用於研究和解決信息不對稱環境下網上交易風險問題,設計出能夠動態...
多標記學習 多標記學習(multi-label learning)是2018年公布的計算機科學技術名詞。定義 每個樣本同時具有多個標記,學習目的是預測新樣本的所有標記。出處 《計算機科學技術名詞 》第三版。