代價敏感學習(cost-sensitive learning)是2018年公布的計算機科學技術名詞,出自《計算機科學技術名詞 》第三版。
基本介紹
- 中文名:代價敏感學習
- 外文名:cost-sensitive learning
- 所屬學科:計算機科學技術
- 公布時間:2018年
代價敏感學習(cost-sensitive learning)是2018年公布的計算機科學技術名詞,出自《計算機科學技術名詞 》第三版。
代價敏感學習(cost-sensitive learning)是2018年公布的計算機科學技術名詞,出自《計算機科學技術名詞 》第三版。定義機器學習中解決一類判別問題的理論與方法。該類問題中不同類型的判別錯誤往往會導致顯...
《面向不平衡數據和代價敏感學習的圖像隱寫分析》是依託上海大學,由馮國瑞擔任項目負責人的聯合基金項目。中文摘要 實用隱寫分析面臨有效特徵提取速度慢、含密圖像不易獲得,虛警和漏檢造成的後果不同等關鍵問題。為此,項目研究面向不平衡數據處理和代價敏感學習的隱寫檢測新方法,研究內容包括:(1)提取低複雜度特徵,...
《代價敏感的主動學習研究》是依託南京航空航天大學,由黃聖君擔任項目負責人的面上項目。項目摘要 傳統監督學習往往基於大量已標記數據進行模型訓練,導致高昂的人工標註代價。主動學習選擇性地向專家查詢部分最有價值信息,可有效減少學習代價。然而,現有方法簡單地將代價等同為標註樣本數目,無法有效處理實際套用中在樣本...
(1)提出了決策粗糙集的非單調正域屬性約簡,給出了非單調屬性約簡的定義,分析了該約簡的性質,並研究了求解非單調約簡獲取代價敏感知識的搜尋算法。(2)結合屬性約簡與代價敏感學習,提出一種基於決策粗糙集的代價敏感序貫決策方法。(3)提出了基於決策粗糙集的下近似-代價聯合保持的屬性約簡方法,並基於遺傳...
類別不平衡學習是機器學習與數據挖掘領域的重要分支之一,其在很多套用領域中均發揮著重要作用。本書首先系統地介紹了與類別不平衡學習相關的一些基礎概念及理論(第1、2章),進而在上述理論的基礎上,討論了一些主流的類別不平衡學習技術及對應算法,具體包括樣本採樣技術(第3章)、代價敏感學習技術(第4章)、決策輸出...
在不確定性與非平衡性條件下,構建考慮穩態與隨機態關聯性的貝葉斯網路學習模型;分析決策代價敏感性對推理效率與品質的影響,針對不同條件提出降低誤判率、漏判的措施。通過實證研究對模型進行驗證,將理論與仿真結果套用於醫療決策分析中。結題摘要 醫療決策系統主要是運用智慧型算法與推理機制模擬醫生臨床診斷,基於規則/案例...
項目組將針對以上四種形式的數據不均衡的非精確性分別提出一種基於類別的非精確代價敏感學習方法、一種基於樣本的非精確代價敏感學習方法、一種代價敏感的多標記學習方法、以及一種多標記數據的樣本分布不平衡學習方法。本項目可望在國際期刊、國際會議和國內一級學報上發表高質量論文5-8篇,申請國家發明專利1 項,培養...
借鑑機器學習中分類學習的套用經驗,提出基於代價敏感學習的排序算法來解決第一個問題,提高排序的性能(序的準確性);提出用於排序學習的半監督學習方法和主動學習方法來解決第二個問題,降低標註代價。研究成果除用於信息檢索外,在其他需要排序學習的相關領域,如經濟學、社會科學等領域都有著廣泛套用。
項目以典型工業系統為對象,在深入分析數據不平衡特性的不完整、強噪聲、相對冗餘和樣本不均四種表現的基礎上,針對複雜非線性故障的特徵提取問題,研究以半監督和流形學習方法為核心的故障診斷理論與方法。研究內容包括:面向不平衡樣本的半監督數據重構方法;基於DAPK流形學習建模技術;基於代價敏感小波網路的故障特徵提取...
第6章 值分散式強化學習算法/ 6.1離散分布投影的值分散式算法/ 6.2分位數回歸的值分散式算法/ 6.2.1分位數回歸/ 6.2.2Wasserstein距離/ 6.2.3QR-DQN算法/ 6.2.4單調的分位數學習算法/ 6.3隱式的值分布網路/ 6.4基於值分布的代價敏感學習/ 6.4.1IQN中的代價敏感學習/ 6.4.2基於IQN的actor-...
本課題擬對適合於軟體度量分析任務特點的學習建模方法進行研究,提出一種能夠主動地從備選樣本空間有選擇性地採樣並獲取標記以供學習的學習方法;提出一種能夠利用大量難以獲得標記的樣本提升學習能力的學習方法;提出一種對目標類錯誤分類代價敏感的學習方法;提出一種能夠針對目標類樣本比例較小的數據進行有效學習的學習...
4.6.3 參數敏感性分析 71 4.6.4 譜分析 74 第5章 類別不平衡學習(一) 77 5.1 類別不平衡學習方法 77 5.1.1 採樣 77 5.1.2 代價敏感學習 78 5.1.3 集成學習 79 5.2 DEC 81 5.3 修正Stein損失函式 81 5.4 CSMS 83 5.5 理論分析 86 5.6 模型最佳化 86 5.7 實驗...
9.3.3 代價敏感學習 138 9.4 案例:用決策樹分析客戶違約情況 140 9.5 關於信息熵的擴展 147 第 10 章 人工神經網路:從人腦神經元開始 151 10.1 從人腦神經元到人工神經網路 152 10.2 感知機 154 10.3 人工神經網路 159 10.3.1 隱藏層的作用 159 10.3.2 人工神經網路算法 160 10...
“LAMDA”的含義是“Learning And Mining from DatA”,LAMDA的主要研究興趣包括機器學習、數據挖掘、模式識別、信息檢索、演化計算、神經計算,以及相關的其他領域。目前的主要研究內容包括:集成學習、半監督與主動學習、多示例與多標記學習、代價敏感和類別不平衡學習、度量學習、降維與特徵選擇、結構學習與聚類、演化...
組織行為數據普遍存在類不平衡和誤分類代價不一致的問題,這導致標準分類器所構建的組織行為預測模型性能較差。為此,在期望誤分類代價這一指標下,本書研究了四種典型代價敏感學習方法基於不同標準分類器所構建的組織行為預測模型的性能,為不同情形下代價敏感學習方法的恰當選擇提供了依據。另外,本書提出了一個新的...
主要研究內容包括:(1)建立面向微博數據的反語識別多模態、層次化特徵體系;(2)針對具有不平衡特性的微博數據設計相應的反語識別層次化分類模型;(3)三支決策代價敏感學習研究。本項目的主要研究結果包括:(1)對於反語識別特徵體系,提出了建立包括基本辭彙情感、標點符號、諧音詞、微博長度、動詞被動化和文本情感...
第3章代價敏感序貫三支決策 3.1引言 3.2決策與三支決策 3.3三支決策理論簡介 3.4三支序貫決策過程 3.5代價敏感序貫決策模型 3.6代價敏感序貫決策中的兩種代價 3.7代價敏感序貫決策算法 3.8實驗分析 3.9本章小結 致謝 參考文獻 第4章代價敏感學習的粗糙決策方法 4.1引言 4.2代價敏感學習數據模型 4.3...
732貝葉斯網路學習// 733貝葉斯網路構建// 74BNCBR/RBR推理模型// 741相似度評價函式// 742魯棒BNCBR/RBR模型構建// 743改進的KD樹(KD Tree)方法// 744代價敏感學習// 75基於多屬性決策的BNCBR/RBR最佳化協同// 751多屬性的人機融合決策模式// ...
8.3 代價敏感分類方法 8.3.1 數據重採樣 8.3.2 代價敏感學習 8.3.3 基於Adacost的分類算法 8.3.4 實驗結果分析 8.5 集成學習分類方法 8.5.1 集成學習基本概念 8.5.2 基於均值決策的集成學習方法 8.5.3 基於精度權重的集成學習方法 8.5.4 基於代價敏感的集成學習方法 8.5.5 ...
基於以上問題,本文提出了一種基於代價敏感學習和隨機梯度提升的算法融合思想,從而使預測乘客是否出行更加準確。首先,採用廣州省公共運輸數據集,來構建用戶乘車習慣相應的特徵工程,本文主要從乘客,線路和乘客線路互動三個方向來進行構建特徵工程。構建的角度主要從時間,天氣,頻率等。引文格式 王天華. 基於改進的GBDT算法的...
10.4算法描述140 10.5分裂準則141 10.6先驗機率和類別均衡142 10.7缺失值的處理144 10.8屬性的重要度145 10.9動態特徵構造146 10.10代價敏感學習147 10.11停止準則、剪枝、樹序列和樹選擇147 10.12機率樹149 10.13理論基礎150 10.14CART之後的相關研究150 10.15可用軟體151 10.16習題152 參考文獻153 ...
13.2.3 代價敏感學習 270 13.2.4 C5.0算法實踐案例 271 13.3 CART算法 277 13.3.1 CART算法的決策樹生長 277 13.3.2 CART算法的決策樹剪枝 279 13.3.3 先驗機率 280 13.3.4 CART算法實踐案例 281 13.4 實戰技巧 287 13.4.1 生成規則集 287 13.4.2 跟蹤規則 289 第 14章...
5.8 代價敏感學習 6 地表覆蓋分類卷積神經網路設計 6.1 LCC-CNN模型構建方法 6.2 LCC-CNN的訓練與最佳化方法 6.3 損失函式 6.4 多模型集成的地表覆蓋分類方法 6.5 多時相地表覆蓋分類方法 6.6 地表覆蓋分類的遷移學習方法 7 地表覆蓋分類方法實踐 7.1 地表覆蓋分類訓練樣本製作 7.2 LCC-CNN分類實驗 ...
最後,分別從車輛路徑規劃、不平衡和代價敏感學習領域抽象出了有代表性的魯棒最佳化問題,針對其提出了性能更優的求解算法。本項目的成果不僅將推動進化算法基礎理論的研究,也為解決實際的車輛路徑規劃、數據挖掘問題提供了新的關鍵技術。 本項目共發表SCI檢索的期刊論文20篇(其中在IEEE Transactions系列期刊發表論文11篇)...
唐明珠。基於海量數據代價敏感學習的直驅風電機組故障診斷方法研究(項目編號61403046),國家自然科學青年科學基金項目,研究時間為2015年1月-2017年12月,研究經費25萬元 主要發明專利 一種風力發電裝置(NO.2018120601177710)主要論文及專著 [1] Mingzhu Tang,Steven X. Ding,Chunhua Yang,Fanyong Cheng,Yuri A. W. ...
第11章 基於三支決策粗糙集模型的多類代價敏感學習 262 11.1 引言 262 11.2 多類三支決策理論模型 264 11.2.1 代價函式 264 11.2.2 模型 266 11.2.3 性質 268 11.2.4 算法 269 11.3 多類三支決策理論模型 270 11.4 實驗 273 11.4.1 實驗數據集 273 11.4.2 實驗方法 274 11.4.3 實驗...
第三章 不均衡學習的抽樣方法 第四章 基於ODR和BSMOTE的不均衡SVM分類算法 第五章 基於陰性免疫過抽樣的不均衡分類算法 第六章 基於譜聚類欠抽樣不均衡SVM分類算法 第七章 集成方法 第八章 集成算法的理論分析 第九章 兩類不均衡數據學習的代價敏感學習算法 第十章 基於核聚類欠抽樣集成不均衡SVM分類算法 第...