《數據挖掘中的特徵約簡》是2016年科學出版社出版的圖書,作者是陳黎飛、吳濤。
基本介紹
- 中文名:數據挖掘中的特徵約簡
- 作者:陳黎飛、吳濤
- ISBN:9787030496577
- 出版社:科學出版社
- 出版時間:2016-08
《數據挖掘中的特徵約簡》是2016年科學出版社出版的圖書,作者是陳黎飛、吳濤。
《數據挖掘中的特徵約簡》是2016年科學出版社出版的圖書,作者是陳黎飛、吳濤。內容簡介特徵約簡是數據挖掘的一項基礎性技術,其目的在於降低數據的維度和提取數據中的重要特徵或特徵組合。《數據挖掘中的特徵約簡》系統地闡述了特徵...
1、壓縮數據以減少存儲量 2、去除噪聲的影響 3、從數據中提取特徵以便進行分類 4、將數據投影到低維可視空間,以便於看清數據的分布 對付高維數據問題基本的方法就是維數約簡,即將n 維數據約簡成m(M<N)維數據,並能保持原有數據集的完整性,在m 上進行數據挖掘不僅效率更高,且挖掘出來的結果與原有數據集所...
基於這一思路,我們以粗糙集理論與模糊集理論為基點,以拓撲結構分析為方法,研究了基於嵌套結構的含噪音數據的降維與分類方法。研究成果是可以分為以下三個方面: 首先,我們從全局的角度研究了基於參數粗糙集的屬性約簡的拓撲結構。當前關於魯棒特徵選取的研究主要集中於如何設定一個全局次優或是局部最優的屬性約簡...
2.4 數據約簡和轉換29 2.4.1 採樣30 2.4.2 特徵子集選取32 2.4.3 基於坐標軸旋轉的維度約簡32 2.4.4 基於類型轉換的降維39 2.5 小結47 2.6 文獻注釋48 2.7 練習題48 第3章 相似度和距離50 3.1 引言50 3.2 多維數據50 3.2.1 定量型數據51 3.2.2 類別型數據58 3.2.3 ...
本書是在作者多年從事數據挖掘行業實踐和相關科學研究的基礎上編寫而成,書中包括數據挖據理論研究及實際套用的現狀分析、研究內容的組織框架、研究方法與技術路線的描述、數據挖掘理論及套用的綜述、不確定性理論、多目標最佳化的分類器方法、模糊多目標最佳化的分類器模型和算法、基於粗糙集和統計貢獻度的特徵選擇算法、基於...
這項工作不僅奠定了偏覆蓋粗糙集約簡的理論基礎,為模糊粗糙集的約簡提供了新的理論鋪墊,還提出了新的屬性約簡工具--相關族方法,為數據挖掘,模式識別,特徵提取等領域提供了直接可用的新工具,而且拓寬了粗糙集的套用範圍,能夠深化和拓展粗糙集技術在各個領域的套用,具有理論和實際的雙重意義。
《數據挖掘與知識發現》是出版的一本圖書,作者李雄飛。內容簡介 本書詳盡地闡述了數據挖掘與知識發現領域中的一些基本理論和研究方法。介紹了KDD與數據挖 掘的概念、數據挖掘對象、知識發現過程、研究方法以及相關研究領域和套用範圍。作為知識發現的數據預處理工作,簡要敘述了數據清理、數據約簡、數據概念等級分層、多維...
《非負矩陣分解中維數約簡問題的研究》是依託南京大學,由趙金熙擔任項目負責人的面上項目。項目摘要 高維非負數據集的特徵表示是模式識別、機器學習和圖像處理等研究領域的核心課題,非負矩陣分解(NMF)是特徵表示和低秩逼近的有效技術。NMF中的維數約簡因子r 是直接影響特徵表示的重要指標:如r取得過大,就加大計算...
通過這些研究內容的探索與創新,建立四個層次的理論體系,提出並解決其中的關鍵問題,開發具體問題的高性能算法,為實際套用提供高效率、低成本、低風險的數據挖掘方案。結題摘要 維數約簡是機器學習中的核心問題,如何從高維大數據中學習有效的低維表示一直是學者們研究的關鍵問題。本項目研究半結構化、非結構化的高維...
1. 陳黎飛,吳濤著. 數據挖掘中的特徵約簡,科學出版社,2016.8.2. 郭躬德,陳黎飛,李南著. 近鄰分類方法及其套用(上下冊),廈門大學出版社,2013.12.學術論文 - 20篇期刊論文 1. L. Yuan, W. Wang, L. Chen*, Two-stage pruning method for gram-based categorical sequence clustering, International ...