《文本分類中的幾個關鍵問題研究》是2015年中國水利水電出版社出版的圖書,作者是裴志利。
基本信息,內容簡介,
基本信息
書 號 | ISBN 978-7-5170-3115-4 | 計算機號 | |
書 名 | 文本分類中的幾個關鍵問題研究 | ||
作 譯 者 | 裴志利 著 | ||
開 本 | 特16開 平裝 | 字 數 | 105 千字 |
印 張 | 6 | 頁 數 | 96 頁 |
出版時間 | 2015年05月第1版第1次印刷 | ||
出 版 社 | 中國水利水電出版社 | ||
定 價 | 25.00元 | 網上售價 | 22.50元 |
分 類 號 | TP274 | ||
主 題 詞 | 數據採集-研究 |
內容簡介
本書基於數據挖掘的相關技術做了如下幾個方面的工作:①針對標準互信息和tf.idf特徵權重公式的缺點提出了改進方法,改進的方法明顯提高了巨觀準確率、巨觀召回率和巨觀F1值;②針對標準tf.idf方法估算特徵權重的盲目性,提出了基於實數域粗糙集理論的特徵頻率重要度加權方法,該方法改善了樣本空間的分布狀態,明顯提高了文本分類的效果;③提出了一種基於互信息和信息熵對的特徵選擇方法,利用該方法進行特徵選擇的分類效果接近代表分類水平的支持向量機;④提出了基於粗糙集的多知識粒度的啟發式屬性約簡方法,通過引入悲觀和樂觀多粒度函式,有效提高了分類的效率和準確率;⑤研究了基於深度學習的主要模型,並選擇其中的Autoencoder進行文本分類研究,在語料庫20NG上進行了驗證,證明了方法的有效性。