《基於遺傳算法的文本分類及聚類研究》是2008年科學出版社出版的圖書,作者是戴文華。
基本介紹
- 書名:基於遺傳算法的文本分類及聚類研究
- 作者:戴文華
- ISBN:9787030227416
- 類別:圖書 > 社會科學 > 人類學
- 頁數:222
- 出版社:科學出版社
- 出版時間:2008-08-01
- 裝幀:平裝
- 開本:大32開
內容簡介,編輯推薦,圖書目錄,圖書前言,文章節選,
內容簡介
文本分類和聚類技術是應信息檢索和查詢需要而出現的自然語言處理領域的重要研究課題。文本分類和聚類問題中的特徵選擇和抽取技術、文本特徵表示、聚類方法的選擇和實現以及分類方法的選擇和實現,都將對文本分類和聚類結果產生極大影響。針對文本分類和聚類中的文本數據的高維性和稀疏性、同義詞和近義詞問題、效率與精確度之間的搭配問題以及參數最佳化問題,本書提出了使用遺傳算法與傳統分類和聚類方法相結合的思路來進行處理,充分利用了遺傳算法的全局最佳化能力和傳統分類及聚類算法的專業知識,有效地提高了文本分類和聚類的效率與精度。
編輯推薦
本書作者圍繞文本分類和聚類研究,針對一些具體問題,提出了一系列科學可行的解決方案。如基於並行遺傳算法的特徵詞動態提取方法,能夠降低文本對象的特徵維數;採用並行遺傳算法對文本分類和聚類問題中的參數進行最佳化,從而提高文本分類和聚類結果的精確度。 本書除了闡述作者自己的研究成果外,作者還結合自己的實際經驗,對文本自動分類技術、文本自動聚類技術、遺傳算法的相關技術都作了較詳細的描述,對於準備從事相關研究的人士有很大的參考價值。
圖書目錄
序
前言
第1章 緒論
1.1 研究的目的和意義
1.2 國內外研究現狀
1.3 文本分類和聚類存在的問題
1.4 本書研究內容和目標
參考文獻
第2章 文本分類和聚類的基本理論及方法
2.1 文本分類和聚類的概念
2.2 文本的表示
2.3 文本預處理
2.4 文本特徵選擇和抽取
2.5 文本分類方法
2.6 文本聚類方法
2.7 本章小結
參考文獻
第3章 遺傳算法基礎知識
3.1 遺傳算法概述
3.2 標準遺傳算法
3.3 遺傳算法染色體編碼
3.4 適應度函式
3.5 遺傳運算元
3.6 遺傳算法的改進
3.7 本章小結
參考文獻
第4章 混合併行遺傳算法及其在文本聚類中的套用
4.1 k-means算法初始聚類中心的選擇
4.2 混合併行遺傳算法
4.3 基於並行遺傳算法的文本特徵詞提取
4.4 基於混合併行遺傳算法的文本聚類
4.5 實驗設定及結果分析
4.6 本章小結
參考文獻
第5章 混合併行遺傳算法在文本分類中的套用
5.1 基於混合併行遺傳算法的潛在語義挖掘
5.2 基於混合併行遺傳聚類的KNN改進算法(HPGA-KNN)
5.3 SMO-SVM算法
5.4 SMO-SVM算法核函式參數最佳化
5.5 改進的KNN SVM文本分類方法
5.6 實驗設定及分析
5.7 本搴小結
參考文獻
第6章 總結和研究展望
6.1 總結
6.2 後續研究工作展望
附錄A k-means聚類算法關鍵代碼
附錄B 遺傳算法聚類關鍵代碼
附錄C 混合遺傳聚類關鍵代碼
圖書前言
戴文華同志無論學習、研究還是工作,都非常勤奮、踏實、執著,研究能力和鑽研精神都非常強。四年前,他進入華中師範大學計算機科學系攻讀碩士研究生時,已經作為高校教師工作了多年,並已取得了較多的成果;然而他在自然語言處理這個研究方向上,還是一個新兵。但是,經過短短的4年,他已經在該方向做出了突出的研究成果,在文本分類和聚類的理論和方法上,做了系統深入的研究,發表了論文10多篇。現在他碩士期間的主要研究成果即將出版專著,實在是可喜可賀。文本自動分類和聚類是自然語言處理領域裡重要的研究課題,有廣泛的套用前景。
文章節選
第1章 緒論
讓Internet更好地為人類服務,一直是人們努力的方向。通過不懈努力,人們逐漸掌握了多種技術對不斷膨脹的信息進行收集和整理。各種海量信息的複雜性和非結構性,對信息的處理帶來了極大的挑戰。本書為了解決信息處理中的一些相關問題而進行了深入研究,提出了一些切實有效的措施,為海量信息的處理提供了極大幫助。
……
讓Internet更好地為人類服務,一直是人們努力的方向。通過不懈努力,人們逐漸掌握了多種技術對不斷膨脹的信息進行收集和整理。各種海量信息的複雜性和非結構性,對信息的處理帶來了極大的挑戰。本書為了解決信息處理中的一些相關問題而進行了深入研究,提出了一些切實有效的措施,為海量信息的處理提供了極大幫助。
……