基於遺傳算法的文本分類及聚類研究

內容簡介

文本分類和聚類技術是應信息檢索和查詢需要而出現的自然語言處理領域的重要研究課題。文本分類和聚類問題中的特徵選擇和抽取技術、文本特徵表示、聚類方法的選擇和實現以及分類方法的選擇和實現，都將對文本分類和聚類結果產生極大影響。針對文本分類和聚類中的文本數據的高維性和稀疏性、同義詞和近義詞問題、效率與精確度之間的搭配問題以及參數最佳化問題，本書提出了使用遺傳算法與傳統分類和聚類方法相結合的思路來進行處理，充分利用了遺傳算法的全局最佳化能力和傳統分類及聚類算法的專業知識，有效地提高了文本分類和聚類的效率與精度。

編輯推薦

本書作者圍繞文本分類和聚類研究，針對一些具體問題，提出了一系列科學可行的解決方案。如基於並行遺傳算法的特徵詞動態提取方法，能夠降低文本對象的特徵維數；採用並行遺傳算法對文本分類和聚類問題中的參數進行最佳化，從而提高文本分類和聚類結果的精確度。本書除了闡述作者自己的研究成果外，作者還結合自己的實際經驗，對文本自動分類技術、文本自動聚類技術、遺傳算法的相關技術都作了較詳細的描述，對於準備從事相關研究的人士有很大的參考價值。

圖書目錄

序

前言

第1章　緒論

1.1　研究的目的和意義

1.2　國內外研究現狀

1.3　文本分類和聚類存在的問題

1.4　本書研究內容和目標

參考文獻

第2章　文本分類和聚類的基本理論及方法

2.1　文本分類和聚類的概念

2.2　文本的表示

2.3　文本預處理

2.4　文本特徵選擇和抽取

2.5　文本分類方法

2.6　文本聚類方法

2.7　本章小結

參考文獻

第3章　遺傳算法基礎知識

3.1　遺傳算法概述

3.2　標準遺傳算法

3.3　遺傳算法染色體編碼

3.4　適應度函式

3.5　遺傳運算元

3.6　遺傳算法的改進

3.7　本章小結

參考文獻

第4章　混合併行遺傳算法及其在文本聚類中的套用

4.1　k-means算法初始聚類中心的選擇

4.2　混合併行遺傳算法

4.3　基於並行遺傳算法的文本特徵詞提取

4.4　基於混合併行遺傳算法的文本聚類

4.5　實驗設定及結果分析

4.6　本章小結

參考文獻

第5章　混合併行遺傳算法在文本分類中的套用

5.1　基於混合併行遺傳算法的潛在語義挖掘

5.2　基於混合併行遺傳聚類的KNN改進算法（HPGA-KNN）

5.3　SMO-SVM算法

5.4　SMO-SVM算法核函式參數最佳化

基於遺傳算法的文本分類及聚類研究

基本介紹

內容簡介

編輯推薦

圖書目錄

圖書前言

文章節選

相關詞條

熱門詞條