自然語言處理基本理論和方法

《自然語言處理基本理論和方法》是2013年8月哈爾濱工業大學出版社出版的圖書,作者是陳鄞。

自然語言處理基本理論和方法是一本書,本書對自然語言處理的基本理論和方法進行介紹。

基本介紹

  • 書名:自然語言處理基本理論和方法
  • 作者: 陳鄞 
  • ISBN:9787560341262
  • 類別:H.計算機類
  • 頁數:173
  • 定價:28.00元
  • 出版社哈爾濱工業大學出版社
  • 出版時間:2013年8月
  • 裝幀:平裝
  • 開本:16
內容簡介,圖書目錄,

內容簡介

主要內容包括字元集編碼體系、語言計算模型、語言學資源建設、自然語言的詞法分析、句法分析和語義分析等。本書內容源於作者多年的教學及科研心得,適合作為高等院校計算機相關專業本科生及研究生課程的教材。

圖書目錄

第1章 緒論
1.1什麼是自然語言處理
1.2自然語言處理的研究內容
1.3自然語言處理的套用領域
1.4自然語言處理中用到的知識
1.5自然語言處理面臨的困難
1.5.1歧義現象的處理
1.5.2未知語言現象的處理
1.6自然語言處理的基本方法及其發展
1.7學科現狀
1.8語言、思維和理解
1.9本書結構
本章小結
思考練習
第2章 語料庫與辭彙知識庫
2.1語料庫
2.1.1基本概念
2.1.2語料庫類型
2.1,3典型語料庫介紹
2.1.4語料處理的基本問題
2.2辭彙知識庫
2.2.1 WordNet
2.2.2知網
本章小結
思考練習
第3章 n元語法模型
3.1 n元語法的基本概念
3.2數據平滑技術
3.2.1 Laplace法則
3.2.2 GoodTrur1ng估計
3.2.3絕對摺扣和線性折扣
3.2.4 W1tten—Bell平滑算法
3.2.5扣留估計
3.2.6交叉校驗
3.2.7刪除插值法
3.2.8 Katz回退算法
3.3開發和測試模型的數據集
3.4基於詞類的n—gram模型
本章小結
思考練習
第4章 隱馬爾科夫模型
4.1馬爾科夫模型
4.2隱馬爾科夫模型
4.3 HMM的三個基本問題
4.3.1求解觀察值序列的機率
4.3.2確定最優狀態序列
4.3.3 HMM的參數估計
本章小結
思考練習
第5章 常用機器學習方法簡介
5.1 決策樹
5.2貝葉斯分類器
5.3支持向量機
5.4最大熵模型
5.5感知器
5.6 Boost1ng
本章小結
思考練習
第6章 字元編碼與字頻統計
6.1西文字元編碼
6.2中文字元編碼
6.2.1 國標碼
6.2.2大五碼
6.2.3 Un1code與1SO/1EC 10646
6.2.4國標擴展碼
6.2.5 GB 18030
6.3字元編碼知識的作用
6.4字頻統計
6.4.1字頻統計的套用
6.4.2單字字頻統計
6.4.3雙字字頻統計
本章小結
思考練習
第7章 詞法分析
7.1漢語自動分詞及其基本問題
7.1.1分詞規範與詞表
7.1.2切分歧義問題
7.1.3未登錄詞識別問題
7.2基本分詞方法
7.2.1最大匹配法
7.2.2最少分詞法
7.2.3最大機率法
7.2.4與詞性標註相結合的分詞方法
7.2.5基於互現信息的分詞方法
7.2.6基於字分類的分詞方法
7.2.7基於實例的漢語分詞方法
7.3中文姓名識別
7.3.1基於規則的方法
7.3.2基於統計的方法
7.4漢語自動分詞系統的評價
7.5英語形態還原
7.6詞性標註
7.6.1詞性標記集
7.6.2基於規則的詞性標註方法
7.6,3基於統計的詞性標註方法
本章小結
思考練習
第8章 句法分析
8.1文法的表示
8.2自頂向下的句法分析
8.3自底向上的句法分析
8.3.1移近一歸約算法
8.3.2歐雷分析法
8.3.3線圖分析法
8.3.4 cYK分析法
8.4機率上下文無關文法
8.5淺層句法分析
8.5.1問題的提出
8.5.2基於規則的方法
8.5.3基於統計的方法
8.6句法分析系統評測
本章小結
思考練習
第9章 語義分析
9.1詞義消歧
9.1.1基於規則的詞義消歧
9.1.2基於統計的詞義消歧
9.1.3基於實例的詞義消歧
9.1.4基於詞典的詞義消歧
9.2語義角色標註
9.2.1 格語法
9.2.2基於統計機器學習技術的語義角色標註
9.3深層語義推理
9.3.1命題邏輯和渭詞邏輯
9.3.2語義網路
9.3.3概念依存理論
本章小結
思考練習
參考文獻

相關詞條

熱門詞條

聯絡我們