自然語言計算機形式分析的理論與方法

自然語言計算機形式分析的理論與方法

《自然語言計算機形式分析的理論與方法》是2017年中國科學技術大學出版社出版的圖書,作者是馮志偉。

內容簡介,作者簡介,圖書目錄,

內容簡介

自然語言計算機形式分析是橫跨語言學、計算機科學和數學的一個交叉研究領域,是自然語言計算機處理的關鍵。自然語言是信息主要的負荷者,在當今信息網路時代,計算機已經日益普及,普通計算機用戶可以使用的語言資源正以驚人的速度飛快增長。網際網路主要是由自然語言構成的,它已經成為了極為豐富的語言信息資源;移動通信也是以自然語言為媒介的,它已經滲透到日常生活的各個領域。因此,自然語言計算機形式分析對於國家的信息化建設,對於網際網路和移動通信的安全具有重要作用。
本書對自然語言處理中的各種理論和方法進行了系統的總結和梳理。首先討論了自然語言處理的學科定位;接著介紹了語言計算的一些先驅研究;然後以主要的篇幅討論自然語言處理中的各種形式模型,包括基於短語結構語法的形式模型、基於合一運算的形式模型、基於依存和配價的形式模型、基於格語法的形式模型、基於辭彙主義的形式模型、語義自動處理的形式模型、系統功能語法、語用自動處理的形式模型、機率語法、Bayes公式與動態規划算法、N元語法和數據平滑、隱Markov模型(HMM)、語音自動處理的形式模型、統計機器翻譯的形式模型;同時還討論了自然語言處理系統的評測問題;*後從哲學的角度討論了自然語言處理中的理性主義和經驗主義,探索理性主義方法和經驗主義方法相結合的途徑。
本書說理透徹、語言流暢、實例豐富、深入淺出,適合從事自然語言處理研究的科研人員、大學師生閱讀,也可以作為人工智慧、計算語言學等課程的教學參考書。

作者簡介

馮志偉,1939年出生,計算語言學家,先後在北京大學和中國科學技術大學研究生院獲文科和理科碩士學位。精通英語、德語、法語、俄語、日語等多門外語,具有寬厚、堅實的語言學、數學和計算機科學功底,是一位難得的橫跨文理科的複合型專家。50多年來一直從事語言學、數學和計算機科學的跨學科研究,是我國從事自然語言處理和計算語言學研究的學者之一。

圖書目錄


第1章自然語言處理的學科定位
1.1從自然語言處理的過程來考察其學科定位
1.2從自然語言處理的範圍來考察其學科定位
1.3從自然語言處理的歷史來考察其學科定位
1.4當前自然語言處理髮展的幾個特點
參考文獻
第2章語言計算研究的先驅
2.1Markov鏈
2.2Zipf定律
2.3Shannon關於“熵”的研究
2.4Bar-Hillel的範疇語法
2.5Harris的語言串分析法
2.6О.С.Кулагина的語言集合論模型
參考文獻
第3章基於短語結構語法的形式模型
3.1語法的Chomsky層級
3.2有限狀態語法和它的局限性
3.3短語結構語法
3.4遞歸轉移網路和擴充轉移網路
3.5自底向上分析和自頂向下分析
3.6通用句法處理器和線圖分析法
3.7Earley算法
3.8左角分析法
3.9CYK算法
3.10Tomita算法
3.11管轄約束理論與最簡方案
3.12Joshi的樹鄰接語法
3.13漢字結構的形式描述
3.14Hausser的左結合語法
參考文獻
第4章基於合一運算的形式模型
4.1中文信息MMT模型
4.2Kaplan的辭彙功能語法
4.3Martin Kay的功能合一語法
4.4Gazdar的廣義短語結構語法
4.5Shieber的PATR
4.6Pollard的中心語驅動的短語結構語法
4.7Pereira和Warren的定子句語法
參考文獻
第5章基於依存和配價的形式模型
5.1配價觀念的起源
5.2Tesnière的依存語法
5.3依存語法在自然語言處理中的套用
5.4配價語法
5.5配價語法在自然語言處理中的套用
參考文獻
第6章基於格語法的形式模型
6.1Fillmore的格語法
6.2Fillmore的框架網路
參考文獻
第7章基於辭彙主義的形式模型
7.1Gross的辭彙語法
7.2鏈語法
7.3辭彙語義學
7.4知識本體
7.5詞網
7.6知網
7.7Pustejovesky的生成詞庫理論
參考文獻
第8章語義自動處理的形式模型
8.1義素分析法
8.2語義場
8.3語義網路
8.4Montague語法
8.5Wilks的優選語義學
8.6Schank的概念依存理論
8.7Mel’chuk的意義文本理論
8.8詞義排歧方法
參考文獻
第9章系統功能語法
9.1系統功能語法的基本概念
9.2系統功能語法在自然語言處理中的套用
參考文獻
第10章語用自動處理的形式模型
10.1Mann和Thompson的修辭結構理論
10.2文本連貫中的常識推理技術
10.3言語行為理論和會話智慧型代理
參考文獻
第11章 機率語法
11.1機率上下文無關語法與句子的歧義
11.2機率上下文無關語法的基本原理
11.3機率上下文無關語法的三個假設
11.4機率辭彙化上下文無關語法
參考文獻
第12章Bayes公式與動態規划算法
12.1拼寫錯誤的檢查與更正
12.2Bayes公式與噪聲信道模型
12.3最小編輯距離算法
12.4發音問題研究中的Bayes方法
12.5發音變異的決策樹模型
12.6加權自動機
12.7向前算法
12.8Viterbi算法
附錄
參考文獻
第13章N元語法和數據平滑
13.1N元語法
13.2數據平滑
參考文獻
第14章隱Markov模型(HMM)
14.1HMM概述
14.2HMM在語音識別中的套用
參考文獻
第15章語音自動處理的形式模型
15.1語音和音位的形式描述方法
15.2聲學語音學和信號
15.3語音自動合成的方法
15.4語音自動識別的方法
參考文獻
第16章統計機器翻譯中的形式模型
16.1機器翻譯與噪聲信道模型
16.2最大熵模型
16.3基於平行機率語法的形式模型
16.4基於短語的統計機器翻譯
16.5基於句法的統計機器翻譯
參考文獻
第17章自然語言處理系統的評測
17.1評測的一般原則和方法
17.2語音合成和文語轉換系統的評測
17.3機器翻譯系統的評測
17.4語料庫系統的評測
17.5國外自然語言處理系統的評測
參考文獻
第18章自然語言處理中的理性主義與經驗主義
18.1哲學中的理性主義和經驗主義
18.2自然語言處理中理性主義和經驗主義的消長
18.3理性主義方法和經驗主義方法的利弊得失
18.4探索理性主義方法和經驗主義方法結合的途徑
參考文獻
附錄走在文理結合的道路上——記自然語言處理專家馮志偉先生
· · · · · ·

相關詞條

熱門詞條

聯絡我們