《計量文體學導論》是2017年3月14日北京大學出版社出版的圖書,作者是施建軍。
基本介紹
內容簡介,編輯推薦,作者簡介,圖書目錄,
內容簡介
本書通俗而且詳細介紹了開展文體計量研究所需統計學的基礎知識,並且利用統計學方法以及基於現代統計學理論的計算機文本挖掘技術(文本聚類和分類技術)開展了以下幾方面的研究:中國古代和現代文學作品的文體特徵的抽取、作者鑑定方法、特定作品的文體分析、作家語言使用的變異、以及計算機文體計量相關軟體工具使用等諸多方面的研究。用計量方法研究了一些歷來受到社會廣泛關注的文體學問題。語言通俗易懂,對所涉及的數學和計算機方面的知識儘量使用比較簡單方法進行描述,具有高中知識水平的讀者既可以閱讀理解。
計量文體學的理論和方法是精確考察作品文體風格、鑑定作品作者的有力武器,可以為司法工作提供科學的鑑定線索,可以為中國古典文獻的整理研究提供更為科學的手段,使國學研究進一步科學化。
計量文體學研究在國外具有很長的歷史,也積累了豐碩的科研成果。但是總體來講和歐美、日本的這方面研究相比還存在著很大的差距,處於落後的局面。本書嘗試從日本相關技術及研究方法中借鑑,希望可以起到拋磚引玉的作用。
計量文體學研究在國外具有很長的歷史,也積累了豐碩的科研成果。但是總體來講和歐美、日本的這方面研究相比還存在著很大的差距,處於落後的局面。本書嘗試從日本相關技術及研究方法中借鑑,希望可以起到拋磚引玉的作用。
編輯推薦
《計量文體學導論》通俗而且詳細介紹了開展文體計量研究所需的統計學基礎知識,並且利用統計學方法以及基於現代統計學理論的計算機文本挖掘技術(文本聚類和分類技術)開展了以下幾方面的計量文體學研究:中國古代和現代文學作品的文體特徵抽取、作者鑑定方法、特定作品的文體分析、作家語言使用的變異、以及計算機文體計量相關軟體工具使用等等。用計量方法研究了一些歷來受到社會廣泛關注的文體學問題,如作者不同文體風格相似作品的作者區分、作者相同風格不同的作品分析、古典名著作者的計量文體學分析等等。
作者簡介
施建軍,上海外國語大學教授,主要從事日文信息計算機智慧型處理、日語語言學、文學作品作者鑑別、漢字文化圈國家語言文字、計算機輔助外語教學等領域的研究。主持和承擔教育部和國家社科重大項目2項、國家社科一般項目4項以及多項省部級項目和國內外橫向項目。
圖書目錄
第一章 緒論
第一節 什麼是計量文體學 1
第二節 國內外計量文體學發展的歷史和現狀 2
第三節 文體的計量特徵 5
第二章 計量文體學相關重要統計學概念
第一節 文體特徵的頻率、機率、條件機率 31
第二節 文體特徵的平均值、中位數、眾數 37
第三節 文體特徵的方差、標準差 46
第四節 文體特徵的相關係數 52
第五節 特徵和文體的相互信息 69
第三章 文體計量研究相關重要機率分布和定理
第一節 文體特徵隨機變數的分布 82
第二節 文體計量研究相關的幾個重要機率分布 88
第三節 文體分析中的大數定律和中心極限定理 99
第四章 文體計量分析中的抽樣和抽樣分布
第一節 文章的抽樣調查和抽樣方法 106
第二節 文體的統計量和抽樣分布 116
第五章 文體計量分析中的參數估計問題
第一節 文體特徵參數的點估計 126
第二節 文體特徵參數範圍的估計 131
第三節 文體特徵平均值範圍的估計 135
第四節 文體特徵參數範圍估計與作家風格比較 152
第六章 文體特徵差異的假設檢驗
第一節 何為假設檢驗 165
第二節 文體特徵假設檢驗的一般步驟 171
第三節 Z檢驗在文體分析中的套用 175
第四節 T檢驗在文體分析中的套用 180
第五節 虛詞使用習慣的假設檢驗 190
第六節 x2檢驗在文體分析中的套用 195
第七章 文體風格個體性差異的方差分析
第一節 文體方差分析的基本原理 202
第二節 不同作家文體特徵的方差分析 209
第三節 相同作家不同作品文體特徵的方差分析 220
第八章 文體特徵的多變數分析
第一節 文本的聚類分析 226
第二節 文體研究中文本聚類分析的有效性 230
第三節 聚類分析和古典文學作品的作者研究 234
第四節 文體研究中文本聚類分析的局限性 241
第九章 支持向量機技術和文學作品作者鑑別
第一節 支持向量機的基本原理 248
第二節 支持向量機技術研究古典文學作品作者的有效性 249
第三節 支持向量機技術和《紅樓夢》作者研究 252
參考文獻 261