《基於修辭結構樹庫的篇章銜接標記研究》是2019年1月世界圖書出版公司出版的圖書,作者是樂明。
基本介紹
- 中文名:基於修辭結構樹庫的篇章銜接標記研究
- 作者:樂明
- 出版社:世界圖書出版公司
- 出版時間:2019年1月
- 頁數:237 頁
- 定價:58 元
- 開本:16 開
- 裝幀:平裝
- ISBN:9787519258788
內容簡介,圖書目錄,
內容簡介
《基於修辭結構樹庫的篇章銜接標記研究》定量考察漢語常見篇章銜接標記在書面話語中的連貫用法。首先根據修辭結構理論(Rhetorical Structure Theory,RST),設立了漢語修辭關係集以及關係優選協定,按標註流程開發出漢語財經評論修辭結構樹庫。接著為各類銜接標記在該篇章語料庫中的分布和用法設立多個特徵變數,展開形式、句法、語義和語用標註。隨後利用樹庫和標註語料,對特定銜接標記展開深入的個案分析,探討其篇章分布與語用連貫作用之間的相關性。最後嘗試利用銜接標記及其所在篇章單元的形式特徵,通過機器學習方法來自動判定所在篇章單元間的修辭連貫關係,測試結果較令人滿意。本文最後也討論了對人工標註質量的理解,以及數據挖掘技術在語言學研究中的套用前景。
圖書目錄
縮略語
第一章 篇章連貫研究概論
1.1 研究對象
1.2 研究背景
1.2.1 篇章連貫的理論研究
1.2.2 篇章剖析技術的發展
1.2.3 標註篇章語料庫的開發
1.2.4 中文信息處理的相關研究
1.3 研究問題
1.4 研究方法及主要成果
1.5 本書結構
第二章 研究方法
2.1 語料庫設計
2.2 語料標註
2.2.1 標註理據
2.2.2 標註原則
2.2.3 標註格式
2.2.4 標註手段
2.2.5 標註質量的控制和檢驗
2.3 統計分析和機器學習
2.3.1 描述性統計
2.3.2 推斷性統計
2.3.3 機器學習
2.4 小結
第三章 構建漢語篇章修辭結構樹庫
3.1 修辭結構理論
3.1.1 內容簡介
3.1.2 套用情況
3.1.3 主要爭議
3.1.4 與漢語傳統理論的比較
3.2 構建漢語篇章語料庫
3.2.1 語料選擇
3.2.2 語料預處理
3.3 漢語篇章基本單元切分
3.3.1 篇章基本單元的定義
3.3.2 切分的方法
3.3.3 自動切分的形式標記
3.3.4 自動切分的處理結果
3.4 漢語篇章修辭關係集的設定
3.4.1 基於特徵的定義方法
3.4.2 漢語修辭關係集的簡化分類
3.4.3 一些說明
3.5 修辭關係標註及篇章修辭結構樹的構造
3.5.1 分號句層級及以上的修辭結構標註
3.5.2 逗號子句層級的修辭結構標註
3.6 工具和流程
3.7 質量控制和檢驗
3.8 小結
第四章 標註篇章銜接標記特徵
4.1 標註對象
4.2 理論框架
4.2.1 連線詞
4.2.2 指代詞
4.2.3 語氣詞
4.2.4 標點符號
4.3 自動標註
4.4 人工標註
4.4.1 標註內容(通用部分)
4.4.2 軟體工具
4.4.3 標註流程和質量控制
4.5 統計分析和參數選擇
4.6 小結
第五章 數據分析
5.1 財經評論語料庫篇章結構特點
5.1.1 修辭結構樹特徵
5.1.2 分號句層級上的RR機率分布
5.1.3 小結
5.2 但、但是
5.2.1 前人成果
5.2.2 標註方案
5.2.3 數據結果
5.2.4 討論
5.2.5 小結
5.3 這、那
5.3.1 前人成果
5.3.2 標註方案
5.3.3 數據結果
5.3.4 討論
5.3.5 小結
5.4 嗎、?
5.4.1 前人成果
5.4.2 標註方案
5.4.3 數據結果
5.4.4 討論
5.4.5 小結
第六章 套用測試——以“因為”為例
6.1 研究背景
6.2 任務分析
6.3 學習工具
6.4 數據處理、結果及討論
6.5 小結
……
第七章 討論
第八章 結語
第九章 附錄
參考文獻
索引
後記