複句關係標記的搭配研究

複句關係標記的搭配研究

《複句關係標記的搭配研究》以關係標記為切入點,以“小句中樞”和“詞語發配”為理論背景,將搭配研究基本手段與“兩個三角”,即“表-里-值”小三角和“普-方-古”大三角的研究方法緊密地結合起來,利用“漢語複句語料庫”與“《人民日報》語料樣本”作為數據支持,追求對語言事實的“觀察充分”、“描寫充分”和“解釋充分”。研究中運用了統計分析、層次聚類等多種跨學科研究方法,目的是從全新的角度來觀察和分析關係標記搭配的句式與語義特點。

基本介紹

  • 書名:複句關係標記的搭配研究
  • 出版社:華中師範大學出版社
  • 頁數:437頁
  • 開本:32
  • 品牌:華中師範大學出版社
  • 作者:姚雙雲 邢福義
  • 出版日期:2008年6月1日
  • 語種:簡體中文
  • ISBN:9787562237389, 7562237387
內容簡介,圖書目錄,文摘,後記,序言,

內容簡介

《複句關係標記的搭配研究》:華中語學論庫第二輯。

圖書目錄


導論
第一章 研究背景:“小句中樞理論”與複句信息工程
引言
第一節 “小句中樞理論”在中文信息處理中的套用
一、套用於詞語的自動切分和標註
二、套用於短語的識別和標註
三、套用於歧義的消解
四、套用於語法實體複雜特徵集的描寫

第二節 “小句中樞理論”與複句信息工程
一、複句研究的重要意義
二、複句信息工程的研究內容、目標和開展
三、關於“漢語複句語料庫”

第三節 “漢語複句語料庫”的利用
一、利用統計數據了解關係標記的使用頻率
二、利用複句語料庫統計關係標記的搭配距離
三、利用標註語料庫發現關係標記的搭配模式
四、利用標註語料庫進行關係標記的識別
小結

第二章 詞語搭配的理論體系與關係標記的搭配
引言
第一節 詞語搭配理論體系的介紹
一、搭配的定義
二、搭配研究發展的幾個重要階段
三、國內搭配研究的開展及簡單評價

第二節 關係標記搭配研究的意義、內容和手段
一、關係標記搭配研究的重要意義
二、關係標記搭配研究的主要內容
三、本研究中用到的基本統計方法

第三節 本書開展研究的語料準備
一、本書使用的兩個語言資源
二、對研究語料的預處理
三、對本書統計數據的說明
小結

第三章 關係標記搭配的基本情況與相關分析
引言
第一節 關係標記的分布情況與使用頻率
一、各類關係標記的分布情況
二、單個關係標記的使用頻率

第二節 關係標記的搭配強度與語義的衍生
一、關係標記搭配強度的統計分析
二、常見的搭配強度大、共現次數多的搭配結構
三、從搭配強度與意義的衍生看“語表”對“語裡”的影響

第三節 關係標記的搭配距離與相關句法特徵
一、關係標記的搭配距離分析
二、搭配距離與相關格式的“表—里—值”分析

第四節 關係標記的語義韻
一、“語義韻”的界定與關係標記的“語義韻”
二、原因標記“多虧”的“語義韻”分析
小結

第四章 遞進標記的搭配、關聯與易位
引言
第一節 遞進標記搭配的基本情況與個案分析
一、遞進標記搭配的基本情況
二、反遞格式“不僅/不但……反而”前搭配項“表—里—值”的分析

第二節 遞進層級句式的關聯與易位
一、遞進層級句式的語義類型
二、遞進層級句式的關聯
三、遞進層級句式的易位
小結

第五章 連詞“結果”的語法化與共時平面的搭配
引言
第一節 “結果”的語法化及語義類型分析
一、“結果”在歷時縱線上的兩個不同形式及其用法
二、“結裹”的語義演變及“結果”虛化過程
三、連詞“結果”虛化的動因
四、連詞“結果”虛化的特點
五、“結果”虛化的認知基礎與類型學意義
六、連詞“結果”的語義分析

第二節 “結果”的連詞典型性問題及其共時平面的使用情況
一、“結果”的連詞典型性聚類分析
二、連詞“結果”的分布、句法位置與搭配

第三節 “結果”和“所以”的搭配差異
一、關聯句類的差異
二、與因果標記搭配強度的差異
小結

第六章 關係標記的連用與異類搭配
引言
第一節 關係標記的連用
一、關係標記連用的分類
二、關係標記連用基本情況的統計與分析
三、影響關係標記連用的重要因素
四、關係標記連用的語用價值

第二節 關係標記的異類搭配
一、關係標記組合的三種形式
二、異類標記搭配的基本模式
三、異類標記的搭配強度及語用價值
四、異類標記的搭配與複句層次的劃分
小結

全書總結
一 本書的結論
二 本書的意義
三 本書的不足及今後的工作
附錄一 “《人民日報》語料樣本”265個關係標記的出現次數
附錄二 “《人民日報》語料樣本”常見搭配模式的MI值統計數據
附錄三 “《人民日報》語料樣本”常見搭配模式的Z值統計數據
附錄四 “《人民日報》語料樣本”中共現次數、MI值和Z值均在前95位的54組搭配格式
附錄五 “《人民日報》語料樣本”中常見搭配標記的平均搭配距離
附錄六 “因為……所以”與“之所以……是因為”搭配距離對比檢索語料
附錄七 90個含有標記“多虧”的檢索例句
附錄八 122個“不僅……反而”的檢索例句
附錄九 關係標記的異類搭配部分語料
參考文獻
後記

文摘

第一章 研究背景:“小句中樞理論”與複句信息工程
引言
本章介紹全書的研究背景——“小句中樞理論”與複句信息工程。主要包括兩節:第一節“‘小句中樞理論,在中文信息處理中的套用”,從詞語的自動切分和標註、短語的識別和標註、歧義的消解、語法實體複雜特徵集的描寫四個方面討論“小句中樞理論”在中文信息處理領域的套用;第二節“‘小句中樞理論’與複句信息工程”,討論複句信息工程的研究內容、研究目標以及“漢語複句語料庫”的建設和利用等問題。
第一節 “小句中樞理論”在中文信息處理中的套用
“小句中樞理論”的核心內容是“句管控”,“句管控”思想在解決中文信息處理面臨的一些難題中可以發揮作用。“小句中樞理論”中的“小三角”研究思路實際上是人們全面認識和描述事物的一種方法,從資訊理論的角度來說是一種全信息表示法,它和當前自然語言處理倡導的“複雜特徵集”的描寫在本質上是相通的。在中文信息處理中,小句中樞理論可以套用於以下幾個方面。
一、套用於詞語的自動切分和標註
詞語的自動切分和標註是進行漢語句法分析的前提。目前,漢語的自動分詞和詞性標註基本上達到了能夠實際套用的水平,但準確率還有待提高。未登錄詞的識辨和歧義切分欄位的處理是自動分詞研究中遇到的兩個主要困難,不能識別未登錄詞或者錯誤的識別都會導致不正確的標註。漢語中,詞的兼類現象特別是活用現象大量存在,增加了分詞系統中詞庫的建設難度。即使在詞庫中確定了形形色色的兼類詞,也難以確定兼類詞的具體詞性,因為兼類詞處於此句法環境中可能是甲類詞,而處於彼句法環境中可能是乙類詞。活用的現象更複雜,什麼詞可以活用,可以活用為什麼詞,都很難把握。然而,兼類也好,活用也好,任何詞進入到具體的句子之中,就一定會受到句子的約束和管控。正因如此,“句管控”思想在理論與實踐上具有不言而喻的價值。

後記

本書是在我2006年提交的博士學位論文基礎上修改、擴充而成的。這次出版做了一些改動,書名和內容都有一些實質性的變化。
2003年我有幸考入華中師範大學語言研究所,師從邢福義先生。在恩師的指導下,我開始從事複句方面的研究。2004年9月份,語言研究所與計算機系合作做一些研究,當時的任務之一就是進行語料庫的開發。課題組成員有語言研究所和計算機系的教師以及兩個單位的十幾名研究生。這些成員後來都參加了邢福義先生主持的華中師範大學211工程項目“小句中樞理論在漢語及臨界領域的套用與驗證”,從事面向信息處理的複句研究。邢先生讓我參加了合作研究,與計算機專業的老師、研究生等一起進行專題研究。在這樣一個環境裡,我的計算機水平有了迅速的提高。後來又通過學友的幫助,熟練地掌握了資料庫的使用和加工方法,並學到了一些初步的編程知識。同時我還自學了一些統計分析教程,掌握了社會科學研究中常見的統計方法。
在課題組成員文理交叉的學術背景下,經過兩年多的學習和實踐,我的知識結構發生了較大的變化,並由此得到了研究理念和研究方法上的一些新啟示。這對我今後研究的走向產生了深遠影響。本書的研究就是在這樣一個背景下開展的。全書以關係標記為突破口研究複句相關的句法問題,探討蘊含在其中的規律。

序言

隨著歷史的發展,社會的進步,科技的發達,語言學在整個世界範圍內越來越展示出強大的活力和能量。中國語言學是世界語言學的重要組成部分。為了對中國語言學事業有所推動,我們組織撰寫“華中語學論庫”。作為專用名稱,這裡的“語學”主要指漢語語言學,近期的15年時間裡以現代漢語語法專題研究為重點。“語學論庫”,這是漢語語言學研究的一個系統工程,如果將來主客觀條件具備,在研究範圍上可以不斷擴大,在研究時間上可以無限延展,在研究隊伍上可以輩輩交接,代代傳承。“華中”一詞,既跟研究隊伍的華中群體相關,又跟華中師範大學出版社的名稱相關。
漢語語言學源遠流長。千百年來,特別是《馬氏文通》出版以來,尤其是20世紀70年代之後,由於一代代學者的不懈努力,漢語語言學沿著“創業——拓新——發展”的軌道不斷推進。目前,漢語語言學所統括的漢語語法學、漢語語音學、漢語方言學、漢語辭彙學、漢語語用學等等學科,都已出現了初步繁榮的喜人局面。
  

相關詞條

熱門詞條

聯絡我們