內容簡介
圖書目錄
陸序
馮序
一、計算理論和語言研究
計算語言學的理論方法和研究取向
基於統計的語言處理模型的有用性和局限性
認知科學和漢語計算語言學
面向當代科技的語言研究的理論和方法
二、論元結構和描述框架
論元角色的層級關係和語義特徵
一套漢語動詞的論元角色的語法指標
漢語謂詞的論元結構的描述框架
論元結構和句式結構互動的動因、機制和條件
——表達精細化對動詞配價和句式構造的影響
三、信息抽取和語義標註
信息抽取的語義知識資源研究
用動詞的論元結構跟事件模板相匹配
——一種由動詞驅動的信息抽取方法
用邏輯和篇章知識來約束模板匹配
——邏輯結構和篇章結構知識在信息抽取中的運用
基於論元結構的語義標註的體系和規範
新聞語體真實文本的語義標註的實踐
四、專題研究和個案分析
容器隱喻和套件隱喻及相關的語法現象
——詞語同現限制的認知解釋和計算分析
關於分詞規範和規範詞表的若干意見
中文信息處理中的語言難題問答
緩衝式移動通信及其發展方向
——一個語言學家的設計思想
走向多層面互動的漢語研究
五、附錄
趙元任先生評傳
朱德熙先生評傳
後記
後記
收入本書的18篇文章,都是我在90年代中期以後陸續寫成的。其中,大部分是作為教育部“十五科研規劃第一批(博士點基金)項目”——“面向信息抽取的語義標註研究”的子課題,而陸續完成的(項目批准號:01JB740006)。現在,我把它們收集在一起,根據文章的內容,大致分成4編,以便讀者閱讀。在這裡,我要感謝教育部給我提供這筆基金,使我能夠在一個比較優越的環境中進行研究、從容地寫作。我還要感謝北京大學社會科學研究部提供了相應的配套經費,使我的研究有了比較充分的物質保障。雖然加在一起的資金並不多,但是足以讓我感受到我們這一代學者的幸運,能夠享受改革開放帶來的偉大成果。這也促使我知恩圖報,努力在自己所從事的專業領域中作出成績,儘可能讓自己的研究多少帶有一點技術色彩,希望為國家的經濟建設獻出一點綿薄之力。
大家知道,計算語言學的研究有不同的思路(approach);而這跟不同的研究者對這門學科的理解,特別是他們的研究取向(orienta—tion)和知識背景有關。我比較喜歡那種對於語言研究和自然語言的計算機處理兩頭都有啟發性的路子,於是免不了要走認知主義的道路,並堅持認知的本質是計算的觀念;在此基礎上,逐步形成基於認知並面向計算的語言研究的路子。當然,我不反對其他路子的計算語言學研究。這反過來也可以解釋,為什麼我對語言的認知研究跟一般的認知語言學或認知語法會如此大異其趣。
在學習和研究計算語言學的過程中,我先後得到黃昌寧、羅振聲和董振東等老師的幫助和鼓勵;跟白碩、王培、金茂兵、孫茂松、周明、姬東鴻和周強等學友的討論,也使我大開眼界。特別是陸儉明老師鼓勵我於1998年給研究生開設《計算語言學》課程,促使我對計算語言學的各種研究路子和教材體系作了系統的梳理。在此,謹向他們表示誠摯的謝意。
序言
在學術研究領域,袁毓林可以說是一位勤奮的耕耘者。他的論文集《漢語語法研究的認知視野》(商務印書館)於2004年出版,現在又推出了新的論文集《基於認知的漢語計算語言學研究》。我大略地翻閱了一下全書各篇的內容,論文集的書名“基於認知的漢語計算語言學研究”,點明了該書的基本內容——從認知的視角來研究計算語言學,特別是中文信息處理的問題。正文具體分四部分內容:
第一部分內容,作者取名為“計算理論和語言研究”,包括四篇文章:《計算語言學的理論方法和研究取向》、《基於統計的語言處理模型的有用性和局限性》、《認知科學和漢語計算語言學》和《面向當代科技的語言研究的理論和方法》。計算語言學的研究,大致可以分為兩個層面,一個是理論模型的研究,一個是工程研究(或說具體的技術方法研究)。據我所知,袁毓林主要從事理論模型的研究,所以這一部分內容作者主要從巨觀的角度介紹說明了計算語言學的理論方法和研究取向;評述了在自然語言處理中已運用過的基於規則和基於統計的兩種處理模型,指出處理語言這種複雜的系統“必須走規則和統計相結合的道路”;從認知科學的視角作者把自己認為有價值的並且是可行的計算語言學研究模式介紹給讀者,並結合作者自己的研究實踐討論說明了基於認知並面向計算的漢語語法研究的路線;展示了認知語言學和計算語言學相互結合的可能性。這部分內容對有興趣了解或從事計算語言學研究的人來說,是值得一讀的,是很有啟迪意義的。
第二部分內容,作者取名為“論元結構和描述框架”,也包括四篇文章:《論元角色的層級關係和語義特徵》、《一套漢語動詞的論元角色的語法指標》、《漢語渭詞的論元結構的描述框架》和《論元結構和句式結構互動的動因、機制和條件——表達精細化對動詞配價和句式構造的影響》。袁毓林是我國最早研究配價問題的學者之一,特別是他第一個發表了有關漢語名詞配價的研究成果,該成果被廣為引用。