內容簡介
《HNC與語言學研究(第4輯)(2009)》:第四屆HNC與語言學研究學術研討會論文集
圖書目錄
第一部分 基礎理論和語言本體研究
把文字數據變成文字記憶
關於漢語語義概念的一點思考
概念基元空間的下沉及與詞義結構的語言對接
現代漢語空間短語的基本類型
組織名在主流媒體上的分布信息及其價值
從HNC看“從到”的語義角色及其判定
HNC與本體概念網的比較研究
面向漢語框架語義知識庫的動詞“感覺”分析
面向自然語言處理的人機語義研究
基於HNC理論的“是的”結構研究及教學
談HNC的知識表示方法
面向自然語言處理的語言本體研究
標點句的獨立性判斷
網路流行語的敘事特點及功能
第二部分 知識庫資源建設及其套用
語義網際網路與《新編同義詞詞林》
事件描述塊句法語義標註庫的構建
釋雅例句檢索工具的需求分析
動詞詞典在漢語辭彙教學中的套用
略論基於HNC的學習型電子詞典編纂研究
HNC語義標註語料庫查詢工具的用戶需求
句群處理突破的關鍵:HNC領域句類知識庫
漢英雙語多元邏輯組合標註的基本內容
法治活動的領域句類表示式和知識描述
基於本體的多媒體教學資源管理及檢索研究
語言資源建設的理論與實踐初探
跨越語句理解的知識(庫)建設
第三部分 基礎技術研究與開發
無頭迭句與花園幽徑句的辨識與處理
英語特徵語義塊構成分析及計算機處理
結合領域句類知識的省略恢複方法
面向大句處理的句類分析系統的設計與實現
英語非限定形態動詞分析處理
憲法句間回指模糊的消解研究
漢語理解處理中的動態詞及其組合模式
句處理與句群處理
利用讀音信息的詞語切分處理
現代漢語文本中四字語的識別
英語主輔語義塊辨識初探
中文機構名識別需要使用的知識資源
現代漢語數量短語及其自動識別的研究
HNC符號的解析及套用
中文信息處理中兼類詞研究困難的原因
HNC理論的句類假設檢驗知識與現有句類分析系統E語義塊識別的檢測分析
第四部分 套用研發之一:機器翻譯
形如獨立小句的原型句蛻之漢英變換
從HNC機器翻譯評測看機器翻譯發展
從一項實證研究看機器翻譯的路線之爭
面向漢英機器翻譯的格式自轉換研究
關聯於是否判斷句的迭句轉換研究——以漢英機器翻譯為視角
英語方式動詞在英漢機器翻譯中的處理分析
漢英機器翻譯中的輔塊序位研究
英漢機器翻譯中“0F”結構的處理
基於HNC理論的時間輔語義塊的漢英機器翻譯初探
塊擴句的漢英句類及句式轉換
漢語小句向英語輔塊的變換研究
漢英機器翻譯中“以為”句式的理解處理
簡析機器翻譯軟體的需求
第五部分 套用研發之二:信息檢索和抽取
中文文本中企業併購信息的自動抽取
農業信息檢索中含單動詞和雙名詞的詞語串之語義理解策略
針對HNC理論的特殊語序結構的抽取策略——基於足球比賽報導新聞文本的抽取任務
求職簡歷信息的自動抽取
基於規則的人物關係抽取所需的語言知識研究
搜尋引擎的個性化和智慧型化
農業信息智慧型檢索的知識需求分析
基於HNC理論的精確檢索方法的設計與實現
中國奧運冠軍動態信息抽取技術研究
網路文本中對企業產品和服務評價傾向的表達方式分析
第六部分其他套用技術和系統研發
基於HNC的網路信息輿情分析系統套用
HNC知識檢索系統在專利文獻檢索中的套用
HNC在農業垂直搜尋中的套用
HNC在Web日誌管理中的套用探討
HNC在網站客服系統中的套用探討
基於向量空間模型的話題主動發現和跟蹤
漢語網路詞典的現狀和發展方向淺析
序言
本書是第四屆“HNC與語言學研究學術研討會”的論文集。
HNC是概念層次網路理論的簡稱,該理論由中國科學院聲學研究所黃曾陽先生創立,它的基本特徵是通過構建語言概念空間來探索和模擬大腦的語言理解過程。
“HNC與語言學研究學術研討會”(簡稱“HNC研討會”)最早由語言學家邢福義先生和黃曾陽先生倡議,它有三個基本宗旨:一是搭建語言信息處理界的學術交流平台,以碰撞促發展;二是創造有利於原創性新思想發展的學術環境,鼓勵和發揚創新;三是理論探索與套用實踐並重,促進學術界和產業界的溝通與互動。第一屆HNC研討會於2001年4月在
華中師範大學舉行,第二屆於2003年9月在中國科學院聲學研究所舉行,第三屆於2005年12月在
北京師範大學舉行。
第四屆HNC研討會於2009年11月14日至15日在北京師範大學舉行,本屆研討會留給與會者的感受可以概括為四點:第一,HNC的基礎研究和套用開發與四年前相比又取得了很大的進展,HNC團隊進一步壯大;第二,學術界和產業界對HNC理論與技術有了更多的關注和了解;第三,中文信息處理的各個方面都在不斷向前發展,新的思想、理論和技術不斷產生,各個流派之間的交流不斷擴大和加深;第四,論文作者大多是年輕的生力軍,說明我國語言信息處理的發展後繼有人。
前三屆HNC研討會的論文集,書名分別為《HNC與語言學研究》《第二屆HNC與語言學研討會論文集》《中文信息處理的探索與實踐》,本屆HNC研討會論文集的書名定為《HNC與語言學研究(第4輯)》,以後將固定採用這一名稱,只是改變括弧中的數字,以與研討會的屆數對應。
本書收錄了第四屆HNC研討會上宣讀的74篇論文,分為6個部分:
1.基礎理論和語言本體研究(14篇)
2.知識庫資源建設及其套用(12篇)
3.基礎技術研究與開發(16篇)
4.套用研發之一:機器翻譯(14篇)
5.套用研發之二:信息檢索和抽取(11篇)
6.其他套用技術和系統研發(7篇)
其中第四部分集中反映了HNC的最新進展,即在機器翻譯方面的基礎研究和套用實踐。
本書出版時間比較倉促,編者水平也有限,如有疏漏和不妥之處,懇請讀者和論文作者批評指正。