通過句法位置提取中文關鍵字的實驗研究

通過句法位置提取中文關鍵字的實驗研究

《通過句法位置提取中文關鍵字的實驗研究》是2011年蘇州大學出版社出版的圖書,作者是王家鉞。

基本介紹

  • 書名:通過句法位置提取中文關鍵字的實驗研究
  • 作者:王家鉞
  • 出版社:蘇州大學出版社
  • 出版時間:2011年10月1日
  • 頁數:149 頁
  • 開本:32 開
  • ISBN:9787811378214 
  • 語種:簡體中文, 英語
內容簡介,圖書目錄,作者簡介,

內容簡介

《通過句法位置提取中文關鍵字的實驗研究》是基於我的博士學位論文Chinese Keyword Extractionby Term Positions改寫而成。《通過句法位置提取中文關鍵字的實驗研究》詳盡描述了自然語言處理尤其是信息檢索的各種主要方法,並對信息檢索領域“相關性”這一核心概念做了非常充分的回顧與文獻綜述(這部分內容單獨發表在《現代外語》2001年第2期上),在此基礎上提出了基於句法位置提取關鍵字的初步構想。
《通過句法位置提取中文關鍵字的實驗研究》詳盡描述了自然語言處理尤其是信息檢索的各種主要方法,並對信息檢索領域“相關性”這一核心概念進行了回顧與綜述,在此基礎上提出了基於句法位置提取關鍵字的初步構想,通過小型問卷調查證明了基本名物性短語的重要性。在實驗部分,作者以從某技術型網站蒐集的小型文本庫為實驗對象,首先證明了不同文本位置以及不同句法層級上產生關鍵字的可能性有顯著差異。隨後使用向量空間模型(VSM)提取其關鍵字,然後對文本庫中的基本名物性短語的句法位置進行手工標註,通過這些位置提取關鍵字,再將二者進行對比。實驗表明,通過句法位置提取的關鍵字與通過VSM提取的關鍵字沒有顯著差異。最後作者對這些實驗結果進行了討論。

圖書目錄

Chapter 1 Introduction
1.1 Motivation
1.2 Discussions on KE methods
1. 3 Possible contribution
1. 4 Structure
Chapter 2 Information retrieval: the ultimate goal
2.1 Introduction
2.2 Theories and practices
2.3 Traditional methods
2.3.1 Free text string searching
2.3.2 Indexing
2.4 Advanced strategies
2.4.1 The Vector Space Model
2.4.2 Probabilistic approaches
2.4.3 Document classification and clustering
2.5 Linouistic approaches to IR
2.5.1 Problems with statistical methods
2.5.2 Non-statistical methods
2.6 Phrase indexing
2.7 Nominal phrases
2.7.1 Significance
2.7.2 Phrase detection and extraction
2.7.3 BaseNPs
2.8 Summary
Chapter 3 Web search and relevance: trigger and rationale
3.1 Web search: a good landing for IR discussions
3.2 The "hypertext challenge"?
3.3 Search engines: performance and problems
3.4 IR and relevance
3.5 Relevance studies
3.5.1 Anatomy of the concept
3.5.2 Relevance assessment variation
3.5.3 System-oriented relevance
3.5.4 User-oriented relevance
3.5.5 System-oriented definitions of relevance
3.6 Discussion and re-definition
Chapter 4 Keyword extraction: methodology and practices
4. 1 KE: a good aid for IR
4.2 What is "topic"?
4.3 KE review
4.3.1 Text segmentation and topic extraction
4.3.2 Basic methods
4.3.3 Studies and practice in keyword extraction
4.3.4 Comments
4.3.5 Implications for IE
4.4 The hypothesis
Chapter 5 Experiments
5.1 Design
5.2 Experiment A: testing the hypothesis
5.2.1 The tagging scheme
5.2.2 Corpus material
5.2.3 Tagging
5.2.4 Manual keywords
5.2.5 Outcome and analysis
5.2.6 Validity of data and residual issues
5.3 Subsequent experiments : testing the effect
5.3.1 Automatically extracted keywords
5.3.2 Outcome of the four keyword extraction methods
5.4 Discussions
5.5 Summary
Chapter 6 Conclusions and further research
6.1 Summary of the study
6.2 Further research
Bibliography
Appendices

作者簡介

王家鉞,廣西師範大學外國語學院英語語言文學系主任、博士、副教授、碩士研究生導師。從事套用語言學、語料庫語言學、計算機輔助翻譯等領域的研究。在《外語界》《現代外語》等刊物上發表論文多篇,主持省廳級課題2項。

相關詞條

熱門詞條

聯絡我們