自動編制文摘用計算機析取文獻內容摘要(文摘)。
簡介,歷史發展,
簡介
用計算機析取文獻內容摘要(文摘)。手工編制文摘,按不同目的,分指示性文摘和報導性文摘。指示性文摘要求概括文獻的主要內容,需要語義理解、知識析取和高度的概括智慧型,這是現代計算機還難以具備的人工智慧,雖然人們正在努力,但估計在短期內難有重大的、可提供大規模實用的突破。所以,迄今已報導的自動編制文摘的試驗,基本上是摘錄型的報導性文摘,而且,基本做法與自動抽詞十分類似:第一步是根據詞在文獻中的頻率及位置等信息給詞賦權;第二步是根據句子的組成成份、結構特點及位置等因素決定句子的權值;最後,再根據句子的權值大小及語境推斷和句法聚集等輔助手段,決定應抽取哪些句子並組裝成文獻的報導性文摘。
歷史發展
H.P.盧恩1958年發表的、以詞在文獻中的出現頻率為其重要性的有效測度的理論,仍然是現今詞加權方法的基礎。P.B.巴克森德爾經過分析研究,在同年發表了“大多數反映文獻主要內容的句子往往出現在段首或段尾”的結論,對以後的文摘自動編制研究產生了一定的影響。H.P.埃德蒙森研究了位置法、暗示法、關鍵字法和標題法等4種方法並且加以組合,製成了一個實用的文摘自動編制系統。蘇聯的Э.Ф.斯科羅季科,1972年從語義邏輯圖的觀點出發,提出了將那些與某些句子有語義联系的句子作為文摘句的候選句的方法,是自動編制文摘方面的著名成就。1971年和1975年,由拉什、J.J.波洛克等人開發的ADAM系統,使用了“詞控制表”的方法並以詞的語義和語法狀態為依據,判斷句子是否有價值抽出,獲得了很大的成功。之後,佩斯發表了基於辨認自標識短語的文摘構造方法。所有這些,都說明自動編制文摘的艱巨性和重要性,它與人工智慧、專家系統的結合,必將取得新的突破。