請求問答系統

簡介

請求問答系統是一種問答系統，即根據用戶請求，返回一個用戶一個答案。一般分為3個部分：問題理解，知識檢索以及答案生成。問題理解是指對於自然語言輸入的問題，首先需要理解問題問的是什麼：是在問一個詞語的定義，是在查詢某項智力知識，等等，只有準確地理解問題，才有可能到正確的知識庫檢索答案。

問答系統

問答系統（Question answering），是未來自然語言處理的明日之星。問答系統外部的行為上來看，其與目前主流資訊檢索技術有兩點不同：首先是查詢方式為完整而口語化的問句，再來則是其回傳的為高精準度網頁結果或明確的答案字串。以Ask Jeeves為例，使用者不需要思考該使用什麼樣的問法才能夠得到理想的答案，只需要用口語化的方式直接提問如“請問誰是美國總統？”即可。而系統在了解使用者問句後，會非常清楚地回答“歐巴馬是美國總統”。面對這種系統，使用者不需要費心去一一檢視搜尋引擎回傳的網頁，對於資訊檢索的效率與資訊的普及都有很大幫助。從系統內部來看，問答系統使用了大量有別於傳統資訊檢索系統自然語言處理技術，如自然語言剖析（Natural Language Parsing）、問題分類（Question Classification）、專名辨識（Named Entity Recognition）等等。少數系統甚至會使用複雜的邏輯推理機制，來區隔出需要推理機制才能夠區隔出來的答案。在系統所使用的資料上，除了傳統資訊檢索會使用到的資料外（如字典），問答系統還會使用本體論等語義資料，或者利用網頁來增加資料的豐富性。

截至目前為止，最著名的問答系統應屬IBM的沃森系統。該系統在2011年於Jeopardy節目中，與人類同場較勁，並獲得最後的勝利。

分類

我們可以從知識領域、答案來源等角度來替問答系統做分類。從知識領域來看，可分為“封閉領域”以及“開放領域”兩類系統。封閉領域系統專注於回答特定領域的問題，如醫藥或特定公司等。由於問題領域受限，系統有比較大的發揮空間，可以導入如專屬本體論等知識，或將答案來源全部轉換成結構性資料，來有效提升系統的表現。開放領域系統則希望不設限問題的內容範圍，天文地理無所不問。系統中所有知識與元件都必須儘量做到與領域不相關，當然難度也相對地提高。

若根據答案來源來區分，可分為“資料庫問答”、“常問問題問答”、“新聞問答”、“網際網路問答”等系統。資料庫是最常見的結構化資料儲存媒介。雖然透過操控SQL語言便能夠有效率地存取資料，但有些系統試圖提供更直覺的自然語言查詢界面，希望能進一步降低學習門檻。1970年代的LUNAR系統算是早期成功的案例，其正確答題率可以達到百分之七十，可回答月球隕石相關資料。微軟的English Query則是近期的一個商業產品。English Query在剖析完英文問句後，會根據底層資料庫結構，自動產生出相對應的SQL查詢。雖然有這些成功系統案例，但資料庫問答系統似乎很難被大眾所接受，其中一個因素可能是因為對於結構化資料來說，結構化的查詢界面在查詢上更為方便。常問問題（Frequently Asked Questions, FAQs）是公司或者長期經營領域中常見的重要資源。一份FAQ資料包含了一個問句以及相對應的答案描述。FAQ問答系統的主要責任在比對使用者問句與現有FAQ問句的相似度，此與其他問答系統著重在答案語料中擷取答案的作法不同。另一種重要的系統為新聞問答系統。今日新聞媒體都已經數位化了，每日累積所產生的新聞資訊量是相當可觀的，加上新聞的內容廣泛豐富，作為開放領域問答系統的答案來源是最適合不過的。這樣的特性使得此類系統的評估較為容易，因此稍後會提到的國際評估會議都是採用此類系統作為評估對象。最後一類的是網際網路問答系統，這些系統利用搜尋引擎回傳的結果網頁，從中擷取答案。主要挑戰在於如何處理網路多異質性的資料，以及高噪聲網頁過濾等問題。

請求問答系統

基本介紹

簡介

問答系統

分類

知識檢索

概述

特徵

知識檢索的理論基礎

相關詞條

熱門詞條