基於人工智慧的深度問答服務提供方法和裝置

基於人工智慧的深度問答服務提供方法和裝置

《基於人工智慧的深度問答服務提供方法和裝置》是百度線上網路技術(北京)有限公司於2015年9月7日申請的專利,該專利的公布號為CN105159996A,授權公布日為2015年12月16日,發明人是馬艷軍、呂雅娟、吳華、肖欣延、張偉萌、李興建。

《基於人工智慧的深度問答服務提供方法和裝置》公開了一種基於人工智慧的深度問答服務提供方法和裝置,其中,方法包括:獲取用戶輸入的問題信息;根據問題信息獲取用戶的用戶需求信息;根據用戶需求信息將問題信息分發至對應的至少一個問答服務模組;接收至少一個問答服務模組返回的問答結果,並對問答結果進行決策以確定最終的問答結果。該發明實施例的基於人工智慧的深度問答服務提供方法和裝置,通過用戶輸入的問題信息,獲取用戶的用戶需求信息,並根據用戶需求信息將問題信息分發至至少一個問答服務模組,並接收至少一個問答服務模組返回的問答結果,最終對問答結果進行決策以確定最終的問答結果,能夠針對用戶的深度問題為用戶提供更加準確的問答結果,提升用戶使用滿意度。

2020年7月14日,《基於人工智慧的深度問答服務提供方法和裝置》獲得第二十一屆中國專利獎優秀獎。

(概述圖為《基於人工智慧的深度問答服務提供方法和裝置》摘要附圖)

基本介紹

  • 中文名:基於人工智慧的深度問答服務提供方法和裝置
  • 申請人:百度線上網路技術(北京)有限公司
  • 申請日:2015年9月7日
  • 申請號:2015105648265
  • 公布號:CN105159996A
  • 公布日:2015年12月16日
  • 發明人:馬艷軍、呂雅娟、吳華、肖欣延、張偉萌、李興建
  • 地址:北京市海淀區上地十街10號百度大廈三層
  • Int. Cl.:G06F17/30(2006.01)I
  • 代理機構:北京清亦華智慧財產權代理事務所
  • 代理人:宋合成
  • 類別:發明專利
專利背景,發明內容,專利目的,技術方案,改善效果,附圖說明,技術領域,權利要求,實施方式,榮譽表彰,

專利背景

隨著科技的不斷進步,搜尋引擎已成為人們生活中必不可少的部分,並日趨智慧型化。2015年前,傳統的搜尋引擎的互動方式是用戶輸入搜尋關鍵字,搜尋引擎返回與用戶需求相關的搜尋結果,並按照相關性由高到低的順序排序。用戶可瀏覽和點擊搜尋結果,並從中選擇感興趣或有需求的信息和內容。其中,有的搜尋引擎利用了框計算技術與知識圖譜技術。框計算技術主要是搜尋引擎針對用戶輸入的查詢關鍵字直接提供結果或者服務。例如:用戶在搜尋引擎中搜尋“北京天氣”、“人民幣美元匯率”、“五一放假”等關鍵字,都可以在搜尋結果頁面的最頂端展現結果。而知識圖譜技術旨在將與用戶需求相關的知識組織並展現成一張“知識圖”,以滿足用戶對背景知識的需求以及延伸的需求。例如搜尋“劉德華”,通過知識圖譜技術,搜尋引擎可展現劉德華的身高、生日、影視作品等背景知識,以及“張學友”、“朱麗倩”等其他相關人物。
另外,有的搜尋系統還可以基於自然語言,通過與用戶進行互動問答的方式,向用戶提供所需的資源。例如:在智慧型手機端,用戶可以通過如:蘋果siri、谷歌googlenow、百度語音助手等移動套用來獲取所需資源。上述套用主要通過語音作為載體,以自然語言的形式向系統發出本地服務、網上搜尋等指令,並以語音播報的形式向用戶反饋結果。
此外,用戶還可以向深度問答系統提問,獲得相應的答案。例如“黃河流經哪幾個省”、“英國的首都是哪座城市”等。
但是,在實現《基於人工智慧的深度問答服務提供方法和裝置》過程中,該發明人發現2015年之前的技術中至少存在如下問題:當前系統只能用於回答已有知識庫中已存在的簡單問題,而對於複雜度較高、時效性強、與用戶主觀觀點相關的深度問題等,則很難做出有效回答,並且人機互動方式不夠簡便、自然。

發明內容

專利目的

《基於人工智慧的深度問答服務提供方法和裝置》旨在至少在一定程度上解決相關技術中的技術問題之一。為此,該發明的一個目的在於提出一種基於人工智慧的深度問答服務提供方法,能夠針對用戶的深度問題為用戶提供更加準確的問答結果,提升用戶使用滿意度。
《基於人工智慧的深度問答服務提供方法和裝置》的第二個目的在於提出一種基於人工智慧的深度問答服務提供裝置。

技術方案

為了實現上述目的,《基於人工智慧的深度問答服務提供方法和裝置》第一方面實施例提出了一種基於人工智慧的深度問答服務提供方法,包括:S1、獲取用戶輸入的問題信息;S2、根據所述問題信息獲取用戶的用戶需求信息;S3、根據所述用戶需求信息將所述問題信息分發至對應的至少一個問答服務模組;以及S4、接收所述至少一個問答服務模組返回的問答結果,並對所述問答結果進行決策以確定最終的問答結果。
《基於人工智慧的深度問答服務提供方法和裝置》實施例的基於人工智慧的深度問答服務提供方法,通過獲取用戶輸入的問題信息,並根據問題信息獲取用戶的用戶需求信息,以及根據用戶需求信息將問題信息分發至對應的至少一個問答服務模組,並接收至少一個問答服務模組返回的問答結果,最終對問答結果進行決策以確定最終的問答結果,能夠針對用戶的深度問題為用戶提供更加準確的問答結果,提升用戶使用滿意度。
《基於人工智慧的深度問答服務提供方法和裝置》第二方面實施例提出了一種基於人工智慧的深度問答服務提供裝置,包括:輸入接收模組、多個問答服務模組、分發模組和決策模組,其中,所述多個問答服務模組,用於根據接收到的問題信息生成問答結果並返回至所述決策模組;所述輸入接收模組,用於獲取用戶輸入的問題信息;所述分發模組,用於根據所述問題信息獲取用戶的用戶需求信息,並根據所述用戶需求信息將所述問題信息分發至對應的至少一個問答服務模組;以及所述決策模組,用於接收所述至少一個問答服務模組返回的問答結果,並對所述問答結果進行決策以確定最終的問答結果。

改善效果

《基於人工智慧的深度問答服務提供方法和裝置》實施例的基於人工智慧的深度問答服務提供裝置,通過獲取用戶輸入的問題信息,並根據問題信息獲取用戶的用戶需求信息,以及根據用戶需求信息將問題信息分發至對應的至少一個問答服務模組,並接收至少一個問答服務模組返回的問答結果,最終對問答結果進行決策以確定最終的問答結果,能夠針對用戶的深度問題為用戶提供更加準確的問答結果,提升用戶使用滿意度。

附圖說明

圖1是根據《基於人工智慧的深度問答服務提供方法和裝置》一個實施例的基於人工智慧的深度問答服務提供方法的流程圖一。
圖2是根據《基於人工智慧的深度問答服務提供方法和裝置》一個實施例的對問答結果進行決策的流程圖。
圖3是根據《基於人工智慧的深度問答服務提供方法和裝置》一個實施例的基於人工智慧的深度問答服務提供方法的流程圖二。
圖4是根據《基於人工智慧的深度問答服務提供方法和裝置》一個實施例的基於人工智慧的深度問答服務提供裝置的結構示意圖一。
圖5是根據《基於人工智慧的深度問答服務提供方法和裝置》一個實施例的基於人工智慧的深度問答服務提供裝置的結構示意圖二。
圖6是根據《基於人工智慧的深度問答服務提供方法和裝置》一個實施例的深度問答服務模組的結構示意圖。
圖7是根據《基於人工智慧的深度問答服務提供方法和裝置》一個實施例的信息搜尋服務模組的結構示意圖。
圖8是根據《基於人工智慧的深度問答服務提供方法和裝置》一個實施例的決策模組的結構示意圖一。
圖9是根據《基於人工智慧的深度問答服務提供方法和裝置》一個實施例的決策模組的結構示意圖二。
圖10是根據《基於人工智慧的深度問答服務提供方法和裝置》一個實施例的基於人工智慧的深度問答服務提供裝置的結構示意圖三。

技術領域

《基於人工智慧的深度問答服務提供方法和裝置》涉及人工智慧技術領域,尤其涉及一種基於人工智慧的深度問答服務提供方法和裝置。

權利要求

1.一種基於人工智慧的深度問答服務提供方法,其特徵在於,包括以下步驟:
S1、獲取用戶輸入的問題信息;
S2、根據所述問題信息獲取用戶的用戶需求信息;
S3、根據所述用戶需求信息將所述問題信息分發至對應的至少一個問答服務模組;以及
S4、接收所述至少一個問答服務模組返回的問答結果,並對所述問答結果進行決策以確定最終的問答結果。
2.如權利要求1所述的方法,其特徵在於,在所述步驟S1之後,還包括:
S5、獲取與所述用戶的對話互動信息;
S6、根據所述對話互動信息的對話上文對所述問題信息進行補全。
3.如權利要求1所述的方法,其特徵在於,所述步驟S4具體包括:
S41、接收所述至少一個問答服務模組返回的問答結果;
S42、根據所述問題信息生成需求分析特徵;
S43、獲取各個問答服務模組返回的問答結果的置信度特徵、所述用戶的對話互動信息的上下文特徵以及所述用戶的個性化模型特徵;
S44、根據所述需求分析特徵、所述問答結果的置信度特徵、所述用戶的對話互動信息的上下文特徵以及所述用戶的個性化模型特徵對所述問答結果進行決策以確定最終的問答結果。
4.如權利要求3所述的方法,其特徵在於,其中,所述需求分析特徵、所述問答結果的置信度特徵、所述用戶的對話互動信息的上下文特徵以及所述用戶的個性化模型特徵分別對應有各自的決策權重。
5.如權利要求4所述的方法,其特徵在於,所述步驟S4還包括:根據所述用戶的日誌基於增強學習模型對所述需求分析特徵、所述問答結果的置信度特徵、所述用戶的對話互動信息的上下文特徵以及所述用戶的個性化模型特徵的決策權重進行訓練。
6.如權利要求1所述的方法,其特徵在於,所述問答服務模組包括阿拉丁服務模組、垂類服務模組、深度問答服務模組和信息搜尋服務模組。
7.如權利要求6所述的方法,其特徵在於,還包括:所述深度問答服務模組接收所述問題信息;所述深度問答服務模組根據所述問題信息獲取對應的問題類型;所述深度問答服務模組根據所述問題類型選擇對應的問答模式,並根據選擇的答案生成模式和所述問題信息生成對應的問答結果。
8.如權利要求7所述的方法,其特徵在於,當所述問題類型為實體類型時,所述根據選擇的答案生成模式和所述問題信息生成對應的問答結果具體包括:根據所述問題信息生成實體類問題信息;基於搜尋引擎抓取的摘要和歷史展現日誌對所述實體類問題信息進行擴展以生成同族實體問題信息簇,其中,所述同族實體問題信息簇分別對應候選答案;從所述同族實體問題信息簇分別對應候選答案中抽取候選實體;計算所述候選實體的置信度;以及將所述置信度大於預設定信度閾值的候選實體作為問答結果進行反饋。
9.如權利要求7所述的方法,其特徵在於,當所述問題類型為觀點類型時,所述根據選擇的答案生成模式和所述問題信息生成對應的問答結果具體包括:獲取所述問題信息對應的候選答案;對所述候選答案進行切分以生成多個候選答案短句;對所述多個候選答案短句進行聚合以生成觀點聚合簇;判斷所述觀點聚合簇的觀點類型;根據所述觀點類型從所述觀點聚合簇中選擇出答案觀點,並生成所述答案觀點對應的摘要;對所述答案觀點進行評分,並將評分大於預設評分閾值的答案觀點作為問答結果進行反饋。
10.如權利要求9所述的方法,其特徵在於,所述對所述多個候選答案短句進行聚合以生成觀點聚合簇具體包括:提取所述多個候選答案短句中的關鍵字;計算每兩個所述關鍵字之間的向量夾角和/或語義相似度;對所述向量夾角小於預設角度或語義相似度大於預設閾值的所述候選答案進行聚合以生成觀點聚合簇。
11.如權利要求7所述的方法,其特徵在於,當所述問題類型為片段類型時,所述根據選擇的答案生成模式和所述問題信息生成對應的問答結果具體包括:獲取所述問題信息對應的候選答案;對所述候選答案進行切分以生成多個候選答案短句;對所述多個候選答案短句進行重要度打分以生成所述候選答案短句對應的短句重要度特徵;根據所述短句重要度特徵生成答案摘要;根據所述答案摘要的短句重要度特徵對答案質量進行打分,並根據打分結果對候選答案進行排序;將排序結果作為問答結果進行反饋。
12.如權利要求11所述的方法,其特徵在於,所述根據所述答案摘要的短句重要度特徵對答案質量進行打分具體包括:根據所述答案摘要的短句重要度特徵、答案權威性、問題信息的相關性和答案的豐富度對答案質量進行打分。
13.如權利要求11所述的方法,其特徵在於,所述根據打分結果對候選答案進行排序具體包括:獲取用戶的行為數據;以及根據所述用戶的行為數據和所述打分結果對所述候選答案進行排序。
14.如權利要求1-13任一項所述的方法,其特徵在於,還包括:所述信息搜尋服務模組接收所述問題信息;所述信息搜尋服務模組根據所述問題信息進行搜尋以生成多個候選網頁;所述信息搜尋服務模組對所述候選網頁進行篇章分析以生成對應的摘要,並將摘要作為問答結果進行反饋。
15.如權利要求1-14任一項所述的方法,其特徵在於,所述對所述候選網頁進行篇章分析以生成對應的摘要具體包括:對所述候選網頁進行篇章分析以生成對應的候選篇章;對所述候選篇章中的句子進行打分排序;以及根據打分排序結果生成所述摘要。
16.如權利要求15所述的方法,其特徵在於,所述根據打分排序結果生成所述摘要具體包括:獲取用戶的需求場景信息;根據所述需求場景信息和所述打分排序結果生成所述摘要。
17.如權利要求15所述的方法,其特徵在於,還包括:對多個候選篇章的信息進行聚合。
18.一種基於人工智慧的深度問答服務提供裝置,其特徵在於,包括輸入接收模組、多個問答服務模組、分發模組和決策模組,其中,所述輸入接收模組,用於獲取用戶輸入的問題信息;所述分發模組,用於根據所述問題信息獲取用戶的用戶需求信息,並根據所述用戶需求信息將所述問題信息分發至對應的至少一個問答服務模組;所述多個問答服務模組,用於根據接收到的問題信息生成問答結果並返回至所述決策模組;所述決策模組,用於接收所述至少一個問答服務模組返回的問答結果,並對所述問答結果進行決策以確定最終的問答結果。
19.如權利要求18所述的裝置,其特徵在於,還包括:補全模組,用於獲取與所述用戶的對話互動信息,並根據所述對話互動信息的對話上文對所述問題信息進行補全。
20.如權利要求18所述的裝置,其特徵在於,所述決策模組具體包括:問答結果接收子模組,用於接收所述至少一個問答服務模組返回的問答結果;分析子模組,用於根據所述問題信息生成需求分析特徵,並獲取各個問答服務模組返回的問答結果的置信度特徵、所述用戶的對話互動信息的上下文特徵以及所述用戶的個性化模型特徵;決策子模組,用於根據所述需求分析特徵、所述問答結果的置信度特徵、所述用戶的對話互動信息的上下文特徵以及所述用戶的個性化模型特徵對所述問答結果進行決策以確定最終的問答結果。
21.如權利要求20所述的裝置,其特徵在於,其中,所述需求分析特徵、所述問答結果的置信度特徵、所述用戶的對話互動信息的上下文特徵以及所述用戶的個性化模型特徵分別對應有各自的決策權重。
22.如權利要求21所述的裝置,其特徵在於,所述決策模組還包括:訓練子模組,用於根據所述用戶的日誌基於增強學習模型對所述需求分析特徵、所述問答結果的置信度特徵、所述用戶的對話互動信息的上下文特徵以及所述用戶的個性化模型特徵的決策權重進行訓練。
23.如權利要求18所述的裝置,其特徵在於,所述問答服務模組包括阿拉丁服務模組、垂類服務模組、深度問答服務模組和信息搜尋服務模組。
24.如權利要求23所述的裝置,其特徵在於,所述深度問答服務模組包括:第一接收子模組,用於接收所述問題信息;問題類型獲取子模組,用於根據所述問題信息獲取對應的問題類型;第一問答結果生成子模組,用於根據所述問題類型選擇對應的問答模式,並根據選擇的答案生成模式和所述問題信息生成對應的問答結果。
25.如權利要求24所述的裝置,其特徵在於,當所述問題類型為實體類型時,所述第一問答結果生成子模組根據所述問題信息生成實體類問題信息,並基於搜尋引擎抓取的摘要和歷史展現日誌對所述實體類問題信息進行擴展以生成同族實體問題信息簇,其中,所述同族實體問題信息簇分別對應候選答案,以及從所述同族實體問題信息簇分別對應候選答案中抽取候選實體,並計算所述候選實體的置信度,以及將所述置信度大於預設定信度閾值的候選實體作為問答結果進行反饋。
26.如權利要求24所述的裝置,其特徵在於,當所述問題類型為觀點類型時,所述第一問答結果生成子模組獲取所述問題信息對應的候選答案,並對所述候選答案進行切分以生成多個候選答案短句,以及對所述多個候選答案短句進行聚合以生成觀點聚合簇,並判斷所述觀點聚合簇的觀點類型,以及根據所述觀點類型從所述觀點聚合簇中選擇出答案觀點,並生成所述答案觀點對應的摘要,以及對所述答案觀點進行評分,並將評分大於預設評分閾值的答案觀點作為問答結果進行反饋。
27.如權利要求26所述的裝置,其特徵在於,所述第一問答結果生成子模組,具體用於:提取所述多個候選答案短句中的關鍵字,並計算每兩個所述關鍵字之間的向量夾角和/或語義相似度,以及對所述向量夾角小於預設角度或語義相似度大於預設閾值的所述候選答案進行聚合以生成觀點聚合簇。
28.如權利要求24所述的裝置,其特徵在於,當所述問題類型為片段類型時,所述第一問答結果生成子模組獲取所述問題信息對應的候選答案,並對所述候選答案進行切分以生成多個候選答案短句,以及對所述多個候選答案短句進行重要度打分以生成所述候選答案短句對應的短句重要度特徵,並根據所述短句重要度特徵生成答案摘要,以及根據所述答案摘要的短句重要度特徵對答案質量進行打分,並根據打分結果對候選答案進行排序,以及將排序結果作為問答結果進行反饋。
29.如權利要求28所述的裝置,其特徵在於,所述第一問答結果生成子模組,具體用於:根據所述答案摘要的短句重要度特徵、答案權威性、問題信息的相關性和答案的豐富度對答案質量進行打分。
30.如權利要求28所述的裝置,其特徵在於,所述第一問答結果生成子模組,具體用於:獲取用戶的行為數據,並根據所述用戶的行為數據和所述打分結果對所述候選答案進行排序。
31.如權利要求18所述的裝置,其特徵在於,所述信息搜尋服務模組具體包括:第二接收子模組,用於接收所述問題信息;搜尋子模組,用於根據所述問題信息進行搜尋以生成多個候選網頁;第二問答結果生成子模組,用於對所述候選網頁進行篇章分析以生成對應的摘要,並將摘要作為問答結果進行反饋。
32.如權利要求31所述的裝置,其特徵在於,所述第二問答結果生成子模組具體包括:篇章生成單元,用於對所述候選網頁進行篇章分析以生成對應的候選篇章;排序單元,用於對所述候選篇章中的句子進行打分排序;以及摘要生成單元,用於根據打分排序結果生成所述摘要。
33.如權利要求32所述的裝置,其特徵在於,所述摘要生成單元,具體用於:獲取用戶的需求場景信息,並根據所述需求場景信息和所述打分排序結果生成所述摘要。
34.如權利要求32所述的裝置,其特徵在於,所述第二問答結果生成子模組還包括:聚合單元,用於對多個候選篇章的信息進行聚合。

實施方式

下面參考附圖描述《基於人工智慧的深度問答服務提供方法和裝置》實施例的基於人工智慧的人機互動的互動引導方法和裝置。
圖1是根據《基於人工智慧的深度問答服務提供方法和裝置》一個實施例的基於人工智慧的深度問答服務提供方法的流程圖。
如圖1所示,基於人工智慧的深度問答服務提供方法可包括:
S1、獲取用戶輸入的問題信息。
其中,問題信息可以是文字信息,也可以是語音信息。例如,用戶輸入的問題信息“北京有什麼小吃?”。
S2、根據問題信息獲取用戶的用戶需求信息。
具體地,可對問題信息進行需求分析,從而獲取用戶的用戶需求信息。舉例來說,用戶需求信息可以為垂類需求、阿拉丁需求、深度問答需求、信息搜尋需求等。
S3、根據用戶需求信息將問題信息分發至對應的至少一個問答服務模組。
其中,問答服務模組可包括阿拉丁服務模組、垂類服務模組、深度問答服務模組和信息搜尋服務模組。
在《基於人工智慧的深度問答服務提供方法和裝置》的一個實施例中,當用戶需求信息為阿拉丁需求時,可將問題信息分發至阿拉丁服務模組;當用戶需求信息為垂類需求時,可將問題信息分發至垂類服務模組;當用戶需求信息為深度問答需求時,可將問題信息分發至深度問答服務模組;當用戶需求信息為信息搜尋需求時,可將問題分發至信息搜尋服務模組。
其中,阿拉丁服務是能夠為用戶需求提供精準滿足的一類服務的統稱,例如美元兌換人民幣、2015年春節放假等。舉例來說,用戶的問題信息為“劉德華的老婆是誰?”,則可對該問題信息進行分析,可分析出需求類型為“人物”,查詢主體為“劉德華”,查詢屬性為“老婆”,並可將查詢屬性進行歸一,將查詢屬性歸一為“妻子”。然後搜尋並獲得結果欄位為“朱麗倩”,再基於自然語言生成技術(NaturalLanguageGeneration)生成問答結果“劉德華的老婆是朱麗倩”。再例如:用戶的問題信息為“北京明天熱嗎?”,通過搜尋並獲得結果欄位為“35攝氏度”,可基於常識知識庫和預設的規則,生成問答結果“明天天氣很熱,最高溫度為35攝氏度,建議注意防暑降溫。”其中,常識知識庫可包括常識類知識,如溫度高於30攝氏度屬於天氣熱。
垂類服務是針對垂類需求進行多輪互動的服務,例如“訂機票”等。垂類服務主要通過對話控制技術(DialogueManagement)和對話策略技術(DialoguePolicy),對用戶的需求進行澄清,從而向用戶提供滿足用戶需求的問答結果。舉例來說,用戶的問題信息為“北京到上海的機票”,則可對該問題信息進行分析,然後向用戶反問“您的出發日期是哪天?”,用戶回答“明天”,然後繼續反問“您對航空公司是否有要求?”等,逐步澄清用戶的需求,並最終返回滿足用戶需求的問答結果。
深度問答服務為針對用戶輸入的問題信息,基於深入的語義分析和知識挖掘技術,從而為用戶提供精準的問答結果的服務。當用戶需求信息為深度問答需求時,深度問答服務模組可接收問題信息,並根據問題信息獲取對應的問題類型,然後根據問題類型選擇對應的問答模式,以及根據選擇的答案生成模式和問題信息生成對應的問答結果。其中,問題類型可包括實體類型、觀點類型和片段類型。
更具體地,當問題類型為實體類型時,可根據問題信息生成實體類問題信息,並基於搜尋引擎抓取的摘要和歷史展現日誌對實體類問題信息進行擴展以生成同族實體問題信息簇。其中,同族實體問題信息簇分別對應候選答案。然後從同族實體問題信息簇分別對應候選答案中抽取候選實體,再計算候選實體的置信度,以及將置信度大於預設定信度閾值的候選實體作為問答結果進行反饋。舉例來說,問題信息為“劉德華老婆是誰?”,候選答案為“其實早在九二年時就有報導,劉德華和朱麗倩已經在加拿大秘密註冊結婚…”,其中,候選實體為“劉德華”、“朱麗倩”、“加拿大”。然後基於實體知識庫和問答語義匹配模型計算各候選實體的置信度,可計算出候選實體“朱麗倩”的置信度大於預設定信度閾值,則可確定“朱麗倩”為問答結果。另外,還可將候選答案中首次出現“朱麗倩”的分句作為答案摘要。
當問題類型為觀點類型時,可獲取問題信息對應的候選答案,並對候選答案進行切分以生成多個候選答案短句,然後對多個候選答案短句進行聚合以生成觀點聚合簇。具體地,可根據短句中辭彙的IDF(反文檔頻率)得分提取候選答案短句中的關鍵字,並對包含否定詞的關鍵字進行泛化並生成否定標籤,然後基於否定標籤將關鍵字用向量進行表示,計算每兩個關鍵字之間的向量夾角和/或語義相似度,然後對向量夾角小於預設角度或語義相似度大於預設閾值的候選答案進行聚合以生成觀點聚合簇。
在此之後,可判斷觀點聚合簇的觀點類型。其中,觀點可包括是非類、評價類、建議類等。具體地,可通過預先設定的規則或者基於統計模型確定觀點聚合簇的觀點類型。然後根據觀點類型從對應的觀點聚合簇中選擇出答案觀點。其中,選擇答案觀點的規則可包括但不僅限於選取信息覆蓋最全面的答案觀點、選取IDF*log(IDF)值最低的答案觀點和選取在候選答案對應的文章中出現次數最多的答案觀點。其中,IDF為反文檔頻率。在此之後,可生成答案觀點對應的摘要,然後可對答案觀點進行評分,並將評分大於預設評分閾值的答案觀點作為問答結果進行反饋。舉例來說,問題信息為“懷孕注意事項”,其中一個候選答案為“懷孕時應謹守醫、多、戰原則,亦即定期看醫師,多臥床休息,戰勝自己的不良習慣。”,可將該候選答案切分為“懷孕時應謹守醫、多、戰原則”、“亦即定期看醫師”、“多臥床休息”、“戰勝自己的不良習慣”四個候選答案短句。然後可將候選答案短句中重複的內容或者近似的內容進行聚合生成觀點聚合簇,並選出答案觀點。之後,可根據信息豐富度、論據充分度、信息冗餘度等對答案觀點進行評分,並將評分大於預設評分閾值的答案觀點作為問答結果進行反饋。此外,在選出答案觀點後,可獲取其在來源文章中所在的句子,然後按照預定長度截取句子,從而生成該答案觀點對應的摘要。之後可根據內容豐富度、答案權威性對摘要進行排序。
當問題類型為片段類型時,可獲取問題信息對應的候選答案,並對候選答案進行切分以生成多個候選答案短句,然後對多個候選答案短句進行重要度打分以生成候選答案短句對應的短句重要度特徵,並根據短句重要度特徵生成答案摘要,然後可根據答案摘要的短句重要度特徵、答案權威性、問題信息的相關性和答案的豐富度對答案質量進行打分。其中,短句重要度特徵可包括聚合特徵、相關度特徵、類型特徵和問題答案匹配度特徵。其中,聚合特徵用於衡量短句的重複度,例如:詞向量質心特徵、NGram(計算出現機率)特徵、Lexrank(多文本自動摘要)特徵等。類型特徵為問題的類型特徵,如WHAT(什麼)類型、WHY(為什麼)類型、HOW(如何)類型等。答案權威性為答案來源的網站的權威度。在此之後,可獲取用戶的行為數據,然後根據用戶的行為數據和打分結果對候選答案進行排序,最終將排序結果作為問答結果進行反饋。其中,用戶的行為數據是可包括用戶對問答結果的點擊行為、在問答結果上停留的時間、通過當前的問答結果跳轉至其他問答結果等用戶的歷史行為信息。
當用戶需求信息為信息搜尋需求時,信息搜尋服務模組可接收問題信息,並根據問題信息進行搜尋以生成多個候選網頁,然後對候選網頁進行篇章分析以生成對應的候選篇章。具體地,可對候選網頁進行篇章內容抽取、篇章主題分割和篇章關係分析生成對應的候選篇章。其中,篇章內容抽取主要為識別候選網頁的正文部分,刪除與用戶需求信息無關的內容。篇章主題分割為對篇章的主題結構進行分析,可將篇章劃分為多個子主題。篇章關係分析為分析篇章中多個子主題之間的關係,例如並列關係等。在生成候選篇章之後,可對候選篇章中的句子進行打分排序。其中,打分排序主要基於句子在候選篇章中的重要度以及句子與用戶需求信息之間的相關度。在此之後,可獲取用戶的需求場景信息,並根據需求場景信息和打分排序結果生成摘要,最終將摘要作為問答結果進行反饋。其中場景信息可包括移動終端場景、電腦場景。當場景信息為移動終端場景時,則可對句子進行壓縮簡寫,使生成的摘要儘量簡明扼要;當場景信息為電腦場景時,可對句子進行拼接融合,使得生成的摘要詳細清楚。當然,生成候選篇章時,由於候選篇章中的內容均與用戶需求信息具有相關性,則可能會有重複或互補的內容,則需要對多個候選篇章的信息進行聚合。
S4、接收至少一個問答服務模組返回的問答結果,並對問答結果進行決策以確定最終的問答結果。具體地,如圖2所示,可包括以下步驟:
S41、接收至少一個問答服務模組返回的問答結果。
S42、根據問題信息生成需求分析特徵。
S43、獲取各個問答服務模組返回的問答結果的置信度特徵、用戶的對話互動信息的上下文特徵以及用戶的個性化模型特徵。
S44、根據需求分析特徵、問答結果的置信度特徵、用戶的對話互動信息的上下文特徵以及用戶的個性化模型特徵對問答結果進行決策以確定最終的問答結果。
具體地,對問答結果進行決策以確定最終的問答結果主要基於以下幾個特徵:1、需求分析特徵,通過對用戶的問題信息進行需求分析,可選擇更符合用戶需求的問答服務模組提供的問答結果。2、問答結果置信度特徵,每個問答服務模組提供的問答結果均具有置信度,可選擇置信度高的問答結果。3、用戶的對話互動信息的上下文特徵,可選擇更符合上下文信息的問答結果。4、用戶的個性化模型特徵,可選擇更符合用戶個性化需求的問答結果。其中,需求分析特徵、問答結果的置信度特徵、用戶的對話互動信息的上下文特徵以及用戶的個性化模型特徵分別對應有各自的決策權重。基於以上特徵對問答結果進行決策,從而確定最終的問答結果。在確定最終的問答結果後,可反饋給用戶,從而滿足用戶的需求。其中,問答結果可通過語音播報的方式,亦可以通過螢幕顯示的方式反饋給用戶。採用語音播報的方式使得人機互動的過程更加簡便、自然。
另外,還可根據用戶的日誌基於增強學習模型對需求分析特徵、問答結果的置信度特徵、用戶的對話互動信息的上下文特徵以及用戶的個性化模型特徵的決策權重進行訓練,從而為用戶提供更符合用戶需求的問答結果。
另外,如圖3所示,在步驟S1之後,還可包括以下步驟:
S5、獲取與用戶的對話互動信息。
S6、根據對話互動信息的對話上文對問題信息進行補全。
具體地,在多輪互動過程中,用戶通常會基於對話上文省略問題信息中的一部分內容,因此需要對問題信息進行補全,從而澄清用戶的需求。例如:對話上文為“北京有什麼小吃?”,而問題信息為“那特產呢?”,則需要對用戶輸入的問題信息進行補全,生成新的問題信息“北京有什麼特產?”。
《基於人工智慧的深度問答服務提供方法和裝置》實施例的基於人工智慧的深度問答服務提供方法,通過獲取用戶輸入的問題信息,並根據問題信息獲取用戶的用戶需求信息,以及根據用戶需求信息將問題信息分發至對應的至少一個問答服務模組,並接收至少一個問答服務模組返回的問答結果,最終對問答結果進行決策以確定最終的問答結果,能夠針對用戶的深度問題為用戶提供更加準確的問答結果,提升用戶使用滿意度。
為實現上述目的,《基於人工智慧的深度問答服務提供方法和裝置》還提出一種基於人工智慧的深度問答服務提供裝置。
圖4是根據《基於人工智慧的深度問答服務提供方法和裝置》一個實施例的基於人工智慧的深度問答服務提供裝置的結構示意圖一。
如圖4所示,該基於人工智慧的深度問答服務提供裝置可包括:輸入接收模組1000、分發模組2000、問答服務模組3000和決策模組4000。
輸入接收模組1000用於獲取用戶輸入的問題信息。其中,問題信息可以是文字信息,也可以是語音信息。例如,用戶輸入的問題信息“北京有什麼小吃?”。分發模組2000用於根據問題信息獲取用戶的用戶需求信息,並根據用戶需求信息將問題信息分發至對應的至少一個問答服務模組3000。其中,如圖5所示,問答服務模組3000可包括阿拉丁服務模組3100、垂類服務模組3200、深度問答服務模組3300和信息搜尋服務模組3400。
具體地,分發模組2000可對問題信息進行需求分析,從而獲取用戶的用戶需求信息。舉例來說,當用戶需求信息為阿拉丁需求時,可將問題信息分發至阿拉丁服務模組;當用戶需求信息為垂類需求時,可將問題信息分發至垂類服務模組;當用戶需求信息為深度問答需求時,可將問題信息分發至深度問答服務模組;當用戶需求信息為信息搜尋需求時,可將問題分發至信息搜尋服務模組。
多個問答服務模組3000用於根據接收到的問題信息生成問答結果並返回至決策模組4000。
其中,阿拉丁服務是能夠為用戶需求提供精準滿足的一類服務的統稱,例如美元兌換人民幣、2015年春節放假等。舉例來說,用戶的問題信息為“劉德華的老婆是誰?”,則阿拉丁服務模組3100可對該問題信息進行分析,可分析出需求類型為“人物”,查詢主體為“劉德華”,查詢屬性為“老婆”,並可將查詢屬性進行歸一,將查詢屬性歸一為“妻子”。然後搜尋並獲得結果欄位為“朱麗倩”,再基於自然語言生成技術(NaturalLanguageGeneration)生成問答結果“劉德華的老婆是朱麗倩”。再例如:用戶的問題信息為“北京明天熱嗎?”,通過搜尋並獲得結果欄位為“35攝氏度”,可基於常識知識庫和預設的規則,生成問答結果“明天天氣很熱,最高溫度為35攝氏度,建議注意防暑降溫。”其中,常識知識庫可包括常識類知識,如溫度高於30攝氏度屬於天氣熱。
垂類服務是針對垂類需求進行多輪互動的服務,例如“訂機票”等。垂類服務模組3200主要通過對話控制技術(DialogueManagement)和對話策略技術(DialoguePolicy),對用戶的需求進行澄清,從而向用戶提供滿足用戶需求的問答結果。舉例來說,用戶的問題信息為“北京到上海的機票”,則可對該問題信息進行分析,然後向用戶反問“您的出發日期是哪天?”,用戶回答“明天”,然後繼續反問“您對航空公司是否有要求?”等,逐步澄清用戶的需求,並最終返回滿足用戶需求的問答結果。
深度問答服務為針對用戶輸入的問題信息,基於深入的語義分析和知識挖掘技術,從而為用戶提供精準的問答結果的服務。當用戶需求信息為深度問答需求時,深度問答服務模組3300可接收問題信息,並根據問題信息獲取對應的問題類型,然後根據問題類型選擇對應的問答模式,以及根據選擇的答案生成模式和問題信息生成對應的問答結果。其中,問題類型可包括實體類型、觀點類型和片段類型。
其中,如圖6所示,深度問答服務模組3300具體包括第一接收子模組3310、問題類型獲取子模組3320和第一問答結果生成子模組3330。
第一接收子模組3310用於接收問題信息。問題類型獲取子模組3320用於根據問題信息獲取對應的問題類型。
第一問答結果生成子模組3330用於根據問題類型選擇對應的問答模式,並根據選擇的答案生成模式和問題信息生成對應的問答結果。
當問題類型為實體類型時,可根據問題信息生成實體類問題信息,並基於搜尋引擎抓取的摘要和歷史展現日誌對實體類問題信息進行擴展以生成同族實體問題信息簇。其中,同族實體問題信息簇分別對應候選答案。然後從同族實體問題信息簇分別對應候選答案中抽取候選實體,再計算候選實體的置信度,以及將置信度大於預設定信度閾值的候選實體作為問答結果進行反饋。舉例來說,問題信息為“劉德華老婆是誰?”,候選答案為“其實早在九二年時就有報導,劉德華和朱麗倩已經在加拿大秘密註冊結婚…”,其中,候選實體為“劉德華”、“朱麗倩”、“加拿大”。然後基於實體知識庫和問答語義匹配模型計算各候選實體的置信度,可計算出候選實體“朱麗倩”的置信度大於預設定信度閾值,則可確定“朱麗倩”為問答結果。另外,還可將候選答案中首次出現“朱麗倩”的分句作為答案摘要。
當問題類型為觀點類型時,可獲取問題信息對應的候選答案,並對候選答案進行切分以生成多個候選答案短句,然後對多個候選答案短句進行聚合以生成觀點聚合簇。具體地,可根據短句中辭彙的IDF(反文檔頻率)得分提取多個候選答案短句中的關鍵字,並對包含否定詞的關鍵字進行泛化並生成否定標籤,然後基於否定標籤將關鍵字用向量進行表示,計算每兩個關鍵字之間的向量夾角和/或語義相似度,然後對向量夾角小於預設角度或語義相似度大於預設閾值的候選答案進行聚合以生成觀點聚合簇。
在此之後,可判斷觀點聚合簇的觀點類型。其中,觀點可包括是非類、評價類、建議類等。具體地,可通過預先設定的規則或者基於統計模型確定觀點聚合簇的觀點類型。然後根據觀點類型從對應的觀點聚合簇中選擇出答案觀點。其中,選擇答案觀點的規則可包括但不僅限於選取信息覆蓋最全面的答案觀點、選取IDF*log(IDF)值最低的答案觀點和選取在候選答案對應的文章中出現次數最多的答案觀點。其中,IDF為反文檔頻率。在此之後,可生成答案觀點對應的摘要,然後可對答案觀點進行評分,並將評分大於預設評分閾值的答案觀點作為問答結果進行反饋。舉例來說,問題信息為“懷孕注意事項”,其中一個候選答案為“懷孕時應謹守醫、多、戰原則,亦即定期看醫師,多臥床休息,戰勝自己的不良習慣。”,可將該候選答案切分為“懷孕時應謹守醫、多、戰原則”、“亦即定期看醫師”、“多臥床休息”、“戰勝自己的不良習慣”四個候選答案短句。然後可將候選答案短句中重複的內容或者近似的內容進行聚合生成觀點聚合簇,並選出答案觀點。之後,可根據信息豐富度、論據充分度、信息冗餘度等對答案觀點進行評分,並將評分大於預設評分閾值的答案觀點作為問答結果進行反饋。此外,在選出答案觀點後,可獲取其在來源文章中所在的句子,然後按照預定長度截取句子,從而生成該答案觀點對應的摘要。之後可根據內容豐富度、答案權威性對摘要進行排序。
當問題類型為片段類型時,可獲取問題信息對應的候選答案,並對候選答案進行切分以生成多個候選答案短句,然後對多個候選答案短句進行重要度打分以生成候選答案短句對應的短句重要度特徵,並根據短句重要度特徵生成答案摘要,然後可根據答案摘要的短句重要度特徵、答案權威性、問題信息的相關性和答案的豐富度對答案質量進行打分。其中,短句重要度特徵可包括聚合特徵、相關度特徵、類型特徵和問題答案匹配度特徵。其中,聚合特徵用於衡量短句的重複度,例如:詞向量質心特徵、NGram(計算出現機率)特徵、Lexrank(多文本自動摘要)特徵等。類型特徵為問題的類型特徵,如WHAT(什麼)類型、WHY(為什麼)類型、HOW(如何)類型等。答案權威性為答案來源的網站的權威度。在此之後,可獲取用戶的行為數據,然後根據用戶的行為數據和打分結果對候選答案進行排序,最終將排序結果作為問答結果進行反饋。其中,用戶的行為數據是可包括用戶對問答結果的點擊行為、在問答結果上停留的時間、通過當前的問答結果跳轉至其他問答結果等用戶的歷史行為信息。
如圖7所示,信息搜尋服務模組3400具體包括第二接收子模組3410、搜尋子模組3420和第二問答結果生成子模組3430。其中,第二問答結果生成子模組3430具體包括篇章生成單元3431、排序單元3432、摘要生成單元3433和聚合單元3434。
第二接收子模組3410用於接收問題信息。搜尋子模組3420用於根據問題信息進行搜尋以生成多個候選網頁。第二問答結果生成子模組3430用於對候選網頁進行篇章分析以生成對應的摘要,並將摘要作為問答結果進行反饋。
具體地,篇章生成單元3431可對候選網頁進行篇章內容抽取、篇章主題分割和篇章關係分析生成對應的候選篇章。其中,篇章內容抽取主要為識別候選網頁的正文部分,刪除與用戶需求信息無關的內容。篇章主題分割為對篇章的主題結構進行分析,可將篇章劃分為多個子主題。篇章關係分析為分析篇章中多個子主題之間的關係,例如並列關係等。在生成候選篇章之後,排序單元3432可對候選篇章中的句子進行打分排序。其中,打分排序主要基於句子在候選篇章中的重要度以及句子與用戶需求信息之間的相關度。在此之後,摘要生成單元3433可獲取用戶的需求場景信息,並根據需求場景信息和打分排序結果生成摘要,最終將摘要作為問答結果進行反饋。其中場景信息可包括移動終端場景、電腦場景。當場景信息為移動終端場景時,則可對句子進行壓縮簡寫,使生成的摘要儘量簡明扼要;當場景信息為電腦場景時,可對句子進行拼接融合,使得生成的摘要詳細清楚。當然,生成候選篇章時,由於候選篇章中的內容均與用戶需求信息具有相關性,則可能會有重複或互補的內容,則需要聚合單元3434對多個候選篇章的信息進行聚合。
決策模組4000用於接收至少一個問答服務模組3000返回的問答結果,並對問答結果進行決策以確定最終的問答結果。其中,如圖8所示,決策模組4000可包括問答結果接收子模組4100、分析子模組4200、決策子模組4300。問答結果接收子模組4100用於接收至少一個問答服務模組返回的問答結果。
分析子模組4200用於根據問題信息生成需求分析特徵,並獲取各個問答服務模組返回的問答結果的置信度特徵、用戶的對話互動信息的上下文特徵以及用戶的個性化模型特徵。
決策子模組4300用於根據需求分析特徵、問答結果的置信度特徵、用戶的對話互動信息的上下文特徵以及用戶的個性化模型特徵對問答結果進行決策以確定最終的問答結果。
具體地,對問答結果進行決策以確定最終的問答結果主要基於以下幾個特徵:1、需求分析特徵,通過對用戶的問題信息進行需求分析,可選擇更符合用戶需求的問答服務模組提供的問答結果。2、問答結果置信度特徵,每個問答服務模組提供的問答結果均具有置信度,可選擇置信度高的問答結果。3、用戶的對話互動信息的上下文特徵,可選擇更符合上下文信息的問答結果。4、用戶的個性化模型特徵,可選擇更符合用戶個性化需求的問答結果。其中,需求分析特徵、問答結果的置信度特徵、用戶的對話互動信息的上下文特徵以及用戶的個性化模型特徵分別對應有各自的決策權重。
此外,如圖9所示,決策模組4000還可包括訓練子模組4400。訓練子模組4400用於根據用戶的日誌基於增強學習模型對需求分析特徵、問答結果的置信度特徵、用戶的對話互動信息的上下文特徵以及用戶的個性化模型特徵的決策權重進行訓練,從而為用戶提供更符合用戶需求的問答結果。
另外,如圖10所示,基於人工智慧的深度問答服務提供裝置還可包括補全模組5000。補全模組5000用於獲取與用戶的對話互動信息,並根據對話互動信息的對話上文對問題信息進行補全。
具體地,在多輪互動過程中,用戶通常會基於對話上文省略問題信息中的一部分內容,因此需要對問題信息進行補全,從而澄清用戶的需求。例如:對話上文為“北京有什麼小吃?”,而問題信息為“那特產呢?”,則需要對用戶輸入的問題信息進行補全,生成新的問題信息“北京有什麼特產?”。
《基於人工智慧的深度問答服務提供方法和裝置》實施例的基於人工智慧的深度問答服務提供裝置,通過獲取用戶輸入的問題信息,並根據問題信息獲取用戶的用戶需求信息,以及根據用戶需求信息將問題信息分發至對應的至少一個問答服務模組,並接收至少一個問答服務模組返回的問答結果,最終對問答結果進行決策以確定最終的問答結果,能夠針對用戶的深度問題為用戶提供更加準確的問答結果,提升用戶使用滿意度。

榮譽表彰

2020年7月14日,《基於人工智慧的深度問答服務提供方法和裝置》獲得第二十一屆中國專利獎優秀獎。

相關詞條

熱門詞條

聯絡我們