一種菜品信息的處理方法及裝置

一種菜品信息的處理方法及裝置

《一種菜品信息的處理方法及裝置》是北京三快線上科技有限公司於2017年3月31日申請的專利,該專利的公布號為CN107169013A,授權公布日為2017年9月15日,發明人是曾軻、王瀚森、李露、王露珠。

《一種菜品信息的處理方法及裝置》其中的方法具體包括:確定待識別菜品的依存句法路徑;利用基於菜品元素搭配的路徑模板庫,對所述依存句法路徑對應的菜品元素進行識別,以得到對應的菜品元素識別結果。該申請實施例能夠實現對於新菜品的菜品元素識別,進而提高菜品元素識別的成功率。

2020年7月14日,《一種菜品信息的處理方法及裝置》獲得第二十一屆中國專利獎優秀獎。

(概述圖為《一種菜品信息的處理方法及裝置》摘要附圖)

基本介紹

  • 中文名:一種菜品信息的處理方法及裝置
  • 申請人:北京三快線上科技有限公司
  • 申請日:2017年3月31日
  • 申請號:2017102096657
  • 公布號:CN107169013A
  • 公布日:2017年9月15日
  • 發明人:曾軻、王瀚森、李露、王露珠
  • 地址:北京市海淀區北四環西路9號2106-030
  • Int.Cl.:G06F17/30(2006.01)I
  • 代理機構:北京潤澤恆智慧財產權代理有限公司
  • 代理人:劉祥景
  • 類別:發明專利
專利背景,發明內容,專利目的,技術方案,改善效果,附圖說明,技術領域,權利要求,實施方式,榮譽表彰,

專利背景

隨著信息技術的發展,菜品元素的識別得到了越來越多的套用。菜品元素的識別不僅可以對錯綜複雜的菜品名稱進行結構化的解析識別,而且,經過解析識別後的菜品元素可以進行進一步的挖掘,對於構建用戶畫像等任務都有重要的意義。
2017年3月之前的一種菜品元素的識別方案,通常構建菜品元素的詞庫,這樣,當有一個菜品需要被解析時,通過該菜品的名稱所包含辭彙與詞庫中各個詞條的匹配,來識別該菜品中的各菜品元素。
《一種菜品信息的處理方法及裝置》發明人在實施該申請實施例的過程中發現,2017年3月之前的方案中菜品元素識別的成功率依賴於詞庫的容量,當有新菜品出現時,若詞庫中不含有該新菜品的名稱所包含辭彙,則識別不成功;因此,2017年3月之前的方案中菜品元素識別的成功率較低。

發明內容

專利目的

《一種菜品信息的處理方法及裝置》實施例以便提供一種克服上述問題或者至少部分地解決上述問題的菜品信息的處理方法及裝置,能夠實現對於新菜品的菜品元素識別,進而提高菜品元素識別的成功率。

技術方案

《一種菜品信息的處理方法及裝置》實施例公開了一種菜品信息的處理方法,所述方法包括:確定待識別菜品的依存句法路徑;利用基於菜品元素搭配的路徑模板庫,對所述依存句法路徑對應的菜品元素進行識別,以得到對應的菜品元素識別結果。
可選地,所述對所述依存句法路徑對應的菜品元素進行識別,包括:在基於菜品元素搭配的路徑模板庫中確定與所述依存句法路徑相匹配的目標依存句法路徑模板;依據所述目標依存句法路徑模板對應的菜品元素搭配關係,確定所述依存句法路徑對應的菜品元素。
可選地,所述確定所述待識別菜品的依存句法路徑,包括:對所述待識別菜品名稱進行分詞和詞性標註;分別針對所述待識別菜品名稱所包含的兩個辭彙,構建以所述兩個辭彙為首尾節點的依存句法路徑。
可選地,通過如下步驟建立所述路徑模板庫:針對菜品元素搭配庫中各元素辭彙搭配關係,獲取預置菜品包含的、與所述元素辭彙搭配關係相匹配的兩個目標辭彙;其中,所述元素辭彙搭配關係用於表示屬於不同菜品元素類別的兩個辭彙;分別針對所述預置菜品所包含的兩個目標辭彙,構建以所述兩個目標辭彙為首尾節點的依存句法路徑模板;將所述依存句法路徑模板保存至路徑模板庫;其中,所述路徑模板庫的菜品元素搭配關係與所述元素辭彙搭配關係相匹配。
可選地,通過如下步驟獲取所述元素辭彙搭配關係:獲取多個菜品元素類別對應的菜品元素庫;將對應於不同菜品元素類別的菜品元素庫中兩個辭彙進行搭配,以得到對應的元素辭彙搭配關係。
可選地,通過如下步驟構建所述菜品元素庫:對預置菜品集合中預置菜品的名稱進行分詞和詞性標註;依據所述預置菜品的分詞結果中各分詞的詞頻,構建詞頻集合;依據所述詞頻集合中各辭彙所屬的菜品元素類別,構建對應的菜品元素庫。
可選地,所述方法還包括:利用所述路徑模板庫,對所述預置菜品的依存句法路徑對應的菜品元素進行識別;依據所述預置菜品的菜品元素識別結果,對所述菜品元素庫進行擴充。
可選地,所述路徑模板庫用於存儲依據菜品元素搭配關係得到的依存句法路徑模板。另一方面,該申請實施例公開了一種菜品信息的處理方法,所述方法包括:
獲取待識別菜品;利用多個菜品元素類別對應的菜品元素庫,對所述待識別菜品的菜品元素進行識別,以得到對應的菜品元素識別結果;其中,所述菜品元素庫為依據路徑模板庫擴充得到。
可選地,所述路徑模板庫用於存儲依據菜品元素搭配關係得到的依存句法路徑模板。
可選地,通過如下步驟擴充得到所述菜品元素庫:利用所述路徑模板庫,對預置菜品集合中預置菜品的依存句法路徑對應的菜品元素進行識別;依據所述預置菜品的菜品元素識別結果,對所述菜品元素庫進行擴充。
可選地,所述方法還包括:利用詞向量模型,獲取所述菜品元素庫中詞條的相似詞條;將所述相似詞條擴充至所述菜品元素庫中。
再一方面,該申請實施例公開了一種菜品信息的處理裝置,所述裝置包括:路徑確定模組,用於確定待識別菜品的依存句法路徑;菜品元素識別模組,用於利用基於菜品元素搭配的路徑模板庫,對所述依存句法路徑對應的菜品元素進行識別,以得到對應的菜品元素識別結果。
可選地,所述菜品元素識別模組包括:模板確定子模組,用於在基於菜品元素搭配的路徑模板庫中確定與所述依存句法路徑相匹配的目標依存句法路徑模板;以及菜品元素確定子模組,用於依據所述目標依存句法路徑模板對應的菜品元素搭配關係,確定所述依存句法路徑對應的菜品元素。
可選地,所述裝置還包括:用於建立所述路徑模板庫的模板庫建立模組;所述模板庫建立模組包括:目標辭彙獲取子模組,用於針對菜品元素搭配庫中各元素辭彙搭配關係,獲取預置菜品包含的、與所述元素辭彙搭配關係相匹配的兩個目標辭彙;其中,所述元素辭彙搭配關係用於表示屬於不同菜品元素類別的兩個辭彙;模板構建子模組,用於分別針對所述預置菜品所包含的兩個目標辭彙,構建以所述兩個目標辭彙為首尾節點的依存句法路徑模板;以及模板保存子模組,用於將所述依存句法路徑模板保存至路徑模板庫;其中,所述路徑模板庫的菜品元素搭配關係與所述元素辭彙搭配關係相匹配。
又一方面,該申請實施例公開了一種菜品信息的處理裝置,所述裝置包括:菜品獲取模組,用於獲取待識別菜品;菜品元素識別模組,用於利用多個菜品元素類別對應的菜品元素庫,對所述待識別菜品的菜品元素進行識別,以得到對應的菜品元素識別結果。
可選地,所述裝置還包括:預置菜品元素識別模組,用於利用所述路徑模板庫,對預置菜品集合中預置菜品的依存句法路徑對應的菜品元素進行識別;第一菜品元素庫擴充模組,用於依據所述預置菜品的菜品元素識別結果,對所述菜品元素庫進行擴充。
可選地,所述裝置還包括:相似詞條獲取模組,用於利用詞向量模型,獲取所述菜品元素庫中詞條的相似詞條;第二菜品元素庫擴充模組,用於將所述相似詞條擴充至所述菜品元素庫中。
再一方面,該申請實施例公開了一種計算設備,包括:存儲器、處理器及存儲在存儲器上並可在處理器上運行的電腦程式,其特徵在於,所述處理器執行所述程式時實現以下步驟:確定待識別菜品的依存句法路徑;利用基於菜品元素搭配的路徑模板庫,對所述依存句法路徑對應的菜品元素進行識別,以得到對應的菜品元素識別結果。
又一方面,該申請實施例公開了一種計算機可讀存儲介質,其上存儲有電腦程式,所述程式被處理器執行時實現以下步驟:確定待識別菜品的依存句法路徑;利用基於菜品元素搭配的路徑模板庫,對所述依存句法路徑對應的菜品元素進行識別,以得到對應的菜品元素識別結果。
再一方面,該申請實施例公開了一種計算設備,包括:存儲器、處理器及存儲在存儲器上並可在處理器上運行的電腦程式,其特徵在於,所述處理器執行所述程式時實現以下步驟:獲取待識別菜品;利用多個菜品元素類別對應的菜品元素庫,對所述待識別菜品的菜品元素進行識別,以得到對應的菜品元素識別結果;其中,所述菜品元素庫為依據路徑模板庫擴充得到。
又一方面,該申請實施例公開了一種計算機可讀存儲介質,其上存儲有電腦程式,所述程式被處理器執行時實現以下步驟:獲取待識別菜品;利用多個菜品元素類別對應的菜品元素庫,對所述待識別菜品的菜品元素進行識別,以得到對應的菜品元素識別結果;其中,所述菜品元素庫為依據路徑模板庫擴充得到。

改善效果

《一種菜品信息的處理方法及裝置》實施例包括以下優點:該申請實施例利用路徑模板庫對待識別菜品的依存句法路徑對應的菜品元素進行識別,其中,該路徑模板庫所存儲的依存句法路徑模板是依據菜品元素搭配關係得到的,其具備識別菜品元素搭配關係對應的兩個菜品元素的能力;由於該申請實施例中依存句法路徑表示為:從一個辭彙到達另一個辭彙的路徑上所有辭彙的詞性和該路徑上相鄰兩個辭彙之間的依存關係組成的鏈條,也即該申請實施例是利用詞性及辭彙之間的依存關係進行菜品元素識別的,而可以不受詞庫容量的限制,故該申請實施例可以實現對於新菜品的菜品元素識別,進而提高菜品元素識別的成功率。

附圖說明

圖1是《一種菜品信息的處理方法及裝置》其中一個實施例的一種菜品信息的處理方法的步驟流程圖;
圖2是該申請其中一個實施例的一種建立路徑模板庫的方法的步驟流程圖;
圖3是該申請另一實施例的一種菜品信息的處理方法的步驟流程圖;
圖4該申請其中一個實施例的一種菜品信息的處理裝置的結構框圖;
圖5是該申請另一實施例的一種菜品信息的處理裝置的結構框圖;
圖6是該申請的一種計算設備1500的結構示意圖。

技術領域

《一種菜品信息的處理方法及裝置》涉及信息處理技術領域,特別是涉及一種菜品信息的處理方法及裝置。

權利要求

1.一種菜品信息的處理方法,其特徵在於,所述方法包括:確定待識別菜品的依存句法路徑;利用基於菜品元素搭配的路徑模板庫,對所述依存句法路徑對應的菜品元素進行識別,以得到對應的菜品元素識別結果。
2.根據權利要求1所述的方法,其特徵在於,所述對所述依存句法路徑對應的菜品元素進行識別,包括:在基於菜品元素搭配的路徑模板庫中確定與所述依存句法路徑相匹配的目標依存句法路徑模板;依據所述目標依存句法路徑模板對應的菜品元素搭配關係,確定所述依存句法路徑對應的菜品元素。
3.根據權利要求1所述的方法,其特徵在於,所述確定所述待識別菜品的依存句法路徑,包括:對所述待識別菜品名稱進行分詞和詞性標註;分別針對所述待識別菜品名稱所包含的兩個辭彙,構建以所述兩個辭彙為首尾節點的依存句法路徑。
4.根據權利要求1至3中任一所述的方法,其特徵在於,通過如下步驟建立所述路徑模板庫:針對菜品元素搭配庫中各元素辭彙搭配關係,獲取預置菜品包含的、與所述元素辭彙搭配關係相匹配的兩個目標辭彙;其中,所述元素辭彙搭配關係用於表示屬於不同菜品元素類別的兩個辭彙;分別針對所述預置菜品所包含的兩個目標辭彙,構建以所述兩個目標辭彙為首尾節點的依存句法路徑模板;將所述依存句法路徑模板保存至路徑模板庫;其中,所述路徑模板庫的菜品元素搭配關係與所述元素辭彙搭配關係相匹配。
5.根據權利要求4所述的方法,其特徵在於,通過如下步驟獲取所述元素辭彙搭配關係:獲取多個菜品元素類別對應的菜品元素庫;將對應於不同菜品元素類別的菜品元素庫中兩個辭彙進行搭配,以得到對應的元素辭彙搭配關係。
6.根據權利要求5所述的方法,其特徵在於,通過如下步驟構建所述菜品元素庫:對預置菜品集合中預置菜品的名稱進行分詞和詞性標註;依據所述預置菜品的分詞結果中各分詞的詞頻,構建詞頻集合;依據所述詞頻集合中各辭彙所屬的菜品元素類別,構建對應的菜品元素庫。
7.根據權利要求6所述的方法,其特徵在於,所述方法還包括:利用所述路徑模板庫,對所述預置菜品的依存句法路徑對應的菜品元素進行識別;依據所述預置菜品的菜品元素識別結果,對所述菜品元素庫進行擴充。
8.根據權利要求1至3中任一所述的方法,其特徵在於,所述路徑模板庫用於存儲依據菜品元素搭配關係得到的依存句法路徑模板。
9.一種菜品信息的處理方法,其特徵在於,所述方法包括:獲取待識別菜品;利用多個菜品元素類別對應的菜品元素庫,對所述待識別菜品的菜品元素進行識別,以得到對應的菜品元素識別結果;其中,所述菜品元素庫為依據路徑模板庫擴充得到。
10.根據權利要求9所述的方法,其特徵在於,所述路徑模板庫用於存儲依據菜品元素搭配關係得到的依存句法路徑模板。
11.根據權利要求9或10所述的方法,其特徵在於,通過如下步驟擴充得到所述菜品元素庫:利用所述路徑模板庫,對預置菜品集合中預置菜品的依存句法路徑對應的菜品元素進行識別;依據所述預置菜品的菜品元素識別結果,對所述菜品元素庫進行擴充。
12.根據權利要求9或10所述的方法,其特徵在於,所述方法還包括:利用詞向量模型,獲取所述菜品元素庫中詞條的相似詞條;將所述相似詞條擴充至所述菜品元素庫中。
13.一種菜品信息的處理裝置,其特徵在於,所述裝置包括:路徑確定模組,用於確定待識別菜品的依存句法路徑;菜品元素識別模組,用於利用基於菜品元素搭配的路徑模板庫,對所述依存句法路徑對應的菜品元素進行識別,以得到對應的菜品元素識別結果。
14.根據權利要求13所述的裝置,其特徵在於,所述菜品元素識別模組包括:模板確定子模組,用於在基於菜品元素搭配的路徑模板庫中確定與所述依存句法路徑相匹配的目標依存句法路徑模板;以及菜品元素確定子模組,用於依據所述目標依存句法路徑模板對應的菜品元素搭配關係,確定所述依存句法路徑對應的菜品元素。
15.根據權利要求13或14所述的裝置,其特徵在於,所述裝置還包括:用於建立所述路徑模板庫的模板庫建立模組;所述模板庫建立模組包括:目標辭彙獲取子模組,用於針對菜品元素搭配庫中各元素辭彙搭配關係,獲取預置菜品包含的、與所述元素辭彙搭配關係相匹配的兩個目標辭彙;其中,所述元素辭彙搭配關係用於表示屬於不同菜品元素類別的兩個辭彙;模板構建子模組,用於分別針對所述預置菜品所包含的兩個目標辭彙,構建以所述兩個目標辭彙為首尾節點的依存句法路徑模板;以及模板保存子模組,用於將所述依存句法路徑模板保存至路徑模板庫;其中,所述路徑模板庫的菜品元素搭配關係與所述元素辭彙搭配關係相匹配。
16.一種菜品信息的處理裝置,其特徵在於,所述裝置包括:菜品獲取模組,用於獲取待識別菜品;菜品元素識別模組,用於利用多個菜品元素類別對應的菜品元素庫,對所述待識別菜品的菜品元素進行識別,以得到對應的菜品元素識別結果。
17.根據權利要求16所述的裝置,其特徵在於,所述裝置還包括:預置菜品元素識別模組,用於利用所述路徑模板庫,對預置菜品集合中預置菜品的依存句法路徑對應的菜品元素進行識別;第一菜品元素庫擴充模組,用於依據所述預置菜品的菜品元素識別結果,對所述菜品元素庫進行擴充。
18.根據權利要求16或17所述的裝置,其特徵在於,所述裝置還包括:相似詞條獲取模組,用於利用詞向量模型,獲取所述菜品元素庫中詞條的相似詞條;第二菜品元素庫擴充模組,用於將所述相似詞條擴充至所述菜品元素庫中。
19.一種計算設備,其特徵在於,包括:存儲器、處理器及存儲在存儲器上並可在處理器上運行的電腦程式,其特徵在於,所述處理器執行所述程式時實現以下步驟:確定待識別菜品的依存句法路徑;利用基於菜品元素搭配的路徑模板庫,對所述依存句法路徑對應的菜品元素進行識別,以得到對應的菜品元素識別結果。
20.一種計算機可讀存儲介質,其上存儲有電腦程式,其特徵在於,所述程式被處理器執行時實現以下步驟:確定待識別菜品的依存句法路徑;利用基於菜品元素搭配的路徑模板庫,對所述依存句法路徑對應的菜品元素進行識別,以得到對應的菜品元素識別結果。
21.一種計算設備,其特徵在於,包括:存儲器、處理器及存儲在存儲器上並可在處理器上運行的電腦程式,其特徵在於,所述處理器執行所述程式時實現以下步驟:獲取待識別菜品;利用多個菜品元素類別對應的菜品元素庫,對所述待識別菜品的菜品元素進行識別,以得到對應的菜品元素識別結果;其中,所述菜品元素庫為依據路徑模板庫擴充得到。
22.一種計算機可讀存儲介質,其上存儲有電腦程式,其特徵在於,所述程式被處理器執行時實現以下步驟:獲取待識別菜品;利用多個菜品元素類別對應的菜品元素庫,對所述待識別菜品的菜品元素進行識別,以得到對應的菜品元素識別結果;其中,所述菜品元素庫為依據路徑模板庫擴充得到。

實施方式

參照圖1,示出了《一種菜品信息的處理方法及裝置》其中一個實施例的一種菜品信息的處理方法的步驟流程圖,所述方法具體可以包括如下步驟:步驟101、確定待識別菜品的依存句法路徑;步驟102、利用基於菜品元素搭配的路徑模板庫,對所述依存句法路徑對應的菜品元素進行識別,以得到對應的菜品元素識別結果。
該申請實施例中,菜品可以為採用各種技術手段和相應的技術設備,對原料加工得到的可供直接食用的菜餚。菜品元素可用於表示影響菜品的元素,可選地,上述菜品元素對應的菜品元素類別可以包括:食材、做法、配料、醬料和口味等。該申請實施例的菜品元素識別可以識別得到待識別菜品各辭彙對應的目標菜品元素類別,其中,某目標菜品元素類別對應的辭彙可以為該待識別菜品對應的菜品元素名稱或者菜品元素。
針對2017年3月之前的方案不能識別詞庫中不存在的菜品的問題,該申請實施例依據菜品元素搭配關係得到依存句法路徑模板,並利用路徑模板庫對待識別菜品的依存句法路徑對應的菜品元素進行識別;由於該申請實施例中依存句法路徑表示為:從一個辭彙到達另一個辭彙的路徑上所有辭彙的詞性和該路徑上相鄰兩個辭彙之間的依存關係組成的鏈條,也即該申請實施例是利用詞性及辭彙之間的依存關係進行菜品元素識別的,而可以不受詞庫容量的限制,故該申請實施例可以實現對於新菜品的菜品元素識別,進而提高菜品元素識別的成功率。
在該申請的一種套用示例中,假設預置菜品集合中存在已知菜品“番茄炒雞蛋”,該已知菜品“番茄炒雞蛋”所包含的3個辭彙“番茄”、“炒”和“雞蛋”分別被存儲在食材、做法和配料等菜品元素類別的詞庫(以下簡稱菜品元素庫)中;且“番茄(名詞)”與“炒(動詞)”之間的依存關係為主謂關係,“炒(動詞)”與“雞蛋(名詞)”之間的依存關係為動賓關係,且已知菜品“番茄炒雞蛋”的依存句法路徑作為依存句法路徑模板被存儲在路徑模板庫中;則在待識別菜品“豆角燜面”對應的辭彙未被菜品元素庫存儲時,由於待識別菜品“豆角燜面”所包含的3個辭彙“豆角”、“燜”和“面”中,“豆角(名詞)”與“燜(動詞)”之間的依存關係為主謂關係,“燜(動詞)”與“面(名詞)”之間的依存關係為動賓關係,也即,待識別菜品“豆角燜面”的依存句法路徑是與已知菜品“番茄炒雞蛋”的依存句法路徑模板相匹配的,故可以按照已知菜品“番茄炒雞蛋”的依存句法路徑模板對應的菜品元素搭配關係,得到待識別菜品“豆角燜面”的各辭彙對應的菜品元素識別結果:豆角(食材)、燜(做法)、以及面(配料)。
該申請實施例可以套用於任意的需要進行菜品元素識別的套用場景中。例如,該申請實施例可以套用於APP(應用程式,Application)的套用場景中,具體地,可以通過預置接口接收用戶輸入的待識別菜品,並在對該待識別菜品進行菜品元素識別後,向用戶輸出對應的菜品元素識別結果。又如,該申請實施例可以套用於網站查詢的套用場景中,以便於用戶查詢待識別菜品對應的菜品元素識別結果。或者,該申請實施例可以套用於大數據分析的套用場景中,具體地,第一設備可以接收第二設備傳送的待識別菜品,並在對該待識別菜品進行菜品元素識別後,向該第二設備輸出對應的菜品元素識別結果。可以理解,該申請實施例對於具體的套用場景不加以限制。
在實際套用中,接收的待識別菜品的數目可以為一個或者多個。並且,可以接收待識別菜品的信息,該待識別菜品的信息可以為名稱,也可以為訪問地址、ID(標識,Identity)等信息,以根據該訪問地址或者ID獲得該待識別菜品的名稱。該申請實施例主要以待識別菜品的信息為名稱為例進行說明。
該申請實施例在獲得待識別菜品名稱後,可以對該待識別菜品名稱對應的語句進行分析,以確定該待識別菜品的依存句法路徑。可選地,可通過依存句法工具來確定該待識別菜品的依存句法路徑。該依存句法工具使用LTP(語言技術平台,Language Technology Plantform)技術,不僅可以實現分詞、詞性標註等功能,而且可以完成分析語言單位內成分之間的依存關係,揭示其句法結構,直觀來講,可以分析識別語句中的“主謂賓”、“定狀補”等語法成分,並分析各語法成分之間的關係,如“主謂關係”、“動賓關係”、“定中關係”等。
在該申請的一種可選實施例中,上述確定所述待識別菜品的依存句法路徑的步驟101,具體可以包括:對待識別菜品名稱進行分詞和詞性標註;分別針對所述待識別菜品名稱所包含的兩個辭彙,構建以所述兩個辭彙為首尾節點的依存句法路徑。
以待識別菜品“豆角燜面”為例,可以對其包含的分詞進行兩兩組合,以得到任意兩個辭彙之間的依存關係,其中,任意兩個辭彙之間的依存關係中,該兩個辭彙可以為對應依存句法路徑的首尾節點(首節點和尾節點)。以“豆角”和“燜”兩個辭彙為例,假設其詞性分別為A’和C’,則其依存句法路徑可以表示為:“A’→x’→C’”,其中,x’表示A’與C’之間的依存關係。以“豆角”和“面”兩個辭彙為例,假設其詞性分別為A’和B’,則其依存句法路徑可以表示為:“A’→x’→C’→y’→B”,其中,y’表示C’與B’之間的依存關係。
在該申請的另一種可選實施例中,上述對所述依存句法路徑對應的菜品元素進行識別的步驟102,具體可以包括:在基於菜品元素搭配的路徑模板庫中確定與所述依存句法路徑相匹配的目標依存句法路徑模板;依據所述目標依存句法路徑模板對應的菜品元素搭配關係,確定所述依存句法路徑對應的菜品元素。例如,可以依據所述依存句法路徑,在基於菜品元素搭配的路徑模板庫中進行查找,以得到與所述依存句法路徑相匹配的目標依存句法路徑模板。可選地,可以對路徑模板庫中的依存句法路徑模板進行遍歷,並將依存句法路徑與路徑模板庫中的當前依存句法路徑模板進行匹配,若匹配成功,則可以結束遍歷,若匹配失敗,則可以將路徑模板庫中的下一依存句法路徑模板作為當前依存句法路徑模板。
在匹配過程中,可以將依存句法路徑與當前依存句法路徑模板所包含的各節點的詞性和節點之間的依存關係進行比對,若一致,則可以認為匹配成功。例如,假設依存句法路徑為:“A’→x’→C’”,當前依存句法路徑模板為:“A→x→C”,若A’與A的詞性相同、C’與C的詞性相同、且A’與C’之間的依存關係x’與A與C之間的依存關係x相同,則可以認為二者匹配成功。同理,對於“A’→x’→C’→y’→B”與“A→x→C→y→B”兩個路徑,若A’與A的詞性相同、B’與B的詞性相同、C’與C的詞性相同、且A’與C’之間的依存關係x’與A與C之間的依存關係x相同、以及C’與B’之間的依存關係y’與C與B之間的依存關係y相同,則可以認為二者匹配成功。可以理解,該領域技術人員可以根據實際套用需求,採用所需的匹配過程,該申請實施例對於依存句法路徑與路徑模板庫中的依存句法路徑模板之間的具體匹配過程不加以限制。
該申請實施例中,所述路徑模板庫可用於存儲依據菜品元素搭配關係得到的依存句法路徑模板,其中,該路徑模板庫所存儲的依存句法路徑模板是依據菜品元素搭配關係得到的,故其首尾節點可以分別對應不同的菜品元素,這樣,該申請實施例可以依據目標依存句法路徑模板對應的菜品元素搭配關係,確定所述依存句法路徑對應的菜品元素。假設菜品元素搭配關係為“食材-做法”,則其依存句法路徑模板的首節點和尾節點可以分別對應食材和做法,故可以認為依存句法路徑的首節點對應的菜品元素為食材,尾節點對應的菜品元素為做法。同理,假設菜品元素搭配關係為“食材-配料”,則其依存句法路徑模板的首節點和尾節點分別對應食材和配料,故可以認為依存句法路徑的首節點對應的菜品元素為食材,尾節點對應的菜品元素為配料。同理,假設菜品元素搭配關係為“食材-口味”,則其依存句法路徑模板的首節點和尾節點分別對應食材和口味,故可以認為依存句法路徑的首節點對應的菜品元素為食材,尾節點對應的菜品元素為口味。
同樣以待識別菜品“豆角燜面”為例,假設“豆角”和“燜”對應的依存句法路徑為:“A’→x’→C’”,“A’→x’→C’”與“食材-做法”的依存句法路徑模板“A→x→C”匹配成功,則得到的菜品元素識別結果可以包括:“豆角”對應的菜品元素為食材,“燜”對應的菜品元素為做法。
在實際套用中,該領域技術人員可以採用多種方式建立上述路徑模板庫。例如,可以在對預置菜品進行分析的基礎上,得到預置菜品的具有菜品元素搭配關係的兩個辭彙,然後依據該兩個辭彙得到該菜品元素搭配關係對應的依存句法路徑模板。
在該申請的一種可選實施例中,可以利用菜品元素搭配庫中元素辭彙搭配關係對預置菜品的依存句法路徑模板進行挖掘,相應地,建立所述路徑模板庫的過程具體可以包括:針對菜品元素搭配庫中各元素辭彙搭配關係,獲取預置菜品包含的、與所述元素辭彙搭配關係相匹配的兩個目標辭彙;其中,所述元素辭彙搭配關係用於表示屬於不同菜品元素類別的兩個辭彙;分別針對所述預置菜品所包含的兩個目標辭彙,構建以所述兩個目標辭彙為首尾節點的依存句法路徑模板;將所述依存句法路徑模板保存至路徑模板庫;其中,所述路徑模板庫的菜品元素搭配關係與所述元素辭彙搭配關係相匹配。
在實際套用中,預置菜品的來源可以有多種。例如,可以在收集所有餐飲類別商戶的菜品,並將收集的菜品保存至預置菜品集合F。可選地,在將收集的菜品保存至預置菜品集合F之前,可以對收集的菜品進行數據清理。例如,上述數據清理具體可以包括:對於收集的菜品進行過濾清理,即刪除字元長度過短或過長的菜品名稱、刪除重複的菜品名稱、修正菜品名稱中的錯別字等。
菜品元素搭配庫可用於存儲元素辭彙搭配關係。例如,“食材-做法”菜品元素搭配庫用於記錄菜品元素類別為食材與菜品元素類別為做法的辭彙之間的搭配關係;“食材-配料”菜品元素搭配庫用於記錄菜品元素類別為食材與菜品元素類別為配料的辭彙之間的搭配關係。
在該申請的一種可選實施例中,通過如下步驟獲取所述元素辭彙搭配關係:獲取多個菜品元素類別對應的菜品元素庫;將對應於不同菜品元素類別的菜品元素搭配庫中兩個辭彙進行搭配,以得到對應的元素辭彙搭配關係。例如,“食材-做法”、“食材-口味”、“食材-配料”的菜品元素搭配庫,分別表示為:Z={(s1z1),(s2z2)…(snzn)},K={(s1k1),(s2k2)…(snkn)},P={(s1p1),(s2p2)…(snpn)},其中,s表示食材辭彙,z表示做法辭彙,k表示口味辭彙,p表示配料辭彙。
在實際套用中,可以遍歷預置菜品集合F中所有預置菜品,將各預置菜品與菜品元素搭配庫中各元素辭彙關係進行匹配,若某預置菜品包含某元素辭彙搭配關係,則解析出該預置菜品對應的依存句法路徑,並將解析結果作為依存句法路徑模板進行保存。例如,預置菜品集合F中某元素f為“abcde”,Z集合中某元素為“ad”,經判斷得知“abcde”包含了“ad”,則針對“abcde”對“ad”的路徑進行解析。假設從“a”到“d”,將依次經過辭彙“e”和“b”,則可以得到依存句法路徑“A”→x”→E→y”→B”→z→D”,其中A”為辭彙a的詞性,E為辭彙e的詞性,B”為辭彙b的詞性,D為辭彙d的詞性,x”為辭彙a與辭彙e之間的依存關係(如主謂、動賓等),y”為辭彙e與辭彙b之間的依存關係,z為辭彙b與辭彙d之間的依存關係。
在該申請的一種可選實施例中,可以依據各依存句法路徑模板的頻率,對挖掘得到的依存句法路徑模板進行處理,以提高路徑模板庫的質量。例如,可以統計各依存句法路徑模板的頻率,按照頻率從大到小的順序對各依存句法路徑模板進行排列,分別得到“食材-做法”對應的依存句法頻率集合Tz、“食材-口味”對應的依存句法頻率集合Tk、“食材-配料”對應的依存句法頻率集合Tp,集合形式可以為:{(t1r1),(t2r2)…(tnrn)},其中,t為依存句法路徑,r為該路徑出現的頻率,r1>r2>…>rn。對於Tz、Tk、Tp中所有元素,若r大於某一閾值h,則保留該元素,反之,若r小於等於閾值h,則丟棄該元素;並將保留下的依存句法路徑目標加入到路徑模板庫中。例如,該申請實施例的路徑模板庫可以包括但不限於:“食材-做法”對應的路徑模板庫Msz、“食材-口味”對應的路徑模板庫Msk、以及“食材-配料”對應的路徑模板庫Msp,路徑模板庫的形式均可以為:{t1,t2…tn},t為依存句法路徑目標,按照頻率從大到小排列。
在該申請的一種可選實施例中,可以通過如下步驟獲取上述菜品元素庫:對預置菜品集合中預置菜品的名稱進行分詞和詞性標註;依據所述預置菜品的分詞結果中各分詞的詞頻,構建詞頻集合;依據所述詞頻集合中各辭彙所屬的菜品元素類別,構建對應的菜品元素庫。上述依據詞頻集合構建得到的菜品元素庫,能夠通過菜品元素庫存儲一些高頻率的辭彙,而可以不存儲低頻率的辭彙,因此能夠節省存儲空間。
在該申請的一種套用示例中,假設預置菜品集合F={f1,f2…fn},分詞和詞性標註後的集合為W={(w11p11),(w12p12)…(w21p21),(w22p22)…(wnm pnm)},其中,w為分詞結果,即單個辭彙,p為各辭彙的詞性,菜品名稱f1被分解為(w11p11)、(w12p12)...若干辭彙及詞性,菜品名稱f2被分解為(w21p21)、(w22p22)...若干辭彙及詞性,以此類推。如“番茄炒雞蛋”被分解為(番茄名詞)、(炒動詞)、(雞蛋名詞)。
進一步,可以將分詞結果中的辭彙和詞性集合進行詞頻統計,並按照詞頻從大到小排列,構成詞頻集合Q={(w1p1q1),(w2p2q2)…(wnpnqn)},其中,q表示(wp)的頻率,且q1>=q2>=…>=qn。對於Q中所有元素,若q大於某一閾值m,則保留該元素,反之,若q小於等於閾值m,則丟棄該元素。
對於保留的Q中元素,可以通過人工判別、用戶投票等方式確定其菜品元素類別,也即可以確定所保留的辭彙屬於“食材”、“做法”、“口味”、“配料”等菜品元素類別中的哪一類,並依據確定結果加入對應類別的菜品元素庫,形成“食材”菜品元素庫Ws、“做法”菜品元素庫Wz、“口味”菜品元素庫Wk、“配料”菜品元素庫Wp,Wz、Wk、Wp均可以為:{w1p1,w2p2…wnpn}。
在該申請的一種可選實施例中,可以按照如下方式確m的取值:
1)通過y=argmin f(x),計算y;其中,且f(x)≥0;argmin表示的是函式f(x)取值最小時的自變數x取值;n為Q中元素數目,λ為手動設定(0<λ<1),如0.9。
2)m=qy,其中,y為上一步求得的結果,作為Q中q的下角標序號,得到m。上述構建的菜品元素庫存儲了一些高頻辭彙,例如,“番茄”、“辣椒”在“食材”菜品元素庫中,“炒”、“燒”在“做法”菜品元素庫中,則“食材-做法”的菜品元素搭配庫可以存儲“番茄-炒”、“番茄-燒”、“辣椒-炒”、“辣椒-燒”等高頻的元素辭彙搭配關係,進一步,可以依據高頻的元素辭彙搭配關係對預置菜品進行挖掘,以得到高頻的依存句法路徑模板。例如,“A→x→B→→y→C”為挖掘得到的高頻的依存句法路徑模板,其中A是“食材”a的詞性,C是“做法”c的詞性,B是a到達c之間的那個辭彙的詞性,x為a辭彙和b辭彙之間的依存關係(如主謂、動賓等),y為b辭彙和c辭彙之間的依存關係。
為了提高菜品元素庫的覆蓋率,該申請實施例還可以利用所述路徑模板庫對當前的菜品元素庫進行擴充。相應地,該申請實施例的方法還可以包括:利用所述路徑模板庫,對所述預置菜品的依存句法路徑對應的菜品元素進行識別;依據所述預置菜品的菜品元素識別結果,對所述菜品元素庫進行擴充。
在該申請的一種套用示例中,可以利用“A→x→B→→y→C”來重新匹配預置菜品集合F中的所有預置菜品,具體地,可以將集合F中的預置菜品進行分詞和詞性標註,若某預置菜品的名稱中某兩個辭彙之間滿足“A→x→B→→y→C”這個依存句法路徑模板,則可以認為預置菜品中A所對應的辭彙為“食材”,預置菜品中C所對應的辭彙為“做法”,由此可以識別出除高頻辭彙之外的辭彙。例如,除了識別出“番茄”、“辣椒”、“炒”、“燒”之外,還識別出“香菇”、“燉”之類的辭彙,因為“香菇”、“燉”不是高頻辭彙,在構建菜品元素庫的過程中並沒有被加入到菜品元素庫中,但是卻滿足“A→x→B→→y→C”這樣的依存句法路徑模板(“香菇”的詞性為A,“燉”的詞性為C,“香菇”和“燉”之間還存在辭彙b,b的詞性為B,“香菇”和b之間的依存關係為x,b和“燉”之間的依存關係為y),這樣可以實現菜品元素庫的擴充。
在該申請的一種可選實施例中,可以在通過擴充得到最新的菜品元素庫後,可以利用該最新的菜品元素庫得到最新的菜品元素搭配庫,並利用最新的菜品元素搭配庫對預置菜品的依存句法路徑模板進行挖掘,也即,可以通過疊代完成路徑模板庫的擴充,進而提高路徑模板庫的覆蓋率。
為使該領域技術人員更好地理解該申請實施例,參照圖2,示出了該申請其中一個實施例的一種建立路徑模板庫的方法的步驟流程圖,所述方法具體可以包括如下步驟:
步驟201、收集餐飲類別商戶的菜品,對收集的菜品進行數據清理,並將數據清理後的菜品作為預置菜品保存至預置菜品集合F;
步驟202、對預置菜品集合F中各預置菜品進行分詞和詞性標註,得到集合W={(w11p11),(w12p12)…(w21p21),(w22p22)…(wnm pnm)};
步驟203、對集合W進行詞頻統計,並按照詞頻從大到小排列,構成詞頻集合Q={(w1p1q1),(w2p2q2)…(wnpnqn)};
步驟204、按照詞頻對詞頻集合Q中辭彙進行篩選,確定篩選後各辭彙所屬的菜品元素類別,並依據該菜品元素類別,構建對應的菜品元素庫;
步驟205、獲取多個菜品元素類別對應的菜品元素庫,將對應於不同菜品元素類別的菜品元素庫中兩個辭彙進行搭配,以得到對應的元素辭彙搭配關係,並將該元素辭彙搭配關係存儲至菜品元素搭配庫;
步驟206、針對菜品元素搭配庫中各元素辭彙搭配關係,獲取集合F中預置菜品包含的、與所述元素辭彙搭配關係相匹配的兩個目標辭彙;
步驟207、分別針對所述預置菜品所包含的兩個目標辭彙,構建以所述兩個目標辭彙為首尾節點的依存句法路徑模板;
步驟208、將所述依存句法路徑模板保存至路徑模板庫;其中,所述路徑模板庫的菜品元素搭配關係與所述元素辭彙搭配關係相匹配;
步驟209、利用所述路徑模板庫,對集合F中預置菜品的依存句法路徑對應的菜品元素進行識別,依據所述預置菜品的菜品元素識別結果,對所述菜品元素庫進行擴充,並將擴充後的菜品元素庫輸出至步驟205。也即步驟205-步驟209可以為疊代執行的步驟。
在該申請的另一種可選實施例中,為了提高菜品元素庫的覆蓋率,該申請實施例的方法還可以包括:利用詞向量模型,獲取所述菜品元素庫中詞條的相似詞條;將所述相似詞條擴充至所述菜品元素庫中。詞向量模型可以實現辭彙的向量化表示,其不僅僅能夠標識藥物的名稱,而且能夠表達更豐富的信息,例如,兩個辭彙之間的關係信息。例如,在採用名稱匹配的情況下,“番茄”與“西紅柿”之間是沒有關係,“口味”與“湯味”、“味道”、“口感”等辭彙之間可以是沒有關係的,而通過詞向量模型可以挖掘出這兩個辭彙之間的關係,進而獲得覆蓋率更高的相似詞條。
在該申請的一種套用示例中,可以使用詞向量模型,獲得與辭彙w近似的辭彙集合S={s1,s2…sn},若滿足similar(w,si)>θ,則將該si加入到相應菜品元素庫中,其中,similar表示w和si之間的相似度,θ為手動設定值,範圍0<θ<1。可選地,可以採用歐氏距離、餘弦距離等相似度度量計算w和si之間的相似度。例如,在w為“味道”時,將輸出“口味:0.687054;口感:0.650905;湯味:0.528859...”等相似詞條,其中的數字表示該辭彙距離目標辭彙的餘弦距離,距離越接近1表示越相似。
綜上,該申請實施例的菜品信息的處理方法,利用路徑模板庫對待識別菜品的依存句法路徑對應的菜品元素進行識別,其中,該路徑模板庫所存儲的依存句法路徑模板是依據菜品元素搭配關係得到的,其具備識別菜品元素搭配關係對應的兩個菜品元素的能力;由於該申請實施例中依存句法路徑表示為:從一個辭彙到達另一個辭彙的路徑上所有辭彙的詞性和該路徑上相鄰兩個辭彙之間的依存關係組成的鏈條,也即該申請實施例是利用詞性及辭彙之間的依存關係進行菜品元素識別的,而可以不受詞庫容量的限制,故該申請實施例可以實現對於新菜品的菜品元素識別,進而提高菜品元素識別的成功率。
並且,該申請實施例可以利用所述路徑模板庫對當前的菜品元素庫進行擴充,並依據擴充得到的最新菜品元素庫得到最新的菜品元素搭配庫,進而利用最新的菜品元素搭配庫中元素辭彙搭配關係對預置菜品的依存句法路徑模板進行挖掘,以得到最新的路徑模板庫,因此能夠提高路徑模板庫的覆蓋率。
參照圖3,示出了該申請另一實施例的一種菜品信息的處理方法的步驟流程圖,所述方法具體可以包括如下步驟:
步驟301、獲取待識別菜品;
步驟302、利用多個菜品元素類別對應的菜品元素庫,對所述待識別菜品的菜品元素進行識別,以得到對應的菜品元素識別結果;其中,所述菜品元素庫可以為依據路徑模板庫擴充得到。
該申請實施例可以利用依據路徑模板庫對菜品元素庫進行擴充,由於所述路徑模板庫可用於存儲依據菜品元素搭配關係得到的依存句法路徑模板,故可以提高菜品元素庫的覆蓋率,進而提高菜品元素識別的成功率。
在實際套用中,擴充前的菜品元素庫可以為2017年3月之前的方案中的詞庫,也可以為該申請實施例構建的菜品元素庫,該申請實施例對擴充前的菜品元素庫不加以限制。
在該申請的一種套用示例中,假設擴充前的菜品元素庫為該申請構建的菜品元素庫,假設該菜品元素庫可用於存儲辭彙與詞頻之間的映射關係,所存儲的辭彙按照詞頻從大到小的順序排列,且菜品元素庫中辭彙的詞頻均大於閾值m,則擴充前的菜品元素庫僅僅能夠存儲一些高頻辭彙。
而該申請實施例可以利用路徑模板庫對當前的菜品元素庫進行擴充,以得到符合路徑模板庫中依存句法路徑模板的低頻辭彙。例如,利用路徑模板庫,除了識別出“番茄”、“辣椒”、“炒”、“燒”等高頻辭彙之外,還識別出“香菇”、“燉”之類的低頻辭彙。
在該申請的一種可選實施例中,利用路徑模板庫對當前的菜品元素庫進行擴充的過程可以包括:利用所述路徑模板庫,對所述預置菜品的依存句法路徑對應的菜品元素進行識別;依據所述預置菜品的菜品元素識別結果,對所述菜品元素庫進行擴充。
例如,可以利用依存句法路徑模板“A→x→B→→y→C”來匹配預置菜品集合F中的所有預置菜品,其中A是“食材”a的詞性,C是“做法”c的詞性;具體地,可以將集合F中的預置菜品進行分詞和詞性標註,只要某預置菜品的名稱中某兩個辭彙之間滿足“A→x→B→→y→C”這個依存句法路徑模板,都可以認為預置菜品中A所對應的辭彙為“食材”,預置菜品中C所對應的辭彙為“做法”,由此可以識別出除高頻辭彙之外的低頻辭彙。
在該申請的另一種可選實施例中,為了提高菜品元素庫的覆蓋率,該申請實施例的方法還可以包括:利用詞向量模型,獲取所述菜品元素庫中詞條的相似詞條;將所述相似詞條擴充至所述菜品元素庫中。詞向量模型可以實現辭彙的向量化表示,其不僅僅能夠標識藥物的名稱,而且能夠表達更豐富的信息,例如,兩個辭彙之間的關係信息。例如,在採用名稱匹配的情況下,“番茄”與“西紅柿”之間是沒有關係,“口味”與“湯味”、“味道”、“口感”等辭彙之間是沒有關係的,而通過詞向量模型可以挖掘出這兩個辭彙之間的關係,進而獲得覆蓋率更高的相似詞條。
綜上,該申請實施例的菜品信息的處理方法,可以利用依據路徑模板庫對菜品元素庫進行擴充,故可以提高菜品元素庫的覆蓋率,這樣,利用擴充後的菜品元素庫進行待識別菜品的識別,能夠提高菜品元素識別的成功率。
需要說明的是,對於方法實施例,為了簡單描述,故將其都表述為一系列的動作組合,但是該領域技術人員應該知悉,該申請實施例並不受所描述的動作順序的限制,因為依據該申請實施例,某些步驟可以採用其它順序或者同時進行。其次,該領域技術人員也應該知悉,說明書中所描述的實施例均屬於優選實施例,所涉及的動作並不一定是該申請實施例所必須的。
參照圖4,示出了該申請其中一個實施例的一種菜品信息的處理裝置的結構框圖,該裝置具體可以包括:路徑確定模組401,用於確定待識別菜品的依存句法路徑;菜品元素識別模組402,用於利用基於菜品元素搭配的路徑模板庫,對所述依存句法路徑對應的菜品元素進行識別,以得到對應的菜品元素識別結果。
可選地,上述路徑模板庫可用於存儲依據菜品元素搭配關係得到的依存句法路徑模板。
可選地,上述菜品元素識別模組402可以包括:模板確定子模組,用於在基於菜品元素搭配的路徑模板庫中確定與所述依存句法路徑相匹配的目標依存句法路徑模板;以及菜品元素確定子模組,用於依據所述目標依存句法路徑模板對應的菜品元素搭配關係,確定所述依存句法路徑對應的菜品元素。
可選地,上述路徑確定模組可以包括:第一分詞標註子模組,用於對待識別菜品名稱進行分詞和詞性標註;以及路徑構建子模組,用於分別針對所述待識別菜品名稱所包含的兩個辭彙,構建以所述兩個辭彙為首尾節點的依存句法路徑。
可選地,上述裝置還可以包括:用於建立所述路徑模板庫的模板庫建立模組;所述模板庫建立模組可以包括:目標辭彙獲取子模組,用於針對菜品元素搭配庫中各元素辭彙搭配關係,獲取預置菜品包含的、與所述元素辭彙搭配關係相匹配的兩個目標辭彙;其中,所述元素辭彙搭配關係用於表示屬於不同菜品元素類別的兩個辭彙;模板構建子模組,用於分別針對所述預置菜品所包含的兩個目標辭彙,構建以所述兩個目標辭彙為首尾節點的依存句法路徑模板;以及模板保存子模組,用於將所述依存句法路徑模板保存至路徑模板庫;其中,所述路徑模板庫的菜品元素搭配關係與所述元素辭彙搭配關係相匹配。
可選地,上述裝置還可以包括:用於獲取所述元素辭彙搭配關係的搭配關係獲取模組;所述搭配關係獲取模組可以包括:菜品元素庫獲取子模組,用於獲取多個菜品元素類別對應的菜品元素庫;以及辭彙搭配子模組,用於將對應於不同菜品元素類別的菜品元素庫中兩個辭彙進行搭配,以得到對應的元素辭彙搭配關係。
可選地,上述裝置還可以包括:用於構建所述菜品元素庫的菜品元素庫構建模組;所述菜品元素庫構建模組可以包括:第二分詞標註子模組,用於對預置菜品集合中預置菜品的名稱進行分詞和詞性標註;詞頻集合構建子模組,用於依據所述預置菜品的分詞結果中各分詞的詞頻,構建詞頻集合;以及菜品元素庫構建子模組,用於依據所述詞頻集合中各辭彙所屬的菜品元素類別,構建對應的菜品元素庫。
可選地,上述裝置還可以包括:預置菜品元素識別模組,用於利用所述路徑模板庫,對所述預置菜品的依存句法路徑對應的菜品元素進行識別;菜品元素庫擴充模組,用於依據所述預置菜品的菜品元素識別結果,對所述菜品元素庫進行擴充。
對於裝置實施例而言,由於其與方法實施例基本相似,故描述的比較簡單,相似的地方請相互參照即可。
參照圖5,示出了該申請另一實施例的一種菜品信息的處理裝置的結構框圖,該裝置具體可以包括:菜品接收模組501,用於獲取待識別菜品;菜品元素識別模組502,用於利用多個菜品元素類別對應的菜品元素庫,對所述待識別菜品的菜品元素進行識別,以得到對應的菜品元素識別結果;其中,所述菜品元素庫可以為依據路徑模板庫擴充得到。
可選地,所述路徑模板庫用於存儲依據菜品元素搭配關係得到的依存句法路徑模板。
可選地,上述裝置還可以包括:預置菜品元素識別模組,用於利用所述路徑模板庫,對預置菜品集合中預置菜品的依存句法路徑對應的菜品元素進行識別;第一菜品元素庫擴充模組,用於依據所述預置菜品的菜品元素識別結果,對所述菜品元素庫進行擴充。
可選地,上述裝置還可以包括:相似詞條獲取模組,用於利用詞向量模型,獲取所述菜品元素庫中詞條的相似詞條;第二菜品元素庫擴充模組,用於將所述相似詞條擴充至所述菜品元素庫中。
對於裝置實施例而言,由於其與方法實施例基本相似,故描述的比較簡單,相似的地方請相互參照即可。
參照圖6,示出了該申請的一種計算設備1500的結構示意圖,具體可以包括:至少一個處理器1501、存儲器1502、至少一個網路接口1504和用戶接口1503。計算設備1500中的各個組件通過匯流排系統1505耦合在一起。可理解,匯流排系統1505用於實現這些組件之間的連線通信。匯流排系統1505除包括數據匯流排之外,還包括電源匯流排、控制匯流排和狀態信號匯流排。但是為了清楚說明起見,在圖6中將各種匯流排都標為匯流排系統1505,計算設備1500還包括拍照組件1506,拍照組件1506包括攝像頭。該申請實施例的計算設備的例子具體可以包括但不限:智慧型手機、平板電腦、電子書閱讀器、MP3(動態影像專家壓縮標準音頻層面3,Moving Picture Experts Group Audio Layer III)播放器、MP4(動態影像專家壓縮標準音頻層面4,Moving Picture Experts Group Audio Layer IV)播放器、膝上型便攜計算機、車載電腦、台式計算機、機頂盒、智慧型電視機、可穿戴設備等等。
其中,用戶接口1503可以包括顯示器、鍵盤或者點擊設備(例如,滑鼠,軌跡球(trackball)、觸感板或者觸控螢幕等。
可以理解,該申請實施例中的存儲器1502可以是易失性存儲器或非易失性存儲器,或可包括易失性和非易失性存儲器兩者。其中,非易失性存儲器可以是唯讀存儲器(Read-OnlyMemory,ROM)、可程式唯讀存儲器(ProgrammableROM,PROM)、可擦除可程式唯讀存儲器(ErasablePROM,EPROM)、電可擦除可程式唯讀存儲器(ElectricallyEPROM,EEPROM)或快閃記憶體。易失性存儲器可以是隨機存取存儲器(RandomAccessMemory,RAM),其用作外部高速快取。通過示例性但不是限制性說明,許多形式的RAM可用,例如靜態隨機存取存儲器(StaticRAM,SRAM)、動態隨機存取存儲器(DynamicRAM,DRAM)、同步動態隨機存取存儲器(SynchronousDRAM,SDRAM)、雙倍數據速率同步動態隨機存取存儲器(DoubleDataRate SDRAM,DDRSDRAM)、增強型同步動態隨機存取存儲器(Enhanced SDRAM,ESDRAM)、同步連線動態隨機存取存儲器(SynchlinkDRAM,SLDRAM)和直接記憶體匯流排隨機存取存儲器(DirectRambusRAM,DRRAM)。該申請實施例描述的系統和方法的存儲器1502旨在包括但不限於這些和任意其它適合類型的存儲器。
在一些實施方式中,存儲器1502存儲了如下的元素,可執行模組或者數據結構,或者他們的子集,或者他們的擴展集:作業系統15021和應用程式15022。
其中,作業系統15021,包含各種系統程式,例如框架層、核心庫層、驅動層等,用於實現各種基礎業務以及處理基於硬體的任務。應用程式15022,包含各種應用程式,例如媒體播放器(MediaPlayer)、瀏覽器(Browser)等,用於實現各種套用業務。實現該申請實施例方法的程式可以包含在應用程式15022中。
在該申請實施例中,通過調用存儲器1502存儲的程式或指令,具體的,可以是應用程式15022中存儲的程式或指令,處理器1501用於確定待識別菜品的依存句法路徑;利用基於菜品元素搭配的路徑模板庫,對所述依存句法路徑對應的菜品元素進行識別,以得到對應的菜品元素識別結果;或者,處理器1501用於獲取待識別菜品;利用多個菜品元素類別對應的菜品元素庫,對所述待識別菜品的菜品元素進行識別,以得到對應的菜品元素識別結果;其中,所述菜品元素庫為依據路徑模板庫擴充得到。
上述該申請實施例揭示的方法可以套用於處理器1501中,或者由處理器1501實現。處理器1501可能是一種積體電路晶片,具有信號的處理能力。在實現過程中,上述方法的各步驟可以通過處理器1501中的硬體的集成邏輯電路或者軟體形式的指令完成。上述的處理器1501可以是通用處理器、數位訊號處理器(DigitalSignalProcessor,DSP)、專用積體電路(ApplicationSpecificIntegratedCircuit,ASIC)、現成可程式門陣列(FieldProgrammableGateArray,FPGA)或者其他可程式邏輯器件、分立門或者電晶體邏輯器件、分立硬體組件。可以實現或者執行該申請實施例中的公開的各方法、步驟及邏輯框圖。通用處理器可以是微處理器或者該處理器也可以是任何常規的處理器等。結合該申請實施例所公開的方法的步驟可以直接體現為硬體解碼處理器執行完成,或者用解碼處理器中的硬體及軟體模組組合執行完成。軟體模組可以位於隨機存儲器,快閃記憶體、唯讀存儲器,可程式唯讀存儲器或者電可擦寫可程式存儲器、暫存器等該領域成熟的存儲介質中。該存儲介質位於存儲器1502,處理器1501讀取存儲器1502中的信息,結合其硬體完成上述方法的步驟。
可以理解的是,該申請實施例描述的這些實施例可以用硬體、軟體、固件、中間件、微碼或其組合來實現。對於硬體實現,處理單元可以實現在一個或多個專用積體電路(ApplicationSpecificIntegratedCircuits,ASIC)、數位訊號處理器(DigitalSignalProcessing,DSP)、數位訊號處理設備(DSPDevice,DSPD)、可程式邏輯設備(ProgrammableLogicDevice,PLD)、現場可程式門陣列(Field-ProgrammableGateArray,FPGA)、通用處理器、控制器、微控制器、微處理器、用於執行該申請所述功能的其它電子單元或其組合中。
對於軟體實現,可通過執行該申請實施例中所述功能的模組(例如過程、函式等)來實現該申請實施例中所述的技術。軟體代碼可存儲在存儲器中並通過處理器執行。存儲器可以在處理器中或在處理器外部實現。
可選地,所述處理器1501,還用於在基於菜品元素搭配的路徑模板庫中確定與所述依存句法路徑相匹配的目標依存句法路徑模板;依據所述目標依存句法路徑模板對應的菜品元素搭配關係,確定所述依存句法路徑對應的菜品元素。
可選地,所述處理器1501,還用於對所述待識別菜品名稱進行分詞和詞性標註;分別針對所述待識別菜品名稱所包含的兩個辭彙,構建以所述兩個辭彙為首尾節點的依存句法路徑。
可選地,所述處理器1501,還用於針對菜品元素搭配庫中各元素辭彙搭配關係,獲取預置菜品包含的、與所述元素辭彙搭配關係相匹配的兩個目標辭彙;其中,所述元素辭彙搭配關係用於表示屬於不同菜品元素類別的兩個辭彙;分別針對所述預置菜品所包含的兩個目標辭彙,構建以所述兩個目標辭彙為首尾節點的依存句法路徑模板;將所述依存句法路徑模板保存至路徑模板庫;其中,所述路徑模板庫的菜品元素搭配關係與所述元素辭彙搭配關係相匹配。
可選地,所述處理器1501,還用於獲取多個菜品元素類別對應的菜品元素庫;將對應於不同菜品元素類別的菜品元素庫中兩個辭彙進行搭配,以得到對應的元素辭彙搭配關係。
可選地,所述處理器1501,還用於對預置菜品集合中預置菜品的名稱進行分詞和詞性標註;依據所述預置菜品的分詞結果中各分詞的詞頻,構建詞頻集合;依據所述詞頻集合中各辭彙所屬的菜品元素類別,構建對應的菜品元素庫。
可選地,所述處理器1501,還用於利用所述路徑模板庫,對所述預置菜品的依存句法路徑對應的菜品元素進行識別;依據所述預置菜品的菜品元素識別結果,對所述菜品元素庫進行擴充。
可選地,所述路徑模板庫用於存儲依據菜品元素搭配關係得到的依存句法路徑模板。
可選地,所述處理器1501,還用於利用所述路徑模板庫,對預置菜品集合中預置菜品的依存句法路徑對應的菜品元素進行識別;依據所述預置菜品的菜品元素識別結果,對所述菜品元素庫進行擴充。
可選地,所述處理器1501,還用於利用詞向量模型,獲取所述菜品元素庫中詞條的相似詞條;將所述相似詞條擴充至所述菜品元素庫中。

榮譽表彰

2020年7月14日,《一種菜品信息的處理方法及裝置》獲得第二十一屆中國專利獎優秀獎。

相關詞條

熱門詞條

聯絡我們