《一種基於維基百科雙向連結的詞語語義相關度判斷方法》是廣西師範大學於2018.09.21申請的專利,該專利的公布號為:CN109325230B,專利公布日:2021.06.15,發明人是:朱新華; 郭青松; 張蘭芳; 陳宏朝。
基本介紹
- 中文名:一種基於維基百科雙向連結的詞語語義相關度判斷方法
- 授權公告號:CN109325230B
- 授權公告日:2021.06.15
- 申請號:2018111086470
- 申請日:2018.09.21
- 地址:541004廣西壯族自治區桂林市七星區育才路15號
- 發明人:朱新華; 郭青松; 張蘭芳; 陳宏朝
- Int. Cl.:G06F40/30(2020.01)I; G06F40/216(2020.01)I; G06F16/30(2019.01)I
- 專利代理機構:南寧東智智慧財產權代理事務所(特殊普通合夥)45117
- 代理人:巢雄輝; 汪治興
- 專利權人:廣西師範大學
專利摘要
本發明公開了一種基於維基百科雙向連結的詞語語義相關度判斷方法,對於任意兩個詞語有:S1.在維基百科數據資源庫中分別獲取兩個詞語的定位頁面;S2.若定位頁面為內容頁面,即是義項頁面,轉S3;若定位頁面為消歧頁面,進行消岐處理,轉S3;S3.計算出兩個詞語每一個義項頁面的概念語義解釋,概念語義解釋為一個雙向連結向量;S4.計算兩個詞語義項頁面間的雙向連結向量的餘弦,獲得每一對義項概念間的語義相關度,將最大值作為兩個詞語的語義相關度。本發明把維基百科中頁面的入連結和出連結作為頁面特徵,構建描述概念語義的特徵向量模型,並結合一種基於社會認知度的消岐策略,提高了基於維基百科連結的詞語語義相關度計算的準確度。