《專利信息語義表示與深度挖掘》是一本2022年科學技術文獻出版社出版的圖書,作者是張金柱。
基本介紹
- 中文名:專利信息語義表示與深度挖掘
- 作者:張金柱
- 出版社:科學技術文獻出版社
- 出版時間:2022年11月1日
- 開本:16 開
- 裝幀:平裝
- ISBN:9787518986125
內容簡介,圖書目錄,
內容簡介
以專利數據語義表示為基白宙陵船礎,專利信息深度挖掘問題能夠得到更好的解決。本書根據專利數據分析與挖掘的一般流程,結合其中的研究重點和研究熱點,著力解決以下5個方面的問題。
①專利科學引文元數據抽取和分析。當前科學技術間的關聯研究主要通過非專利引文分析實現,非專利引文包括期刊論文、會議論文、著作、檔案等多種類型,而其中很多類型並不能作為科學知識的代表。如何借鑑和改進表示學習方法,快速準確地識別出非專利引文中的專利科學引文,進而抽取專利科學引文中的多種特徵項來表示專利引用的科學知識,實現更準確的科學技術關聯分析,研究科學知識與技術套用間的知識轉移和流動,是專利信息深度挖掘的基礎性工作。
②無監督跨語言專利推薦。跨語言專利推薦可以為企業和個人遴選相關重要專利、發現相關技術發展趨勢、追蹤最新技術進展提供輔助,進而提供個性化的信息推送和決策支持服務,是有效獲取其他語言相關專利應捆盛的重要途徑。當前,擔詢兆跨語言專利推薦多從查詢詞和文本精確翻譯的角度出發,往往需要大規模特定領域的雙語詞典、雙語語料庫及高效準確的機器翻譯等方法來實現有監督的跨語言查詢擴展,導致這些方法套用擴展到其他領域進行跨語言專利推薦的難度較大。與此同時,由此推薦的專利大多是相似專利,推薦的多樣性和相關性尚需進一步擴展,亟須從專利文本語義表示角度出發進行相關再請戀試專利推薦,以提供更好的決策支持服務。
③技術機會預測。技術機會作為技術創新及市場創新活動的基礎,可以為企業提供可能的未來發展方向參考,是進行任何一項技術創新活動都要考慮的重要因素,也是決定企業能否順利開展技術創新活動的關鍵環節。當前研究主要側重於對已發生的技術機會進行發現,而技術機會預測則多是通過分析大量歷史數據進行驗證。實際上,當技術機會出現時,一般還沒有積累大量數據,特別是在技術機會尚處於萌芽階段的時候。因此,需要藉助表示學習方法和類比設計方法,協同利用具有類似功能或效果的相關領域數據,在尚未累積大量數據的技術萌芽期對技術機會進行預測,更好地支撐數據驅動的管理決策。
④技術融合預測。技術融合是新技術產生的重要來源,預測潛在的技術融合成為企業提高競爭能力、獲取競爭優勢甚至是顛覆現有市場的最有效和最重要的技術手段。當前,技術融合預測的定量分析和研究主要從3個角度展開,包括基於專利引用的技術融合預測、基於專利分類號共現的技術融合預測及基於專利文本的技術融合預測,但還存在以下問題亟須解決:第一,專利引用具有一定的時間滯後性,需要一定的時間積累,因此現有研究多是對已有技術融合的驗證,不利於技術融合預測。第二,專利分類號共現不能體現專利分類號在序列中的位置特徵和上下文語義,由此得到的專利分類語義表示可能存在信息丟失的問題。此外,現有研究一般平等對待專利分類序列中的每個專利分類號,進而賦予同樣的文本信息,造成不同專利分類具有大量相同文本,不利於區分專利分類。尤為重要的是,專利分類網路結構和文本內容中的每一維特徵的貢獻程度可能並不相同,需要針對不同領域數據進行針對性學習,自動調整特徵的權重和貢獻。
⑤專利大數據處理與分析系統構建。全流程專利數據處理與分析的工具軟體較少,而且一般僅能實現專利處理與分析中的某一步驟,無法形成規範的輸入輸出,難以簡便快捷地對特定領域進行全流程分析與處理。此外,需要針對專利數據分析與挖掘,系統調研專利特徵項,設計專利數據倉庫,研究和實現專利大數據獲取、解析、預處理、查詢、統計、分析和可視化的全流程專利處理與分析系統,從而為專利數據深度挖掘提供更好的工具軟體支撐。
為了解決上述問題,本書引入表示學習理論與方法,研究專利信息語義表示,進而針對情報分析現實需要,從專利信息語義表示角度形成了一系列新方法和新技術,主要包棄判贈括:從專利科學引文角度出發,提出基於表示學習的專利科學引文識別、專利科學引文特徵項抽取及多種專利科學引文內容深度挖掘方法;從專利推薦角度出發,利用不同語種但相同翻遙語義的詞在語義空間中位置相近的原理,提出基於表示學習的無監督跨語言專利推薦方法;從技術機會預測角度,結炒屑墊合表示學習和類比設計,提出基於短語語義表示和類比設計的技術機會預測方法;從技術融合預測角度,結合表示學習理論與方法,研究專利分類文本賦予及其語義表示、專利分類網路結構語義表示及融合表示,形成基於專利分類語義表示的技術融合預測方法;從信息系統構建角度,設計專利數據倉庫,研究和實現專利大數據獲取、解析、預處理、查詢、統計、分析和可視化的全流程專利處理與分析系統構建。
圖書目錄
緒論
專利信息語義表示與深度挖掘的研究背景
專利信息語義表示成為必然趨勢
專利信息深度挖掘成為創新發展的重要助力
相關概念界定
專利信息基礎類概念
專利信息表示類概念
專利信息挖掘類概念
專利信息系統構建類概念
研究意義和研究問題
研究意義
研究問題
研究內容
研究方法和研究架構
研究方法
研究架構
專利信息語義表示與深度挖掘的理論和方法基礎
表示學習
網路表示學習
文本表示學習
融合表示學習
專利信息深度挖掘
專利網路挖掘的視角
專利文本挖掘的視角
專利科學引文語義表示與挖掘
專利科學引文挖掘的研究背景和研究問題
專利科學引文語義表示與挖掘的相關研究
專利科學引文元數據抽取研究
專利科學引文內容挖掘研究
基於表示學習的專利科學引文元數據自動抽取
專利科學引文識別
專利科學引文標題抽取
專利科學引文元數據自動抽取實證分析
基於表示學習的專利科學引文內容挖掘
專利科學引文內容元數據的獲取
基於專利科學引文的科學關聯度計算
基於專利科學引文摘要的內容挖掘
基於專利科學引文關鍵字的內容挖掘
專利科學引文內容挖掘實證分析
基於專利文本語義表示的跨語言相關專利推薦
跨語言專利推薦的研究背景和研究問題
跨語言專利推薦的相關研究
專利推薦
跨語言專利檢索
跨語言詞向量映射
基於表示學習的跨語言相關專利推薦
詞向量映射理論基礎
構建無監督跨語言詞向量映射方法
基於無監督詞向量映射的雙語專利文本表示方法
基於雙語專利文本表示的跨語言相關專利推薦方法
實證研究
數據來源
數據預處理
評價方法
結果分析
基於短語語義表示的技術機會預測
技術機會預測的研究背景和研究問題
技術機會預測的相關研究
類比設計
潛在技術機會預測研究
潛在技術機會實現路徑研究
基於表示學習和類比設計的潛在技術機會預測方法
技術機會有關的類比知識單元抽取
技術機會有關的類比關係建立
基於技術機會得分的潛在技術機會預測
基於類比設計的潛在技術機會預測實證研究
基於表示學習和知識圖譜的技術機會實現路徑構建
潛在技術機會實現路徑技術主題抽取
潛在技術機會實現路徑構造
潛在技術機會實現路徑知識圖譜構建
技術機會實現路徑構建實證研究
基於專利分類語義表示的技術融合預測
技術融合預測的研究背景和研究問題
技術融合預測的理論與方法基礎
基於專利引用的技術融合預測
基於專利分類號共現的技術融合預測
基於專利文本的技術融合預測
基於專利分類語義表示的技術融合預測
基於專利分類序列語義表示的技術融合預測
基於專利分類文本語義表示的技術融合預測
基於專利分類序列結構和文本內容語義融合的技術融合預測基於鏈路預測的技術融合預測定量評估方法
實證研究
數據來源
數據解析
數據預處理
基於專利序列語義表示的技術融合預測結果
基於專利分類文本語義表示的技術融合預測結果
融合專利分類序列與文本語義表示的技術融合預測結果技術融合預測示例
專利大數據全流程處理與分析系統
需求分析
系統需求分析
競品分析
概要設計
詳細設計
系統開發流程設計
界面設計及使用流程
資料庫設計
基於網路表示學習的專利信息分析系統
系統設計
需求分析
系統套用流程設計
系統開發流程設計
界面設計與功能模組
專利系統主界面
專利數據導入模組
專利網路生成模組
專利網路語義表示模組
專利主題識別模組
專利主題可視化模組
相似專利推薦模組
系統的具體功能及使用
系統功能的實現過程
系統功能實現的關鍵技術
結論與展望
研究總結
貢獻與創新之處
不足與後續研究
⑤專利大數據處理與分析系統構建。全流程專利數據處理與分析的工具軟體較少,而且一般僅能實現專利處理與分析中的某一步驟,無法形成規範的輸入輸出,難以簡便快捷地對特定領域進行全流程分析與處理。此外,需要針對專利數據分析與挖掘,系統調研專利特徵項,設計專利數據倉庫,研究和實現專利大數據獲取、解析、預處理、查詢、統計、分析和可視化的全流程專利處理與分析系統,從而為專利數據深度挖掘提供更好的工具軟體支撐。
為了解決上述問題,本書引入表示學習理論與方法,研究專利信息語義表示,進而針對情報分析現實需要,從專利信息語義表示角度形成了一系列新方法和新技術,主要包括:從專利科學引文角度出發,提出基於表示學習的專利科學引文識別、專利科學引文特徵項抽取及多種專利科學引文內容深度挖掘方法;從專利推薦角度出發,利用不同語種但相同語義的詞在語義空間中位置相近的原理,提出基於表示學習的無監督跨語言專利推薦方法;從技術機會預測角度,結合表示學習和類比設計,提出基於短語語義表示和類比設計的技術機會預測方法;從技術融合預測角度,結合表示學習理論與方法,研究專利分類文本賦予及其語義表示、專利分類網路結構語義表示及融合表示,形成基於專利分類語義表示的技術融合預測方法;從信息系統構建角度,設計專利數據倉庫,研究和實現專利大數據獲取、解析、預處理、查詢、統計、分析和可視化的全流程專利處理與分析系統構建。
圖書目錄
緒論
專利信息語義表示與深度挖掘的研究背景
專利信息語義表示成為必然趨勢
專利信息深度挖掘成為創新發展的重要助力
相關概念界定
專利信息基礎類概念
專利信息表示類概念
專利信息挖掘類概念
專利信息系統構建類概念
研究意義和研究問題
研究意義
研究問題
研究內容
研究方法和研究架構
研究方法
研究架構
專利信息語義表示與深度挖掘的理論和方法基礎
表示學習
網路表示學習
文本表示學習
融合表示學習
專利信息深度挖掘
專利網路挖掘的視角
專利文本挖掘的視角
專利科學引文語義表示與挖掘
專利科學引文挖掘的研究背景和研究問題
專利科學引文語義表示與挖掘的相關研究
專利科學引文元數據抽取研究
專利科學引文內容挖掘研究
基於表示學習的專利科學引文元數據自動抽取
專利科學引文識別
專利科學引文標題抽取
專利科學引文元數據自動抽取實證分析
基於表示學習的專利科學引文內容挖掘
專利科學引文內容元數據的獲取
基於專利科學引文的科學關聯度計算
基於專利科學引文摘要的內容挖掘
基於專利科學引文關鍵字的內容挖掘
專利科學引文內容挖掘實證分析
基於專利文本語義表示的跨語言相關專利推薦
跨語言專利推薦的研究背景和研究問題
跨語言專利推薦的相關研究
專利推薦
跨語言專利檢索
跨語言詞向量映射
基於表示學習的跨語言相關專利推薦
詞向量映射理論基礎
構建無監督跨語言詞向量映射方法
基於無監督詞向量映射的雙語專利文本表示方法
基於雙語專利文本表示的跨語言相關專利推薦方法
實證研究
數據來源
數據預處理
評價方法
結果分析
基於短語語義表示的技術機會預測
技術機會預測的研究背景和研究問題
技術機會預測的相關研究
類比設計
潛在技術機會預測研究
潛在技術機會實現路徑研究
基於表示學習和類比設計的潛在技術機會預測方法
技術機會有關的類比知識單元抽取
技術機會有關的類比關係建立
基於技術機會得分的潛在技術機會預測
基於類比設計的潛在技術機會預測實證研究
基於表示學習和知識圖譜的技術機會實現路徑構建
潛在技術機會實現路徑技術主題抽取
潛在技術機會實現路徑構造
潛在技術機會實現路徑知識圖譜構建
技術機會實現路徑構建實證研究
基於專利分類語義表示的技術融合預測
技術融合預測的研究背景和研究問題
技術融合預測的理論與方法基礎
基於專利引用的技術融合預測
基於專利分類號共現的技術融合預測
基於專利文本的技術融合預測
基於專利分類語義表示的技術融合預測
基於專利分類序列語義表示的技術融合預測
基於專利分類文本語義表示的技術融合預測
基於專利分類序列結構和文本內容語義融合的技術融合預測基於鏈路預測的技術融合預測定量評估方法
實證研究
數據來源
數據解析
數據預處理
基於專利序列語義表示的技術融合預測結果
基於專利分類文本語義表示的技術融合預測結果
融合專利分類序列與文本語義表示的技術融合預測結果技術融合預測示例
專利大數據全流程處理與分析系統
需求分析
系統需求分析
競品分析
概要設計
詳細設計
系統開發流程設計
界面設計及使用流程
資料庫設計
基於網路表示學習的專利信息分析系統
系統設計
需求分析
系統套用流程設計
系統開發流程設計
界面設計與功能模組
專利系統主界面
專利數據導入模組
專利網路生成模組
專利網路語義表示模組
專利主題識別模組
專利主題可視化模組
相似專利推薦模組
系統的具體功能及使用
系統功能的實現過程
系統功能實現的關鍵技術
結論與展望
研究總結
貢獻與創新之處
不足與後續研究