知識抽取(knowledge extraction)是2019年全國科學技術名詞審定委員會公布的圖書館·情報與文獻學名詞。
基本介紹
- 中文名:知識抽取
- 外文名:knowledge extraction
- 所屬學科:圖書館·情報與文獻學
- 公布時間:2019年
- 審定機構:全國科學技術名詞審定委員會
知識抽取(knowledge extraction)是2019年全國科學技術名詞審定委員會公布的圖書館·情報與文獻學名詞。
知識抽取(knowledge extraction)是2019年全國科學技術名詞審定委員會公布的圖書館·情報與文獻學名詞。定義通過識別、理解、篩選、格式化,把文獻中的各個知識點抽取出來,以一定形式存入知識庫中的過程。目的...
知識提取 知識提取(knowledge extraction)是2018年公布的計算機科學技術名詞。定義 從文本型知識源中抽取出隱含的、有價值的知識的過程。出處 《計算機科學技術名詞 》第三版。
知識挖掘(KDD)是從數據中發現有用知識的整個過程;數據開採(DM)是KDD過程中的一個特定步驟,它用專門算法從數據中抽取模式(patterns)。1996年,Fayyad、PiatetskyShapiror和Smyth將KDD過程定義為:從數據中鑑別出有效模式的非平凡過程,該模式是新的、可能有用的和最終可理解的。知識挖掘算法的好壞將直接影響到...
《面向網路百科的知識抽取研究》是依託中國人民解放軍國防科技大學,由王挺擔任項目負責人的面上項目。中文摘要 在Web2.0的推動下,網路百科作為群體智慧的平台得到了飛速發展,已經成為了一種取代傳統印刷版大百科全書的顛覆性創新。網路百科不僅為用戶提供了豐富的信息,也為計算機的智慧型套用系統提供了潛在的大規模的...
《基於句子匹配分析的知識抽取》是2014年科學技術文獻出版社出版的圖書,作者是化柏林。內容簡介 化柏林編著的《基於句子匹配分析的知識抽取》主要從基礎理論、研究方法、技術實現、實驗分析等四個層面對句子級知識抽取研究進行探討,並展示了一個句子級知識抽取系統框架,在此基礎上實現各種具體的抽取任務,包括定義抽取、...
(1)知識抽取:把蘊含於信息源中的知識經過識別、理解、篩選、歸納等過程抽取出來,並存儲於知識庫中。(2)知識建模:構建知識模型,主要包括三個階段:知識識別、知識規範說明和知識精化。(3)知識轉換:把知識由一種表示形式變換為另一種表示形式。(4)知識存儲:把用適當模式表示的知識經編輯、編譯送入知識庫...
文本知識獲取是指從文本中自動獲取實體、事件和相關屬性等知識,並對這些知識進行結構化組織,為網路空間大搜尋知識的查找與推理提供基礎。知識獲取是指從泛在網路空間數據中獲取本體知識的過程,其被首先定義在專家系統中。文本知識獲取從所抽取的內容上分主要包括實體知識抽取、事件抽取、屬性抽取,下面分別從這三個方面...
《WEB文本挖掘中知識模式的抽取和評價機制》是依託大連理工大學,由林鴻飛擔任項目負責人的面上項目。項目摘要 面對網際網路上的海量信息,如何幫助人們從大量非結構化的WEB文本中提取有效、新穎、可理解的知識模式,成為人們關注的焦點。我們將採用WEB結構分析技術、自然語言理解技術和語言學知識,建立基於語義框架的信息...
具體從多粒度、一體化和信息組織三方面展開,研究內容包括:(1)多粒度信息抽取。針對每個信息單元,從粗粒度到細粒度進行分層抽取,重點解決細粒度知識抽取問題。(2)一體化信息抽取。針對每種類型的粒度知識,選取所有抽取該粒度知識的信息單元,充分考慮不同信息單元之間知識與結構等方面的參照作用,進行一體化研究,...
面向視音頻的知識獲取。面向視音頻的知識獲取是指從視音頻數據中抽取實體、實體特徵、實體間關係等知識的過程。其涉及到視音頻的表示、視音頻與語言的關聯兩個方面的內容。通常,在得到視音頻的語言描述後,可以進一步基於視音頻語言描述文本的信息進行結構化的抽取。
知識獲取有三種方式:非自動知識獲取、知識抽取、機器學習知識。非自動知識獲取由知識工程師通過閱讀有關文獻或與領域專家交流,獲取原始知識並進行分析、歸納、整理,形成用自然語言表述的知識條目輸入到資料庫中。知識抽取是對蘊含於文本文獻中的知識進行識別、理解、篩選、格式化,把文獻的每個知識點抽取出來,以一定形式...
第一屆科學文獻知識實體抽取與評估研討會已於2020年08月04日~ 2020年08月05日在西安市舉辦。會議背景 在大數據時代,海量的信息和數據極大地改變了人類文明。信息的廣泛可得性為人們提供了更多的機會,但也出現了一個新的挑戰:我們如何從眾多的信息源獲取有用的知識。知識實體是某一特定學科或研究領域中相對獨立、...
面向視音頻的知識獲取是指從視音頻數據中抽取實體、實體特徵、實體間關係等知識的過程,為網路空間大搜尋奠定視音頻知識搜尋的基礎。知識獲取是指從泛在網路空間數據中獲取本體知識的過程,其被首先定義在專家系統中。面向視音頻的知識獲取涉及到視音頻的表示、視音頻與語言的關聯兩個方面的內容。得到視音頻的語言描述後...
本書基於實際業務進行抽象,結合知識圖譜的7個構建步驟,深入分析知識圖譜技術套用以及8個行業綜合案例的設計與實現。全書分為基礎篇、構建篇、實踐篇,共16章內容。基礎篇(第1章),介紹知識圖譜的定義、分類、發展階段,以及構建方式、邏輯/技術架構、現狀與套用場景等。構建篇(第2~8章),詳細介紹知識抽取、...
符號方法基於決策樹、粗集理論等技術,得到的分類知識以分類規則的形式出現;而連線主義方法則以神經網路為代表,其知識蘊含在其結構中,不易為人所理解,因而一度被認為不適合於進行數據挖掘。然而由於神經網路在分類問題中具有分類精度高、魯棒性好等優點,很多的研究者致力於從神經網路中抽取分類規則。其基本思路都是...
知識獲取 對多模態的行業知識,如生產系統中的機理模型、行業技術文獻、專家經驗、歷史方法總結、測試報告等,進行解析和處理,這是數據轉化為知識的第一個關鍵階段。支持多模態知識抽取技術可以對多源異構數據(包括結構化、非結構化、半結構化數據)進行快捷便利的知識識別和知識抽取。為了減少模型對訓練樣本的依賴,...
在此基礎上,開發一個概念和概念實例的知識獲取平台,並在該平台上評估和分析提出的知識抽取、學習和驗證的方法。結題摘要 本項目的研究目的是從Web文本中獲取概念和概念實例的屬性和屬性值知識,研究內容包括屬性和屬性值知識表示、抽取、學習和驗證的模型和方法,並開發一個屬性和屬性值的知識獲取平台。 在屬性和...
IE的前身是文本理解。人工智慧研究者一直致力於建造能把握整篇文檔的精確內容的系統。這些系統通常只在很窄的知識領域範圍內運行良好,向其他新領域移植的性能卻很差[53]。八十年代以來,美國政府一直支持MUC對信息抽取技術進行評測。各屆MUC吸引了許多來自不同學術機構和業界實驗室的研究者參加信息抽取系統競賽。每個參加...
《知識中台:數位化轉型中的認知技術》是2022年3月電子工業出版社出版圖書,作者是張傑,吳明輝。從數據科學的視角出發,提出知識中台需要管理三類知識(事實知識、原理知識和技能知識)和具備四項能力(知識抽取、知識管理、知識計算和知識演化)內容簡介 結合人工智慧的前沿成果,分章節詳細講述了其中的關鍵技術和實施路徑...
第1章 基礎知識 1.1 大數據 1.2 知識圖譜 第2章 知識抽取與存儲 2.1 概述 2.2 實體抽取 2.3 關係抽取 2.4 事件抽取 2.5 知識抽取 2.6 知識存儲 2.7 開放知識庫和KG 第3章 知識表示、推理和融合 3.1 知識表示 3.2 知識建模 3.3 知識推理 3.4 知識融合 3.5 知識表示學習 3....
本項目嘗試基於遷移學習方法,解決傳統的信息抽取過程需要較多人工參與且依賴於大規模訓練語料和缺乏領域自適應性的問題,研究從現有的數據中遷移知識,用來幫助將來的學習或者其它領域的學習。通過探索相應的信息抽取方法,彌補領域資源匱乏和領域資源變遷的問題;系統地研究信息抽取的領域自適應方法,從而提高信息抽取的自動化...
《文本中信息的自動抽取方法研究》是依託山西大學,由張永奎擔任項目負責人的面上項目。項目摘要 從文本中抽取信息的過程可粗略地分解為文本分析和信息抽取兩個階段。我們研製了一個基於文本的信息檢索實驗系統,利用自然語言處理技術從無結構的自由文本中提取相關信息並構造結構化的包括相關知識的資料庫,從而實現智慧型信息...
基於本體的工具(Ontology-based Tools):這些工具首先需要專家參與,人工建立某領域的知識庫,然後工具基於知識庫去做抽取操作。如果知識庫具有足夠的表達能力,那么抽取操作可以做到完全自動。而且由這些工具生成的包裝器具有比較好的靈活性和適應性。代表工具有:BYU,X-tract。流程 網路數據抽取技術流程的實現 其...
本書就是圍繞COMMONKADS方法論來介紹知識工程和知識管理,主要內容包括:知識的價值、知識工程和基礎、知識抽取技術以及知識系統的設計與實現方法。書中提供了很多用COMMONKADS方法設計和開發的知識密集型系統的案例,極具實用性。本書內容全面,講解透徹,適合信息系統工程以及知識和信息管理領域的技術人員閱讀,本書還可以...
3.2.4 知識圖譜資料庫比較 120 3.3 知識存儲關鍵技術 121 3.3.1 知識圖譜資料庫的存儲:以Neo4j為例 121 3.3.2 知識圖譜資料庫的索引 124 3.4 開源工具實踐 126 3.4.1 三元組資料庫Apache Jena 126 3.4.2 面向RDF的三元組資料庫gStore 128 參考文獻 131 第4章 知識抽取與知識挖掘 133 4.1 ...
《跨領域信息抽取方法及其在數字圖書中的套用研究》是依託上海大學,由朱文浩擔任項目負責人的青年科學基金項目。中文摘要 在信息爆炸的背景下,利用信息抽取從半結構化和非結構化文本中抽取結構化信息已經成為資料庫、網際網路、知識發現、語義網以及信息檢索等多個領域的重要支撐技術之一。 根據國內外研究現狀,信息抽取...
針對這兩個挑戰,本項目首先引入一個多知識源導向的開放的信息抽取框架,在其中構造一個基於簡標註和弱監督學習的信息抽取器,並進行命名實體識別和開放的關係抽取的聯合分析,從而提高系統的性能和泛化能力,進而實現項目的最終的目標-面向非特定的關係,構造一個具有高準確率和召回率的信息抽取系統,並擁有很強的泛化能力,...
複雜圖譜構建:針對複雜的知識圖譜需求,如醫藥知識圖譜,可以使用Sophon KG的本體定義模組,用戶通過互動式配置即可完成概念層級以及實體和關係屬性的繼承定義,平台支持可視化展示,使得知識結構一目了然。智慧型知識抽取:平台內置金融場景的知識抽取模型,可以實現事件、實體、關係、屬性的自動化抽取。針對其他業務場景,用戶...
空間數據挖掘是指從空間資料庫中抽取沒有清楚表現出來的隱含的知識和空間關係,並發現其中有用的特徵和模式的理論、方法和技術。 空間數據挖掘和知識發現的過程大致可分為以下多個步驟:數據準備、數據選擇、數據預處理、數據縮減或者數據變換、確定數據挖掘目標、確定知識發現算法、數據挖掘、模式解釋、知識評價等,而數據...
文本挖掘是網路熱詞。文本挖掘是從非結構化的文本信息中抽取潛在的、用戶感興趣的重要模式或知識的過程,可以把它看作數據挖掘或資料庫中知識發現的延伸。對文本信息的挖掘主要是以數理統計學和計算語言學為理論基礎,讓計算機發現某些文字出現的規律以及文字與語義、語法間的聯繫。文本挖掘涉及多個學科領域,如信息檢索、...