專利信息學

專利信息學

專利信息學指的是利用計算機方法對專利信息進行分析,從而發現若用逐篇專利文獻分析可能難以看出的那些關係和趨勢的一門科學。

基本介紹

  • 中文名:專利信息學
  • 類型:專利術語
內容,原理,

內容

這個術語的含義包括了以下幾種形式的專利信息分析:
專利情報——利用專利信息來確定某機構的技術能力,並利用該情報來制定技術發展戰略中的策略;
專利地圖——有時也稱之為空白區域圖,它是利用已公開的專利數據繪製出與特定主題或新發明相關領域的可視化圖表等;
專利引證分析——在相同或完全不同的市場空間內,基於某機構的專利被另一家公司引證的情況進行的專利引證關係研究,其目的是為了大致確定專利的價值,或者更確切地說,確定潛在的許可夥伴或線索。
此外,專利信息學還包括對所獲取的各種專利信息、專利情報等的深人分析和套用。
從上面的定義可以看出,這一概念至少包括了兩層含義:一是對海量信息的收集和整理,也就是管理好這些數據;二是要通過分析發現在表象掩蓋下的事實和規律,也就是用好這些數據。

原理

當對專利信息學進行更詳細的探討時,可以將不同的分析方式劃分為兩大類,即:數據挖掘(datamining)和文本挖掘(textmining)。
數據挖掘,是指從劃定域內的數據中抽取出有用的信息並對其進行分析。通常,這意味著對專利中所包含的著錄項目信息進行分析。比如說,有人可能想考察某一特定技術領域專利權人和國際專利分類號(IPC)之間的關係。挖掘或描繪該信息可得知這一技術領域內的主要參與者以及他們通常所關注的具體技術內容。如果使用德溫特數據的話,還可以用德溫特手工代碼代替IPC來進行類似分析。
文本挖掘或繪圖,一般涉及在所包含的主要技術構思的基礎上將檔案分類。其數據源是未經過組織的文本,它沒有被結構化,這些材料唯一的結構來自於作者撰寫它們時所採用的方式,以及他們在不同的構思和概念之問如何建立起一種聯繫。比如說,你可以收集某一特定專利權人的所有專利文獻,並對這些文獻的文本進行分析。在一幅聚類圖中,藉助計算機軟體可以從這些文獻中提取出主要的構思,並根據這些構思將文獻分類。之後,計算機軟體還可以通過某種方式將這些聚類可視化,繪製成圖。通過觀察這些聚類(以及隨後考察涉及的文獻本身,當然這時文獻是以某種方式組織過的),可以很快得知某機構所從事工作的概況,以及這些工作在內部是如何關聯的。
進行數據挖掘或文本挖掘的效果如何,通常取決於分析員對所分析的數據源的熟悉程度,例如對數據的結構、內容、具體項目的含義等的了解,以及製作和分析這些數據的方法。數據挖掘或文本挖掘得越成功,所獲得的有用信官、和情報就越多。

相關詞條

熱門詞條

聯絡我們