基於國家自然科學基金成果海量數據的統計學方法研究

基於國家自然科學基金成果海量數據的統計學方法研究

《基於國家自然科學基金成果海量數據的統計學方法研究》是依託東北師範大學,由郝立柱擔任項目負責人的數學天元基金項目。

基本介紹

  • 中文名:基於國家自然科學基金成果海量數據的統計學方法研究
  • 項目類別:數學天元基金項目
  • 項目負責人:郝立柱
  • 依託單位:東北師範大學
項目摘要,結題摘要,

項目摘要

隨著大數據時代的到來,基金成果的海量數據處理在技術上已變得可行,然而在方法論研究上還遠不夠成熟。本項目重點研究基於科學基金成果數據的統計學方法。首先建立基金資助所產生的SCI論文及引文資料庫、關鍵字和熱點詞資料庫、學科間論文引用網路資料庫,以此為基礎,提出高效的關鍵字提取方法和熱點追蹤方法,進行科學基金資助傾向與國際科研熱點之間的關聯分析;以時間序列模型為基礎,擬建立動態干預模型,用以分析由於每年科學基金資助傾向和力度的不同對相應的時間序列模型產生的干預的因果效應;建立學科間論文引用情況的互動圖——學科影響網路,用來描述和量化各學科對其它學科的影響力。本項目通過構建一個統一的框架為綜合評價科學基金對各學科的資助成效提供方法論依據。

結題摘要

本項目提取了自1986年到2015年的全部結題報告附表二(基金信息計算機統計表)中全部信息。本項目以東北師範大學為依託單位,在項目執行期間,多次使用計算機機房的計算機進行並行數據處理,自行研發了兩種主要的自動化技術,通過程式控制PDF中的文本提取和截屏技術分析圖形的點陣結構,並與文本提取的結果進行匹配,最後對匹配結果不一致的信息進行人工校對,從而極大地提高了信息提取的正確率。專為信息提取建立了一個較為完善的信息處理平台,全部的信息處理都在平台內實現,從而極大地提高了工作效率,保障了項目的如期順利完成。 建立了描述性統計分析所需的各種統計圖表,建立了關鍵字網路、合作者網路,通過網路分析了多個項目負責人的合作關係,分析了多個領域的研究方向的變化規律。

相關詞條

熱門詞條

聯絡我們