《極限學習機礦產資源評價研究》是依託吉林大學,由陳永良擔任項目負責人的面上項目。
基本介紹
- 中文名:極限學習機礦產資源評價研究
- 項目類別:面上項目
- 項目負責人:陳永良
- 依託單位:吉林大學
項目摘要,結題摘要,
項目摘要
極限學習機是一種學習速度快、操作容易、人工干預少、泛化性能強的新型計算智慧型模型,已成為大規模計算和人工智慧的有效理論工具。將該模型引入礦產資源評價研究領域,有望解決多元非線性統計模型在礦產資源評價套用中面臨的計算複雜度過高和存儲空間過大等諸多技術瓶頸問題。鑒於此,項目組擬概括和總結極限學習機理論與套用研究的最新成果,借鑑極限學習機和極限學習機集成模型在解決大規模並行回歸和分散式集成分類等問題方面的套用研究經驗,研製基於極限學習機、並行式極限學習機集成模型、線上順序極限學習機和分散式線上順序極限學習機集成模型的一系列多元非線性礦產資源評價模型;以實驗區地物化遙多源地學觀測數據為基本數據源,套用新模型預測礦產資源遠景靶區,創建極限學習機礦產資源評價套用研究的一個典型範例。研究工作能夠為當代礦產資源評價提供新技術與新方法,對極限學習機理論的發展具有積極的促進作用,理論與實際意義重大。
結題摘要
該項目是已結題的兩個基金項目(40872193和41072244)研究工作的延續。主要研究地物化遙多源地學觀測數據高維非線性統計建模方法,通過建立多元非線性統計模型實現高維空間綜合致礦地質異常信息的提取和礦產靶區統計預測。前兩個項目分別研究面向礦產資源評價的非線性隱含變數模型和PoE模型和算法。針對這兩類算法模型建模計算複雜度高和存儲空間大的套用技術瓶頸,項目組把機器學習領域大規模計算的人工智慧有效理論工具ELM模型理論引入礦產資源評價領域,通過套用拓展研究,研製出礦產資源評價的ELM模型體系,實現海量多源地學觀測數據的ELM模型統計建模和礦產靶區預測。 極限學習機是一種新的單隱層前饋神經網路模型學習算法。該算法的輸入權和隱藏層閾值是隨機選擇的,輸出權是由隱藏層輸出矩陣的廣義逆矩陣確定的。與傳統的單隱層前饋神經網路算法不同,ELM算法同時最小化訓練誤差和輸出權範數,其訓練速度比傳統的反向傳播學習算法快數千倍而且泛化性能更強。極限學習機模型為各種類型的特徵映射提供了一個統一的訓練平台來解決分類和回歸的建模問題。ELM算法克服了諸多神經網路模型收斂速度慢和過擬合問題。因此,已廣泛用於解決機器學習領域的模式識別、統計預測、分類和回歸等科學問題。選擇青海省拉陵灶火地區為實驗研究區,將研究區劃分成200×187個格線統計單元(含礦單元17個),構建了基於極限學習機回歸和分類的多金屬礦產靶區預測模型,預測了研究區的多金屬礦產靶區,用礦產預測與效果評價的通用效益-代價模型評價了礦產靶區預測效果,用AUC指標評價了礦產靶區預測總體效果,用約登指數確定了礦產靶區與非靶區的最佳分界線並圈定了最優預測靶區。極限學習機回歸、邏輯斯蒂回歸、極限學習機分類和多層感知機模型的礦產靶區預測效果的對比分析結果表明:①代價-效益曲線特徵和AUC統計值揭示極限學習機模型能夠很好地區分研究區含礦和非含礦統計單元;②極限學習機模型預測的最優靶區只占研究區總面積為2.66~3.66%,但包含了研究區82%的已知多金屬礦床(點);③極限學習機回歸和分類模型的學習訓練過程耗時只有75.6~518.3秒;④極限學習機回歸模型優於邏輯斯蒂回歸模型,極限學習機分類模型優於多層感知機模型。因此,極限學習機是一種有潛在套用前景的數據驅動型礦產靶區模型,其相應研究成果對當代礦產資源評價方法體系的發展具有重要意義。