《基於機器學習的圍棋人機對弈算法的研究》是依託昆明理工大學,由吳霖擔任項目負責人的地區科學基金項目。
基本介紹
- 中文名:基於機器學習的圍棋人機對弈算法的研究
- 項目類別:地區科學基金項目
- 項目負責人:吳霖
- 依託單位:昆明理工大學
項目摘要,結題摘要,
項目摘要
圍棋做為人工智慧領域最後一個沒有被攻克的二人棋類遊戲,一直吸引了大量的研究工作。本項目力圖在小棋格下構造一個實際可用的基於機器自動學習的圍棋系統。. 本項目由兩個子系統組成。第一個子系統研究如何用人工神經網路自動學習圍棋評價函式。其研究重點是降低學習誤差。第二個子系統研究如何用搜尋算法修復自動學習的評價函式的評價誤差。質量控制是兩個子系統間協同的關鍵問題。本項目力圖在圍棋這個局限的領域內尋找有效的質量控制手段,來構造基於機器學習的有實用價值的圍棋系統。
結題摘要
項目圍繞UCT算法在圍棋死活題上的套用、機率圖模型在計算機圍棋研究中的套用以及機器學習算法三方面的內容展開研究和探討,取得了以下進展:1.UCT在圍棋死活題上的套用方面,提出並實現了封閉邊界圍棋死活題的UCT求解算法,並對算法的求解效率進行了探究;2.機率圖模型在計算機圍棋研究中的套用方面,在全面掌握了TrueSkill模型的基礎上,提出了基於TrueSkill的圍棋專業棋手排名算法,並且根據圍棋比賽的特點,提出了融合先後手優勢的競技水平估計算法;3.在機器學習算法方面,研究了與計算機圍棋相關的機器學習算法在其他領域,特別是在自然語言處理方面的套用。項目發表論文12篇,其中SCI收錄1篇,EI收錄5篇,已培養碩士研究生3名,正在培養碩士研究生1名。