基本介紹
簡介,規則,排行榜,分數差異與勝率對照,與人類對應,知名圍棋軟體,相關術語,
簡介
CGOS提供圍棋軟體在各式棋盤上使用GTP(Go Text Protocol)對弈(目前支援9x9、13x13以及標準19x19棋盤),系統會自動配對對手進行對弈,並提供等級分計算排行榜,讓圍棋軟體的開發者可以了解軟體的實力。
規則
為了讓程式判斷更為簡單與清楚,採用Tromp–Taylor規則計算勝負(但禁止自殺),該規則接近于于中國規則。讓子在19x19與13x13為貼7.5目,在9x9的則為7.0目。
比賽用時采包乾制,9x9為每方五分鐘,13x13為每方十分鐘,19x19為每方十五分鐘。除此之外,系統會在每一步都增加一小段可用時間,以避免軟體本身以為沒有逾時,但伺服器卻因為網路傳輸延遲而造成判負的情況。
排行榜
CGOS採用等級分的機制計算排行榜。系統提供兩種排行榜:
- 第一種為即時更新的Elo,在每次對弈完後就會更新成績,可以較即時得知軟體實力,但僅保留三十天內有下棋的軟體資訊,且排名準確度較差。
- 第二種為每日更新一次的BayesElo,軟體最少需有100場的成績才會列入排名計算。雖然更新頻率沒有前者Elo高,但因算法的特性以及場次低標限制,排名較Elo準確,而且保留所有歷史資料。一般在討論相對強度時都會以BayesElo為主。
不管哪一種等級分,都會遇到分數漂移的問題(英語:Rating inflation/deflation)。CGOS的解法是將GNU Go(賬號Gnugo-3.7.10-a1)固定在1800分作為基準,並且常態參與比賽,以確保軟體分數的穩定性。
分數差異與勝率對照
在CGOS官網上有完整的列表。常見的對應點為:
- 差70分時約60%。
- 差150分時約70%。
- 差240分時約80%。
- 差380分時約90%。
- 差800分時約99%。
與人類對應
CGOS的維護者山下宏依照AlphaGo相關的論文,以及2018年一月時Go Ratings的資料,推算AlphaGo的各種版本以及人類頂尖棋手在CGOS上可能對應到的BayesElo分數:
軟體或人類 | BayesElo | Go Ratings | 備註 |
---|---|---|---|
AlphaGo Zero(40 blocks版) | 5422 | 4450 | |
AlphaGo(Master版) | 5231 | 4250 | |
AlphaGo Zero(20 blocks版) | 5022 | 4050 | |
AlphaGo(Lee版) | 4672 | 3700 | Go Ratings的3700分是以AlphaGo李世乭五番棋中四勝一負的戰績推算。 |
4592 | 3620 | 發文當時人類在Go Ratings上最高分的棋手。 | |
4590 | 3618 | ||
4546 | 3574 | ||
4514 | 3542 | ||
4269 | 3297 | 賬號Zen-15.7-4c1g,發文當時在CGOS上BayesElo分數最高的賬號。 | |
AlphaGo(Fan版,176 GPU) | 4122 | 3150 | |
AlphaGo(Fan版,48 CPU與8 GPU) | 3862 | 2890 | |
GNU Go | 1800 | 828 | 賬號Gnugo-3.7.10-a1,固定的基準分。 |
知名圍棋軟體
由於CGOS提供了二十四小時都可以自動對弈的環境,有不少知名圍棋的軟體都有官方或愛好者將軟體掛上去測試:
- AQ,即AQ系列,截至2018年5月,免費圍棋軟體中實力最好的圍棋軟體。
- DeepZenGo,即Zen系列。
- GNU Go,即Gnugo-3.7.10-a1,系統固定其Elo與BayesElo等級分為1800,作為排名的計算基準。
- Leela及Leela Zero,即leela與LZ系列。
- PhoenixGo,即cronus系列,截至2018年5月,是CGOS上排名最高的圍棋軟體。
- 天壤圍棋,即define-3.0與tianrang系列。
相關術語
- 計算機圍棋
- 網路圍棋