阿爾法元

阿爾法元

阿爾法元,谷歌DeepMind的機器系統。

基本介紹

  • 中文名:阿爾法元
  • 外文名:AlphaZero
主要配置,主要成績,

主要配置

阿爾法元(Alpha Zero)的設計理念和系統配置完全和Lee/Master不同,它不依託於人類的先驗成果,完全靠自我對弈學習下棋。此前,Lee/Master都是用上千盤人類業餘和專業棋手的棋譜進行訓練。
同時,Zero僅配置了4個TPU,Lee則是48個谷歌TPU計算單元。

主要成績

2017年10月,《自然》雜誌刊登了谷歌DeepMind團隊的新成果,名為AlphaZero(暫譯:阿爾法元)的機器系統僅訓練3天就戰勝了AlphaGo Lee,比分100:0,後者就是戰敗李世石的那套。

相關詞條

熱門詞條

聯絡我們