事件簿人機圍棋對弈

AlphaGo改良後消耗電量僅10分之1

柯潔首場與人工智能Alphago的圍棋對戰,最終柯潔僅僅落敗。開發AlphaGo的DeepMind更說AlphaGo現時棋力比16年與李世乭對戰時強得多。

由Demis Hassabis、Shane Legg及Mustafa Suleyman 於2010年創立DeepMind,開發電腦AI系統AlphaGo,這更是第一個撃敗人類職業圍棋選手及世界冠軍的AI程式。16年3月以4比1總比分戰勝了圍棋世界冠軍李世乭,是人工智能領域中重要里程碑,亦躋身圍棋界最高稱號「職業九段行列」,成為史上首個獲得該榮譽的非人類棋手。

年初AlphaGo2.0就以「Master/Magister」名字與世界頂級圍棋選手進行60場網上快棋對局,並獲全勝戰績。這都是AlphaGo自我進化的最佳素材,圍棋一直被認為是AI最具挑戰性項目,包含了龐大搜索空間。AlphaGo採用了新穎的機器學習技術,結合監督學習及強化學習優勢,形成一個策略網絡(Policy network),以棋盤上局勢作輸入數據,並對所有可行的落子位置產生一個概率分佈。從而訓練出一個價值觀網絡(value network),再對自我對奕進行預測,預測所有可行落子位置的結果。

目前最新版本的AlphaGo是利用雲端(Cloud Computing)上以單TPU(Tensor Processing Unit)運行,即是早前Google I/O開發者大會上所公佈的最新版本。TPU是專門為機器學習設計的處理器,相比16年3月與李世乭的比賽,最新版本的處理計算時所消耗的電量僅為以往的10分之1,可在最低的功耗下發揮最大的效能。