AlphaGO 的成功,在於使用了深度學習與強化學習,讓 AI 可以不斷從回饋獎勵中學習。並且在策略上採用更有效率的蒙地卡羅樹搜索法,改善 AI 的判斷能力。 圖|研之有物(資料來源|吳廸融)