Min! A1pha-G0

使用 MCTS 算法实现的集结棋 (Lines of Action)。

一、小组成员及分工

郭帅帅 3160104060 （棋盘环境对象 board.py、GUI app.py、其他测试引擎 random.py, greedy.py, human.py）
何洪良 3160103176 （MCTS 引擎 mcts.py, mcts_engine.py）

二、开发环境

Python 3.7.3
Linux 4.19 / Windows 10

依赖：

PyQt5==5.12.2

三、实现的功能

精美图形界面
人机博弈，对可走位置有视觉提示
显示双方计算时间
通过命令行参数动态调整双方引擎，实现模块化

四、运行方法

1. 建立虚拟环境（可选）

$ python3 -m venv venv
$ source venv/bin/activate

2. 安装依赖

(venv)$ pip install PyQt5==5.12.2

3. 运行

显示帮助：

(venv)$ python src/app.py -h
usage: app.py [-h] [-a ENGINE_A] [-b ENGINE_B]

Mini Alpha-Go. Available engines: mcts, random, greedy, human

optional arguments:
  -h, --help            show this help message and exit
  -a ENGINE_A, --engine_a ENGINE_A
                        Engine for player a (black). Default: human.
  -b ENGINE_B, --engine_b ENGINE_B
                        Engine for player b (white). Default: human.

人机博弈：

(venv)$ python src/app.py

黑方使用贪婪，白方使用 MCTS：

(venv)$ python src/app.py -a greedy -b mcts

五、实现说明

1. 关于 mcts 引擎的说明

由于集结棋一局步骤较多，因此需要更多的模拟时间，mcts 引擎在每一步耗时在55秒左右
在对局开始的时候模拟次数较少，对局接近结束或者棋子较少的情况下模拟次数较多
在一个节点的所有子节点都被探索过的前提下，才会使用 UCT 算法，否则是 random
尚未进行更有效的优化来提升棋力

2. 棋盘与引擎接口

棋盘类 Board 的接口为：

matrix (2d-array) 中数字含义：
    0 - 无棋
    1 - 黑棋
    -1 - 白棋

color (int): 当前准备下棋的颜色

avail_steps (dict): 存储当前黑白方能走的位置
    {
        B: {
            (0, 1): [(1, 1), (2, 2)]
            (4, 3): [(0, 0)],
            (5, 5): [],
            ...
        },
        W: {
            ...
        }
    }

counts (dict): 当前双方棋子数量
    {
        B: 12,
        W: 12
    }

is_terminal (bool): 是否处于终止状态（双方都无棋可下，或一方棋子仅剩下一颗，或某一方连起来）

自定义引擎只需实现一个 exec(board: Board) -> (source: tuple, target: tuple) 方法，即接收一个棋盘状态 board，返回一个走法，从点 source 走到 target。

mini-alpha-go

Commits

docs

rm mcts_git.py

中英文空格

readme

simplified