https://github.com/zhaipro/alphalineuppuzzle

Lineup Puzzle 游戏 AI 灵感来自于AlphaGo
https://github.com/zhaipro/alphalineuppuzzle

Last synced: 29 days ago
JSON representation

Lineup Puzzle 游戏 AI 灵感来自于AlphaGo

Host: GitHub
URL: https://github.com/zhaipro/alphalineuppuzzle
Owner: zhaipro
License: mit
Created: 2016-03-28T03:04:57.000Z (about 10 years ago)
Default Branch: develop
Last Pushed: 2017-12-17T07:35:43.000Z (over 8 years ago)
Last Synced: 2025-01-28T03:50:03.490Z (over 1 year ago)
Language: Python
Homepage:
Size: 699 KB
Stars: 1
Watchers: 2
Forks: 3
Open Issues: 1
Metadata Files:
- Readme: README.md
- License: LICENSE

Awesome Lists containing this project

README

          # AlphaLineupPuzzle

该项目是Lineup Puzzle游戏的AI。

命名灵感来自于AlphaGo，

其目的是学习并掌握AlphaGo论文中提到的相关技术。

## 当前进展

- [ ] AlphaLineupPuzzle开发

 - [x] 棋盘

 - [x] 蒙特卡洛树搜索

 - [x] 快速走子

 - [ ] 策略网络

 - [ ] 联合策略网络和蒙特卡洛树搜索

 - [ ] 值网络

 - [ ] 强化学习

 - [ ] AI界面

## v0.1版本的性能

v0.1版本在单核心上运行了8天(11679分钟)，共完成248局游戏。以下是对这248局游戏存档的统计：

name   |sum    |mean   |min    |max

-------|-------|-------|-------|-------

得分   |-      |155943 |4500   |922000

步数   |133309 |537    |23     |3142

候选   |-      |22.85  |0      |100

其中每消除一行得500分。

## 快速走子策略的性能

神经网络库用的是chainer。训练数据来自于v0.1的存档。

**第一次尝试（v0.2）：**

提取并旋转、镜面扩展了训练数据。

其中前10%用于测试，后90%用于训练。

其在测试集上的预测准确率为22.5%（纯蒙的话，准确率为4.38%），在训练集上的准确率为23.1%

**第二次尝试（v0.3）：**

```bash

python -m AlphaLineupPuzzle.preprocessing.game_converter v2 -e 1 -v -o data.h5f

python -m AlphaLineupPuzzle.training.training -i data.h5f -a 0.0005 -b 32 -n 5 -o v0.3 -v

python -m AlphaLineupPuzzle.ai -i v0.3 -c 248 | grep -E [0-9]+ | sum.sh

```

**结论：**

1. 与随机走子对比，训练结果是有效果的 。

1. 更简单的输入输出结构能得到更好的效果。

以下是仅使用快速走子策略的得分。其中随机走子作为对照组，它仅等概率地挑选合法走子。

执行批次|策略网络v0.2|策略网络 v0.3|随机走子

--------|--------|----|--------

第一次  |5540    |11260|1274

第二次  |5512    |13247|1304

第三次  |5318    |11491|1236

其中每个批次都包含248局游戏，分值为这248局的平均得分。

## 截图

游戏界面如下：

![](./screenshots/game.png)

AI运行时如下：

![](./screenshots/AI.png)

ecosyste.ms

Data

Tools

Indexes

Applications

Experiments

Awesome

https://github.com/zhaipro/alphalineuppuzzle

Awesome Lists containing this project

README