Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/ganjinzero/tenpai_prediction
用深层神经网络预测日本麻将立直听牌
https://github.com/ganjinzero/tenpai_prediction
japanese-majhong mahjong neural-network richi
Last synced: about 1 month ago
JSON representation
用深层神经网络预测日本麻将立直听牌
- Host: GitHub
- URL: https://github.com/ganjinzero/tenpai_prediction
- Owner: GanjinZero
- Created: 2018-12-04T01:19:40.000Z (about 6 years ago)
- Default Branch: master
- Last Pushed: 2022-06-22T01:47:15.000Z (over 2 years ago)
- Last Synced: 2024-05-23T04:45:44.494Z (8 months ago)
- Topics: japanese-majhong, mahjong, neural-network, richi
- Language: Python
- Homepage:
- Size: 46.9 MB
- Stars: 55
- Watchers: 5
- Forks: 9
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
---
title: 科学麻将:从不放炮开始
date: 2019-03-26 15:34:00
tags: 日麻, 听牌预测, 深度学习
---# 项目地址
[https://github.com/GanjinZero/Tenpai_prediction](https://github.com/GanjinZero/Tenpai_prediction)# 项目背景
日本麻将是一种最强调防守的麻将,它比其他的麻将更注重不要点炮(也就是放铳)。雀魂最近比较流行,所以我又重新开始玩日麻(以前在MJ和天凤都打过一点)。我也比较菜,才打到雀士三。一个经常遇到的场景时,当有人立直(门清宣告听牌)的时候,当我选择弃胡时,我想知道应该打出什么样的牌才不会点炮。这就是在这个项目中研究的问题:当他家率先立直时,他家可能的听牌有哪些。这个问题可以看成是一个文本分类问题来考虑,将前面已经打过的牌当作文本,听牌考虑成文本最终的分类。当然这还是和文本分类问题不太一样的,因为对于某一个文本一般是固定一个分类(比如情感分类中的积极或者消极);而对于麻将而言首先一次听牌可以听好几种牌(纯正九莲宝灯!)、其次同样的舍牌可能听的牌完全不同。在这里推荐一本书《科学するマジャン》,可以在苹果的图书商店下载到。这里有利用概率论计算的麻将打法和一些关于麻将的数值模拟结果。本项目也是在阅读该书中产生的想法。
![听说你在做大牌](https://imgsa.baidu.com/forum/w%3D580/sign=d3fafccb01f431adbcd243317b37ac0f/5499bccb39dbb6fd332bfc7f0424ab18972b373d.jpg)
```
ロン!断幺九!30符1番,1000点!
```# 数据准备
## 牌谱收集最初是在《科学する麻雀》中看到了该书作者とつげき東北的[个人主页](http://totutohoku.b23.coreserver.jp/hp/),然后在这面找到他收集的一些在东风庄这个平台上的一些[牌谱](http://totutohoku.b23.coreserver.jp/hp/HAIHU.htm)。
[![kagakul](https://img1.doubanio.com/view/subject/l/public/s27317998.jpg)]()
一共收集有万份左右的牌谱。
一份牌谱的示例如下
```
東2局 0本場(リーチ0) YZKTR 3000 松戸の俊 -1500 菌太郎 -1000 シャモア -500
30符 二飜ツモ リーチ 門前清模和
[1西]3p8p9p3s4s8s8s南西北白白発
[2北]1m5m6m7m4p6p1s5s7s東白白中
[3東]3m5m2p3p4p6p8p9p1s5s7s8s8s
[4南]1m4m4m9m1p5p5p7p9p4s4s北中
[表ドラ]西 [裏ドラ]北
* 3G9s 3D9s 4G中 4d9m 1G8m 1d北 2G4m 2d1s 3G6p 3D6p 4G1p 4d1m
* 1G6s 1d南 2G2s 2d1m 3G6s 3D6s 4G2s 4D2s 1C3s4s 1d8m 2C6m7m 2d2s
* 3G3s 3G3s 4G7p 4d9p 4R 1G3s 1d9p
```这里记录了对局信息,胡牌的番型和各家起手牌、宝牌、每家每一轮的摸牌、切牌和鸣牌。这些牌谱的具体信息会在下文的**牌谱准备**中详细介绍。4R代表南家立直,那么对于东、西、北家都需要预测南家可能的听牌。因为各家的起手牌不同,摸到的牌也不同,所以对于南家的听牌有不同的估计(在德扑中叫做阻隔牌)。三家由于有不同的起手信息,所以可以生成三份训练数据。例如对于北家而言,可以只留下北家可以知道的信息作为训练用的x,而将南家的真实听牌作为训练用的y。
## 数据增强
只用这些牌谱数据看起来还有些不够,训练出的结果不是很理想。考虑可以这样生成一些假的牌谱。将中、发、白以某种顺序置换;将饼、万、索以某种顺序置换;将123456789变成987654321。这样的变换不能保证是完全合理的。一个原因是绿一色导致索和饼、万并不是完全等价的,但考虑到绿一色出现的概率如此的低就不管了。另一个原因是宝牌的问题,比如原来的宝牌指示牌是1m,宝牌是2m。如果进行了123456789变成987654321,宝牌就会变成8m;这时宝牌指示牌并不能变成9m,而变成了7m。这两个问题不能很好解决,但为了获得更多的牌谱,还是进行了这几种置换。中发白的置换共6种,饼万索的置换共6种,数字颠倒共2种(颠倒或者不颠倒),一共6\*6\*2=72种变换方式。对每一份牌谱,我们随机的选择k=7种变换作为增强的数据。(考虑到内存大小,k不要太大)
## 将牌谱编码
我们将每一次摸牌,鸣牌或者打牌都定义为一个action,然后将这个action嵌入到一个52维向量中。这个向量描述了这个动作是谁执行的(东西南北家),是进行了什么动作(摸牌、切牌、吃碰杠、立直),是和哪一张牌进行了交互,交互牌是否是自风、场风、宝牌这些信息。具体的编码方式可以看**/src/haifu_parser.py**中的**action_to_vector(action, player, chanfon, jikaze, dora_list)**函数。
# 模型训练
模型使用了双层LSTM网络连接34维的Softmax层进行预测(麻将一共34张不同的牌)。损失函数为交叉熵。在两块1080Ti的显卡下训练70个epoch得到了预训练的模型,大约需要训练2个小时。具体的模型可以参照**/src/neural_network.py**中的结构。
# 进行预测
## 预备工作
需要有可以编译Python3的环境。在终端中输入
```
$ git clone https://github.com/GanjinZero/Tenpai_prediction.git
```
下载该项目。在终端中输入
```
$ pip install -r requirements.txt
```
安装依赖。## 牌谱准备
预训练好的模型保存在**model/tenpai.model**。我们需要将牌谱设置为**data/test.txt**中的格式,并保存到**data/test.txt**中:
```
東2局 0本場(リーチ0)
123
[1西]
[2北]1m5m6m7m4p6p1s5s7s東白白中
[3東]
[4南]
[表ドラ]西 [裏ドラ]北
* 3D9s 4d9m 1d北 2G4m 2d1s 3D6p 4d1m
* 1d南 2G2s 2d1m 3D6s 4D2s 1C3s4s 1d8m 2C6m7m 2d2s
* 3D3s 4d9p 4R 1G3s 1d9p
```
- 第一行填写东x局(或者南x局),后面的本场、立直棒、点棒信息都不是必要的。
- 第二行填写符数、翻数、番形,可以留空行,但不能把这行都删了。
- 第三-六行填写四家起手牌,可以只填自家牌,其他留空。其中m代表万,p代表饼,s代表索;“東南西北中発白”请使用日语汉字。比如:
```
[1西]
[2北]1m5m6m7m4p6p1s5s7s東白白中
[3東]
[4南]
```
- 第七行填写宝牌和里宝牌,里宝牌可以不填。注意是宝牌,不是宝牌指示牌!
- 第八行起填写这局牌的行进过程。每一行以\*开始,每一个行动和行动之间有一个空格。比如第一行的动作3D9s可以翻译为东家摸切9s,4d9m可以翻译为3家切掉9m。只需要记录自家的摸牌动作(在这里就是2G,因为其他家摸到的牌你是看不见的,就算输入了模型也会忽略其他家的摸牌数据)完整的动作对应表见下表:| 字符 | 含义 | 用法示例 |
| :-------: | :----------------: | :----------------: |
| G | 自摸(不是自摸和) | 1G1m |
| d | 切牌 | 1d2s |
| D | 摸切 | 1D1m |
| N | 碰 | 1N |
| C | 吃 | 1C1s3s(1s3s是玩家1自己的牌) |
| K | 杠 | 1K1s |
| R | 立直 | 1R |
| A | 胡牌 | 1A |**data/test.txt**中可以保存多个牌谱,请在牌谱和牌谱之间用空行分隔。
P.S. 如果可以直接获取到文字格式的天凤或者雀魂牌谱,可以编写一个牌谱的自动encoder,就不需要上述这么麻烦了。
## 开始预测
在**src**文件夹下,使用如下的命令进行预测
```
$ python predict.py
```就可以看到类似如下的预测结果
```
Richi player tenpai: ['3m', '6m', '9m']
Player 1:
{'3m': 0.33759603, '6m': 0.33912653, '9m': 0.32323775}
Richi player tenpai: ['3m', '6m', '9m']
Player 2:
{'3m': 0.337948, '6m': 0.33527905, '9m': 0.31589714}
Richi player tenpai: ['3m', '6m', '9m']
Player 3:
{'3m': 0.33415237, '6m': 0.33977884, '9m': 0.32597464}
Richi player tenpai: ['6m']
```# 其他
欢迎提供更多的牌谱和咖啡给作者!联系作者:
[Github]() - https://github.com/GanjinZero/
Email -
![Jyama](http://img.nga.178.com/attachments/mon_201810/02/-4kkseQ5-8o3iKkT8S3c-3c.png)