Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/harryoung/kunpeng-ai-competetion

华为2019年鲲鹏AI大赛32强源码
https://github.com/harryoung/kunpeng-ai-competetion

python strategy-game

Last synced: about 1 month ago
JSON representation

华为2019年鲲鹏AI大赛32强源码

Host: GitHub
URL: https://github.com/harryoung/kunpeng-ai-competetion
Owner: Harryoung
License: apache-2.0
Created: 2019-09-09T07:22:40.000Z (over 5 years ago)
Default Branch: master
Last Pushed: 2019-09-09T16:14:14.000Z (over 5 years ago)
Last Synced: 2024-11-06T18:02:14.387Z (3 months ago)
Topics: python, strategy-game
Language: JavaScript
Homepage:
Size: 82.9 MB
Stars: 0
Watchers: 2
Forks: 0
Open Issues: 0
Metadata Files:
- Readme: README.md
- License: LICENSE

Awesome Lists containing this project

README

# KUNPENG-AI-Competetion
华为2019年鲲鹏AI大赛32强源码分享
[比赛链接](https://developer.huaweicloud.com/competition/competitions/1000005050/introduction)
## 心得
本次比赛一开始是抱着玩一玩的心态做的，在央企工作比较闲，锻炼锻炼自己，以防脑子生锈。后来无意过了初赛，又经过几天集中改进策略修改bug之后过了复赛第一轮，而且在复赛第二轮前的小组热身赛中表现一直不错。这时我才发现原来我可以冲刺一下决赛，遗憾的是决赛换了地图，我的算法复杂度瞬间上升，在比赛服务器上超时了，0分惨败出局。让人不甘心的是看超时前的表现，进决赛应该是没问题的，而我只需要将一个搜索步长减一，就完全能满足每轮800ms延时的要求，由此带来的性能下降也就一丢丢。如果比赛方在复赛第二轮当天开方AI以提供测试环境就好了。怎么说呢，人生总是充满各种意外，因为意外（幸运）进了复赛，也因为意外憾别决赛，唯一能做好的，就是充实现在，放眼未来了。共勉。
## 主要思路
核心思想是两个词，一个是损益计算，另一个是WFS宽度优先搜索。
### 损益计算
对当前回合的每一个本方player，分别起算其可能动作的损益值gain，选取损益值最大的动作。损益值由一系列因素决定，包括但不限于与最近的enemy的距离，与最近的power的距离，与本方其它player的距离，与虫洞的距离，与最近的不在视野内的greatPower（定义分值大于3的power为greatPower）的距离等等，thief mode 与 police mode 考虑的因素有所不同。
### WFS
WFS的作用就是用来搜索上述最近距离，使用了队列模块Queue，相信了解WFS的人都不用多做解释了。

## 思考
### 1. WFS是否复杂度太高，不考虑用动态规划Dijkstra算法计算两点间最近路径吗？
哈哈一开始我是想到用Dijkstra的，但是由于对动态规划的敬畏导致我最后没去实现（手动捂脸），据说效率蛮高的，应该有大佬开源了相关代码。另一方面，利用Dijkstra计算需要对当前每一个我方player和每一个可见enemy以及power计算最短路径，感觉总体耗时也挺高的。当然，可以用一个dict存储已经计算过的最短路径，这样越到后面所需要的计算量越小，也可以一开始就把所有可能的两点间最短路径都算出来，存在表里，反正前几个回合一般也没什么危险，只是需要注意不要超过10回合，否则判为掉线，而一旦顺利计算完成，就一劳永逸了。而用WFS的话，所有上述所需计算的最短步数，都是可以在同一个WFS里一起搜索的（除了thief mode 下寻找最近的enemy，因为时空隧道的存在，两点间的最短路径是不对称的），整体效率其实也差不了多少。
### 2. constants.py里面定义了太多权重值以及搜索步数值，有什么依据吗？
没有哈哈，纯靠感觉！另一方面，如果计算资源够的话，可以暴力grid search一发，找到最佳组合啧啧。
### 3. 没考虑强化学习吗？
一开始我以为会有很多大佬用强化学习，结果据我所知没一个用的（手动狗头）。一来是状态太多不好建模，复杂度太高，而且激励函数不好定；另一方面是比赛方只提供了Windows版的服务端可执行程序，没有源码，没法去自己调整一些变量，输出一些必要信息以供训练。当然，肯定是我对强化学习不够了解，真正的大佬应该觉得这根本不是问题，毕竟围棋这么复杂的游戏都能用强化学习解决的很好，这肯定不在话下。

## 备注
* 由于GitHub大文件限制，ui文件夹下的部分文件上传失败，感兴趣的朋友可以在官网去下载试题文档。
* server/map_generator.py是群里大佬提供的。
* 个人源码在Client_Python/client/ballclient/service下。
* PS：用GitHub还不多，有些地方没有完全交代清楚还请见谅~
* 最后，代码中肯定还有bug，有心人如果发现还请告知，不胜感激~~~