https://github.com/hyeon9mak/hcp_2020
๐ฎ ํฌ์ผ๋ชฌ ๊ธธ์ฐพ๊ธฐ ๊ฒ์ (๊ด์ด๋ํ๊ต ์ปดํจํฐ์ ๋ณด๊ณตํ๋ถ ๊ณ ๊ธCํ๋ก๊ทธ๋๋ฐ ํํ๋ก์ ํธ)
https://github.com/hyeon9mak/hcp_2020
epsilon-greedy frozen-lake-game q-learning q-learning-algorithm
Last synced: 5 months ago
JSON representation
๐ฎ ํฌ์ผ๋ชฌ ๊ธธ์ฐพ๊ธฐ ๊ฒ์ (๊ด์ด๋ํ๊ต ์ปดํจํฐ์ ๋ณด๊ณตํ๋ถ ๊ณ ๊ธCํ๋ก๊ทธ๋๋ฐ ํํ๋ก์ ํธ)
- Host: GitHub
- URL: https://github.com/hyeon9mak/hcp_2020
- Owner: Hyeon9mak
- Created: 2020-09-17T04:17:56.000Z (about 5 years ago)
- Default Branch: master
- Last Pushed: 2020-12-06T10:04:08.000Z (almost 5 years ago)
- Last Synced: 2025-03-29T08:43:53.286Z (8 months ago)
- Topics: epsilon-greedy, frozen-lake-game, q-learning, q-learning-algorithm
- Language: C
- Homepage:
- Size: 30.2 MB
- Stars: 0
- Watchers: 1
- Forks: 3
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# ๊ด์ด๋ํ๊ต ์ปดํจํฐ์ ๋ณด๊ณตํ๋ถ 2020ํ๋
๋ 2ํ๊ธฐ ๊ณ ๊ธCํ๋ก๊ทธ๋๋ฐ ํํ๋ก์ ํธ
## ํฌ์ผ๋ชฌ ๊ธธ์ฐพ๊ธฐ ๊ฒ์ ์๊ฐ

- ๊ฒฉ์๋ก ์ด๋ฃจ์ด์ง ๊ฒ์ํ์ ์ถ๋ฐ์ง์ ๊ณผ ๋์ฐฉ์ง์ ์ ์
๋ ฅํ๋ฉด
์ค์ค๋ก ์ต์ ํ๋ ๊ฒฝ๋ก๋ฅผ ์ฐพ์๋ด๋ ๊ฐํํ์ต ๊ฒ์.
- Frozen lake game ๊ณผ ํฌ์ผ๋ชฌ์คํฐ ๊ฒ์์์
์์ด๋์ด ์ฐฉ์.
### 4 x 4 Map

### 7 x 7 Map

### 10 x 10 Map #[10 x 10 Map ์ค์ ๋์ ์์ ๋งํฌ](https://youtu.be/ZSPgoS3yVrI)

์ด ์ธ์๋, Map.txt ํ์ผ ํธ์ง์ ํตํด ์์ ๋กญ๊ฒ ๋งต ๊ตฌ์ฑ ๊ฐ๋ฅ!
## ๊ฒ์ ์ค๋ช
### ๊ฒ์ ์์ ์

- Map.txt ํ์ผ์ ์ด์ฉํ ๊ฒ์ ๋งต ๊ตฌ์ฑ
- Txy -> xy๋ ์ง๋ฆ๊ธธ/ํจ์ ์ถ๊ตฌ์ ์ขํ
- ์ ํํ ๋งต ๊ตฌ์ฑ์ ์ด์ฉํ์ง ์์ ์ ์๋ฌ ๋ฐ์!
### ๊ฒ์ ์ค

- ์์๋๋ก ์ฐ, ์ข, ์, ํ ๊ธฐ๋ ๊ฐ ์๋ฏธ
- 6/30 ํ๋ก ํํ๋์ง๋ง ์ค์ 6,000/30,000 ํ์
- 1,000 ๋จ์๋ก ํ๋ฉด์ ์ถ๋ ฅ๋๋ ์ํ
### ๊ฒ์ ์ข
๋ฃ ํ

- ์ต์ข
์ ์ผ๋ก ํ๋ ์ด์ด๊ฐ ์ด๋ํ ์ต์ ์ ๊ฒฝ๋ก ํํ
- Enter ํค ์
๋ ฅ์ ํตํ ์ข
๋ฃ
## ํ๋ก์ ํธ ์ธ๋ถ
### ํ์
- ํ์ฅ ๋ฐ์ ํ ์ปดํจํฐ์ ๋ณด๊ณตํ๋ถ 2020202074
- ํ์ ๊นํ์ค ์ปดํจํฐ์ ๋ณด๊ณตํ๋ถ 2020202041
- ํ์ ์ต์ฑ์ฐ ์ปดํจํฐ์ ๋ณด๊ณตํ๋ถ 2019202081
- ํ์ ์ตํ๊ตฌ ์ปดํจํฐ์ ๋ณด๊ณตํ๋ถ 2015722010
### ์ฃผ์ ์ ์ ๊ณผ์

- ์ํ๊ณ ์ดํ ๊ฐํํ์ต AI ๊ด์ฌ ์ฆ๊ฐ
- Q-learning, E-greedy ํ์ต์ ํตํ ๊ฐ๋ฐ ๊ฐ๋ฅ์ฑ ํ์ธ
### ํ๋ก์ ํธ ์ค์ผ์ฅด๋ง


### ํต์ฌ ์๊ณ ๋ฆฌ์ฆ
- Q-learning
- E-greedy
### ์ฐธ๊ณ
- [์ผ์ฑ sds saida ํ ์คํํฌ๋ํํธ ์ธ๊ณต์ง๋ฅ](http://m.hani.co.kr/arti/economy/it/870696.html#cb)
- [์ํ์ฐฉ์ค ์๋ ๊ธธ์ฐพ๊ธฐ ์ธ๊ณต์ง๋ฅ](http://m.hani.co.kr/arti/science/future/926150.html)
- [ํ์ฝฉ ๊ณผ๊ธฐ๋ ๊น์ฑํ ๊ต์๋ ๊ฐ์](https://hunkim.github.io/ml/)
- [ํ
์ํ๋ก์ฐ ํ๋ ์์ํฌ q-learning ์ค๋ช
](https://www.tensorflow.org/agents/tutorials/0_intro_rl)
- [Frozen lake game](https://colab.research.google.com/github/simoninithomas/Deep_reinforcement_learning_Course/blob/master/Q_Learning_with_FrozenLakev2.ipynb)