[강화학습] Reinforcement Learning
핵심은 일단 해보는 것!
지도학습이 배움을 통해서 실력을 키우는 곳이라면, 일단 해보면서 경험을 통해 실력을 키우는 것이 강화학습!
두 개의 주체가 필요합니다. 게이머와 게임을 예시로 들겠습니다.
이런 상태에서 게임의 실력을 키워가는 과정을 따져봅시다.
- 우선 게임은 게이머에게 현재의 상태를 보여줍니다. 캐릭터는 어디에 있고, 장애물은 어디에 있는지 알려줍니다.
- 동시에 현재의 점수도 알려줍니다. 게이머는 이 값이 높아지는 것이 상이고, 장애물에 부딪히는 것이 벌입니다.
- 관찰의 결과에 따라서 어떤 상태에서 어떻게 행동해야 더 많은 상을 받고, 더 적은 벌을 받을 수 있는지를 알게 됩니다.
- 즉, 판단력이 강화된 것입니다.
- 판단에 따라서 행동을 합니다.
- 그 행동은 게임에 변화를 주게 됩니다.
강화학습의 용어로 변경해보자면,
- 게임 -> 환경 (environment)
- 게이머 -> 에이전트 (agent)
- 게임화면 -> 상태 (state)
- 게이머의 조작 -> 행동 (action)
- 상과 벌 -> 보상 (reward)
- 게이머의 판단력 -> 정책 (policy)
강화학습에서는 더 많은 보상을 받을 수 있는 정책을 만드는 것이 핵심입니다.
알파고가 바로 강화학습을 통해 구현된 소프트웨어!
수업시간에 배운 강화학습을 통해서 똑똑해지는 기계를 보여주는 영상
https://www.youtube.com/watch?v=VMp6pq6_QjI | 강화학습을 이용해서 자동차의 주차능력을 향상시키는 예제입니다. |
https://youtu.be/kopoLzvh5jY | 시뮬레이션 환경을 이용한 숨바꼭질 강화학습 영상입니다. |
https://youtu.be/QilHGSYbjDQ | 팩맨의 게임능력을 향상시키는 예제입니다. |
https://youtu.be/ZhsEKTo7V04 | 강화학습을 통해 로봇팔이 문 여는 방법을 터득하는 영상입니다. |
https://www.youtube.com/watch?v=Aut32pR5PQA | 2D 시뮬레이터 상에서 강화학습을 이용해 자율주행 기능을 구현하는 영상입니다. |
https://www.youtube.com/watch?v=WSW-5m8lRMs&t=357s | 인공신경망과 강화학습을 이용해 플래피 버드 게임을 하는 인공지능을 만드는 영상입니다. |
내가 찾은 강화학습을 통해 게임능력을 향상시키는 스네이크 게임 예시 youtu.be/zIkBYwdkuTk
이 포스팅까지 머신러닝의 여러 기능에 대해서 공부해 보았다. 이제는 실전이다!!
머신러닝을 사용하고자 할 때 유용할만한 판단의 지도까지 활용하면 이제 초급반은 끝~~
'Professional Insights > Technology & Innovation' 카테고리의 다른 글
2021 머신러닝야학 - 6 (0) | 2021.01.17 |
---|---|
Technical Solution Architect (0) | 2021.01.14 |
2021 머신러닝야학 - 4 (0) | 2021.01.12 |
2021 경제 공부 - 1 비트코인에 대한 전망 (2) | 2021.01.10 |
2021 머신러닝야학 - 3 (0) | 2021.01.07 |