본문 바로가기
Interests/Data & Programming

2021 머신러닝야학 - 5

by Melissa Levasseur 2021. 1. 13.

[강화학습] Reinforcement Learning

핵심은 일단 해보는 것! 

지도학습배움을 통해서 실력을 키우는 곳이라면, 일단 해보면서 경험을 통해 실력을 키우는 것강화학습!

 

두 개의 주체가 필요합니다. 게이머와 게임을 예시로 들겠습니다.

이런 상태에서 게임의 실력을 키워가는 과정을 따져봅시다.

  1. 우선 게임은 게이머에게 현재의 상태를 보여줍니다. 캐릭터는 어디에 있고, 장애물은 어디에 있는지 알려줍니다.
  2. 동시에 현재의 점수도 알려줍니다. 게이머는 이 값이 높아지는 것이 상이고, 장애물에 부딪히는 것이 벌입니다.
  3. 관찰의 결과에 따라서 어떤 상태에서 어떻게 행동해야 더 많은 상을 받고, 더 적은 벌을 받을 수 있는지를 알게 됩니다.
  4. 즉, 판단력이 강화된 것입니다.
  5. 판단에 따라서 행동을 합니다.
  6. 그 행동은 게임에 변화를 주게 됩니다.

강화학습의 용어로 변경해보자면,  

  • 게임 -> 환경 (environment)
  • 게이머 -> 에이전트 (agent)
  • 게임화면 -> 상태 (state)
  • 게이머의 조작 -> 행동 (action)
  • 상과 벌 -> 보상 (reward)
  • 게이머의 판단력 -> 정책 (policy)

강화학습에서는 더 많은 보상을 받을 수 있는 정책을 만드는 것이 핵심입니다. 

알파고가 바로 강화학습을 통해 구현된 소프트웨어!

수업시간에 배운 강화학습을 통해서 똑똑해지는 기계를 보여주는 영상

https://www.youtube.com/watch?v=VMp6pq6_QjI 강화학습을 이용해서 자동차의 주차능력을 향상시키는 예제입니다. 
https://youtu.be/kopoLzvh5jY 시뮬레이션 환경을 이용한 숨바꼭질 강화학습 영상입니다. 
https://youtu.be/QilHGSYbjDQ 팩맨의 게임능력을 향상시키는 예제입니다.
https://youtu.be/ZhsEKTo7V04 강화학습을 통해 로봇팔이 문 여는 방법을 터득하는 영상입니다.
https://www.youtube.com/watch?v=Aut32pR5PQA 2D 시뮬레이터 상에서 강화학습을 이용해 자율주행 기능을 구현하는 영상입니다.
https://www.youtube.com/watch?v=WSW-5m8lRMs&t=357s 인공신경망과 강화학습을 이용해 플래피 버드 게임을 하는 인공지능을 만드는 영상입니다.

내가 찾은 강화학습을 통해 게임능력을 향상시키는 스네이크 게임 예시  youtu.be/zIkBYwdkuTk 

 

이 포스팅까지 머신러닝의 여러 기능에 대해서 공부해 보았다. 이제는 실전이다!!

머신러닝을 사용하고자 할 때 유용할만한 판단의 지도까지 활용하면 이제 초급반은 끝~~

 

'Interests > Data & Programming' 카테고리의 다른 글

2021 머신러닝야학 - 6  (0) 2021.01.17
Technical Solution Architect  (0) 2021.01.14
2021 머신러닝야학 - 4  (0) 2021.01.12
2021 머신러닝야학 - 3  (0) 2021.01.07
2021 머신러닝야학 - 2  (0) 2021.01.07

댓글