본문 바로가기

강화학습2

2021 머신러닝야학 - 5 [강화학습] Reinforcement Learning 핵심은 일단 해보는 것! 지도학습이 배움을 통해서 실력을 키우는 곳이라면, 일단 해보면서 경험을 통해 실력을 키우는 것이 강화학습! 두 개의 주체가 필요합니다. 게이머와 게임을 예시로 들겠습니다. 이런 상태에서 게임의 실력을 키워가는 과정을 따져봅시다. 우선 게임은 게이머에게 현재의 상태를 보여줍니다. 캐릭터는 어디에 있고, 장애물은 어디에 있는지 알려줍니다. 동시에 현재의 점수도 알려줍니다. 게이머는 이 값이 높아지는 것이 상이고, 장애물에 부딪히는 것이 벌입니다. 관찰의 결과에 따라서 어떤 상태에서 어떻게 행동해야 더 많은 상을 받고, 더 적은 벌을 받을 수 있는지를 알게 됩니다. 즉, 판단력이 강화된 것입니다. 판단에 따라서 행동을 합니다. 그 .. 2021. 1. 13.
2021 머신러닝야학 - 3 [머신러닝의 분류] 머신러닝은 단일 기술이 아니다. 기계학습은 지도학습 + 비지도학습 + 강화학습 으로 이뤄져 있다. ** 비유는 이해하기에는 좋지만, 비슷한 것일뿐 진실이 아니기 때문에 동일시해서는 안된다는 걸 명심 할 것! 지도학습은 문제집으로 학생을 가르치듯이 데이터로 컴퓨터를 학습시켜서 모델을 만드는 방식 비지도학습은 기계에게 데이터에 대한 통찰력을 부여하는 것. 정답을 알려주지 않더라도 데이터를 관찰하고 의미나 관계를 밝혀내는 것 (정리) 강화학습은 지도학습과 비슷하지만, 정답을 알려주는 지도학습과는 다르게 경험을 통해 어떻게 하는 것이 더 좋은 결과를 낼 수 있는지 스스로 수련하는 것. 퀘스트를 깨고 경험치를 쌓는 것과 비슷하다고 보면 됨. [지도학습] 원인 -> 결과의 방식. 과거의 데이터로.. 2021. 1. 7.