[아이리스 분류하기]
종속변수가 양적데이터 => 회귀 알고리즘 사용
종속변수가 범주형데이터 => 분류 데이터 사용
어떻게 수식이 아닌 종속변수를 공식으로 만들 수 있을까???
와 천재.. MBTI 점수 매기는거랑 비슷하넹!!!!
pd.get_dummies(데이터셋) 만 있으면 자동으로 원핫인코딩 즉 종속변수가 숫자가 아닌 것들을 모아 변환해준다!!!!
모델을 구성해보자!
각각 종속변수들에 대한 공식이 만들어져야 하므로 종속변수의 개수는 3개
분류 예측 : 0~100% 확률값으로 분류를 표현. 분류모델이 분류를 추측할 떄 사람처럼 할 수 있게 하는 것.
1) Sigmoid 2) Softmax의 방법으로 나뉜다. 우리는 Softmax만 사용한다 우선!
Softmax는 종속변수 예측치의 합이 최대 1이 되게끔 하는 것이다. 해당 독립변수들을 바탕으로 setosa가 될 확률 0.2 virginica 0.3 versicolor 0.5로 확률 비교를 하는 것! (이해한 것이 맞는지 모르겠지만 ㅎ)
분류에 사용하는 loss는 categorical_crossentropy를 사용한다.
model.compile(loss='categorical_crossentropy', metrics='accuracy') 을 사용하면 정확도도 확인하는 것이 가능하다!
[실습]
꺅 재밌다.
'Professional Insights > Technology & Innovation' 카테고리의 다른 글
2021 머신러닝 야학 - The end (0) | 2021.01.19 |
---|---|
2021 머신러닝야학 - 8 (0) | 2021.01.18 |
2021 머신러닝야학 - 6 (0) | 2021.01.17 |
Technical Solution Architect (0) | 2021.01.14 |
2021 머신러닝야학 - 5 (0) | 2021.01.13 |