Professional Insights/Technology & Innovation

2021 머신러닝야학 - 7

Melissa Levasseur 2021. 1. 18. 22:41

[아이리스 분류하기]

종속변수가 양적데이터 => 회귀 알고리즘 사용

종속변수가 범주형데이터 => 분류 데이터 사용 

어떻게 수식이 아닌 종속변수를 공식으로 만들 수 있을까???

와 천재.. MBTI 점수 매기는거랑 비슷하넹!!!!

pd.get_dummies(데이터셋) 만 있으면 자동으로 원핫인코딩 즉 종속변수가 숫자가 아닌 것들을 모아 변환해준다!!!!

모델을 구성해보자!

각각 종속변수들에 대한 공식이 만들어져야 하므로 종속변수의 개수는 3개

분류 예측 : 0~100% 확률값으로 분류를 표현. 분류모델이 분류를 추측할 떄 사람처럼 할 수 있게 하는 것.

1) Sigmoid 2) Softmax의 방법으로 나뉜다. 우리는 Softmax만 사용한다 우선!

Softmax는 종속변수 예측치의 합이 최대 1이 되게끔 하는 것이다. 해당 독립변수들을 바탕으로 setosa가 될 확률 0.2 virginica 0.3 versicolor 0.5로 확률 비교를 하는 것! (이해한 것이 맞는지 모르겠지만 ㅎ)

분류에 사용하는 loss는 categorical_crossentropy를 사용한다.

model.compile(loss='categorical_crossentropy', metrics='accuracy') 을 사용하면 정확도도 확인하는 것이 가능하다!

[실습]

꺅 재밌다.

'Professional Insights > Technology & Innovation' 카테고리의 다른 글

2021 머신러닝 야학 - The end  (0) 2021.01.19
2021 머신러닝야학 - 8  (0) 2021.01.18
2021 머신러닝야학 - 6  (0) 2021.01.17
Technical Solution Architect  (0) 2021.01.14
2021 머신러닝야학 - 5  (0) 2021.01.13