머신러닝 이진분류의 Evaluation 평가에 대해 알아보자(Accuracy, Precision, Recall, F1_Score, ROC_AUC)
머신러닝의 이진분류의 평가는 정확도, 오차행렬, 정밀도, 재현율, F1_스코어, ROC_AUC 로 할 수 있다. 이 평가들은 다른 지표에서도 이용 가능 하지만 특히나 영향력을 발휘하는 평가 지표 들이다. 그러면 하나 하나에 대해 자세히 알아보고자 한다. 1. Accuracy(정확도) 정확도는 전체 데이터에서 예측 결과가 동일한 데이터의 건수의 퍼센트를 나타낸다. 만일 전체 실제 데이터는 [1, 1, 0, 0, 0]이고 실제 데이터는 [1, 1, 1, 0, 0] 이면 가운데 1이 틀리게 예측되었다. 이럴 때 정확도는 0.8이다. 아주 직관적이고 편리한 방법이다. 하지만 데이터가 어떻게 구성되있냐에 따라 우연적으로 accuracy 가 아주 좋게 나올 수 도 있고 아닐 수도 있기 때문에 이것만 가지고 수치를 ..