6.5. Performance Metrics

 

last update datetime: Mar 07, 2020 8:04 PM

https://strutive07.github.io/assets/images/6_5_Performance_Metrics/Untitled.png

지금까지는 accuracy, 즉 True positive 와 True Negative 의 개수의 합 으로 정확도를 나타내었다. 조금 더 많은 measure 들을 공부해보자.

https://strutive07.github.io/assets/images/6_5_Performance_Metrics/Untitled%201.png

True positive: 실제 True → 예측 True (정답)

False positive: 실제 False → 예측 True (오답)

False negative: 실제 True → 예측 False (오답)

True negative: 실제 False → 예측 False (정답)

Precision 정밀도

모델이 True 라고 분류한것중, True 의 비율.

스팸 필터, True 가 스팸일 경우, 의학에서 암을 예측할때 암이 예측될경우가 True 일 경우등, True 일때를 골라내는 task 의 안정성이 중요할 경우 사용함.

모델의 입장에서 True positive 의 비율

https://strutive07.github.io/assets/images/6_5_Performance_Metrics/Untitled%202.png

Recall 재현율

실제 True 중, 모델이 True 라고 예측한것의 비율

실제 데이터의 입장에서 True positive 의 비율.

https://strutive07.github.io/assets/images/6_5_Performance_Metrics/Untitled%203.png

F-Measure

우리가 많이 사용하는 F1-score 의 일반화 버전.

precision 과 recall을 동시에 고려하는것. 두 measure의 조화 평균이다.

https://strutive07.github.io/assets/images/6_5_Performance_Metrics/Untitled%204.png

여기서 b 를 조정하면서 recall에 더 집중할것인지, precision에 더 집중할것인지 조정할 수 있다.

보통은 1로 두어서 두 measure의 조화평균으로 사용한다.

분류성능평가지표 - Precision(정밀도), Recall(재현율) and Accuracy(정확도)