Cloud&BigData/Machine Learing

F Measure - Precision과 Recall을 통합한 정확도 측정

루키~ 2015. 8. 3. 08:33

동전을 10번 던져서 계속 앞면이 나왔다고 하면, 앞면이 나올 확률을 1이라고 할 수 있을까? 

분명 동전을 던진 회수가 너무 적기 때문에 1이 아니라고 이야기할 것이다. 

즉, 계속해서 반복했을 때도 동일하게 나오는지 체크하는 것이 필요하다. 


그래서 일반적인 정확도(Precision) 뿐만 아니라 재현율(Recall)이 정보검색, 패턴인식, 기계학습에서 의미가 있는 것이다. 

이러한 정확도와 재현율을 하나의 지표로 통합해서 정확성을 측정하는 방법들이 존재한다. 


F-Measure

정확성을 측정하는데 가장 많이 사용하는 F-Measure에 대해 살펴보기로 하자. 

F-Measure는 Precision과 Recall의 트레이드오프를 잘 통합하여 정확성을 한번에 나타내는 지표라 할 수 있다. 

보통 가중치를 가진 조화 평균(weighted harmonic mean)이라고도 한다. 


조화 평균

일반적으로 계산하는 평균은 산술 평균(Arithmetic Mean)이라고 한다. 

조화 평균(Harmonic Mean)은 주어진 수들의 역수의 산술 평균을 구한 값의 역수를 말한다. 



조화 평균은 평균속력을 구할 때 주로 사용한다. 

예를 들어, 똑같은 거리를 갈 때는 40 km/h의 속력이었고, 올 때는 60 km/h였다고 하자. 

왕복 평균 속력은 50 km/h가 아니라 조화 평균값인 48 km/h가 된다. 

왜냐하면 이동하는데 걸린 시간은 평균 48 km/h로 달린 시간과 동일하기 때문이다. 


두 수 사이의 조화 평균은 다음과 같다. 



F-Measure 수식

F-Measure를 구하기 위해 Precision과 Recall에 대한 조화 평균에 가중치 알파를 적용하면 다음과 같다. 



여기에서 Precision과 Recall에 적용한 가중치를 0.5로 동일하게 부여하면, 우측 식의 베타 값은 1이 된다. 

이것을 F1 Measure라 하고 자주 사용하는 F-Measure 값이기도 하다. 

아래 수식을 보면 앞의 두 수 사이의 조화 평균과 동일한 것을 알 수 있다. 



F-Measure 활용

F1 Measure는 Precision과 Recall의 중요성을 동일하게 보고 있다. 

만약 Recall이 Precision보다 더 중요하다면 F2 Measure를, Precision이 Recall보다 더 중요하다면 F0.5 Measure를 사용할 수 있다. 

여기서 2나 0.5는 베타의 값이라는 것을 기억해 두기 바란다. 


G-Measure

조화 평균과 함께 자주 이야기하는 것으로 기하 평균(Geometric Mean)이 있다. 

마찬가지로 F-Measure대신 기하 평균을 활용한 G-Measure도 사용할 수 있다고 한다. 

하지만 보통 F-Measure를 주로 사용하니 참고하기 바란다. 



마지막으로 Precision, Recall, F-Measure에 대한 다음 동영상 강의를 참고하자.