호랭이 분석가

#0. 추천 시스템 정확도 측정 지표 본문

Python/Recommend

#0. 추천 시스템 정확도 측정 지표

데이터호랑이 2022. 8. 11. 00:17
반응형

정확도 측정이란 예상 점수(평점)와 실제 점수의 차이를 계산하는 방법과,

추천한 아이템과 사용자의 실제 선택을 비교하는 방법이 있다.

이처럼 정확도는 예측값과 실제값의 차이로 계산되는데, 차이를 계산하는 수식으로는 다양한 지표가 있다.

 

1. 연속형 정확도 측정 지표

 

사용자의 평점과 같이 예측값과 실제값이 연속 값을 갖는 경우에 사용할 수 있는 지표는 아래와 같습니다.

 

      • MAD (Mean Absolute Deviation) 
      • $$ \frac{\sum( | r_{i,j} - p_{i,j} | )}{k} $$  
        • MSE (Mean Squared Error)
        • $$ \frac{\sum(r_{i,j} - p_{i,j})^{2}}{k} $$  
        • RMSE (Root Mean Squared Error)
        • $$ \sqrt \frac{\sum(r_{i,j} - p_{i,j})^{2}}{k}   $$  

 

실제 예측값(r)과 예상 예측값(p)의 차이를 기본으로 정확성을 구하고 있습니다.

k는 정확도 계산에 포함된 총 상품 수입니다.

 

2.  이진값 정확도 측정 지표 

 

사용자에게 추천 아이템을 제시한 경우 특정 상품을 클릭했는지(1), 안 했는지(0)와 같이

0과 1로 결과를 갖는 경우에 사용할 수 있는 지표는 아래와 같습니다.

 

  • 정밀도 (precision) 
  • 재현율 (recall) 
  • 조화평균 (F1 Score)
  • 범위 (coverage)

 

 

정밀도와 재현율 - 위키백과, 우리 모두의 백과사전

위키백과, 우리 모두의 백과사전. 이진 분류 기법(binary classification)을 사용하는 패턴 인식과 정보 검색 분야에서, 정밀도는 검색된 결과들 중 관련 있는 것으로 분류된 결과물의 비율이고, 재현

ko.wikipedia.org

 

'Python > Recommend' 카테고리의 다른 글

#1. 추천 시스템 주요 알고리즘  (0) 2022.09.07
Comments