정보처리기술사/12. 인공지능

📊 PR(Precision-Recall) 곡선과 ROC(Receiver Operating Characteristic) 곡선 비교

남훈 멘토 2025. 2. 23. 21:05

문제

[135 정보관리 1교시] 1. PR(Precision Recall) 곡선과 ROC(Receiver Operating Characteristic) 곡선 비교

출제의도 예상

머신러닝 모델의 성능을 평가할 때 PR 곡선과 ROC 곡선은 매우 중요한 시각화 도구입니다. 하지만 두 곡선의 개념과 사용 목적에는 차이가 있어, 상황에 맞게 선택하는 것이 중요합니다. 이 글에서는 PR 곡선과 ROC 곡선의 개념과 차이점을 이해하고, 사용처와 장단점을 상세히 비교합니다.


1️⃣ PR(Precision-Recall) 곡선과 ROC(Receiver Operating Characteristic) 곡선의 개념 비교

비교 항목

함목 PR(Precision-Recall) 곡선 ROC(Receiver Operating Characteristic) 곡선
정의 재현율(Recall)과 정밀도(Precision)의 관계를 나타내며, 긍정(Positive) 클래스 탐지 성능을 평가하는 곡선 위양성 비율(FPR)과 진양성 비율(TPR) 간의 관계를 나타내며, 전체 분류 성능을 평가하는 곡선
평가 지표 정밀도(Precision) vs. 재현율(Recall) 진양성 비율(TPR) vs. 위양성 비율(FPR)
x축 재현율(Recall) 위양성 비율(FPR)
y축 정밀도(Precision) 진양성 비율(TPR)

🔎 설명: PR 곡선은 재현율이 증가할수록 정밀도가 감소할 수 있음을 보여줍니다. 긍정 클래스 탐지 성능을 중점적으로 평가할 때 유용합니다.


2️⃣ PR(Precision-Recall) 곡선과 ROC(Receiver Operating Characteristic) 곡선의 상세

비교 항목 PR 곡선 ROC 곡선
 


목적 긍정(Positive) 클래스 식별 성능 평가 전체적인 분류 성능 평가 및 민감도-특이도 분석
주 사용처 불균형 데이터셋 (예: 희귀 질병 진단) 균형 데이터셋 (예: 일반 이진 분류 문제)
중요 포인트 긍정 클래스 탐지 성능 전체 분류 성능 (TPR vs. FPR)
대표 예시 스팸 필터링, 이상 탐지 이메일 분류, 대출 승인 모델

 


 

📝 결론

데이터가 불균형한 경우: PR 곡선 사용 추천 (긍정 탐지에 초점)
데이터가 균형적이거나 전체 성능 비교 시: ROC 곡선 사용 권장
실제 사용 예시:

  • PR 곡선: 희귀 질환 진단 모델 (긍정 발견이 중요)
  • ROC 곡선: 금융 신용 점수 모델 (전체적인 분류 성능 필요)