문제
[135 정보관리 1교시] 1. PR(Precision Recall) 곡선과 ROC(Receiver Operating Characteristic) 곡선 비교
출제의도 예상
머신러닝 모델의 성능을 평가할 때 PR 곡선과 ROC 곡선은 매우 중요한 시각화 도구입니다. 하지만 두 곡선의 개념과 사용 목적에는 차이가 있어, 상황에 맞게 선택하는 것이 중요합니다. 이 글에서는 PR 곡선과 ROC 곡선의 개념과 차이점을 이해하고, 사용처와 장단점을 상세히 비교합니다.
1️⃣ PR(Precision-Recall) 곡선과 ROC(Receiver Operating Characteristic) 곡선의 개념 비교
비교 항목
함목 | PR(Precision-Recall) 곡선 | ROC(Receiver Operating Characteristic) 곡선 |
정의 | 재현율(Recall)과 정밀도(Precision)의 관계를 나타내며, 긍정(Positive) 클래스 탐지 성능을 평가하는 곡선 | 위양성 비율(FPR)과 진양성 비율(TPR) 간의 관계를 나타내며, 전체 분류 성능을 평가하는 곡선 |
평가 지표 | 정밀도(Precision) vs. 재현율(Recall) | 진양성 비율(TPR) vs. 위양성 비율(FPR) |
x축 | 재현율(Recall) | 위양성 비율(FPR) |
y축 | 정밀도(Precision) | 진양성 비율(TPR) |
🔎 설명: PR 곡선은 재현율이 증가할수록 정밀도가 감소할 수 있음을 보여줍니다. 긍정 클래스 탐지 성능을 중점적으로 평가할 때 유용합니다.
2️⃣ PR(Precision-Recall) 곡선과 ROC(Receiver Operating Characteristic) 곡선의 상세
비교 항목 | PR 곡선 | ROC 곡선 |
![]() |
![]() |
|
목적 | 긍정(Positive) 클래스 식별 성능 평가 | 전체적인 분류 성능 평가 및 민감도-특이도 분석 |
주 사용처 | 불균형 데이터셋 (예: 희귀 질병 진단) | 균형 데이터셋 (예: 일반 이진 분류 문제) |
중요 포인트 | 긍정 클래스 탐지 성능 | 전체 분류 성능 (TPR vs. FPR) |
대표 예시 | 스팸 필터링, 이상 탐지 | 이메일 분류, 대출 승인 모델 |
📝 결론
✅ 데이터가 불균형한 경우: PR 곡선 사용 추천 (긍정 탐지에 초점)
✅ 데이터가 균형적이거나 전체 성능 비교 시: ROC 곡선 사용 권장
✅ 실제 사용 예시:
- PR 곡선: 희귀 질환 진단 모델 (긍정 발견이 중요)
- ROC 곡선: 금융 신용 점수 모델 (전체적인 분류 성능 필요)
'정보처리기술사 > 12. 인공지능' 카테고리의 다른 글
딥씨크(DeepSeek) 중국 LLM의 혁신과 AI 생태계의 변화 (1) | 2025.02.27 |
---|