혼동 행렬

Jmnote (토론 | 기여)님의 2021년 5월 27일 (목) 01:20 판 (→‎개요)

1 개요

confusion matrix
혼동행렬, 혼돈 행렬, 컨퓨전 행렬, 정오행렬, 오분류표, 분류표
  • 지도 학습으로 훈련된 분류 알고리즘의 성능을 시각화 할 수있는 표
  • 분류 모델의 예측 성공률, 즉 라벨과 모델의 분류 사이의 상관관계를 요약한 NxN 표
  • 혼동행렬의 축 중 하나는 모델이 예측한 레이블이고, 다른 축은 실제 레이블이다.
  • N은 클래스 수를 나타낸다.
  • 이진 분류 문제에서는 N=2이다.
  • 왼쪽 헤더에 예측 분류(predicted class), 위쪽 헤더에 실제 분류(actual class)를 배치하는 것이 일반적이다.
  • 이진 분류 문제의 경우, 예시1, 예시2를 참고하자.
  • 다중 클래스 분류 문제인 경우, 혼동행렬로 오류 패턴을 파악할 수 있다.
  • 예를 들어 혼동행렬은 필기 숫자를 인식하도록 학습된 모델이 4를 9로, 아니면 7을 1로 잘못 예측하는 경향이 있음을 나타낼 수 있다.
  • 혼동행렬은 정밀도, 재현율 등의 다양한 성능 측정항목을 계산하는 데 필요한 정보를 포함한다.

2 형식

실제 분류
P N
예측 분류 P TP FP
N FN TN

3 예시 1

실제 분류
고양이
예측 분류 고양이 5 2
3 3

4 예시 2

구분 종양(예측) 비종양(예측)
종양(실제) 18 1
비종양(실제) 6 452
  • 위 혼동행렬에서는 실제로 종양이 있었던 샘플 19개 중 18개는 모델이 정확히 분류(참긍정 18개)했고, 1개는 종양이 없는 것으로 잘못 분류(거짓부정 1개)했다.
  • 마찬가지로, 실제로 종양이 없었던 샘플 458개 중 452개는 정확히 분류(참음성 452개)되었고 6개는 잘못 분류(거짓양성 6개)되었다.

5 같이 보기

6 참고

문서 댓글 ({{ doc_comments.length }})
{{ comment.name }} {{ comment.created | snstime }}