극단값

Jmnote (토론 | 기여)님의 2021년 8월 16일 (월) 18:28 판 (Jmnote님이 극단치 문서를 극단값 문서로 이동했습니다)
(차이) ← 이전 판 | 최신판 (차이) | 다음 판 → (차이)
  다른 뜻에 대해서는 아웃라이어, 1만 시간 법칙 문서를 참조하십시오.

1 개요[ | ]

outlier
극단치, 극단값, 특이점, 특이값, 이상점, 이상치, 이상값, 이산점, 가외치, 바깥점
  • 다른 값에 비해 크게 벗어난 값
  • 비정상적으로 분포를 벗어난 값
  • 다른 대부분의 값과 동떨어진 값
  • 실제값이 특이한 경우와 측정오류에 의해 특이한 경우는, 개념적으로 다르지만 실용적으로 구별하기 어려움
  • 특별한 기준은 없으나 대략 ±3 표준편차 밖에 위치하는 사례
  • 이상점은 모델 학습에서 문제를 일으키는 경우가 많다.
  • 중심 측도, 산포 측도, 상관계수의 값을 왜곡시킬 수 있다.
극단치에 민감한 값: 범위, 평균, 표준편차
극단치에 덜 민감한 값: 최빈값, 중앙값, 사분위범위

  • 머신러닝에서는 다음과 같은 경우가 이상점에 해당한다.
    • 가중치의 절대값이 높은 경우
    • 예측된 값이 실제 값과 비교적 멀리 떨어진 경우
    • 입력 데이터의 값이 평균에서 대략적으로 표준편차 3만큼 떨어진 경우
  • 이상점은 모델 학습에서 문제를 일으키는 경우가 많다.

2 같이 보기[ | ]

3 참고[ | ]

문서 댓글 ({{ doc_comments.length }})
{{ comment.name }} {{ comment.created | snstime }}