"극단값"의 두 판 사이의 차이

9번째 줄: 9번째 줄:
* 특별한 기준은 없으나 대략 ±3 [[표준편차]] 밖에 위치하는 사례
* 특별한 기준은 없으나 대략 ±3 [[표준편차]] 밖에 위치하는 사례
* 이상점은 모델 학습에서 문제를 일으키는 경우가 많다.
* 이상점은 모델 학습에서 문제를 일으키는 경우가 많다.
* [[집중경향치]], [[상관계수]] 추정치의 값을 왜곡시킬 수 있다.
* [[중심 측도]], [[산포 측도]], [[상관계수]]값을 왜곡시킬 수 있다.
:극단치에 민감한 값: [[범위]], [[평균]], [[표준편차]]
:극단치에 민감한 값: [[범위]], [[평균]], [[표준편차]]
:극단치에 덜 민감한 값: [[최빈값]], [[중앙값]], [[사분위범위]]
:극단치에 덜 민감한 값: [[최빈값]], [[중앙값]], [[사분위범위]]

2020년 10월 24일 (토) 18:08 판

  다른 뜻에 대해서는 아웃라이어, 1만 시간 법칙 문서를 참조하십시오.

1 개요

outlier
극단치, 극단값, 특이점, 특이값, 이상점, 이상치, 이상값, 이산점, 가외치
  • 다른 값에 비해 크게 벗어난 값
  • 비정상적으로 분포를 벗어난 값
  • 다른 대부분의 값과 동떨어진 값
  • 실제값이 특이한 경우와 측정오류에 의해 특이한 경우는, 개념적으로 다르지만 실용적으로 구별하기 어려움
  • 특별한 기준은 없으나 대략 ±3 표준편차 밖에 위치하는 사례
  • 이상점은 모델 학습에서 문제를 일으키는 경우가 많다.
  • 중심 측도, 산포 측도, 상관계수의 값을 왜곡시킬 수 있다.
극단치에 민감한 값: 범위, 평균, 표준편차
극단치에 덜 민감한 값: 최빈값, 중앙값, 사분위범위

2 예시 사례

  • 가중치의 절대값이 높은 경우
  • 예측된 값이 실제 값과 비교적 멀리 떨어진 경우
  • 입력 데이터의 값이 평균에서 대략적으로 표준편차 3만큼 떨어진 경우

3 같이 보기

4 참고

문서 댓글 ({{ doc_comments.length }})
{{ comment.name }} {{ comment.created | snstime }}