결정트리 학습

1 개요[ | ]

반면, 테스트데이터에 대한 정확도는 떨어질 수 있다. (과적합)

트리가 매우 약할 수 있다(non-robust).
- 훈련 데이터가 조금만 바뀌어도 결과가 크게 바뀔 수 있다.
최적의 결정트리를 학습하는 문제는 NP-완전한 것으로 알려져 있다.
- 각 노드에서 지역적 최적을 추구하는, 탐욕 알고리즘 같은 휴리스틱 기반이다.
- 전체적 최적이라는 보장이 없다.
잘 일반화되지 않는 지나치게 복잡한 트리(과적합)를 만들 수 있다.
- 단, 가지치기(pruning) 등의 방법으로 해소할 수 있다.
범주형 변수의 경우, 사례가 더 많은 쪽으로 편향될 수 있다.
- 단, 조건부 추론접근법, 2단계 접근법, 적응적 leave-one-out 특성 선택(adaptive leave-one-out feature selection) 등으로 방지할 수 있다.