Overfitting과 Underfitting
모델이 너무 training set에만 특화되어 있어서 test set과 실제 데이터를 제대로 반영하지 못하는 경우를 overfit(high variance)이라고 한다.
반대로 모델이 너무 단순해서 train set조차 제대로 대변하지 못하는 경우를 underfit(high bias)라고 한다.
자세한 사항은 아래 링크를 참고하자.
Overfitting을 해결하는 방법
- 더 많은 training data 모으기
- 특성 줄이기 (e.g. PCA)
- 규제 설정하기
Underfitting을 해결하는 방법
- 더 많은 특성 추가하기
별도의 출처 표시가 있는 이미지를 제외한 모든 이미지는 강의자료에서 발췌하였음을 밝힙니다.
댓글남기기