반응형
테스트 세트로 모델을 튜닝하면 안되는 이유
모델을 만들 때 하이퍼파라미터 값을 변경하며 정확도를 올리는 작업을 할 때 '모델을 튜닝한다'라고 한다.
그런데 테스트 세트에 대해 모델을 튜닝하게 되면 좋은 성능을 기대하기 어렵다. 그 이유가 무엇일까?
모델을 학습하고 테스트하는 과정은 흔히 모의고사를 풀어 보고 실제 수능 시험을 치는 학생과도 같은데, 테스트 세트로 모델을 튜닝하게 되면 수능 시험의 문제 자체를 외우게 한 것과 비슷하기 때문에 테스트에 대해서는 높은 정확도를 보이지만 다른 문제에 대해서는 성능이 낮게 나올 것이다.
이러한 현상을 '테스트 세트의 정보가 모델에 새어 나갔다'고 말하며 이 경우 모델의 일반화 성능(generalization performance)이 왜곡된다.
'AI & BigData' 카테고리의 다른 글
[AI] Diffusion: stable diffusion webui (0) | 2023.07.27 |
---|---|
[AI] 과대적합(overfitting) / 과소적합(underfitting) (0) | 2023.07.25 |
[AI] 사이킷런을 활용해 훈련 세트와 테스트 세트로 나누기 (0) | 2023.06.22 |
[AI] 로지스틱 손실 함수 - 크로스 엔트로피, 연쇄 법칙(Cross Entropy & Chain Rule) (3) | 2023.06.18 |
[AI] YOLOv5를 활용한 히잡, 마스크 객체 인식 실습 (0) | 2023.06.03 |