[AI] 테스트 세트로 모델을 튜닝하면 안되는 이유

PSLeon ㅣ 2023. 7. 25. 08:56

테스트 세트로 모델을 튜닝하면 안되는 이유

모델을 만들 때 하이퍼파라미터 값을 변경하며 정확도를 올리는 작업을 할 때 '모델을 튜닝한다'라고 한다.

그런데 테스트 세트에 대해 모델을 튜닝하게 되면 좋은 성능을 기대하기 어렵다. 그 이유가 무엇일까?

모델을 학습하고 테스트하는 과정은 흔히 모의고사를 풀어 보고 실제 수능 시험을 치는 학생과도 같은데, 테스트 세트로 모델을 튜닝하게 되면 수능 시험의 문제 자체를 외우게 한 것과 비슷하기 때문에 테스트에 대해서는 높은 정확도를 보이지만 다른 문제에 대해서는 성능이 낮게 나올 것이다.

이러한 현상을 '테스트 세트의 정보가 모델에 새어 나갔다'고 말하며 이 경우 모델의 일반화 성능(generalization performance)이 왜곡된다.

'AI & BigData' 카테고리의 다른 글

[AI] Diffusion: stable diffusion webui (0)	2023.07.27
[AI] 과대적합(overfitting) / 과소적합(underfitting) (0)	2023.07.25
[AI] 사이킷런을 활용해 훈련 세트와 테스트 세트로 나누기 (0)	2023.06.22
[AI] 로지스틱 손실 함수 - 크로스 엔트로피, 연쇄 법칙(Cross Entropy & Chain Rule) (3)	2023.06.18
[AI] YOLOv5를 활용한 히잡, 마스크 객체 인식 실습 (0)	2023.06.03

코딩하는 해커

[AI] 테스트 세트로 모델을 튜닝하면 안되는 이유

테스트 세트로 모델을 튜닝하면 안되는 이유

'AI & BigData' 카테고리의 다른 글

티스토리툴바