반응형
Q. 영-분산 예측변수가 뭐야?
A. 영-분산 예측변수(zero-variance predictor)란, 분산(variance)이 0에 가까운 예측변수를 말합니다. 다른 말로는 상수(constant) 예측변수라고도 합니다.
영-분산 예측변수는 예측 모델에서 유용한 정보를 제공하지 않으므로, 모델에 포함시키지 않아도 됩니다. 이는 모델이 불필요한 변수를 학습하는 것을 방지하고, 모델의 성능을 향상시키는 데 도움을 줍니다.
예를 들어, 모든 샘플에서 동일한 값(예: 상수)을 가지는 예측변수는 분산이 0에 가깝기 때문에 영-분산 예측변수가 됩니다. 이러한 예측변수는 모델에 포함시키지 않아도 됩니다. 또한, 특정 샘플에서만 값을 가지는 예측변수도 분산이 0에 가깝기 때문에 영-분산 예측변수가 됩니다. 이러한 경우에도 해당 예측변수는 모델에 포함시키지 않아도 됩니다.
반응형
'프로그래밍 > 데이터 사이언스 공부' 카테고리의 다른 글
YOLOv8 사용해보기 (0) | 2023.09.17 |
---|---|
상관행렬(correlation matrix)이 뭐야? 상관행렬의 단점은? (0) | 2023.03.07 |
표준 로지스틱 분포의 누적분포함수 (0) | 2023.03.07 |
오즈(odds)란 무엇인가? (0) | 2023.03.07 |
맷플롯립(matplotlib) 패키지로 산점도(scatter plot) 그리기 (0) | 2023.03.05 |