반응형
데이터마이닝에서 오즈(odds)는 어떤 사건이 발생할 확률과 발생하지 않을 확률 간의 비율을 의미합니다. 예를 들어, 동전 던지기에서 앞면이 나올 확률이 1/2라면, 오즈는 앞면이 나올 확률과 뒷면이 나올 확률 간의 비율인 1:1입니다.
오즈는 보통 로그 오즈(log odds)라고도 불리며, 로그 오즈는 로그 함수를 적용한 오즈값입니다. 로그 오즈를 사용하는 이유는, 오즈값이 1보다 작거나 클 경우, 로그 함수를 적용하면 음수값이 나오고, 오즈값이 1과 가까울 경우, 로그 함수를 적용하면 0에 가까운 값이 나오기 때문입니다.
데이터마이닝에서 오즈는 머신러닝 알고리즘에서 사용되는 분류 모델의 성능을 평가하는 데에도 활용됩니다. 예를 들어, 이진 분류 모델에서 오즈비는 모델의 예측력과 관련된 지표 중 하나로 사용됩니다. 오즈비가 1보다 크면 양성 클래스에 속할 확률이 높고, 1보다 작으면 음성 클래스에 속할 확률이 높습니다. 따라서, 오즈비가 높을수록 모델의 성능이 좋다고 판단할 수 있습니다.
반응형
'프로그래밍 > 데이터 사이언스 공부' 카테고리의 다른 글
상관행렬(correlation matrix)이 뭐야? 상관행렬의 단점은? (0) | 2023.03.07 |
---|---|
영-분산 예측변수가 뭐야? (0) | 2023.03.07 |
표준 로지스틱 분포의 누적분포함수 (0) | 2023.03.07 |
맷플롯립(matplotlib) 패키지로 산점도(scatter plot) 그리기 (0) | 2023.03.05 |
데이터 사이언스 입문 강의 정리 (1) | 2023.02.26 |