반응형

프로그래밍 176

상관행렬(correlation matrix)이 뭐야? 상관행렬의 단점은?

Q. 데이터마이닝에서 상관행렬이 뭐야? A. 상관행렬(correlation matrix)은 데이터마이닝에서 변수 간의 상관관계를 나타내는 행렬입니다. 상관관계는 두 변수 사이의 관련성을 나타내는 지표로, 변수 간의 선형적인 관계를 측정합니다. 상관행렬은 변수 간의 상관관계를 나타내는데, 상관계수(correlation coefficient)를 사용합니다. 상관계수는 -1에서 1 사이의 값을 가지며, 1에 가까울수록 양의 상관관계(두 변수가 함께 증가), -1에 가까울수록 음의 상관관계(두 변수가 서로 반대로 증감)를 나타냅니다. 0에 가까울수록 두 변수 사이에는 상관관계가 없습니다. 상관행렬은 주로 변수 간의 다중공선성(multicollinearity)을 확인하는 데 사용됩니다. 다중공선성은 변수 간의 강..

영-분산 예측변수가 뭐야?

Q. 영-분산 예측변수가 뭐야? A. 영-분산 예측변수(zero-variance predictor)란, 분산(variance)이 0에 가까운 예측변수를 말합니다. 다른 말로는 상수(constant) 예측변수라고도 합니다. 영-분산 예측변수는 예측 모델에서 유용한 정보를 제공하지 않으므로, 모델에 포함시키지 않아도 됩니다. 이는 모델이 불필요한 변수를 학습하는 것을 방지하고, 모델의 성능을 향상시키는 데 도움을 줍니다. 예를 들어, 모든 샘플에서 동일한 값(예: 상수)을 가지는 예측변수는 분산이 0에 가깝기 때문에 영-분산 예측변수가 됩니다. 이러한 예측변수는 모델에 포함시키지 않아도 됩니다. 또한, 특정 샘플에서만 값을 가지는 예측변수도 분산이 0에 가깝기 때문에 영-분산 예측변수가 됩니다. 이러한 경우..

표준 로지스틱 분포의 누적분포함수

Q. 로지스틱 분포의 표준분포함수가 뭐야? A. 로지스틱 분포의 누적분포함수(Cumulative Distribution Function, CDF)는 다음과 같은 수식으로 정의됩니다: F(x) = 1 / [1 + exp(-(x - μ) / σ)] 여기서, x는 로지스틱 분포에서 랜덤 변수의 값, μ는 로지스틱 분포의 평균(mean), σ는 로지스틱 분포의 표준편차(standard deviation)입니다. 로지스틱 분포는 일반적으로 시그모이드 함수와 유사한 형태를 가지고 있으며, 이로 인해 로지스틱 회귀분석에서 사용되기도 합니다. CDF는 x 이하의 값이 나타날 확률을 나타내는데, 로지스틱 분포에서는 CDF 값이 0.5일 때가 중앙값(median)에 해당합니다. Q. μ, σ 이거 두개는 뭐라고 읽고 무슨..

오즈(odds)란 무엇인가?

데이터마이닝에서 오즈(odds)는 어떤 사건이 발생할 확률과 발생하지 않을 확률 간의 비율을 의미합니다. 예를 들어, 동전 던지기에서 앞면이 나올 확률이 1/2라면, 오즈는 앞면이 나올 확률과 뒷면이 나올 확률 간의 비율인 1:1입니다. 오즈는 보통 로그 오즈(log odds)라고도 불리며, 로그 오즈는 로그 함수를 적용한 오즈값입니다. 로그 오즈를 사용하는 이유는, 오즈값이 1보다 작거나 클 경우, 로그 함수를 적용하면 음수값이 나오고, 오즈값이 1과 가까울 경우, 로그 함수를 적용하면 0에 가까운 값이 나오기 때문입니다. 데이터마이닝에서 오즈는 머신러닝 알고리즘에서 사용되는 분류 모델의 성능을 평가하는 데에도 활용됩니다. 예를 들어, 이진 분류 모델에서 오즈비는 모델의 예측력과 관련된 지표 중 하나로..

딥 웹 접속방법

딥 웹 접속방법을 물어봤다 딥 웹은 일반적으로 일반적인 인터넷 브라우저로는 접속할 수 없는 인터넷의 일부입니다. 따라서 딥 웹에 접속하려면 다음과 같은 단계를 따라야 합니다. 토르(Tor) 브라우저 설치: 토르 브라우저는 인터넷 사용자의 익명성을 보호하기 위해 개발된 브라우저입니다. 딥 웹에 접속하기 위해서는 토르 브라우저를 다운로드하고 설치해야 합니다. 토르 브라우저 실행: 토르 브라우저를 실행하면, 인터넷을 통해 익명으로 딥 웹에 접속할 수 있습니다. 검색 엔진 사용: 딥 웹은 일반적인 검색 엔진으로는 검색되지 않습니다. 대신, 딥 웹 전용 검색 엔진인 "DuckDuckGo"나 "Grams"와 같은 검색 엔진을 사용해야 합니다. 이러한 검색 엔진을 사용하여 딥 웹에서 원하는 정보를 검색할 수 있습니다..

맥북 M1에 오라클 설치

https://shanepark.tistory.com/400 [MacOS] M1 맥북 도커로 ORACLE DB 실행하기 Intro M1 맥북을 처음 구입 한 이후로 약 1년 반동안, 오라클 데이터베이스를 띄우기 위해 참 많은 노력을 했었습니다. 원래부터 Oracle이 MacOS를 정식 지원을 하지는 않았지만, 그나마 이전의 맥북에 shanepark.tistory.com https://oralytics.com/2022/09/22/running-oracle-database-on-docker-on-apple-m1-chip/ Running Oracle Database on Docker on Apple M1 Chip This post is for you if you have an Apple M1 laptop an..

for문으로 중첩 리스트 만들기

혼작 공부하는 머신러닝을 공부하다가 처음보는 파이썬 용법이 나와서 그 부분만 따로 공부했습니다 파이썬을 아주 기초부분만 다루는 책만 공부해봐서 이런 용법은 처음 봤습니다 fish_data = [[l, w] for l, w in zip(length, weight)] 구문 fish_data = [[l, w] for l, w in zip(length, weight)] 구문을 더 잘 이해하기 위해 더 작은 부분으로 분해해 보겠습니다. zip(length, weight) - zip() 함수는 두 개 이상의 매개변수(이 경우 length와 weight)을 취하고 각 매개변수의 요소를 집계하는 반복자를 반환합니다. 이 경우 길이와 무게의 해당 요소를 튜플로 집계합니다. 예를 들어 길이가 [1, 2, 3]이고 무게가 ..

맷플롯립(matplotlib) 패키지로 산점도(scatter plot) 그리기

파이썬에서 과학계산용 그래프를 그리는 대표적인 패키지는 맷플롯립이다. 이 패키지를 임포트하고 산점도를 그리는 scatter() 함수를 사용해본다. 도미와 빙어를 무게, 길이 데이터로 산점도를 그린다. # 도미의 길이, 무게 데이터 bream_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, 32.0, 32.0, 33.0, 33.0, 33.5, 33.5, 34.0, 34.0, 34.5, 35.0, 35.0, 35.0, 35.0, 36.0, 36.0, 37.0, 38.5, 38.5, 39.5, 41.0, 41.0] bream_weight = [242.0, 290.0, 340.0, 363.0,..

자바 언어 초심자 팁 20가지

기본 문법 이해: Java 언어의 구문과 변수, 연산자 및 제어 구조와 같은 기본 개념을 이해해야 합니다. 객체 지향 프로그래밍 개념 배우기: Java는 객체 지향 프로그래밍 언어이므로 객체, 클래스, 상속 및 다형성과 같은 개념을 이해해야 합니다. Java 개발 환경 설정: Java로 개발하려면 JDK(Java Development Kit) 및 IDE(통합 개발 환경)를 설치해야 합니다. 변수 선언 및 사용: Java에서 변수를 선언하고 사용하는 방법을 이해해야 합니다. 다양한 데이터 유형 이해: Java의 다양한 데이터 유형과 그 특성을 이해해야 합니다. 제어 구조 사용 방법 알아보기: if 문 및 루프와 같은 제어 구조는 프로그램 흐름을 제어하는 데 필수적입니다. 메서드 정의 및 사용 방법 이해: ..

반응형