Q. 데이터마이닝에서 상관행렬이 뭐야? A. 상관행렬(correlation matrix)은 데이터마이닝에서 변수 간의 상관관계를 나타내는 행렬입니다. 상관관계는 두 변수 사이의 관련성을 나타내는 지표로, 변수 간의 선형적인 관계를 측정합니다. 상관행렬은 변수 간의 상관관계를 나타내는데, 상관계수(correlation coefficient)를 사용합니다. 상관계수는 -1에서 1 사이의 값을 가지며, 1에 가까울수록 양의 상관관계(두 변수가 함께 증가), -1에 가까울수록 음의 상관관계(두 변수가 서로 반대로 증감)를 나타냅니다. 0에 가까울수록 두 변수 사이에는 상관관계가 없습니다. 상관행렬은 주로 변수 간의 다중공선성(multicollinearity)을 확인하는 데 사용됩니다. 다중공선성은 변수 간의 강..