2025/12 2

MinMaxScaler

Interaction(상호작용 비율) 지표가 포함된 모델에서 K-Means 클러스터링을 수행하기 전에 적용하면 좋습니다. MinMaxScaler모든 피처(Feature)값을 0과 1사이로 압축하는 기법입니다. X(sclaed) = ( X - X(min) ) / ( X(max) - X(min) )최솟값 (x min) 은 0이 되고 최댓값(x max)는 1이 됩니다.데이터의 상대적 분포는 유지하면서 오직 단위(Scale)만 통일합니다.K-means에서 스케일링을 해야하는 이유K-Means는 데이터 포인트 사이의 유클리드 거리를 계산하여 군집을 나눕니다.(평균값)만약 매출은 수천만원인데 비율은 0~1 사이라면 매출을 더 중요한 변수로 착각하기 때문에 문제가 생깁니다. MinMaxSclaer를 통해 모든 변..

통계 2025.12.24

비즈니스 의사결정에 사용하는 수학적 원리

1. 선형회귀(Linear) vs 이차회귀(Quadratic)선형회귀 : y = Ax + b이 식은 x 가 오를 때마다 y가 일정한 비율(A)으로 계속 증가하거나 감소한다고 가정합니다.다만 실제 세상에서는, 적당히 따뜻할 땐 좋지만, 너무 더우면 나가기 싫어지는 현상을 설명하지 못합니다 (변곡점)이차회귀 : y = Ax^2 + Bx + C그래서 이런 변곡점을 설명하기 위해 X의 제곱항을 추가한 다항 회귀식을 만듭니다.여기서 A는 그래프의 곡률(Curvature)을 결정하는 핵심 변수 입니다.A가 음수나 양수에 따라 이차함수의 그래프 모양이 달라집니다.A > 0 = 아래로 볼록한(U자) 모양A 따라서 이차항의 계수(A)가 음수이면서 통계적으로 유의미(p 수학적으로 이 데이터는 위로 볼록한 포물선 형태를 ..

통계 2025.12.23