머신러닝
[머신러닝] 선형 모델의 성능 향상을 위한 방법
서노리
2022. 4. 22. 04:10
반응형
선형 모델의 성능 향상을 위한 방법
1. 스케일 전처리(정규화)
- 선형 모델은 각각의 특성에 대해 가중치를 할당
- 따라서 각각 특성의 스케일 차이 발생 시 가중치 적용에 어려움
- 정규화 : 데이터를 구성하는 각 컬럼의 값을 평균은 0, 표준편차는 1로 스케일 조정
from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
scaler.fit(X_train)
X_train = scaler.transform(X_train)
X_test = scaler.transform(X_test)
2. 차원 확장
- 선형 모델의 방정식 : y = x1 * w1 + x2 * w2 ... xN * wN + b
- 차원을 확장하여 데이터에 대한 성능을 극대화
from sklearn.preprocessing import PolynomialFeatures
# - degree 하이퍼 파라메터를 사용하여 차원을 조절
poly = PolynomialFeatures(degree=2, include_bias=False)
poly.fit(X)
X_poly = poly.transform(X)
# 차원을 2차원으로 확장한 데이터로 학습을 진행
model = LinearRegression().fit(X_poly, y)
pred = model.predict(X_poly)
반응형