다항회귀모델과 다중선형회귀모델의 관계

Yeju Ham
3 min readMay 3, 2021

--

  1. 다중선형회귀모델(Multiple Linear Regression)

여러가지의 요소들이 Y에 어떠한 영향을 미치는지 알 수 있다. 각 요소들이 독립적이어야 한다. (아니면 다중공선성 문제가 생김) 예를 들어, 과자A의 가격 책정에 고려되는 요소들이 여러가지가 있다면 그것들이 각각의 독립변수가 된다. 고등학교 수학시간에 배운 내용을 생각하면 된다.

2. 다항회귀모델 (Polynomial Regression)

독립변수와 타겟변수 사이에 비선형 관계를 학습 할 수 있는 모델이다. 직선뿐 아니라 곡선으로도 표현이 되기 때문에 모델과의 오차가 줄어들어 원래의 데이터 셋을 잘 설명할 수 있다. 차수를 높여서(제곱) 실제 모델과 더 근사하게 된다.

그러나 그렇기 때문에 과적합이 되기 쉽다..아래 사진은 과적합 된 형태이다. r2스코어는 1이 되었지만 테스트 셋에서는 아주 낮은 점수다. 이런 과적합을 어느정도 방지하기 위해서는 차수를 어떻게 정하는지가 중요한 관건이 된다. 이는 회귀계수들에 F-test를 사용해서 정하거나, F ratio를 이용해 p value가 0.05 이하일 경우에 차수를 높일 수 있다.

polynomial regression은 한 요소를 여러가지 형태로 변형시켜 나타낸 multiple regression이다. 다항회귀가 다중선형회귀의 한 종류이다.

refere

nce:

-multiple linear regression이 polynomial regression보다 나을때?:

-두 회귀의 차이:

https://www.quora.com/Is-polynomial-regression-the-same-as-multiple-regression-i-e-values-are-only-raised-to-powers

--

--

Yeju Ham
Yeju Ham

Written by Yeju Ham

learner, writer, traveler, data science beginner with the whole passion

No responses yet