Statistics/An Introduction to Statistical Learning 2

3.2 다중선형회귀

단순선형회귀는 단일 설명변수를 기반으로 반응변수를 예측합니다. 하지만 실제 상황에서는 보통 하나보다 많은 설명변수가 관련됩니다. 단순선형회귀 포스팅에서 사용한 advertising데이터 역시 라디오, 신문광고 지출에 대한 데이터가 있으며, 이들 두 매체가 판매량과 상관성이 있는지 알고 싶을 수 있습니다. 이 경우 단순선형회귀모델을 확장하여 하나의 모델에서 각 설명변수에 다른 기울기 계수를 할당하는 다중선형회귀 모델을 고려할 수 있습니다. 1. 회귀계수의 추정 est = smf.ols('Sales ~ TV+Radio+Newspaper', ad).fit() est.summary() est = smf.ols('Sales ~ TV', ad).fit() est.summary().tables[1] est = smf..

3.1 단순선형회귀

단순선형회귀는 하나의 설명변수 X에 기초해 양적 반응변수인 Y를 예측합니다. 이번 포스팅에서는 캐글에 advertising데이터로 선형회귀에서 고려해야 할 부분들을 하나씩 짚어봅시다. 데이터는 특정 제품에 대한 TV, radio, newspaper 광고 예산과 그에 따른 sales(1천 유닛)를 나타냅니다. 1. 계수 추정 특정 TV광고 값으로 판매량을 예측한다면 sales와 TV의 관계를 다음처럼 표현할 수 있고 이는 최소제곱선을 표현합니다 실제로 β0과 β1은 알려져 있지 않아 advertising데이터가 가지는 n=200개 관측치를 이용해 회귀 계수를 추정해야 합니다. 이때 결과 직선이 200개 데이터 포인트에 가능한 가깝게 되도록 하는 절편 β0과 기울기 β1를 찾는것입니다 그럼 그 가까움은 어떻..