본문 바로가기
하루 30분 공부/하루10분: 기초 논문 통계

7. 회귀분석을 돌려보자

by ellev 2022. 9. 22.

이제 드디어 돌려보자!!!

메뉴에서 분석 → 회귀분석 → 선형





크기를 종속변수에 넣고

→ 방금 만든 3개의 더미 변수들 + 자란 기간 + 농부경력 은 독립 변수에 넣음




방법: 입력, 단계 선택, 제거, 후진, 전진 의 옵션이 있는데 학과 마다 다름

(예: 사회과학=입력을 많이 사용)

 

일단 가장 기본적인 ‘입력'을 사용.

→ 통계량 클릭

 

논문 쓸때 꼭 선택할 것이 ‘공선성 진단' + ‘Durbin Watson’

→ 계속

→ 확인



회귀(Regression) 결과값 나옴

 

모형요약(Model Summary): R Square(제곱) 과 Adjusted R Square(수정된 R 제곱, adj-R^2) = 설명력

  • 종속변수(Dependent Variable) = 딸기크기
  • 입력된 여러 변수들이 딸기 크기를 몇 % 설명하는가?
  • %이니까 R제곱(R^2)=94.6% / 수정된 R제곱(adj-R^2)=90.0% 를 설명한다는 뜻
  • 보통 독립변수가 여러개인 경우에는 수정된 R 제곱을 많이 쓴다.

 

이번에 볼 것은 Durbin-Watson

  • 수치는 0-4까지
  • 중간인 2에 가까울 수록 좋다 (2.100 이니 좋다~!!!)
  • 보통은 1.7 혹은 1.8~2.2 사이가 대부분이다.

 

이번에는 이 회귀식이 유의한지 유의하지 않은지 살피기

아래로 스크롤 하면 ANOVA 값이 나온다.

  • 유의확률 Sig.값이 .05보다 작으면 유의함 (.05 > p)
  • .05 > p(.001) 이므로 유의하다.
  • 논문에 F값과 Sig. 값을 꼭 함께 제시할 것 



이번에는 여러 독립변수 중 어떤 것이 과연 딸기 크기에 영향을 미쳤는지 알아보자

아래로 스크롤, 계수값(coefficient) 확인

  • 여기서도 유의확률 Sig.가 제일 중요. (사실은 이 값을 가장 먼저 확인해야한다. 이 값이 유의하지 않으면 다른 결과값은 보나마나)
  • 역시 유의확률 Sig.<.05 여야 함
  • 상수(constant) : Sig.=.004 < .05 ⇒ 유의함!!
  • 즉, 딸기 크기에 영향을 미친 변수는 판매처이다.

 

그럼 판매처가 딸기 크기에 어떤 영향을 줬는지 알아보자

B값을 보자

  • B값이 +: 독립변수가 종속변수에 정(+)의 영향을 미침 ⇒ 독립변수가 증가하면 종속변수도 증가한다.
  • B값이 –: 독립변수가 종속변수에 부(–)의 영향을 미침 ⇒ 

 

  • 판매처_백화점의 B값: –5.080 이므로 종속변수(딸기크기)에 – 영향
  • 판매처_소형의 B값: (+) 3.656 이므로 종속변수(딸기크기)에 + 영향

⇒ 즉, 판매처는 딸기 크기에 유의한 영향을 미침. 

⇒ 판매처가 소형마트의 경우 (대형마트에 비해서) 딸기 크기에 정(+)의 영향을 미침



논문에는 표준화 오류(Std. Error), Beta 값과 분야에 따라 t값도 제시한다.



공선성 진단 보기

회귀분석의 기본 가정 중 하나: 독립변수들은 모두 독립적이다.

(그러나 모든 독립변수들이 실제로 모두 독립적이기는 거의 불가능하다. 그러나 ‘통계적'으로 봤을 때 독립적이다 라고 여기는 것)

 

공선성 통계량(Collinearity Statistics) 에서 Tolerance(공차) 와 VIF 값 확인

 

VIF 값이 분야에 따라 10보다 작아야 함 혹은 7보다 작아야 함 처럼 다름

예) 10보다 작아야 함 일때

  • 모든 값이 10보다 작음을 알 수 있다. 즉, “공선성에는 문제가 없는 것으로 나타났다.”라고 해석하면 됨

 

728x90

댓글