이제 드디어 돌려보자!!!
메뉴에서 분석 → 회귀분석 → 선형
크기를 종속변수에 넣고
→ 방금 만든 3개의 더미 변수들 + 자란 기간 + 농부경력 은 독립 변수에 넣음
방법: 입력, 단계 선택, 제거, 후진, 전진 의 옵션이 있는데 학과 마다 다름
(예: 사회과학=입력을 많이 사용)
일단 가장 기본적인 ‘입력'을 사용.
→ 통계량 클릭
논문 쓸때 꼭 선택할 것이 ‘공선성 진단' + ‘Durbin Watson’
→ 계속
→ 확인
회귀(Regression) 결과값 나옴
모형요약(Model Summary): R Square(제곱) 과 Adjusted R Square(수정된 R 제곱, adj-R^2) = 설명력
- 종속변수(Dependent Variable) = 딸기크기
- 입력된 여러 변수들이 딸기 크기를 몇 % 설명하는가?
- %이니까 R제곱(R^2)=94.6% / 수정된 R제곱(adj-R^2)=90.0% 를 설명한다는 뜻
- 보통 독립변수가 여러개인 경우에는 수정된 R 제곱을 많이 쓴다.
이번에 볼 것은 Durbin-Watson
- 수치는 0-4까지
- 중간인 2에 가까울 수록 좋다 (2.100 이니 좋다~!!!)
- 보통은 1.7 혹은 1.8~2.2 사이가 대부분이다.
이번에는 이 회귀식이 유의한지 유의하지 않은지 살피기
아래로 스크롤 하면 ANOVA 값이 나온다.
- 유의확률 Sig.값이 .05보다 작으면 유의함 (.05 > p)
- .05 > p(.001) 이므로 유의하다.
- 논문에 F값과 Sig. 값을 꼭 함께 제시할 것
이번에는 여러 독립변수 중 어떤 것이 과연 딸기 크기에 영향을 미쳤는지 알아보자
아래로 스크롤, 계수값(coefficient) 확인
- 여기서도 유의확률 Sig.가 제일 중요. (사실은 이 값을 가장 먼저 확인해야한다. 이 값이 유의하지 않으면 다른 결과값은 보나마나)
- 역시 유의확률 Sig.<.05 여야 함
- 상수(constant) : Sig.=.004 < .05 ⇒ 유의함!!
- 즉, 딸기 크기에 영향을 미친 변수는 판매처이다.
그럼 판매처가 딸기 크기에 어떤 영향을 줬는지 알아보자
B값을 보자
- B값이 +: 독립변수가 종속변수에 정(+)의 영향을 미침 ⇒ 독립변수가 증가하면 종속변수도 증가한다.
- B값이 –: 독립변수가 종속변수에 부(–)의 영향을 미침 ⇒
- 판매처_백화점의 B값: –5.080 이므로 종속변수(딸기크기)에 – 영향
- 판매처_소형의 B값: (+) 3.656 이므로 종속변수(딸기크기)에 + 영향
⇒ 즉, 판매처는 딸기 크기에 유의한 영향을 미침.
⇒ 판매처가 소형마트의 경우 (대형마트에 비해서) 딸기 크기에 정(+)의 영향을 미침
논문에는 표준화 오류(Std. Error), Beta 값과 분야에 따라 t값도 제시한다.
공선성 진단 보기
회귀분석의 기본 가정 중 하나: 독립변수들은 모두 독립적이다.
(그러나 모든 독립변수들이 실제로 모두 독립적이기는 거의 불가능하다. 그러나 ‘통계적'으로 봤을 때 독립적이다 라고 여기는 것)
공선성 통계량(Collinearity Statistics) 에서 Tolerance(공차) 와 VIF 값 확인
VIF 값이 분야에 따라 10보다 작아야 함 혹은 7보다 작아야 함 처럼 다름
예) 10보다 작아야 함 일때
- 모든 값이 10보다 작음을 알 수 있다. 즉, “공선성에는 문제가 없는 것으로 나타났다.”라고 해석하면 됨
728x90
'하루 30분 공부 > 하루10분: 기초 논문 통계' 카테고리의 다른 글
예제표를 놓고 분산분석 ANOVA을 설명해보자 (0) | 2022.09.28 |
---|---|
변수의 종류와 설문지 작성팁, t-test 하는 이유 (1) | 2022.09.23 |
6. 회귀분석을 돌리기 전 준비하기 (1) | 2022.09.22 |
5. 아노바 ANOVA (0) | 2022.09.19 |
4. 독립표본 t-test (0) | 2022.09.18 |
댓글