본문 바로가기
하루 30분 공부/하루10분: 기초 논문 통계

변수의 종류와 설문지 작성팁, t-test 하는 이유

by ellev 2022. 9. 23.

설문지 작성팁

*논문 작성때는 질적, 양적만 구별하면 됨 (그러나 척도를 알아야 자료에 실수가 없긴함)

질적 변수 a qualitative variable

그룹을 분류하기 위한 변후=수적 계산이 불가능

  • 명목척도: 분류가 목적. 
  • 서열척도: 숫자 안에 순서 개념, 대소 비교

 

양적 변수 a quantitative variable

양과 관련된 값을 측정하는 변수 (뭔가 계산에 들어간다, 평균 표준편차 등)

  • 등간척도: 숫자 사이의 간격을 동일 (임의의 0이 존재)
  • 비율척도: 구간 척도의 특성에 절대 영점을 가지고 있음

 

*명목 → 서열 → 등간 → 비율 의 순서로 정보가 많이 들어있다.

 

유의성검정과 T-검정

양적변수를 분석할때 첫번째 분석이 바로 유의성검정: 유의하냐 아니냐

 

왜?

모든 데이터는 모집단 데이터가 아닌 표본 데이터임

예) 후보 A,B 중 후보 지지율을 알고 싶을때

  • 전체=모집단 즉, 투표권자 (20세 이상 성인 4,000만명)
  • 4천만 모두 조사 불가능 → 3,000명 조사
  • → 결과, 지지율이 A=0.45 / B=0.47 일때 B가 당선이 확실한가?
  • → 1/10000 도 안되는 숫자로는 확신할 수 없음
  • → 확률적인 해석 (이 데이터를 얼마나 믿을 수 있는가에 대한 유의확률로 해석을 할 수 있음)
  • → A=0.45 / B=0.47 를 +/– 를 포함한 ‘범위'로 이야기 한다.



유의성 검정방식

유의확률 (계산해서 나온 값)과 유의수준(기준)을 기준으로 비교

  • 유의확률: p라고 표기
  • 유의수준: 기준 (숫자가 작을수록 엄격)
  • *p<.05
  • **p<.01
  • ***p<.001

 

p값은 t값에 의해 정해진다.

  • 유의확률 p > 유의수준(3가지 *,**,***) ⇒ 유의하지 않다.
  • 유의확률 p < 유의수준(3가지 *,**,***) ⇒ 유의하다.

 

t-검증 결과표와 해석

t-테스트(검증)?

두 집단의 평균차이를 검증하기 위한 분석방법

 

  • 독립변수 Independent variable: 정성적 변수 (변하지 않음, 영향을 주는 변수)
  • 종속변수 Dependent variable: 정량적 변수 (독립변수에 따라 변함, 영향을 받는 변수)
  • 예) 성별에 따른 수분섭취량의 차이

 

딱 보기에 숫자가 차이가 있어보이지만 ‘통계적인 차이가 있나?’를 알려면 반드시 t-test를 거처야만 한다.

예) 수분섭취량(L): 남성=636 / 여성=800

 

어떻게? 

spss에 넣고 돌리면 t값을 통해 p값(유의확률)이 나온다.

  • 3개 기준 중 한가지 기준이라도 적으면 ‘유의하다'라고 말할 수 있다. 
  • 즉, 통계적으로 두 집단의 수분섭취량에 차이가 있다.

 

그럼 이게 끝인가? 아니다.

  1. 차이여부 O/X를 알게 되고
  2. 그 후 이에 대한 해석을 해야함

 

논문 해석을 더 풍성하게 하는 법: 

단순 알게된 사실에서 독립/종속 변수의 관계에 대한 설명을 추가하면 된다.

예) A집단이 물을 더 마심 --> A/B집단의 차이, 성별이 수분섭취량에 영향을 준다.

728x90

댓글