본문 바로가기
728x90

기초통계11

2. 파이썬 기초: 문자열 자료형(1) 1. 자료형 1+1=2 이 형식은 인간에게는 너무나 당연한 것. 그러나 여기서 1이 숫자인지 문자인지 정해주지 않으면 컴퓨터는 바보라 모름 예) ‘1’+’1’=’11’ 문자로 인식할 경우 이런 값이 도출된다. 그래서 자료형이란 문자의 값을 숫자/문자 무엇인지 구분할 수 있게 해줌 ​ 자료에 대한 타입: 숫자, 문자열, 불 ​ ​ 변수 어떤 값을 담는 상자 a=3 3이라는 숫자를 a라는 상자에 담는다. * 주의: 수학에서의 등호와는 다른 표현 예) 수학: a=a+1 (말이 안됨) 여기서 등호(=)는 등호가 아님 오른쪽의 값(a+1)을 왼쪽 상자(변수,a)에 넣는다. ​ 즉, a=3 a=a+1 4=3+1 ​ 2. 숫자형 정수형(int, integer): 1, 2, -2 실수(float): 1.24, -34... 2022. 11. 15.
1. JMP 설치하고 처음 실행해 보기 JMP 점프 무료 버전 설치하기 단계별 지침서(JMP 제공) 30일 무료 버전 여기서 기본 정보를 넣으면 이메일 주소로 링크를 전달해준다. 그후 사이트에서 비밀번호 설정 후 로그인 하면 JMP를 다운받을 수 있다. 일련번호 입력하면 설치가 시작된다. 오른쪽 Window List에 현재 사용중인 Data Table과 관련 레포트가 나온다. 새 데이터 테이블 만들기 새로 만들기 클릭 그럼 이런 창이 생긴다. 새로운 열Column을 만들고 싶은 경우, 빈칸을 더블클릭하면 된다. column열2에도 대충 a,b,c,라고 데이터를 입력하면 왼쪽에 작은 그래프 아이콘이 생성된다. 모델링 타입: 파란 삼각형 아이콘: 숫자데이터, Continuous연속형 빨간 막대 아이콘: 문자데이터, Nominal명목형 녹색 막대 .. 2022. 10. 5.
예제표를 놓고 분산분석 ANOVA을 설명해보자 세 집단 이상의 평균 차이를 검증하기 위한 분석방법 BMI 수치에 따른 수분섭취량의 차이 집단구분 N 평균 표준편차 F 유의확률 사후분석 BMI 수치 (A) 저체중 80명 1111.22리터 222.222 3.012*** 0.001 a 2022. 9. 28.
변수의 종류와 설문지 작성팁, t-test 하는 이유 설문지 작성팁 *논문 작성때는 질적, 양적만 구별하면 됨 (그러나 척도를 알아야 자료에 실수가 없긴함) 질적 변수 a qualitative variable 그룹을 분류하기 위한 변후=수적 계산이 불가능 명목척도: 분류가 목적. 서열척도: 숫자 안에 순서 개념, 대소 비교 양적 변수 a quantitative variable 양과 관련된 값을 측정하는 변수 (뭔가 계산에 들어간다, 평균 표준편차 등) 등간척도: 숫자 사이의 간격을 동일 (임의의 0이 존재) 비율척도: 구간 척도의 특성에 절대 영점을 가지고 있음 *명목 → 서열 → 등간 → 비율 의 순서로 정보가 많이 들어있다. 유의성검정과 T-검정 양적변수를 분석할때 첫번째 분석이 바로 유의성검정: 유의하냐 아니냐 왜? 모든 데이터는 모집단 데이터가 아닌.. 2022. 9. 23.
7. 회귀분석을 돌려보자 이제 드디어 돌려보자!!! 메뉴에서 분석 → 회귀분석 → 선형 크기를 종속변수에 넣고 → 방금 만든 3개의 더미 변수들 + 자란 기간 + 농부경력 은 독립 변수에 넣음 방법: 입력, 단계 선택, 제거, 후진, 전진 의 옵션이 있는데 학과 마다 다름 (예: 사회과학=입력을 많이 사용) 일단 가장 기본적인 ‘입력'을 사용. → 통계량 클릭 논문 쓸때 꼭 선택할 것이 ‘공선성 진단' + ‘Durbin Watson’ → 계속 → 확인 회귀(Regression) 결과값 나옴 모형요약(Model Summary): R Square(제곱) 과 Adjusted R Square(수정된 R 제곱, adj-R^2) = 설명력 종속변수(Dependent Variable) = 딸기크기 입력된 여러 변수들이 딸기 크기를 몇 % 설.. 2022. 9. 22.
6. 회귀분석을 돌리기 전 준비하기 회귀분석 거의 모든 논문 분석의 기초가 바로 회귀분석! 어떤 분석법이, 어떻게 돌리는 것이 맞느냐? 그건 선배 논문과 지도교수의 답변을 참고 지난 번 대충 입력해 놓았던 데이터를 SPSS로 불러왔다. 종속변수: 크기, 무게 독립변수: 자란곳, 판매처, 기간, 경력 여기서 ‘자란 곳'과 ‘판매처’는 명목형! 자란곳이나 판매처의 번호는 커진다고 해서 의미가 없다. 따라서 회귀분석 돌리는데 크게 의미가 없으나, 더미변수를 활용해 돌리자 더미변수란? 기준=무엇을 0으로 만들까 정할 것. 예) 자란곳: 야외를 0, 혹은 비닐하우스를 0 (실제로 기준을 정하는 방법은 다소 까다롭다.) 여기서는 비닐하우스를 0으로 정해보자. 변경할 변수값 선택(자란곳) → 변환 → 다른 변수로 코딩변경 자란 곳을 선택해서 오른쪽으로.. 2022. 9. 22.
5. 아노바 ANOVA 아노바 ANOVA 논문을 읽으면서 자주 봤던 아노바. 스물스물 백만년전 학교에서 배운 기억이 난다. 아노바를 SPSS로 돌리기 위해서는 3개 이상의 집단으로 나눠진 변수가 필요하다. 이전에 공부용으로 대충 만든 데이터에서 보면 딸기의 판매처가 3개 집단이다. 예를 들어 딸기 무게가 판매처에 따라 차이가 있는가 없는가를 알아보자. 메뉴 > 분석 > 평균 및 비율 비교 > 일원배치 분산분석(이것이 바로 ANOVA! 아, 시험공부 했던 기억이~! 떠오른다!) 내가 알고 싶은 것은 '판매처에 따라 무게의 차이가 있을까?'이므로 요인: 평균을 비교하려고 하는 집단변수 즉, '판매처에 따른...'이므로 판매처를 '요인'에 넣고 무게를 '종속변수'에 넣는다. 종속변수를 여러 개 넣으면 결과가 여러 개 나온다. 크기.. 2022. 9. 19.
728x90