본문 바로가기
728x90

하루 30분 공부/하루10분: 기초 논문 통계14

2. 파이썬 기초: 문자열 자료형(1) 1. 자료형 1+1=2 이 형식은 인간에게는 너무나 당연한 것. 그러나 여기서 1이 숫자인지 문자인지 정해주지 않으면 컴퓨터는 바보라 모름 예) ‘1’+’1’=’11’ 문자로 인식할 경우 이런 값이 도출된다. 그래서 자료형이란 문자의 값을 숫자/문자 무엇인지 구분할 수 있게 해줌 ​ 자료에 대한 타입: 숫자, 문자열, 불 ​ ​ 변수 어떤 값을 담는 상자 a=3 3이라는 숫자를 a라는 상자에 담는다. * 주의: 수학에서의 등호와는 다른 표현 예) 수학: a=a+1 (말이 안됨) 여기서 등호(=)는 등호가 아님 오른쪽의 값(a+1)을 왼쪽 상자(변수,a)에 넣는다. ​ 즉, a=3 a=a+1 4=3+1 ​ 2. 숫자형 정수형(int, integer): 1, 2, -2 실수(float): 1.24, -34... 2022. 11. 15.
파이썬 python 설치하기 논문 기초 통계를 위해 이런저런 툴을 둘러보았는데 사실 JMP는 거의 포토샵처럼 마우스만 있으면 차트와 결과 도출이 가능한 툴처럼 보였다. 그리고 다음 학기에 수업을 들을 예정이라 일단 스톱. 지도 교수에게 어떤 툴/언어를 배우는게 좋냐고 물어봤다. "음? 필요 없는데? 왜, 너 졸업하고 뭐가 되고 싶은데? 논문 통계 코딩은 어차피 사람 고용할 건데 뭐할라고" 음.. 너무 한국적인 접근이었나? 당연히 논문 쓰려면 툴이나 언어를 알아야 한다고 생각했는데. 툴에 능숙한 민족답게 너무 한국사람 티를 내었나? 결국 "나중에 고용해서 소통을 좀 더 잘 해보려고" 라고 대답했다. 그래서 원래 계획대로 수박 겉핥기식으로만 배울 생각이다. 어차피 내가 데이터 사이언티스트가 되는 것이 목적이 아니기 때문이다. 혹시라도 .. 2022. 11. 9.
3. JMP-(분포)Distribution 플랫폼을 이용한 통계량 산출(한/영) 데이터분석에서 가장 많이 사용하는 Distribution 데이터를 가져올 때 대부분은 엑셀자료일텐데 점프에서 엑셀 데이터를 불러오는 가장 쉬운 건 복붙이다. 새 데이터 탭 만들기 엑셀 파일을 연 후 원하는 데이터를 드래그 후 카피 File > New > Data Tab (단축키: Ctrl + N) → Ctrl+V를 하면 원하는 것과는 다른 모습의 데이터 테이블이 보이다. (헤더값들도 데이터처럼 들어감) 점프 내에서 붙여넣기 → Ctrl + Shift + V (맥: Command+option+V) 그럼 아래처럼 Col Header 에 엑셀 데이터 첫 행에 있던 값들이 열이름으로 들어온다. WHEN? 원본 데이터 (엑셀)의 첫 행에 열 이름이 있는 경우: Ctrl+V → Ctrl+Shift+V 만약 첫번째 .. 2022. 10. 18.
2. JMP 모델링 타입(한/영) 모델링 타입을 알아야 분석이 가능함. ! 입력한 데이터의 모델링 타입을 정확하게 지정해야 오류를 막을 수 있다. 나이에 따른 키의 차이를 알아보자 이때 필요한 기법은 아노바 ANOVA 메뉴 > Analyze > Fit Y be X 2. Y, response → height / X, Factor → age 를 끌어다 놓는다. 3. 그 후 확인 클릭 4. 각 나이별로 점들이 표시됨 5. 왼쪽 위, 빨간 삼각형 클릭 > Means/Anova 선택 6. 결과물 다시 이전 창으로 돌아가서 데이터를 살펴보자. 이렇게 Ordinal 순서형으로 되어 있는데 age는 continuous 연속형으로도 가능하다. 1. Continuous 로 변경 2. 다시 메뉴 > Analyze > Fit Y by X 3. Recall 재.. 2022. 10. 8.
1. JMP 설치하고 처음 실행해 보기 JMP 점프 무료 버전 설치하기 단계별 지침서(JMP 제공) 30일 무료 버전 여기서 기본 정보를 넣으면 이메일 주소로 링크를 전달해준다. 그후 사이트에서 비밀번호 설정 후 로그인 하면 JMP를 다운받을 수 있다. 일련번호 입력하면 설치가 시작된다. 오른쪽 Window List에 현재 사용중인 Data Table과 관련 레포트가 나온다. 새 데이터 테이블 만들기 새로 만들기 클릭 그럼 이런 창이 생긴다. 새로운 열Column을 만들고 싶은 경우, 빈칸을 더블클릭하면 된다. column열2에도 대충 a,b,c,라고 데이터를 입력하면 왼쪽에 작은 그래프 아이콘이 생성된다. 모델링 타입: 파란 삼각형 아이콘: 숫자데이터, Continuous연속형 빨간 막대 아이콘: 문자데이터, Nominal명목형 녹색 막대 .. 2022. 10. 5.
예제표를 놓고 분산분석 ANOVA을 설명해보자 세 집단 이상의 평균 차이를 검증하기 위한 분석방법 BMI 수치에 따른 수분섭취량의 차이 집단구분 N 평균 표준편차 F 유의확률 사후분석 BMI 수치 (A) 저체중 80명 1111.22리터 222.222 3.012*** 0.001 a 2022. 9. 28.
변수의 종류와 설문지 작성팁, t-test 하는 이유 설문지 작성팁 *논문 작성때는 질적, 양적만 구별하면 됨 (그러나 척도를 알아야 자료에 실수가 없긴함) 질적 변수 a qualitative variable 그룹을 분류하기 위한 변후=수적 계산이 불가능 명목척도: 분류가 목적. 서열척도: 숫자 안에 순서 개념, 대소 비교 양적 변수 a quantitative variable 양과 관련된 값을 측정하는 변수 (뭔가 계산에 들어간다, 평균 표준편차 등) 등간척도: 숫자 사이의 간격을 동일 (임의의 0이 존재) 비율척도: 구간 척도의 특성에 절대 영점을 가지고 있음 *명목 → 서열 → 등간 → 비율 의 순서로 정보가 많이 들어있다. 유의성검정과 T-검정 양적변수를 분석할때 첫번째 분석이 바로 유의성검정: 유의하냐 아니냐 왜? 모든 데이터는 모집단 데이터가 아닌.. 2022. 9. 23.
728x90