본문 바로가기
하루 30분 공부/하루10분: 기초 논문 통계

3. JMP-(분포)Distribution 플랫폼을 이용한 통계량 산출(한/영)

by ellev 2022. 10. 18.

 

데이터분석에서 가장 많이 사용하는 Distribution

데이터를 가져올 때 대부분은 엑셀자료일텐데 점프에서 엑셀 데이터를 불러오는 가장 쉬운 건 복붙이다.

 

 

 

새 데이터 탭 만들기

엑셀 파일을 연 후 원하는 데이터를 드래그 후 카피

 

File > New > Data Tab (단축키: Ctrl + N)

→ Ctrl+V를 하면 원하는 것과는 다른 모습의 데이터 테이블이 보이다. (헤더값들도 데이터처럼 들어감)

 

 

 

점프 내에서 붙여넣기

→ Ctrl + Shift + V (맥: Command+option+V)

그럼 아래처럼 Col Header 에 엑셀 데이터 첫 행에 있던 값들이 열이름으로 들어온다.

 

 

 

WHEN?

  • 원본 데이터 (엑셀)의 첫 행에 열 이름이 있는 경우: Ctrl+V → Ctrl+Shift+V
  • 만약 첫번째 행에 Col 이름이 없다?: 그냥 ctrl+V

 

 

다른 방법(엑셀 내에서 점프 메뉴사용)

엑셀 위에 JMP 라는 메뉴 생김

  1. 환경설정 > dialoge 보면 첫번째 행을 열이름으로 사용을 체크
  2. 데이터 테이블 클릭
    1. 점프에 자동으로 엑셀 파일 이름이 왼쪽에, 행, 열이 제대로 들어옴
    2. 엑셀 원본 파일의 파일명도 점프에 들어온다

(굉장히 편한 기능인데 현재 엑셀이 없으므로 나중에 해보자)

 

 

 

통계량 산출

최근 사용한 파일(Recent Files)에서 Big class family 더블클릭

 

Age~weight 선택

 

 

→ 툴바의 Distribution 아이콘 (혹은 메뉴 > 분석 > 분포(Distribution))

각 메뉴의 맨 위에 있는 기능=그만큼 자주 사용된다는 뜻

 

창의 위에도 보면 아이콘으로 나와 있다.

 

 

해당 아이콘들이 이 보이지 않는다면 view > show tools

 

Distribution(분포) 선택하면 다음창 나온다

 

 

→ 왼쪽에 미리 선택된 것들을 Y columns 로 이동

 

→ OK

→ 분석 결과 나옴

 

 

결과표 분석

Age=범주형 데이터 → 그래프 + 테이블로 빈도(Frequencies) 나옴

Height, weight=연속형 데이터

따라서 히스토그램 & 상자그림

  • Quantiles(백분위수)
    • 75% quartile
    • 3rd quartile
    • Q3(3사 분위수)
    • 25% quartile=Q1(1사분위수)

 

  • 5 Number Summary(Min, Q1, Median, Q3, Max)
    • 상자 그림을 그릴때 필요한 통계

 

그 아래 요약된 통계량(Summary Statistics)

 

 

요약 통계량에 내용을 더 보고 싶다면

→ 빨간 삼각형

→ Customize Summary Staticts

 

 

→ 원하는 것 체크 → OK → 그럼 추가 결과 나옴

→ Sum(합), N Missing(결측값 수), Minimum(최소값), Maximum(최대값) 을 체크한 후 OK

→ 추가 통계량 표시됨

* 추가기능:

예를 들어 차트에서 여자 클릭 → 관련값이 Highlight 된다.

 

 

 

728x90

댓글