통계학도감(2):확률분포

2 분 소요

  • 통계학도감(쿠리하라 신이치 저)을 보고 정리한 내용입니다.

2. 확률분포?

  • 2.1 확률과 확률분포
  • 2.2 확률이 같은 분포 - 균일분포
  • 2.3 동전 던지기의 분포 - 이항분포
  • 2.4 종 모양의 분포 - 정규분포
  • 2.5 척도가 없는 분포 - 표준정규분포
  • 2.6 데이터의 위치를 알 수 있다 - 시그마 구간
  • 2.7 분포의 형태 - 왜도와 첨도
  • 2.8 드물게 일어나는 분포 - 포아송 분포
  • 2.9 여러 데이터를 동시에 취급하기 - 카이스퀘어 분포
  • 2.10 카이스퀘어의 비 - F분포

2. 확률분포?

  • 2.1 확률과 확률분포
    • 사상trial : 실험이나 관측 등의 행위(시행)에 의해 생긴 결과
    • 확률probability : 어느 사상이 어느 정도 일어나기 쉬운지(우연성의 정도)를 수치화한 것. 모든 사상에 대한 확률을 합치면 1(100%)이 된다.
    • 확률변수random Variable : 시행해 봐야 비로소 결과를 알 수 있는 변수를 확률변수. 취할 수 있는 값이 확률에 의해 정의되어 있는 변수.
      • 이산확률변수
      • 연속확률변수
    • 모집단 : 연구대상 전체
      • 모집단 분포의 평균이나 분산을 각각 모평균, 모분산 이라고 하고 이들을 합쳐 ‘모수’ 라고 한다.
  • 2.2 확률이 같은 분포 - 균일분포
    • 각 사상이 일어나는 확률이 같은 분포를 균일분포라고한다.
    • 이산균일 분포
      • ex. 주사위를 던져 각 눈이 나올 확률은 모두 같고, 이산적인 값을 취함.
      • x가 n개의 값을 취할때, 평균은 (n+1)/2 분산은 (n^2-1)/12
        • ex. 주사위(n=6)는 평균은 3.5, 분산은 2.916(35/12)을 가진다.
    • 연속균일분포
      • 다트의 360도 전체값.
      • x가 a,b 사이에 있을때, 평균은 (a+b)/2, 분산은 (b-a)^2/12을 가진다.
  • 2.3 동전 던지기의 분포 - 이항분포
    • 성공이나 실패 같은 사상에 대한 분포. 결과가 두종류 밖에 없는 시행을 베르누이 시행 이라고 한다.
    • 이항분포확률식 : img
  • 2.4 종 모양의 분포 - 정규분포
    • 평균값을 중심으로 대칭을 이루는 종 모양의 분포이다.
    • 검정 등에서는 정규분포가 전제되는 일이 많으며, 통계학에서 중요한 분포.
    • 이항분포의 시행횟수를 늘리면 분포는 정규분포에 가까워진다.
  • 2.5 척도가 없는 분포 - 표준정규분포
    • 표준화란 데이터의 평균값을 0, 표준편차(분산)를 1로 변환하는 것.
    • 변환한 데이터를 표준화변량이라고 한다. 척도(단위)를 의식하지 않고 사용할 수 있다.
    • 표준화한 정규분포는 표준정규분포(z분포)라고 한다.
  • 2.6 데이터의 위치를 알 수 있다 - 시그마 구간
    • 표준화를 하면 데이터가 표준정규분포의 어디에 있는지 대략적인 위치를 알 수 있다. img
    • z값이 3시그마 구간 밖에 있을떄, 해당 데이터는 정규분포에서는 잘 일어나지 않는 수이다. 따라서 이상치일 가능성이 높다. (번외로, 6시그마 활동 : 6시그마 밖, 즉 0.0000034 수준의 불량품 발생확률을 줄이려는 활동을 말함)
  • 2.7 분포의 형태 - 왜도와 첨도
    • 표준분포 모양이 정규분포에서 어느 정도 벗어나 있는지를 측정하기 위한 지표. 좌우가 대칭되는 분포가 아닌경우를 척도화 한것.
    • 왜도
      • 분포가 좌우대칭이면 =0.
      • 왼쪽으로 치우쳐 지면 >0.
      • 오른쪽으로 치우쳐 지면 <0. [img]
    • 첨도
      • 표뽁한 정도를 나타내는 지표.
  • 2.8 드물게 일어나는 분포 - 포아송 분포
  • 2.9 여러 데이터를 동시에 취급하기 - 카이스퀘어 분포
  • 2.10 카이스퀘어의 비 - F분포

스터디하면서 궁금헀던 내용 정리

Q. 이항분포 - 타이타닉도 이항분포? 확률은 꼭 페어해야하나? Q. 이항분포를 무한히 던지면 정규분포 Q. 왜도와 첨도의 값의 의미. skewness, kurtosis. Q. 분포들의 혼합.

  • 트위디 분포 Q. 300개의 데이터를 100개씩 3개로 나누면 자유도가 3개인 카이제곱분포를 할 수 있는가
  • 아, 서로다른 모집단에서 뽑은거면 오케이. Q. 카이분포, F분포 문제풀어보기 https://www.slideshare.net/JeonghunYoon/0228-2-sampledistribution Q. t검정 : student검정 https://m.blog.naver.com/PostView.nhn?blogId=hisukdory&logNo=220692088570&proxyReferer=https%3A%2F%2Fwww.google.com%2F

(EOD)

카테고리:

업데이트: