공부/통계 정리

통계(추정과 신뢰구간)

Parkchanmin 2017. 3. 11. 00:32

안녕하세요 ㅎ

몇일동안 발표준비를 하느라고 정리할시간이 없었네요 

저번시간에는 다양한 표본추출 방법에 대해서 설명을 하였고 중심극한정리에 대해서 설명을 하였습니다. 


표본 추출하는 목적은 모집단에 대한 평균, 표준편차, 분포형태와 같은 모수의 특성을 파악하기 위해서 사용하는 것이라고 설명을 했는데요

이번시간에는 점추정, 신뢰구간 추정과 같은 추정 방법을 통해서 표본으로 모집단의 모수를 어떻게 추정하는 것에 대해서 설명을 하도록 하겠습니다.


추정은 모집단의 대한 유추라고합니다. 

점추정은 모집단의 특성(모수)를 추정하기 위해 사용하는 하나의 계산된 값(통계량)입니다.


이러한 점추정을 예로들어보겠습니다

피그미족의 평균 키는 μ라고 합니다. 요기서 50명을 표본으로 뽑아서 키를 조사하였더니 평균이 135cm가 나왔습니다. 

이때 이러한 135cm처럼 하나의 수치, 하나의 값으로 모수 μ를 추정하는 것이 점추정이라고 합니다. 


이러한 점추정의 결과가 모집단의 모수에 가까운 값이라는 기대는 할 수 있으나 가까운 정도를 계량적 수치로 표현할 수는 없습니다. 따라서 이를 위한 보완적 수단으로 구간추정이라는 추정방법이 필요합니다. 


음... 예를 들어보록 하죠 ㅎ

피그미족의 점추정이 135cm라고 했었습니다. 하지만 이 값은 모수에 대한 추정치일 뿐이고 실제 모평균ㅇ과는 차이를 보일 수 있습니다.

따라서 확률적 표현을 통해서 모집단의 모수가 어떤 범위내에 존재할 가능성에 대해서 기술할수가 있습니다. 

"피그미족의 평균키가 130cm~140cm사이에 있을 가능성이 있을 가능성이 90%이다"라는 표현을 할수 있습니다. 


신뢰구간은 주어진 확률로 모집단의 모수가 존재할 것으로 예상되는 값의 범위입니다.

이로인해서 표본평균의 95%는 모평균 μ를 중심으로 양쪽으로 표준편차의 1.96배가 이내에 존재한다

표본평균의 99%는 μ를 중심으로 양쪽으로 표준편차의 2.58배 이내에 존재한다. 

95%, 99%라는 말이 신뢰구간이라고 하고 신뢰수준이라고도 합니다. 


모평균에 대한 신뢰구간의 폭은 3가지 요인에 의해서 결정이 되는데 

  1. 표본에 속한 관찰값의 수 'n'
  2. 모집단의 변동성, 일반적으로 표본표준편차 s 를 통해 추정합니다. 
  3. 신뢰수준에서 모평균에 대한 경우 (σ를 아는 경우 식은) = 라고 합니다. 이경우에서는 신뢰한계를 z분포를 이용하였습니다.
  4. 또 모표준편차를 모르는 경우에 신뢰한계의 식은라고 하고 , 이경우에서는 신뢰한계를 t분포를 이용하였습니다 .




t를 구하는 식은 이러하다. 




위에서 t분포의 주요한 특징이 있다. 

  1. 1.연속활률분포이고 종모양이고 대칭이다.
  2. 표준정규분포에 비해 좀 더 평평한 모양이다.
  3. 자유도에 따라 여러 형태의 t분포가 존재한다.



비율은 모집단이나 표본에서 어떤 특성을 가진 일부분에 대한 비율, 분수, 퍼센트를 의미한다. 이에 표본비율은 p =X/n이라고 부른다. 

모비율에 대한 신뢰구간은 다음의 공식을 통해서 나뉘어집니다. 

    1.  모평균 추정을 위한 표본크기를 정할때에는 

    • 원하는 신뢰수준 Z

    • 연구자가 감내할 수 있는 오차한계 E

    • 대상 모집단의 변동성 S 이 필요하다. 

    • 결과적으로 모평균을 추정을 위한 표본크기는 다음과 같다. 

    모비율 추정을 위한 표본크기도 3가지 요인에 의해서 나타난다.

    • 원하는 신뢰수준으로 보통 간접적으로z를 사용하여 표현다. 

    • 최대허용오차 

    • 모비율에 대한 점추정치, 0.5를 사용하기도 한다. 

    • 결과적으로 모비율을 추정을 위한 표본크기는 다음와 같다. 

수고하셨습니다. ㅎ


반응형