표본 추출에 대해서 정리하기 전에 모수, 모집단이 있는데요.
모수 (parameter) 란 모집단의 특성을 나타내는 양적 척도 즉 모든 사람을 다 조사 해보는 것
모집단 (population)란 관심의 대상이 되는 원소들 전체의 집합
이러한 모집단에서 추출된어진 대상을 표본이라고 합니다.
그러면!!! 왜 이런 표본추출을 하게 될까요?
첫번째로는 모집단에 대한 조사는 시간이 많이 소요됩니다.
두번째로는 비용이 많이 필요하고 , 물리적으로 불가능한 경우가 많기 때문입니다.
그외의 여러 이유가 있습니다.
표본추출하는 방법은 총 4가지 방법이있는데요
이렇게 여러개의 추출 방법이 있습니다.
이러한 표본은 모집단의 특성을 추론하기 위해서 사용됩니다.
그러나 모집단의 일부분이므로 정확하게 일치하지가 않습니다. 이러한 경우 오차가 발생하는데 이걸 표본오차로 부릅니다.
- 표본오차는 모집단의 모수와 표본통게량과의 차이를 말합니다.
그러면 오차가 발생하게 된다면 어떻게 표본 결과를 믿을까요...? (정확한 예측을 할수가 있을까요??)
그 궁금점을 해결하기 위해서 표본평균의 표본분포에 대해서 이해를 해야됩니다.
- 표본평균의 표본분포는 동일한 크기의 모든 가능한 표본들로부터 얻어진 표본평균들의 확률분포입니다.
- 즉 표본들중에서 동일한 크기를 가진 표본들의 평균의 확률분포입니다.
표본평균분포와 모집단분포와 중요한 관계들이 있는데요
- 표본평균들의 평균은 모집단 평균과 항상 일치한다.
- 표본평균분포의 산포의 폭은 모집단 분포에 비해좁다.
- 표본평균분포의 형태는 정규분포에 가까운 종 모양을 가집니다..
이러한 표본평균분포를 사용하여서 에 중심극한 정리를 사용할수가 있습니다.
중심극한 정리(Central Limit Theorem)란 어떤 모집단으로부터 동일한 크기의 모든 표본들을 추출하고 표본평균분포를 구하면 정규분포에 근사하게 하는 방법입니다.
중심극한 정리의 가장 큰 장점 하나는 모집단의 분포형태에 상관없이 이러한 원리가 적용이 가능하다는 점입니다.
정규분포를 활용한 신뢰구간의 도축과 검정을 수행하는데 결정적인 역할을 합니다.
옆의 그림처럼 다양한 모양의 모집단분포에 대해 보여주고 있습니다.
표준평균 분포에서 최소한 30이상의 표본크기를 주면서 점차적으로 정규분포와 유사한 특성을 가지게 되는것을 볼수가 있습니다.
중심극한 정리의 정의에 의해서 표본평균분포의 산포 폭은 모집단 보다 좁은것이 보입니다.
오늘은 요기까지 정리를 하겠습니다..ㅎㅎ
분포
안녕하세요 정리를 하다보니까 위의 그림에서 분포에 대해서 설명을 재대로 못하기도 하고 이러한 분포에 대해서 좀더 추가적이 정리를 하기 위해서 적었습니다. ㅎ
분포란 일반적으로 흩어져 있는 정도와 경향성을 의미합니다.
이 퍼짐정도를 인해서 예로들어서 학생들의 최고점과 최저점에 대해서 알수 있게 됩니다.
통계학에서도 이와같이 분포를 말할때에도 퍼짐과 경향성을 의미하는 한가지 더 추가하면 분포의 모양도도 들수가 있슴니다 .
이러한 그림의 형태로 분포에는 여러가지 형태가 존재합니다 .
'공부 > 통계 정리' 카테고리의 다른 글
통계(단일 표본의 가설검정) (1) | 2017.03.13 |
---|---|
통계(추정과 신뢰구간) (0) | 2017.03.11 |
통계(연속확률분포) (0) | 2017.03.08 |
통계(이산확률분포) (0) | 2017.03.01 |
통계(확률) (0) | 2017.02.28 |