확률분포: 어떤 실험의 가능한 모든 결과와 각 실험결과별 확률의 나열 확률 변수 : 어떤 실험의 결과의 숫자로 나타낸 것으로 다른 값을 가진다.
이때 모집단의 확률 분포를 알아야 하는데 확률이 지정되는 방식에 따라 이산형과 연속형으로 구분된다.
이산확률변수 : 오직 특정값만 다룬다. 특정값이란 어떤 정해진 값만 가질수 있다는 의미이다.
예)다섯 명의 아이들 중에서 크리스마스선물로 한 개 이상의 장난감을 받은 아이의 수는 0, 1, 2, 3, 4, 5 중의 하나
- 이산형 확률 변수의 특징
- 확률값의 합은 1이다.
- 특정 결과가 나올 확률값은 0.00과 1.00 사이다.
- 결과들은 상호 배타적이다.
연속확률변수 : 특정 범위내의 모든 무한한 숫자값을 대상으로 한다.
예) 현재 A동의 온도를 확률변수로 간주하는 경우 그 확률변수는 23.8°, 18.2°, 13.5°와 같이 다양한 값을 가짐
이산확률분포의 평균, 분산, 표준편차
- 확률 분포의 평균 :
확률분포의 중심위치를 나타내는 전형적인 값이다. 기대값이라고 부른다. p(x) : x값의 확률이다.
∴이산확률분포 평균은 각 값과 해당 발생 확률값을 곱한 다음 모두 합산한 결과이다.
- 확률 분포의 분산 :
변수들의 퍼짐 정도를 알수가 있다.
∴각각의 확률변수 값에서 평균값을 뺀 다음 차이를 제곱하고 제곱값에 확률값을 곱한다. 그 후 곱한 모든값을 더하면된다.
- 확률 분포의 표준편차
밑의 예시처럼 확률과 평균은 식에 대입하여서 구하면된다.
판매차량 대수 x |
확률 P(x) |
평균 | 분산 |
||
0 |
0.10 |
0.00 |
0-2.1 |
4.41 |
0.441 |
1 |
0.20 |
0.20 |
1-2.1 |
1.21 |
0.242 |
2 |
0.30 |
0.60 |
2-2.1 |
0.01 |
0.003 |
3 |
0.30 |
0.90 |
3-2.1 |
0.81 |
0.243 |
4 |
0.10 |
0.40 |
4-2.1 |
3.61 |
0.361 |
총계 |
1.00 |
μ=2.10 |
|
|
σ² = 1.290 |
이항확률분포(Binomial Probability Distribution)
정의 : 한실험 결과에서 두가지 결과만 갖는 경우를 설명하기 위한 방법, 상호배타적이다.
- 특징
- 각 시행의 결과는 상호배타적인 성공과 실패 둘 중 하난로 구분된다.
- 이항분포는 특정 시행 횟수 중 성공한 횟수를 나타낸다.
- 각 시행별 성공과 실패가 나타날 확률은 변하지 않는다.
- 시행은 서로 독립적이다.
- 이항확률 게산법 : 시행횟수와 각 시행별 성공/실패 확률을 사용한다. 공식은 다음과 같이
표현이 됬다.
C는 조합이고, n은 1행 횟수, x는 성공횟수로 명명된 확률 변수, π는 각시행별 성공확률이 된다.
- 이항분포의 평균 :
- 이항분포의 분산 :
- 초기하분포 :
- 각 시행의 결과는 오직 두개의 결과를 가진다.
- 각 시행별 성공 확률은 항상 같지는 않다.
- 초기하 분포는 특정 시행횟수에서 성공한 횟수를 나타낸다.
- 이것은 유한 모집단에 대하여 비복원으로 추출할 때 사용된다.
- 포아송 분포
주어진 특정 간격 동안 발생하는 사건의 횟수를 설명하는 것
- 특정 구간동안 발생하는 사건의 횟수를 설명한다.
- 성공의 확률은 구간의 길이에 비례한다.
- 중복되지 않는 구간은 서로 독립적이다.
- n이 크고 π가 작을 경우 이항확률분포의 추정치로 사용할 수 있다.
'공부 > 통계 정리' 카테고리의 다른 글
통계(추정과 신뢰구간) (0) | 2017.03.11 |
---|---|
통계(표본추출, 중심극한정리) (1) | 2017.03.09 |
통계(연속확률분포) (0) | 2017.03.08 |
통계(확률) (0) | 2017.02.28 |
통계 (0) | 2017.02.04 |