확률
확률 기본 규칙, 조건부 확률과 베이즈 정리, 독립·배반사건, 확률변수와 기댓값의 기초를 정리합니다.
1. 확률의 개념
확률(Probability) 은 사건이 일어날 가능성을 0~1 사이 수치로 표현한 것입니다.
- 0: 절대 일어나지 않음
- 1: 반드시 일어남
- 0.5: 절반의 가능성
수학적 확률
$$P(A) = \dfrac{A\text{가 일어나는 경우의 수}}{\text{전체 경우의 수}}$$
통계적 확률
$$P(A) \approx \dfrac{A\text{가 일어난 횟수}}{\text{총 시행 횟수}},(n \to \infty)$$
2. 기본 법칙
| 법칙 | 수식 |
|---|---|
| 비음성 | $0 \le P(A) \le 1$ |
| 전체 | $P(\Omega) = 1$ |
| 덧셈(배반) | $P(A \cup B) = P(A) + P(B)$ |
| 덧셈(일반) | $P(A \cup B) = P(A)+P(B)-P(A\cap B)$ |
| 여사건 | $P(A^c) = 1 - P(A)$ |
3. 독립과 배반
| 구분 | 정의 |
|---|---|
| 배반(Mutually Exclusive) | 동시에 일어날 수 없음, $P(A\cap B)=0$ |
| 독립(Independent) | 서로 영향 없음, $P(A\cap B) = P(A)P(B)$ |
배반은 "둘이 겹치지 않음", 독립은 "서로 영향 없음" — 혼동 주의.
4. 조건부 확률
B가 일어난 상황에서 A가 일어날 확률: $$P(A|B) = \dfrac{P(A \cap B)}{P(B)}$$
예
- 전체 1000명 중 흡연자 300명
- 흡연자 중 암 환자 60명
- $P(\text{암}|\text{흡연}) = \tfrac{60}{300} = 0.2$
5. 베이즈 정리(Bayes' Theorem)
$$P(A|B) = \dfrac{P(B|A) \cdot P(A)}{P(B)}$$
| 항 | 의미 |
|---|---|
| $P(A)$ | 사전 확률(Prior) |
| $P(A | B)$ |
| $P(B | A)$ |
| $P(B)$ | 증거(Evidence) |
예시 — 의료 검사
- 병 보유 사전 확률 1%
- 병 있으면 양성 나올 확률 99%
- 병 없어도 양성 나올 확률 5%
- 양성 나왔을 때 실제 병 있을 확률은?
$$P(D|+) = \dfrac{0.99 \times 0.01}{0.99 \times 0.01 + 0.05 \times 0.99} \approx 0.167$$
→ 양성이어도 실제 병 있을 확률은 16.7%
이것이 베이즈 추론의 핵심 — 사전 확률이 낮으면 사후 확률도 낮다.
6. 확률 변수
확률 변수(Random Variable) 는 사건의 결과에 수치를 대응시키는 함수.
| 종류 | 설명 | 예 |
|---|---|---|
| 이산 | 셀 수 있는 값 | 주사위 눈 |
| 연속 | 구간 내 임의 실수 | 키, 시간 |
7. 기댓값과 분산
7-1. 기댓값 (Expected Value)
이산: $E[X] = \sum x_i \cdot p_i$ 연속: $E[X] = \int x f(x) dx$
7-2. 분산
$Var(X) = E[(X - \mu)^2] = E[X^2] - \mu^2$
7-3. 표준편차
$\sigma = \sqrt{Var(X)}$
8. 대표 확률분포 수식
이항분포 $B(n, p)$
$$P(X = k) = \binom{n}{k} p^k (1-p)^{n-k}$$
- 평균: $np$
- 분산: $np(1-p)$
포아송분포 $Po(\lambda)$
$$P(X = k) = \dfrac{\lambda^k e^{-\lambda}}{k!}$$
- 평균 = 분산 = $\lambda$
정규분포 $N(\mu, \sigma^2)$
$$f(x) = \dfrac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}}$$
9. 큰 수의 법칙
시행 횟수 $n \to \infty$일 때 표본 평균이 모평균으로 수렴.
→ 시행이 많을수록 통계적 확률이 수학적 확률에 수렴.
10. 출제 포인트
- 배반·독립 구분
- 조건부 확률 공식 적용
- 베이즈 정리 실전 계산
- 기댓값·분산 기본 성질
- 이항·포아송·정규 분포 특징
요약 체크리스트
- 조건부 확률 정의를 쓴다
- 베이즈 정리로 사후 확률을 계산
- 독립과 배반을 구분
- 이항·정규분포 평균·분산 공식