← 일백제ADsP 개념서
← 개념서모바일 버전
3과목 · 데이터 분석·2

확률

확률 기본 규칙, 조건부 확률과 베이즈 정리, 독립·배반사건, 확률변수와 기댓값의 기초를 정리합니다.

1. 확률의 개념

확률(Probability) 은 사건이 일어날 가능성을 0~1 사이 수치로 표현한 것입니다.

  • 0: 절대 일어나지 않음
  • 1: 반드시 일어남
  • 0.5: 절반의 가능성

수학적 확률

$$P(A) = \dfrac{A\text{가 일어나는 경우의 수}}{\text{전체 경우의 수}}$$

통계적 확률

$$P(A) \approx \dfrac{A\text{가 일어난 횟수}}{\text{총 시행 횟수}},(n \to \infty)$$

2. 기본 법칙

법칙 수식
비음성 $0 \le P(A) \le 1$
전체 $P(\Omega) = 1$
덧셈(배반) $P(A \cup B) = P(A) + P(B)$
덧셈(일반) $P(A \cup B) = P(A)+P(B)-P(A\cap B)$
여사건 $P(A^c) = 1 - P(A)$

3. 독립과 배반

구분 정의
배반(Mutually Exclusive) 동시에 일어날 수 없음, $P(A\cap B)=0$
독립(Independent) 서로 영향 없음, $P(A\cap B) = P(A)P(B)$

배반은 "둘이 겹치지 않음", 독립은 "서로 영향 없음" — 혼동 주의.

4. 조건부 확률

B가 일어난 상황에서 A가 일어날 확률: $$P(A|B) = \dfrac{P(A \cap B)}{P(B)}$$

  • 전체 1000명 중 흡연자 300명
  • 흡연자 중 암 환자 60명
  • $P(\text{암}|\text{흡연}) = \tfrac{60}{300} = 0.2$

5. 베이즈 정리(Bayes' Theorem)

$$P(A|B) = \dfrac{P(B|A) \cdot P(A)}{P(B)}$$

의미
$P(A)$ 사전 확률(Prior)
$P(A B)$
$P(B A)$
$P(B)$ 증거(Evidence)

예시 — 의료 검사

  • 병 보유 사전 확률 1%
  • 병 있으면 양성 나올 확률 99%
  • 병 없어도 양성 나올 확률 5%
  • 양성 나왔을 때 실제 병 있을 확률은?

$$P(D|+) = \dfrac{0.99 \times 0.01}{0.99 \times 0.01 + 0.05 \times 0.99} \approx 0.167$$

→ 양성이어도 실제 병 있을 확률은 16.7%

이것이 베이즈 추론의 핵심 — 사전 확률이 낮으면 사후 확률도 낮다.

6. 확률 변수

확률 변수(Random Variable) 는 사건의 결과에 수치를 대응시키는 함수.

종류 설명
이산 셀 수 있는 값 주사위 눈
연속 구간 내 임의 실수 키, 시간

7. 기댓값과 분산

7-1. 기댓값 (Expected Value)

이산: $E[X] = \sum x_i \cdot p_i$ 연속: $E[X] = \int x f(x) dx$

7-2. 분산

$Var(X) = E[(X - \mu)^2] = E[X^2] - \mu^2$

7-3. 표준편차

$\sigma = \sqrt{Var(X)}$

8. 대표 확률분포 수식

이항분포 $B(n, p)$

$$P(X = k) = \binom{n}{k} p^k (1-p)^{n-k}$$

  • 평균: $np$
  • 분산: $np(1-p)$

포아송분포 $Po(\lambda)$

$$P(X = k) = \dfrac{\lambda^k e^{-\lambda}}{k!}$$

  • 평균 = 분산 = $\lambda$

정규분포 $N(\mu, \sigma^2)$

$$f(x) = \dfrac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}}$$

9. 큰 수의 법칙

시행 횟수 $n \to \infty$일 때 표본 평균이 모평균으로 수렴.

→ 시행이 많을수록 통계적 확률이 수학적 확률에 수렴.

10. 출제 포인트

  • 배반·독립 구분
  • 조건부 확률 공식 적용
  • 베이즈 정리 실전 계산
  • 기댓값·분산 기본 성질
  • 이항·포아송·정규 분포 특징

요약 체크리스트

  • 조건부 확률 정의를 쓴다
  • 베이즈 정리로 사후 확률을 계산
  • 독립과 배반을 구분
  • 이항·정규분포 평균·분산 공식