← 일백제ADsP 개념서
← 개념서모바일 버전
3과목 · 데이터 분석·3

가설 검정

귀무가설·대립가설, 1·2종 오류, 유의수준과 p-value, 양측·단측 검정과 대표 검정 기법(t·카이제곱·ANOVA)을 정리합니다.

1. 가설 검정의 개요

가설 검정(Hypothesis Testing) 은 표본 데이터를 바탕으로 모집단의 가설을 검증하는 통계적 절차입니다.

기본 흐름

  1. 가설 설정(귀무·대립)
  2. 유의수준 α 결정 (보통 0.05)
  3. 검정통계량 계산
  4. p-value 또는 임계값 비교
  5. 결론 — 귀무가설 기각 or 채택

2. 가설의 종류

구분 의미
귀무가설 H₀ 차이 없음, 효과 없음 (기본 가정) 새 약과 기존 약 효과 같다
대립가설 H₁ 주장하려는 내용 새 약이 더 효과적이다

검정은 "귀무가설을 기각할 수 있는가"를 따지는 것.

3. 1종 오류 vs 2종 오류

실제 \ 판정 H₀ 채택 H₀ 기각
H₀ 참 올바름 1종 오류(α)
H₀ 거짓 2종 오류(β) 올바름(1-β, 검정력)
  • 1종 오류: "효과 없는데 있다고 판정" — 위험성 크게 다룸
  • 2종 오류: "효과 있는데 없다고 판정"
  • 검정력(Power): $1 - \beta$

4. 유의수준과 p-value

유의수준 α

  • 1종 오류 허용 수준
  • 보통 0.05, 0.01

p-value

  • 귀무가설이 참일 때 관측된 검정통계량보다 극단적인 값이 나올 확률
  • p < α이면 귀무가설 기각
p-value 의미
≤ 0.01 매우 강한 증거
≤ 0.05 유의함
≤ 0.10 경계 수준
> 0.10 유의하지 않음

5. 양측검정 vs 단측검정

구분 H₁
양측 $\mu \neq \mu_0$ 차이가 있다
우측 단측 $\mu > \mu_0$ 더 크다
좌측 단측 $\mu < \mu_0$ 더 작다

단측이 검정력은 높지만, 방향이 명확할 때만 사용.

6. 대표 검정 기법

6-1. t 검정(t-test)

  • 모집단 분산 모를 때 평균 검정
  • 독립표본 t: 두 집단 평균 비교
  • 쌍체 t: 같은 대상 사전·사후 비교

6-2. Z 검정

  • 모분산을 알거나 표본이 매우 큰 경우

6-3. 카이제곱 검정(χ²)

  • 범주형 데이터의 독립성·적합도
  • 예: 성별 × 구매 여부의 관련성

6-4. 분산분석(ANOVA)

  • 3집단 이상 평균 비교
  • 일원분산분석, 이원분산분석

6-5. F 검정

  • 두 집단 분산 동일성 검정
  • ANOVA의 기본 도구

7. 검정 절차 예시 — 두 집단 평균 비교

H₀: 평균차 = 0
H₁: 평균차 ≠ 0

유의수준 α = 0.05
검정통계량 t = (x̄₁ - x̄₂) / SE
자유도 df 계산
p-value 산출

p < 0.05 → H₀ 기각 → "평균에 유의한 차이 있다"
p ≥ 0.05 → H₀ 채택 → "유의한 차이 없다"

8. 효과 크기와 신뢰구간

p-value만으로 부족할 수 있음.

  • 효과 크기(Effect Size): 차이의 크기 (예: Cohen's d)
  • 신뢰구간(CI): 추정치의 구간 표현, 95% CI가 관용

"통계적으로 유의" ≠ "실무적으로 의미 있음"

9. 다중 검정 문제

여러 검정을 반복하면 1종 오류 누적.

보정 방법

  • Bonferroni: $\alpha / n$
  • Holm-Bonferroni, FDR(BH)

10. 출제 포인트

  • 1종·2종 오류 구분
  • p-value 해석
  • t 검정·카이제곱·ANOVA 용도 매칭
  • 양측·단측 선택 기준
  • 효과 크기 vs 통계적 유의성

요약 체크리스트

  • 귀무·대립가설을 구분
  • 1·2종 오류를 예시로 설명
  • t 검정과 ANOVA 차이를 말함
  • p-value와 유의수준 관계 설명