3과목 · 데이터 분석·10장
인공신경망
퍼셉트론, 다층신경망(MLP), 활성화 함수, 역전파와 학습, 과적합 방지 기법과 딥러닝 개요를 정리합니다.
1. 인공신경망이란
인공신경망(Artificial Neural Network, ANN) 은 뇌의 뉴런 구조를 모방한 학습 모델.
- 입력 → 가중치 합 → 활성화 → 출력
- 여러 층 쌓아 복잡한 패턴 학습
2. 퍼셉트론(Perceptron)
단일 퍼셉트론
$$y = f(w_1 x_1 + w_2 x_2 + \cdots + b)$$
- $w$: 가중치
- $b$: 편향
- $f$: 활성화 함수
한계: XOR 같은 비선형 문제 못 풀음 → 다층으로 해결.
3. 다층 퍼셉트론(MLP)
입력층 → 은닉층(여러 개) → 출력층
- 은닉층에서 비선형 활성화
- 층이 깊을수록 표현력 ↑
4. 활성화 함수
| 함수 | 특징 | 용도 |
|---|---|---|
| Sigmoid | 0~1, 기울기 소실 | 이진 출력 |
| Tanh | -1~1 | 은닉층(구버전) |
| ReLU | max(0, x) | 은닉층 표준 |
| Leaky ReLU | 음수에도 작은 기울기 | ReLU 사망 방지 |
| Softmax | 클래스 확률 | 다중 분류 출력층 |
5. 손실 함수
| 문제 | 손실 |
|---|---|
| 회귀 | MSE, MAE |
| 이진 분류 | Binary Cross-Entropy |
| 다중 분류 | Categorical Cross-Entropy |
6. 학습 원리 — 역전파(Backpropagation)
6-1. 순전파(Forward)
- 입력 → 예측
6-2. 손실 계산
- 예측과 정답 차이
6-3. 역전파
- 손실을 가중치에 대한 기울기로 전파
- 연쇄법칙(chain rule) 기반
6-4. 가중치 갱신
$$w \leftarrow w - \eta \cdot \dfrac{\partial L}{\partial w}$$
- $\eta$: 학습률(learning rate)
7. 최적화 알고리즘
| 방법 | 특징 |
|---|---|
| SGD | 배치 단위 기울기 하강 |
| Momentum | 관성 추가 |
| Adam | 적응적 학습률, 가장 널리 사용 |
| RMSProp | 최근 기울기 제곱 평균 |
8. 과적합 방지 기법
- Dropout: 학습 중 뉴런 일부 무작위 비활성
- L2 정규화: 가중치 감쇠
- Early Stopping: 검증 손실 증가 시 중단
- Batch Normalization: 층별 정규화
- 데이터 증강: 이미지 회전·반전·노이즈
9. 딥러닝의 주요 구조
| 구조 | 용도 |
|---|---|
| CNN(Convolutional) | 이미지, 시공간 데이터 |
| RNN / LSTM / GRU | 시계열, 자연어 |
| Transformer | NLP·비전 전반 (BERT/GPT) |
| GAN | 생성 모델(이미지 생성) |
| 오토인코더 | 차원 축소·이상 탐지 |
10. 하이퍼파라미터
- 학습률(learning rate)
- 배치 크기(batch size)
- 은닉층 수·크기
- 드롭아웃 비율
- 에포크 수
11. 파이썬 예 (간단 MLP)
import tensorflow as tf
model = tf.keras.Sequential([
tf.keras.layers.Dense(128, activation='relu', input_shape=(20,)),
tf.keras.layers.Dropout(0.2),
tf.keras.layers.Dense(64, activation='relu'),
tf.keras.layers.Dense(1, activation='sigmoid'),
])
model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
model.fit(X_train, y_train, validation_split=0.2, epochs=20)
12. 출제 포인트
- 퍼셉트론의 한계와 MLP 등장
- ReLU·Sigmoid·Softmax 용도
- 역전파의 연쇄법칙 개념
- Dropout·정규화 등 과적합 방지
- CNN·RNN·Transformer 기본 용도
요약 체크리스트
- 단일 퍼셉트론 수식
- 활성화 함수 4종의 특징
- 역전파 4단계(순전파→손실→역전파→갱신)
- Dropout 작동 원리 설명