← 일백제ADsP 개념서
← 개념서태블릿/PC 버전
3과목 · 데이터 분석·10

인공신경망

퍼셉트론, 다층신경망(MLP), 활성화 함수, 역전파와 학습, 과적합 방지 기법과 딥러닝 개요를 정리합니다.

1. 인공신경망이란

인공신경망(Artificial Neural Network, ANN) 은 뇌의 뉴런 구조를 모방한 학습 모델.

  • 입력 → 가중치 합 → 활성화 → 출력
  • 여러 층 쌓아 복잡한 패턴 학습

2. 퍼셉트론(Perceptron)

단일 퍼셉트론

$$y = f(w_1 x_1 + w_2 x_2 + \cdots + b)$$

  • $w$: 가중치
  • $b$: 편향
  • $f$: 활성화 함수

한계: XOR 같은 비선형 문제 못 풀음 → 다층으로 해결.

3. 다층 퍼셉트론(MLP)

입력층 → 은닉층(여러 개) → 출력층
  • 은닉층에서 비선형 활성화
  • 층이 깊을수록 표현력 ↑

4. 활성화 함수

함수 특징 용도
Sigmoid 0~1, 기울기 소실 이진 출력
Tanh -1~1 은닉층(구버전)
ReLU max(0, x) 은닉층 표준
Leaky ReLU 음수에도 작은 기울기 ReLU 사망 방지
Softmax 클래스 확률 다중 분류 출력층

5. 손실 함수

문제 손실
회귀 MSE, MAE
이진 분류 Binary Cross-Entropy
다중 분류 Categorical Cross-Entropy

6. 학습 원리 — 역전파(Backpropagation)

6-1. 순전파(Forward)

  • 입력 → 예측

6-2. 손실 계산

  • 예측과 정답 차이

6-3. 역전파

  • 손실을 가중치에 대한 기울기로 전파
  • 연쇄법칙(chain rule) 기반

6-4. 가중치 갱신

$$w \leftarrow w - \eta \cdot \dfrac{\partial L}{\partial w}$$

  • $\eta$: 학습률(learning rate)

7. 최적화 알고리즘

방법 특징
SGD 배치 단위 기울기 하강
Momentum 관성 추가
Adam 적응적 학습률, 가장 널리 사용
RMSProp 최근 기울기 제곱 평균

8. 과적합 방지 기법

  • Dropout: 학습 중 뉴런 일부 무작위 비활성
  • L2 정규화: 가중치 감쇠
  • Early Stopping: 검증 손실 증가 시 중단
  • Batch Normalization: 층별 정규화
  • 데이터 증강: 이미지 회전·반전·노이즈

9. 딥러닝의 주요 구조

구조 용도
CNN(Convolutional) 이미지, 시공간 데이터
RNN / LSTM / GRU 시계열, 자연어
Transformer NLP·비전 전반 (BERT/GPT)
GAN 생성 모델(이미지 생성)
오토인코더 차원 축소·이상 탐지

10. 하이퍼파라미터

  • 학습률(learning rate)
  • 배치 크기(batch size)
  • 은닉층 수·크기
  • 드롭아웃 비율
  • 에포크 수

11. 파이썬 예 (간단 MLP)

import tensorflow as tf
model = tf.keras.Sequential([
    tf.keras.layers.Dense(128, activation='relu', input_shape=(20,)),
    tf.keras.layers.Dropout(0.2),
    tf.keras.layers.Dense(64, activation='relu'),
    tf.keras.layers.Dense(1, activation='sigmoid'),
])
model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
model.fit(X_train, y_train, validation_split=0.2, epochs=20)

12. 출제 포인트

  • 퍼셉트론의 한계와 MLP 등장
  • ReLU·Sigmoid·Softmax 용도
  • 역전파의 연쇄법칙 개념
  • Dropout·정규화 등 과적합 방지
  • CNN·RNN·Transformer 기본 용도

요약 체크리스트

  • 단일 퍼셉트론 수식
  • 활성화 함수 4종의 특징
  • 역전파 4단계(순전파→손실→역전파→갱신)
  • Dropout 작동 원리 설명