ADsP 개념서
ADsP 1과목(데이터 이해) · 2과목(분석 기획) · 3과목(데이터 분석) 30장. 세로 스크롤과 큰 글씨로 정리한 모바일 읽기 최적 버전입니다.
1과목 · 데이터 이해
7장데이터의 정의와 종류(정성·정량, 정형·반정형·비정형), DIKW 계층, 데이터베이스와 DBMS, 데이터 웨어하우스/마트의 차이를 정리합니다.
데이터가 기업과 사회에 만들어내는 경제·사회적 가치, 가치 산정의 어려움, 빅데이터 시대의 가치 사슬을 정리합니다.
빅데이터의 3V와 확장(5V, 7V), 기존 데이터와의 차이, 등장 배경, 기술 스택과 시장 변화를 정리합니다.
빅데이터가 만들어내는 4대 가치, 활용 분야, 기업·정부·개인 측면의 효용, 성공 조건을 정리합니다.
데이터 사이언스의 정의, 구성 요소, 데이터 과학자 역할과 역량, 분석 유형과 접근법을 정리합니다.
데이터 거버넌스의 정의와 구성 요소, 조직·프로세스·기술 축, 데이터 품질/마스터데이터/메타데이터 관리와 개인정보 법제를 정리합니다.
산업별 빅데이터·AI 활용 대표 사례, 국내외 기업 사례, 공공 분야 적용 예시를 정리합니다.
2과목 · 데이터 분석 기획
6장분석 기획의 정의, 5단계 사고, 분석 수준 진단, 분석 로드맵과 분석 주제 유형을 정리합니다.
분석 프로젝트의 5대 관리 요소, 일정·범위·품질·리스크·이해관계자 관리, 애자일과 분석 프로젝트 특성을 정리합니다.
KDD, CRISP-DM, SEMMA 방법론의 단계와 특징 비교, 빅데이터 분석 절차(문제정의→결과 활용)까지 정리합니다.
KPI의 정의와 SMART 원칙, KGI와의 차이, BSC(균형성과표), OKR, 분석 과제와 KPI 연결 방법을 정리합니다.
분석 과제 정의, 도출 접근법(하향식/상향식), 과제 평가 기준, 실행 조건과 난이도 판단법을 정리합니다.
분석 마스터 플랜 수립 절차, 이행 계획의 4가지 관점, 이행 이슈와 조직 구조, 전사 분석 확산을 정리합니다.
3과목 · 데이터 분석
17장기술통계·추론통계 개념, 중심·산포 지표, 표본과 모집단, 분포와 기댓값·분산의 의미를 정리합니다.
확률 기본 규칙, 조건부 확률과 베이즈 정리, 독립·배반사건, 확률변수와 기댓값의 기초를 정리합니다.
귀무가설·대립가설, 1·2종 오류, 유의수준과 p-value, 양측·단측 검정과 대표 검정 기법(t·카이제곱·ANOVA)을 정리합니다.
모집단·표본, 표집 방법(확률·비확률), 표본 크기 결정, 편향과 오차, 추정량의 특성을 정리합니다.
단순·다중 회귀, 최소제곱법, 회귀 가정, 결정계수와 조정 R², 다중공선성, 로지스틱 회귀까지 정리합니다.
분류의 정의, 대표 알고리즘(로지스틱·의사결정나무·KNN·SVM·나이브베이즈), 성능 평가 지표(Confusion Matrix·ROC·AUC)를 정리합니다.
비지도학습의 대표 기법 군집 분석의 원리, 계층적·분할적 방법, K-means와 DBSCAN, 군집 평가 지표를 정리합니다.
의사결정나무의 원리, 분리 기준(지니·엔트로피·정보이득), 가지치기와 과적합 방지, CART/C4.5/CHAID 비교를 정리합니다.
앙상블 학습의 원리, 배깅·부스팅·스태킹, 랜덤 포레스트, AdaBoost·GBM·XGBoost의 차이를 정리합니다.
퍼셉트론, 다층신경망(MLP), 활성화 함수, 역전파와 학습, 과적합 방지 기법과 딥러닝 개요를 정리합니다.
머신러닝의 정의, 학습 유형(지도·비지도·준지도·강화), 학습 파이프라인, 일반화와 편향-분산 트레이드오프를 정리합니다.
데이터 마이닝의 정의와 목적, 분류·군집·연관·예측 4대 기법, 프로세스(SEMMA/CRISP-DM), 성과 평가 지표를 정리합니다.
연관 규칙의 개념과 지지도·신뢰도·향상도, Apriori와 FP-Growth 알고리즘, 장바구니 분석 적용 예를 정리합니다.
시계열 정의와 구성 요소, 정상성, 자기상관, ARIMA 모델과 지수평활법, 시계열 예측 평가를 정리합니다.
텍스트 마이닝 정의, 전처리(토큰화·불용어·표제어·형태소), TF-IDF와 임베딩, 감성 분석·토픽 모델링·NLP 적용을 정리합니다.
차원의 저주, PCA·LDA·t-SNE·UMAP·오토인코더의 원리와 활용, 특성 선택과 차원 축소의 차이를 정리합니다.
R의 기본 문법, 자료형과 자료구조, 함수·제어문, 패키지 생태계(tidyverse·ggplot2), 데이터 분석 실무 흐름을 정리합니다.