(한국어) AWS ML Associate (1) - AWS ML 엔지니어 어소시에이트(MLA-C01) 한눈에 보기
AWS ML 엔지니어 어소시에이트(MLA-C01) 한눈에 보기
이 과정에서는 데이터 수집→변환/특징공학→모델 학습/튜닝/평가→생성형 AI→MLOps→보안/거버넌스까지 실무 흐름을 따라가며, SageMaker 중심으로 AWS 서비스들을 연결해 이해합니다.
시험 포인트
- SageMaker 전반(Processing/Training/Inference/Deployment)
- Glue, EMR, Kinesis, S3, EFS, EBS 활용
- 데이터 변환·특징공학 기법 (결측치, 이상치, 불균형 데이터 처리)
- 기본 ML 알고리즘 (XGBoost, Linear Learner 등 SageMaker 내장 알고리즘)
- 성능 측정 지표 (Precision, Recall, F1-score, Accuracy 등)
- 하이퍼파라미터 튜닝 (SageMaker Automatic Model Tuning)
- Bedrock, Jumpstart, RAG, Guardrails 등 생성형 AI 관련 신기능
- MLOps (CI/CD, 파이프라인, 버전 관리, 모니터링, 재학습)
- 보안·컴플라이언스 (IAM, KMS, VPC, CloudTrail, Config 등)
1. 데이터 수집 & 저장
- 형식: 정형/비정형 데이터 (CSV, JSON, 이미지, 로그 등)
- 저장소:
- 데이터 웨어하우스: Redshift
- 데이터 레이크: S3
- 데이터 레이크하우스: Lake Formation
- 스트리밍: Amazon Kinesis
- 파일 스토리지: EFS, FSx
- 블록 스토리지: EBS
2. 데이터 변환 & 특징공학
- EMR: Hadoop, Spark 기반 대규모 데이터 처리
- 결측치/이상치 처리, 불균형 데이터 처리
- SageMaker Processing, Data Wrangler 활용
- AWS Glue: ETL 파이프라인 자동화
3. 모델 학습 & 튜닝 & 평가
- 내장 알고리즘: XGBoost, Linear Learner, K-means, PCA 등
- 딥러닝 기초: 뉴럴 네트워크, 옵티마이저, 학습률, 활성화 함수
- 성능 지표: Precision, Recall, F1-score, Accuracy
- 튜닝: SageMaker Automatic Model Tuning (Hyperparameter Optimization)
4. 생성형 AI
- Bedrock: 여러 파운데이션 모델 API 제공
- RAG (Retrieval Augmented Generation): 외부 데이터 결합, 벡터 DB 활용
- Jumpstart: 사전 학습된 모델 빠른 활용
- Guardrails: 유해 콘텐츠 차단, PII 보호
- LLM Agent: 사용자 정의 툴과 코드 연동
5. MLOps
- 버전 관리: 데이터, 코드, 모델
- 자동화: 데이터 수집, 전처리, 학습, 배포 파이프라인
- CI/CD: CodePipeline, CodeBuild, CodeDeploy
- 컨테이너화: EKS, ECR
- 모니터링: CloudWatch, Model Monitor
- 재학습: 지속적인 데이터 반영
6. 보안 & 거버넌스
- Shared Responsibility Model
- AWS: 클라우드 인프라 보안
- 고객: 데이터, 접근 제어, 암호화
- 보안 서비스: IAM, KMS, Secrets Manager, Macie, WAF, Shield
- 네트워크 보안: VPC, PrivateLink
- 거버넌스 & 비용 관리: CloudTrail, Config, Trusted Advisor, Budgets, Cost Explorer
- Well-Architected ML Lens: 모범 아키텍처 가이드라인
시험 준비 팁
- 기출 및 유사 시험: ML Specialty, Data Engineer Associate와 겹치는 부분 많음
- 실제 경험 없어도 **핸즈온 랩(SageMaker Notebooks)**을 활용해 체험 필수
- 핵심 서비스: SageMaker, Bedrock, Glue, EMR, Kinesis, S3
- ML 기본기 (알고리즘, 지표, 전처리 기법) 반드시 숙지
All articles on this blog are licensed under CC BY-NC-SA 4.0 unless otherwise stated.