AWS ML 엔지니어 어소시에이트(MLA-C01) 한눈에 보기

이 과정에서는 데이터 수집→변환/특징공학→모델 학습/튜닝/평가→생성형 AI→MLOps→보안/거버넌스까지 실무 흐름을 따라가며, SageMaker 중심으로 AWS 서비스들을 연결해 이해합니다.

시험 포인트

  • SageMaker 전반(Processing/Training/Inference/Deployment)
  • Glue, EMR, Kinesis, S3, EFS, EBS 활용
  • 데이터 변환·특징공학 기법 (결측치, 이상치, 불균형 데이터 처리)
  • 기본 ML 알고리즘 (XGBoost, Linear Learner 등 SageMaker 내장 알고리즘)
  • 성능 측정 지표 (Precision, Recall, F1-score, Accuracy 등)
  • 하이퍼파라미터 튜닝 (SageMaker Automatic Model Tuning)
  • Bedrock, Jumpstart, RAG, Guardrails 등 생성형 AI 관련 신기능
  • MLOps (CI/CD, 파이프라인, 버전 관리, 모니터링, 재학습)
  • 보안·컴플라이언스 (IAM, KMS, VPC, CloudTrail, Config 등)

1. 데이터 수집 & 저장

  • 형식: 정형/비정형 데이터 (CSV, JSON, 이미지, 로그 등)
  • 저장소:
    • 데이터 웨어하우스: Redshift
    • 데이터 레이크: S3
    • 데이터 레이크하우스: Lake Formation
  • 스트리밍: Amazon Kinesis
  • 파일 스토리지: EFS, FSx
  • 블록 스토리지: EBS

2. 데이터 변환 & 특징공학

  • EMR: Hadoop, Spark 기반 대규모 데이터 처리
  • 결측치/이상치 처리, 불균형 데이터 처리
  • SageMaker Processing, Data Wrangler 활용
  • AWS Glue: ETL 파이프라인 자동화

3. 모델 학습 & 튜닝 & 평가

  • 내장 알고리즘: XGBoost, Linear Learner, K-means, PCA 등
  • 딥러닝 기초: 뉴럴 네트워크, 옵티마이저, 학습률, 활성화 함수
  • 성능 지표: Precision, Recall, F1-score, Accuracy
  • 튜닝: SageMaker Automatic Model Tuning (Hyperparameter Optimization)

4. 생성형 AI

  • Bedrock: 여러 파운데이션 모델 API 제공
  • RAG (Retrieval Augmented Generation): 외부 데이터 결합, 벡터 DB 활용
  • Jumpstart: 사전 학습된 모델 빠른 활용
  • Guardrails: 유해 콘텐츠 차단, PII 보호
  • LLM Agent: 사용자 정의 툴과 코드 연동

5. MLOps

  • 버전 관리: 데이터, 코드, 모델
  • 자동화: 데이터 수집, 전처리, 학습, 배포 파이프라인
  • CI/CD: CodePipeline, CodeBuild, CodeDeploy
  • 컨테이너화: EKS, ECR
  • 모니터링: CloudWatch, Model Monitor
  • 재학습: 지속적인 데이터 반영

6. 보안 & 거버넌스

  • Shared Responsibility Model
    • AWS: 클라우드 인프라 보안
    • 고객: 데이터, 접근 제어, 암호화
  • 보안 서비스: IAM, KMS, Secrets Manager, Macie, WAF, Shield
  • 네트워크 보안: VPC, PrivateLink
  • 거버넌스 & 비용 관리: CloudTrail, Config, Trusted Advisor, Budgets, Cost Explorer
  • Well-Architected ML Lens: 모범 아키텍처 가이드라인

시험 준비 팁

  • 기출 및 유사 시험: ML Specialty, Data Engineer Associate와 겹치는 부분 많음
  • 실제 경험 없어도 **핸즈온 랩(SageMaker Notebooks)**을 활용해 체험 필수
  • 핵심 서비스: SageMaker, Bedrock, Glue, EMR, Kinesis, S3
  • ML 기본기 (알고리즘, 지표, 전처리 기법) 반드시 숙지