SageMaker – ML 거버넌스 및 확장 기능

SageMaker 거버넌스 도구

머신러닝 모델을 실제 서비스에 배포했다면, 거버넌스(Governance) 가 필수적입니다. SageMaker는 이를 위해 다양한 도구를 제공합니다.

1. SageMaker Model Cards

  • 모델의 필수 정보를 문서화하는 카드 형식
  • 예시:
    • 모델의 의도된 사용 목적
    • 모델 리스크 등급
    • 학습 데이터 및 훈련 과정 상세
  • 시험 포인트: “Model Cards = 모델 문서화”


2. SageMaker Model Dashboard

  • 모든 모델을 중앙에서 조회·검색·탐색할 수 있는 포털
  • 예시:
    • 어떤 모델이 현재 배포되어 추론(Inference)에 사용되는지 추적 가능
  • 품질 관리:
    • 데이터 품질, 모델 품질, 편향(Bias), 설명 가능성(Explainability) 위반 여부 확인
  • 시험 포인트: “중앙 대시보드, 품질 및 편향 모니터링”

------------------------------------------------------------------------

3. SageMaker Role Manager

  • 사용자 역할과 권한을 정의하는 기능
  • 예시:
    • 데이터 사이언티스트, MLOps 엔지니어, 데이터 엔지니어
  • 거버넌스와 보안 관리를 위한 핵심 기능

SageMaker Model Monitor

  • 운영 환경에서 모델 품질을 모니터링하는 기능
  • 연속적(Continuous) 또는 주기적(On-Schedule) 모니터링 가능
  • 편차(Drift) 발생 시 알림 제공 → 데이터 수정·재학습 필요
  • 예시:
    • 대출 승인 모델이 시간이 지나면서 잘못된 신용 점수 사용자에게 대출을 승인하는 경우
  • 시험 포인트: “Model Monitor = 운영 중 모델 품질 모니터링 & 드리프트 감지”


SageMaker Model Registry

  • 모델 중앙 저장소: 버전 관리, 메타데이터 관리, 승인 상태 관리
  • 주요 기능:
    • 모델 카탈로그화
    • 모델 승인(Approval) 프로세스 적용
    • 자동 배포 및 팀 공유
  • 시험 포인트: “Model Registry = 버전 관리 + 승인 + 자동화”

------------------------------------------------------------------------

SageMaker Pipelines

  • ML 워크플로우 자동화 도구 (CI/CD for ML)
  • 데이터 준비 → 모델 학습 → 하이퍼파라미터 튜닝 → 배포까지 자동화
  • 장점:
    • 빠른 반복(Iteration)
    • 수동 작업 제거 → 오류 감소
    • 재사용 가능한 워크플로우
  • 주요 Step 유형:
    • Processing: 데이터 처리/피처 엔지니어링
    • Training: 모델 학습
    • Tuning: 하이퍼파라미터 최적화
    • AutoML: 자동 학습
    • Model: 모델 생성·등록
    • ClarifyCheck: 데이터·모델 편향, 설명 가능성 확인
    • QualityCheck: 데이터·모델 품질 점검
  • 시험 포인트: “Pipelines = CI/CD for ML, Step 유형 구분”

------------------------------------------------------------------------

SageMaker JumpStart

  • 미리 학습된 모델 허브
  • 제공 모델:
    • Hugging Face, Meta, Stability AI, Databricks 등
  • 사용 사례:
    • 수요 예측, 신용 점수 예측, 사기 탐지, 이미지 분류
  • 특징:
    • 커스터마이징 가능
    • SageMaker에서 직접 배포
  • 시험 포인트: “JumpStart = 미리 학습된 모델 & 솔루션”


SageMaker Canvas

  • 노코드(No-Code) 인터페이스로 ML 모델 구축 가능
  • 기능:
    • Bedrock/JumpStart 모델 활용
    • AutoML(SageMaker Autopilot 기반)로 맞춤형 모델 생성
    • Data Wrangler와 연계된 데이터 준비 가능
  • 통합 모델:
    • Rekognition(이미지 분석)
    • Comprehend(텍스트 분석)
    • Textract(문서 분석)
  • 시험 포인트: “Canvas = 비개발자도 ML 모델 구축 가능”


MLFlow on SageMaker

  • 오픈소스 ML 라이프사이클 관리 툴
  • 기능:
    • 실험 추적, 결과 관리
    • SageMaker Studio 내에서 MLFlow Tracking Server 실행 가능
  • 시험 포인트: “MLFlow = 오픈소스 ML 실험 관리”


SageMaker 추가 기능

  1. Network Isolation Mode
    • 외부 네트워크(심지어 S3도) 차단 → 데이터 유출 방지
    • 시험 포인트: “Network Isolation = 보안 강화, 외부 접근 불가”
  2. DeepAR Forecasting Algorithm
    • 시계열 예측 알고리즘
    • 내부적으로 RNN(Recurrent Neural Network) 사용
    • 시험 포인트: “DeepAR = 시계열 예측”

시험 대비 요약

  • Model Cards → 모델 문서화
  • Model Dashboard → 중앙 포털, 품질·편향 추적
  • Model Monitor → 운영 중 품질 모니터링 & 드리프트 감지
  • Model Registry → 버전 관리 + 승인 + 자동 배포
  • Pipelines → CI/CD for ML
  • JumpStart → 미리 학습된 모델 & 솔루션
  • Canvas → 노코드 ML 모델링
  • Clarify → 모델 설명력 & 편향 탐지
  • Ground Truth → RLHF, 데이터 라벨링
  • DeepAR → 시계열 예측
  • Network Isolation → 보안 강화