(한국어) AWS Certified AI Practitioner (38) - SageMaker ML 거버넌스 및 확장 기능
SageMaker – ML 거버넌스 및 확장 기능
SageMaker 거버넌스 도구
머신러닝 모델을 실제 서비스에 배포했다면, 거버넌스(Governance) 가 필수적입니다. SageMaker는 이를 위해 다양한 도구를 제공합니다.
1. SageMaker Model Cards
- 모델의 필수 정보를 문서화하는 카드 형식
- 예시:
- 모델의 의도된 사용 목적
- 모델 리스크 등급
- 학습 데이터 및 훈련 과정 상세
- 시험 포인트: “Model Cards = 모델 문서화”
2. SageMaker Model Dashboard
- 모든 모델을 중앙에서 조회·검색·탐색할 수 있는 포털
- 예시:
- 어떤 모델이 현재 배포되어 추론(Inference)에 사용되는지 추적 가능
- 품질 관리:
- 데이터 품질, 모델 품질, 편향(Bias), 설명 가능성(Explainability) 위반 여부 확인
- 시험 포인트: “중앙 대시보드, 품질 및 편향 모니터링”
3. SageMaker Role Manager
- 사용자 역할과 권한을 정의하는 기능
- 예시:
- 데이터 사이언티스트, MLOps 엔지니어, 데이터 엔지니어
- 거버넌스와 보안 관리를 위한 핵심 기능
SageMaker Model Monitor
- 운영 환경에서 모델 품질을 모니터링하는 기능
- 연속적(Continuous) 또는 주기적(On-Schedule) 모니터링 가능
- 편차(Drift) 발생 시 알림 제공 → 데이터 수정·재학습 필요
- 예시:
- 대출 승인 모델이 시간이 지나면서 잘못된 신용 점수 사용자에게 대출을 승인하는 경우
- 시험 포인트: “Model Monitor = 운영 중 모델 품질 모니터링 & 드리프트 감지”
SageMaker Model Registry
- 모델 중앙 저장소: 버전 관리, 메타데이터 관리, 승인 상태 관리
- 주요 기능:
- 모델 카탈로그화
- 모델 승인(Approval) 프로세스 적용
- 자동 배포 및 팀 공유
- 시험 포인트: “Model Registry = 버전 관리 + 승인 + 자동화”
SageMaker Pipelines
- ML 워크플로우 자동화 도구 (CI/CD for ML)
- 데이터 준비 → 모델 학습 → 하이퍼파라미터 튜닝 → 배포까지 자동화
- 장점:
- 빠른 반복(Iteration)
- 수동 작업 제거 → 오류 감소
- 재사용 가능한 워크플로우
- 주요 Step 유형:
- Processing: 데이터 처리/피처 엔지니어링
- Training: 모델 학습
- Tuning: 하이퍼파라미터 최적화
- AutoML: 자동 학습
- Model: 모델 생성·등록
- ClarifyCheck: 데이터·모델 편향, 설명 가능성 확인
- QualityCheck: 데이터·모델 품질 점검
- 시험 포인트: “Pipelines = CI/CD for ML, Step 유형 구분”
SageMaker JumpStart
- 미리 학습된 모델 허브
- 제공 모델:
- Hugging Face, Meta, Stability AI, Databricks 등
- 사용 사례:
- 수요 예측, 신용 점수 예측, 사기 탐지, 이미지 분류
- 특징:
- 커스터마이징 가능
- SageMaker에서 직접 배포
- 시험 포인트: “JumpStart = 미리 학습된 모델 & 솔루션”
SageMaker Canvas
- 노코드(No-Code) 인터페이스로 ML 모델 구축 가능
- 기능:
- Bedrock/JumpStart 모델 활용
- AutoML(SageMaker Autopilot 기반)로 맞춤형 모델 생성
- Data Wrangler와 연계된 데이터 준비 가능
- 통합 모델:
- Rekognition(이미지 분석)
- Comprehend(텍스트 분석)
- Textract(문서 분석)
- 시험 포인트: “Canvas = 비개발자도 ML 모델 구축 가능”
MLFlow on SageMaker
- 오픈소스 ML 라이프사이클 관리 툴
- 기능:
- 실험 추적, 결과 관리
- SageMaker Studio 내에서 MLFlow Tracking Server 실행 가능
- 시험 포인트: “MLFlow = 오픈소스 ML 실험 관리”
SageMaker 추가 기능
- Network Isolation Mode
- 외부 네트워크(심지어 S3도) 차단 → 데이터 유출 방지
- 시험 포인트: “Network Isolation = 보안 강화, 외부 접근 불가”
- DeepAR Forecasting Algorithm
- 시계열 예측 알고리즘
- 내부적으로 RNN(Recurrent Neural Network) 사용
- 시험 포인트: “DeepAR = 시계열 예측”
시험 대비 요약
- Model Cards → 모델 문서화
- Model Dashboard → 중앙 포털, 품질·편향 추적
- Model Monitor → 운영 중 품질 모니터링 & 드리프트 감지
- Model Registry → 버전 관리 + 승인 + 자동 배포
- Pipelines → CI/CD for ML
- JumpStart → 미리 학습된 모델 & 솔루션
- Canvas → 노코드 ML 모델링
- Clarify → 모델 설명력 & 편향 탐지
- Ground Truth → RLHF, 데이터 라벨링
- DeepAR → 시계열 예측
- Network Isolation → 보안 강화
All articles on this blog are licensed under CC BY-NC-SA 4.0 unless otherwise stated.