(한국어) AWS Certified AI Practitioner (29) - 머신러닝 프로젝트 단계

Created2025-08-25|Updated2025-08-25|CERTIFICATIONAWS_AI_PRACTITIONER_KR

|Post Views:

머신러닝 프로젝트 단계 (Phases of Machine Learning Project)

1. 비즈니스 목표 정의

목표: 어떤 문제를 해결할지 명확히 정의
이해관계자(Stakeholders): 프로젝트의 가치, 예산, 성공 기준을 설정
KPI(핵심 성과 지표): 반드시 정의해야 함 → 모델이 실제로 비즈니스 목표에 기여하는지 판단하는 기준

👉 시험 포인트:
머신러닝 프로젝트의 첫 단계는 항상 비즈니스 문제를 정의하는 것. KPI 설정은 AWS 시험에서 자주 강조됨.

2. 문제 정의와 ML 문제로 전환 (ML Problem Framing)

비즈니스 문제 → ML 문제로 변환
머신러닝이 정말 필요한지, 다른 해결책(예: 단순 규칙 기반)이 더 나은지 판단
데이터 과학자, 데이터 엔지니어, ML 아키텍트, 도메인 전문가가 함께 협업

3. 데이터 처리 (Data Processing)

데이터 수집 및 통합: 중앙에서 접근 가능하도록 정리
전처리 및 시각화: 데이터 품질 확인, 이상치 제거, 결측값 처리
피처 엔지니어링: 새로운 변수를 생성, 변환, 추출하여 모델이 학습할 수 있도록 가공

👉 시험 포인트:
AWS 서비스 연결

AWS Glue: 데이터 수집/정리
Amazon S3: 중앙 저장소
Amazon QuickSight: 데이터 시각화

4. 탐색적 데이터 분석 (EDA, Exploratory Data Analysis)

그래프 시각화로 데이터 분포와 특성 이해
상관행렬(Correlation Matrix): 피처들 간의 연관성 파악
- 예: 공부 시간 ↔ 시험 점수 (0.85 상관관계 → 강한 양의 상관관계)
어떤 피처가 모델에 중요한지 판단

5. 모델 개발 (Model Development)

모델 학습(Training), 튜닝(Tuning), 평가(Evaluation)
하이퍼파라미터(Hyperparameters): 알고리즘 동작 방식을 조정하는 값 (예: 학습률, 트리 개수 등)
반복적인 과정 (Iterative Process)
- 추가적인 피처 엔지니어링
- 하이퍼파라미터 튜닝

👉 시험 포인트:

Amazon SageMaker는 학습, 튜닝, 평가까지 전체 파이프라인을 지원하는 대표 서비스.
SageMaker Automatic Model Tuning 기능도 시험에 자주 나옴.

6. 재학습 (Retraining)

새로운 데이터가 들어올 때 모델을 재학습
피처와 하이퍼파라미터를 조정하여 성능 개선

7. 배포 (Deployment)

모델을 실제 환경에 배포하여 추론(Inferencing) 시작
배포 옵션:
- 실시간 추론 (Real-Time)
- 비동기 추론 (Asynchronous)
- 배치 추론 (Batch)
- 서버리스 (Serverless)
- 온프레미스(On-Premises)

👉 시험 포인트:

SageMaker는 실시간 엔드포인트, 배치 변환(Batch Transform), Serverless Inference 모두 지원

8. 모니터링 (Monitoring)

모델이 원하는 성능을 유지하는지 지속적으로 확인
문제 조기 감지 및 대응(Early Detection & Mitigation)
모델 드리프트(Model Drift): 시간이 지남에 따라 데이터 패턴이 변하면서 모델 성능이 저하되는 현상

👉 시험 포인트:

Amazon SageMaker Model Monitor → 모델 성능 모니터링 자동화

9. 반복(Iteration)과 유지보수

모델 성능 개선 사이클:
- 새로운 데이터 → 재학습 → 배포 → 모니터링
요구사항과 환경은 시간이 지나면서 변함 → 지속적 개선 필요
예시: 의류 추천 모델은 10년 후 패션 트렌드 변화에 따라 새롭게 학습해야 함

전체 워크플로우 요약

비즈니스 목표 정의 & KPI 설정
ML 문제로 전환
데이터 수집, 전처리, 피처 엔지니어링
탐색적 데이터 분석(EDA)
모델 학습, 튜닝, 평가
재학습 및 반복 개선
배포(실시간, 배치, 서버리스 등)
모니터링 및 디버깅
지속적 개선 & 요구사항 반영

✅ 시험 대비 핵심 포인트: - KPI 정의가 가장 첫 단계

EDA(탐색적 데이터 분석)과 상관행렬의 역할
SageMaker 주요 기능: Training, Tuning, Deployment, Monitoring
모델 배포 방식: Real-time, Batch, Serverless, On-premises
모델 드리프트 감지 & 재학습 중요성

Author: Danny Ki

Link: https://kish191919.github.io/2025/08/25/KO-AWS-Certified-AI-Practitioner-29/

Copyright Notice: All articles on this blog are licensed under CC BY-NC-SA 4.0 unless otherwise stated.

AWS AWS_AI_PRACTITIONER KOREAN

Related Articles

(한국어) AWS Certified AI Practitioner (1) - IT & AWS 기초

📚 IT & AWS 기초 요약1. 기본 IT 용어 네트워크(Network): 케이블, 라우터, 서버 등이 연결되어 데이터가 오가는 길. 라우터(Router): 인터넷에서 데이터를 어디로 보낼지 길잡이 역할을 하는 장치. 스위치(Switch): 네트워크 안에서 데이터가 정확한 서버나 컴퓨터로 가도록 도와주는 장치. 2. 클라우드 컴퓨팅의 5가지 핵심 특징 즉시 자원 사용(On-demand self service) → 필요한 자원을 바로 얻을 수 있음. 넓은 네트워크 접근(Broad network access) → 인터넷만 있으면 여러 기기에서 접근 가능. 자원 공유(Multi-tenancy & Resource pooling) → 여러 사용자가 안전하게 같은 자원 공유. 빠른 확장성(Rapid elasticity & Scalability) → 필요에 따라 서버나 자원을 늘리거나 줄일 수 있음. 사용량 기반 과금(Measur...

(한국어) AWS Certified AI Practitioner (10) - Agents (에이전트)

🤖 Amazon Bedrock – Agents (에이전트)📌 에이전트란?Amazon Bedrock의 에이전트(Agents) 는 단순히 질문에 답변하는 모델이 아니라, 여러 단계를 계획하고 실행할 수 있는 고급 기능입니다.즉, 사람이 “생각하고 → 계획하고 → 행동하는” 과정을 흉내 내서 실제 작업까지 자동으로 수행할 수 있습니다. 에이전트는 단순 텍스트 생성 외에도 다음과 같은 일을 할 수 있습니다: AWS 인프라 생성 (서버, S3, Lambda 등) 애플리케이션 배포 자동화 데이터베이스/시스템 작업 수행 외부 API 및 사내 시스템 연동 🔑 Bedrock Agents 주요 특징 멀티스텝 작업 실행: 단순 질의응답이 아니라, 여러 단계를 거쳐 복잡한 업무를 수행 작업 순서 제어: 각 단계가 올바른 순서로 실행되고, 데이터가 단계 간 잘 전달됨 액션 그룹(Action Groups): API, Lambda 함수 등 미리 정의된 작업 단위를 사용 ...

(한국어) AWS Certified AI Practitioner (11) - CloudWatch

📊 Amazon Bedrock & CloudWatch📌 CloudWatch란?Amazon CloudWatch는 AWS 리소스와 애플리케이션을 모니터링하는 서비스입니다.CloudWatch는 다음과 같은 기능을 제공합니다: Logs (로그) → 이벤트나 요청 내역을 기록 (디버깅에 유용) Metrics (지표) → 시스템 성능을 수치로 모니터링 Alarms (알람) → 특정 기준을 넘었을 때 알림 전송 Dashboards (대시보드) → 모니터링 정보를 시각화 👉 시험에 자주 나오는 포인트: CloudWatch Logs: 이벤트·로그 기록 CloudWatch Metrics: CPU, 메모리, 지연 시간 같은 성능 수치 CloudWatch Alarms: 기준치 초과 시 알림 CloudWatch Dashboards: 모니터링 결과 시각화 🔑 Bedrock + CloudWatch 연동1. 모델 호출(Invocation) 로깅 Bedrock...

(한국어) AWS Certified AI Practitioner (12) - Pricing & Model Improvement

📘 Amazon Bedrock – Pricing & Model Improvement1️⃣ Pricing Options🔹 On-Demand (즉시 사용, 사용량만큼 결제) 방식: 전기요금처럼 쓴 만큼만 지불 (Pay-as-you-go) 요금 기준 텍스트 모델 → 입력/출력 토큰 수 임베딩 모델 → 입력 토큰 수 이미지 모델 → 생성된 이미지 수 사용 가능 모델: Base Models 전용 ✅ 장점: 유연성, 사용량 예측이 어려운 경우 적합 ❌ 단점: 장기간 사용 시 비용 부담 ↑ 🔹 Batch Mode (묶음 처리, 최대 50% 할인) 방식: 여러 요청을 한 번에 묶어서 처리 → 결과는 Amazon S3에 단일 파일 저장 할인 혜택: 최대 50% 저렴 ✅ 장점: 대량 처리에 유리, 비용 절감 효과 큼 ❌ 단점: 실시간 응답 불가, 결과 지연 발생 적합 상황: 즉각적인 응답 필요 없고, 대량 요청을 처리할 때 🔹...

(한국어) AWS Certified AI Practitioner (13) - AI Stylist Demo

👗 Amazon Bedrock End-to-End Use Case (AI Stylist Demo)📌 왜 이 데모가 중요한가?앞에서 Amazon Bedrock의 여러 기능을 살펴봤지만, 실제로는 콘솔에서 클릭만 하는 것으로 끝나지 않습니다.실제 애플리케이션에서 Bedrock을 활용하려면 API 호출을 통해 Bedrock 기능을 불러오고, 이를 기반으로 서비스를 만들어야 합니다. AWS에서는 이를 보여주기 위해 AI Stylist라는 데모 애플리케이션을 제공합니다.이 데모를 통해 실제 사용자가 어떻게 Bedrock 기반 앱을 경험하는지 확인할 수 있습니다. 🔗 Try the AI Stylist Demo 📎 Demo Video: Your browser does not support the video tag. 👠 AI Stylist 동작 방식 사용자가 질문을 입력합니다. 예: “저는 컨설턴트인데, 다음 주 뉴욕 출장을 가는데 첫 출근 날 무슨...

(한국어) AWS Certified AI Practitioner (14) - 프롬프트 엔지니어링

📝 프롬프트 엔지니어링 (Prompt Engineering)프롬프트 엔지니어링은 AI 모델이 더 정확하고 원하는 답변을 내도록 질문(프롬프트)을 설계하고 최적화하는 기술을 말합니다.단순히 “AWS를 요약해줘” 같은 질문을 던지는 것보다, 구체적으로 지시, 맥락, 입력 데이터, 출력 형식을 포함하면 훨씬 좋은 결과를 얻을 수 있습니다. 1. 기본 개념 (Naïve Prompt vs. 개선된 Prompt) Naïve Prompt (단순 프롬프트)예: “AWS를 요약해줘.”👉 모델이 알아서 답하긴 하지만, 원하는 수준의 답변이 아닐 수 있음. Prompt Engineering (프롬프트 엔지니어링)👉 프롬프트를 설계하고 개선하여 원하는 답변을 얻는 방법.👉 4가지 핵심 요소: Instructions (지시사항) – 모델이 어떤 일을 해야 하는지 (예: “요약문 작성”) Context (맥락) – 모델이 참고할 추가 정보 (예: “AWS 초보자를 가르치는 상황”) ...