(한국어) AWS Certified AI Practitioner (28) - 머신러닝 추론

Created2025-08-25|Updated2025-08-25|CERTIFICATIONAWS_AI_PRACTITIONER_KR

|Post Views:

머신러닝 – 추론(Inferencing)

1. 추론이란?

추론(Inferencing): 이미 학습된 모델이 새로운 데이터에 대해
예측을 내리는 과정\
**학습(Training)**은 모델이 패턴을 배우는 과정이고,
**추론(Inferencing)**은 학습된 지식을 활용하는 단계

2. 추론의 두 가지 방식

(1) 실시간 추론 (Real-Time Inference)

데이터가 들어오는 즉시 예측을 내려야 하는 경우
특징:
- 빠른 속도가 중요 (정확도보다는 속도 우선)
- 결과를 즉각적으로 제공해야 함
예시: 챗봇, 음성 비서(Alexa, Siri), 온라인 추천 시스템

👉 AWS 자격증에서 자주 나오는 포인트:
실시간 추론은 지연(latency) 최소화가 핵심. 모델 정확도가 조금
낮더라도 즉각적인 응답이 필요한 경우 사용됨.

(2) 배치 추론 (Batch Inference)

대량의 데이터를 모아서 한 번에 처리하는 방식
특징:
- 속도보다는 정확성이 중요
- 분석용으로 주로 사용
- 결과를 받기까지 시간이 오래 걸려도 문제 없음 (분 → 시 → 일 단위 가능)
예시: 대규모 고객 데이터 분석, 리스크 평가 모델

👉 시험에서 자주 묻는 포인트:

실시간 vs 배치 추론의 차이점
실시간 = 속도 중시, 배치 = 정확성 중시

3. 엣지(Edge)에서의 추론

(1) 엣지 디바이스란?

데이터가 생성되는 가까운 위치에 있는 장치들\
일반적으로 컴퓨팅 파워가 제한적이고, 인터넷 연결이 불안정할
수 있음\
예시: IoT 센서, CCTV, 라즈베리 파이, 스마트폰

(2) 소형 언어 모델 (SLM, Small Language Model)

엣지 디바이스에서 직접 실행 가능\
특징:
- 지연 시간이 매우 낮음 (인터넷 통신 불필요, 로컬 실행)\
- 컴퓨팅 자원 소모 적음\
- 오프라인 상태에서도 추론 가능\
예시: 스마트폰 번역 앱, 오프라인 이미지 인식

(3) 대형 언어 모델 (LLM, Large Language Model)

원격 서버에서 실행\
특징:
- 더 강력한 모델 사용 가능\
- 다만, 인터넷 연결 필요\
- 지연 시간(네트워크 왕복) 발생\
예시: ChatGPT, Amazon Bedrock 같은 클라우드 기반 AI

👉 시험 포인트:\

엣지에서의 추론은 SLM → 속도, 오프라인 가능\
클라우드 LLM → 성능 우수하지만 지연과 인터넷 의존도 있음\
문제에서 “인터넷 연결 불안정, 오프라인 환경”이 나오면 SLM 정답!\
“고성능 모델, 복잡한 연산 필요”가 나오면 LLM 선택

4. 시험 대비 정리 (Trade-off 비교)

구분 실시간 추론 배치 추론 SLM(엣지) LLM(서버)

속도 매우 빠름 느려도 OK 매우 빠름 인터넷 지연
(로컬) 발생

정확도 다소 낮을 수 있음 최대한 높음 모델 크기 높음
제한으로 낮음

환경 챗봇, 음성비서 데이터 분석, 오프라인 IoT, 클라우드 AI
리스크 모델 스마트폰 서비스

인터넷 O O X O
필요

5. 추가로 알아두면 좋은 시험 포인트

AWS 관련 서비스와 연결:
- Amazon SageMaker: 실시간/배치 추론 모두 지원
- Amazon Bedrock: 서버 기반 LLM 실행
- AWS IoT Greengrass: 엣지 디바이스에서 모델 실행 가능
시험 문제 예시:
- “한 공장에서 인터넷 연결이 자주 끊기는데, 장치에서 데이터를
  분석해야 한다. 어떤 추론 방식을 선택할까?” → 엣지 추론, SLM\
- “수백만 건의 고객 로그를 기반으로 분석을 진행하고, 결과는 하루
  뒤에 받아도 괜찮다.” → 배치 추론\
- “고객이 입력한 질문에 즉각 답변해야 한다.” → 실시간 추론\
- “더 정확한 결과가 필요하고, 인터넷 연결이 안정적이다.” → LLM
  원격 서버

👉 요약:\

실시간 추론 = 속도 우선, 챗봇\
배치 추론 = 정확도 우선, 대규모 분석\
SLM(엣지) = 빠름 + 오프라인 가능\
LLM(서버) = 강력하지만 인터넷 필요, 지연 존재

Author: Danny Ki

Link: https://kish191919.github.io/2025/08/25/KO-AWS-Certified-AI-Practitioner-28/

Copyright Notice: All articles on this blog are licensed under CC BY-NC-SA 4.0 unless otherwise stated.

AWS AWS_AI_PRACTITIONER KOREAN

Related Articles

(한국어) AWS Certified AI Practitioner (1) - IT & AWS 기초

📚 IT & AWS 기초 요약1. 기본 IT 용어 네트워크(Network): 케이블, 라우터, 서버 등이 연결되어 데이터가 오가는 길. 라우터(Router): 인터넷에서 데이터를 어디로 보낼지 길잡이 역할을 하는 장치. 스위치(Switch): 네트워크 안에서 데이터가 정확한 서버나 컴퓨터로 가도록 도와주는 장치. 2. 클라우드 컴퓨팅의 5가지 핵심 특징 즉시 자원 사용(On-demand self service) → 필요한 자원을 바로 얻을 수 있음. 넓은 네트워크 접근(Broad network access) → 인터넷만 있으면 여러 기기에서 접근 가능. 자원 공유(Multi-tenancy & Resource pooling) → 여러 사용자가 안전하게 같은 자원 공유. 빠른 확장성(Rapid elasticity & Scalability) → 필요에 따라 서버나 자원을 늘리거나 줄일 수 있음. 사용량 기반 과금(Measur...

(한국어) AWS Certified AI Practitioner (10) - Agents (에이전트)

🤖 Amazon Bedrock – Agents (에이전트)📌 에이전트란?Amazon Bedrock의 에이전트(Agents) 는 단순히 질문에 답변하는 모델이 아니라, 여러 단계를 계획하고 실행할 수 있는 고급 기능입니다.즉, 사람이 “생각하고 → 계획하고 → 행동하는” 과정을 흉내 내서 실제 작업까지 자동으로 수행할 수 있습니다. 에이전트는 단순 텍스트 생성 외에도 다음과 같은 일을 할 수 있습니다: AWS 인프라 생성 (서버, S3, Lambda 등) 애플리케이션 배포 자동화 데이터베이스/시스템 작업 수행 외부 API 및 사내 시스템 연동 🔑 Bedrock Agents 주요 특징 멀티스텝 작업 실행: 단순 질의응답이 아니라, 여러 단계를 거쳐 복잡한 업무를 수행 작업 순서 제어: 각 단계가 올바른 순서로 실행되고, 데이터가 단계 간 잘 전달됨 액션 그룹(Action Groups): API, Lambda 함수 등 미리 정의된 작업 단위를 사용 ...

(한국어) AWS Certified AI Practitioner (11) - CloudWatch

📊 Amazon Bedrock & CloudWatch📌 CloudWatch란?Amazon CloudWatch는 AWS 리소스와 애플리케이션을 모니터링하는 서비스입니다.CloudWatch는 다음과 같은 기능을 제공합니다: Logs (로그) → 이벤트나 요청 내역을 기록 (디버깅에 유용) Metrics (지표) → 시스템 성능을 수치로 모니터링 Alarms (알람) → 특정 기준을 넘었을 때 알림 전송 Dashboards (대시보드) → 모니터링 정보를 시각화 👉 시험에 자주 나오는 포인트: CloudWatch Logs: 이벤트·로그 기록 CloudWatch Metrics: CPU, 메모리, 지연 시간 같은 성능 수치 CloudWatch Alarms: 기준치 초과 시 알림 CloudWatch Dashboards: 모니터링 결과 시각화 🔑 Bedrock + CloudWatch 연동1. 모델 호출(Invocation) 로깅 Bedrock...

(한국어) AWS Certified AI Practitioner (12) - Pricing & Model Improvement

📘 Amazon Bedrock – Pricing & Model Improvement1️⃣ Pricing Options🔹 On-Demand (즉시 사용, 사용량만큼 결제) 방식: 전기요금처럼 쓴 만큼만 지불 (Pay-as-you-go) 요금 기준 텍스트 모델 → 입력/출력 토큰 수 임베딩 모델 → 입력 토큰 수 이미지 모델 → 생성된 이미지 수 사용 가능 모델: Base Models 전용 ✅ 장점: 유연성, 사용량 예측이 어려운 경우 적합 ❌ 단점: 장기간 사용 시 비용 부담 ↑ 🔹 Batch Mode (묶음 처리, 최대 50% 할인) 방식: 여러 요청을 한 번에 묶어서 처리 → 결과는 Amazon S3에 단일 파일 저장 할인 혜택: 최대 50% 저렴 ✅ 장점: 대량 처리에 유리, 비용 절감 효과 큼 ❌ 단점: 실시간 응답 불가, 결과 지연 발생 적합 상황: 즉각적인 응답 필요 없고, 대량 요청을 처리할 때 🔹...

(한국어) AWS Certified AI Practitioner (13) - AI Stylist Demo

👗 Amazon Bedrock End-to-End Use Case (AI Stylist Demo)📌 왜 이 데모가 중요한가?앞에서 Amazon Bedrock의 여러 기능을 살펴봤지만, 실제로는 콘솔에서 클릭만 하는 것으로 끝나지 않습니다.실제 애플리케이션에서 Bedrock을 활용하려면 API 호출을 통해 Bedrock 기능을 불러오고, 이를 기반으로 서비스를 만들어야 합니다. AWS에서는 이를 보여주기 위해 AI Stylist라는 데모 애플리케이션을 제공합니다.이 데모를 통해 실제 사용자가 어떻게 Bedrock 기반 앱을 경험하는지 확인할 수 있습니다. 🔗 Try the AI Stylist Demo 📎 Demo Video: Your browser does not support the video tag. 👠 AI Stylist 동작 방식 사용자가 질문을 입력합니다. 예: “저는 컨설턴트인데, 다음 주 뉴욕 출장을 가는데 첫 출근 날 무슨...

(한국어) AWS Certified AI Practitioner (14) - 프롬프트 엔지니어링

📝 프롬프트 엔지니어링 (Prompt Engineering)프롬프트 엔지니어링은 AI 모델이 더 정확하고 원하는 답변을 내도록 질문(프롬프트)을 설계하고 최적화하는 기술을 말합니다.단순히 “AWS를 요약해줘” 같은 질문을 던지는 것보다, 구체적으로 지시, 맥락, 입력 데이터, 출력 형식을 포함하면 훨씬 좋은 결과를 얻을 수 있습니다. 1. 기본 개념 (Naïve Prompt vs. 개선된 Prompt) Naïve Prompt (단순 프롬프트)예: “AWS를 요약해줘.”👉 모델이 알아서 답하긴 하지만, 원하는 수준의 답변이 아닐 수 있음. Prompt Engineering (프롬프트 엔지니어링)👉 프롬프트를 설계하고 개선하여 원하는 답변을 얻는 방법.👉 4가지 핵심 요소: Instructions (지시사항) – 모델이 어떤 일을 해야 하는지 (예: “요약문 작성”) Context (맥락) – 모델이 참고할 추가 정보 (예: “AWS 초보자를 가르치는 상황”) ...