(한국어) AWS Certified AI Practitioner (30) - 하이퍼파라미터 튜닝

Created2025-08-26|Updated2025-08-26|CERTIFICATIONAWS_AI_PRACTITIONER_KR

|Post Views:

하이퍼파라미터 튜닝 (Hyperparameter Tuning)

1. 하이퍼파라미터란?

정의: 모델 구조와 학습 방식을 결정하는 설정값
특징:
- 학습이 시작되기 전에 정해짐
- 데이터 자체가 아니라, 학습 알고리즘의 동작 방식에 영향을 줌
대표 예시:
- 학습률(Learning rate)
- 배치 크기(Batch size)
- 에포크 수(Number of epochs)
- 정규화(Regularization)

👉 시험 포인트:
하이퍼파라미터는 모델 학습 과정에서 자동으로 학습되는 값이 아니라, 사전에 설정하는 값이다.

2. 하이퍼파라미터 튜닝(Hyperparameter Tuning)

목적: 최적의 하이퍼파라미터 값을 찾아 모델 성능을 극대화\
효과:
- 정확도 향상
- 과적합(Overfitting) 감소
- 일반화 성능 강화
방법:
- Grid Search: 가능한 모든 조합 탐색
- Random Search: 임의의 조합을 탐색
- 자동화 서비스:
  - Amazon SageMaker Automatic Model Tuning (AMT) 활용

3. 주요 하이퍼파라미터

(1) 학습률 (Learning Rate)

모델 가중치를 얼마나 크게/작게 업데이트할지 결정
높은 학습률: 빠른 수렴 가능, 하지만 최적값을 지나칠 위험
낮은 학습률: 더 정밀한 수렴 가능, 하지만 속도가 느림

(2) 배치 크기 (Batch Size)

한 번의 가중치 업데이트에 사용되는 데이터 샘플 개수
작은 배치: 안정적인 학습, 하지만 연산 시간이 오래 걸림
큰 배치: 빠른 학습, 하지만 불안정한 업데이트 가능

(3) 에포크 수 (Number of Epochs)

전체 학습 데이터를 몇 번 반복해서 학습할지 결정
너무 적으면: 학습 부족(Underfitting)
너무 많으면: 과적합(Overfitting)

(4) 정규화 (Regularization)

모델이 너무 복잡해져 과적합되지 않도록 제어
정규화를 높이면 단순해지고, 과적합 방지 효과

👉 시험 포인트:
“과적합을 줄이고 싶다”라는 질문 → 정규화 강화를 정답으로 선택하는 경우가 많음.

4. 과적합(Overfitting)과 해결 방법

정의: 학습 데이터에서는 높은 정확도를 보이지만, 새로운 데이터에서는 성능이 급격히 떨어지는 현상

원인

학습 데이터가 너무 적음 → 대표성이 부족
너무 많은 에포크 학습 → 특정 데이터에만 맞춰짐
모델이 지나치게 복잡 → 데이터의 노이즈까지 학습

방지 방법

데이터 양 늘리기 (가장 효과적)
Early Stopping (학습 조기 종료)
데이터 증강(Data Augmentation) (다양성 확보)
하이퍼파라미터 조정 (학습률, 배치 크기, 정규화 등)

👉 시험 포인트:
과적합 방지의 가장 좋은 답은 보통 데이터 양 늘리기

5. 머신러닝이 적합하지 않은 경우

예시 문제:
“카드 10장 중 빨강 5장, 파랑 3장, 노랑 2장 → 파랑 카드를 뽑을 확률은?”
- 답: 3/10 = 0.3
- 단순 수학적 계산으로 정확히 해결 가능

👉 결론:

결정론적(Deterministic) 문제: 코드로 수학적으로 풀 수 있음 → 머신러닝 불필요
머신러닝은 항상 **근사값(Approximation)**을 내므로, 이런 문제에서는 적절하지 않음

6. 시험 대비 핵심 요약

하이퍼파라미터 = 학습 전 설정 (학습률, 배치 크기, 에포크 수, 정규화)
튜닝 목적 = 성능 향상, 과적합 방지
과적합 방지 방법 = 데이터 늘리기, Early Stopping, 데이터 증강, 정규화
AWS 서비스 = SageMaker Automatic Model Tuning
머신러닝이 필요 없는 경우 = 답을 명확히 계산할 수 있는 결정론적 문제

👉 요약하면, 시험에서 하이퍼파라미터와 과적합 방지 방법은 반드시 나오는 단골 주제입니다.
특히 SageMaker AMT와 정규화/데이터 증강 관련 문항이 자주 출제됩니다.

Author: Danny Ki

Link: https://kish191919.github.io/2025/08/26/KO-AWS-Certified-AI-Practitioner-30/

Copyright Notice: All articles on this blog are licensed under CC BY-NC-SA 4.0 unless otherwise stated.

AWS AWS_AI_PRACTITIONER KOREAN

Related Articles

(한국어) AWS Certified AI Practitioner (1) - IT & AWS 기초

📚 IT & AWS 기초 요약1. 기본 IT 용어 네트워크(Network): 케이블, 라우터, 서버 등이 연결되어 데이터가 오가는 길. 라우터(Router): 인터넷에서 데이터를 어디로 보낼지 길잡이 역할을 하는 장치. 스위치(Switch): 네트워크 안에서 데이터가 정확한 서버나 컴퓨터로 가도록 도와주는 장치. 2. 클라우드 컴퓨팅의 5가지 핵심 특징 즉시 자원 사용(On-demand self service) → 필요한 자원을 바로 얻을 수 있음. 넓은 네트워크 접근(Broad network access) → 인터넷만 있으면 여러 기기에서 접근 가능. 자원 공유(Multi-tenancy & Resource pooling) → 여러 사용자가 안전하게 같은 자원 공유. 빠른 확장성(Rapid elasticity & Scalability) → 필요에 따라 서버나 자원을 늘리거나 줄일 수 있음. 사용량 기반 과금(Measur...

(한국어) AWS Certified AI Practitioner (11) - CloudWatch

📊 Amazon Bedrock & CloudWatch📌 CloudWatch란?Amazon CloudWatch는 AWS 리소스와 애플리케이션을 모니터링하는 서비스입니다.CloudWatch는 다음과 같은 기능을 제공합니다: Logs (로그) → 이벤트나 요청 내역을 기록 (디버깅에 유용) Metrics (지표) → 시스템 성능을 수치로 모니터링 Alarms (알람) → 특정 기준을 넘었을 때 알림 전송 Dashboards (대시보드) → 모니터링 정보를 시각화 👉 시험에 자주 나오는 포인트: CloudWatch Logs: 이벤트·로그 기록 CloudWatch Metrics: CPU, 메모리, 지연 시간 같은 성능 수치 CloudWatch Alarms: 기준치 초과 시 알림 CloudWatch Dashboards: 모니터링 결과 시각화 🔑 Bedrock + CloudWatch 연동1. 모델 호출(Invocation) 로깅 Bedrock...

(한국어) AWS Certified AI Practitioner (10) - Agents (에이전트)

🤖 Amazon Bedrock – Agents (에이전트)📌 에이전트란?Amazon Bedrock의 에이전트(Agents) 는 단순히 질문에 답변하는 모델이 아니라, 여러 단계를 계획하고 실행할 수 있는 고급 기능입니다.즉, 사람이 “생각하고 → 계획하고 → 행동하는” 과정을 흉내 내서 실제 작업까지 자동으로 수행할 수 있습니다. 에이전트는 단순 텍스트 생성 외에도 다음과 같은 일을 할 수 있습니다: AWS 인프라 생성 (서버, S3, Lambda 등) 애플리케이션 배포 자동화 데이터베이스/시스템 작업 수행 외부 API 및 사내 시스템 연동 🔑 Bedrock Agents 주요 특징 멀티스텝 작업 실행: 단순 질의응답이 아니라, 여러 단계를 거쳐 복잡한 업무를 수행 작업 순서 제어: 각 단계가 올바른 순서로 실행되고, 데이터가 단계 간 잘 전달됨 액션 그룹(Action Groups): API, Lambda 함수 등 미리 정의된 작업 단위를 사용 ...

(한국어) AWS Certified AI Practitioner (14) - 프롬프트 엔지니어링

📝 프롬프트 엔지니어링 (Prompt Engineering)프롬프트 엔지니어링은 AI 모델이 더 정확하고 원하는 답변을 내도록 질문(프롬프트)을 설계하고 최적화하는 기술을 말합니다.단순히 “AWS를 요약해줘” 같은 질문을 던지는 것보다, 구체적으로 지시, 맥락, 입력 데이터, 출력 형식을 포함하면 훨씬 좋은 결과를 얻을 수 있습니다. 1. 기본 개념 (Naïve Prompt vs. 개선된 Prompt) Naïve Prompt (단순 프롬프트)예: “AWS를 요약해줘.”👉 모델이 알아서 답하긴 하지만, 원하는 수준의 답변이 아닐 수 있음. Prompt Engineering (프롬프트 엔지니어링)👉 프롬프트를 설계하고 개선하여 원하는 답변을 얻는 방법.👉 4가지 핵심 요소: Instructions (지시사항) – 모델이 어떤 일을 해야 하는지 (예: “요약문 작성”) Context (맥락) – 모델이 참고할 추가 정보 (예: “AWS 초보자를 가르치는 상황”) ...

(한국어) AWS Certified AI Practitioner (15) - LLM에서 텍스트 생성 과정 & 프롬프트 최적화

📖 LLM에서 텍스트 생성 과정 & 프롬프트 최적화1️⃣ 텍스트 생성 원리LLM(대규모 언어 모델)은 다음 단어가 무엇일지 확률적으로 계산해서 문장을 만들어 갑니다.예를 들어,“After the rain, the streets were …” 뒤에 올 수 있는 후보 단어와 확률이 있다고 할 때: wet (0.40) flooded (0.25) slippery (0.15) empty (0.10) muddy (0.05) 모델은 이 확률을 기반으로 무작위 선택(random sampling) 하여 다음 단어를 생성합니다.즉, LLM의 출력은 항상 확률적이므로, 같은 질문을 여러 번 해도 결과가 조금씩 달라질 수 있습니다. 2️⃣ 프롬프트 성능 최적화 (Prompt Performance Optimization)Amazon Bedrock 같은 서비스에서는 출력 품질을 조절할 수 있는 여러 파라미터를 제공합니다. 🔹 System Prompt 모델이 어떤 역할을 해...

(한국어) AWS Certified AI Practitioner (16) - 프롬프트 엔지니어링 기법

🎯 프롬프트 엔지니어링 기법 (Prompt Engineering Techniques)프롬프트 엔지니어링은 **생성형 AI(LLM)**이 원하는 방식으로 답변을 하도록 유도하는 핵심 기술입니다. 단순히 질문을 던지는 것이 아니라, 프롬프트를 설계·최적화하여 모델이 더 정확하고 일관된 결과를 내도록 만드는 과정이죠. AWS 자격증 시험에서도 종종 프롬프트 엔지니어링 기법(Zero-Shot, Few-Shot, Chain-of-Thought, RAG 등)이 언급되므로 꼭 이해해 두어야 합니다. 1️⃣ Zero-Shot Prompting (제로샷 프롬프트) 정의: 예시를 전혀 주지 않고, 모델의 일반 지식만 활용해 답변을 얻는 방식. 예시 프롬프트: “개가 미스터리를 해결하는 짧은 이야기를 써줘.” 응답: 모델이 스스로 개연성 있는 이야기를 생성. 👉 특징 대형 언어모델(LLM, Foundation Model)일수록 좋은 결과가 나옴. 시험 포인트:...