(한국어) AWS Certified AI Practitioner (9) - Guardrails (가드레일)

Created2025-08-20|Updated2025-08-21|CERTIFICATIONAWS_AI_PRACTITIONER_KR

|Post Views:

🛡️ Amazon Bedrock – Guardrails (가드레일)

📌 Guardrails란 무엇인가?

Amazon Bedrock의 Guardrails(가드레일) 은 사용자가 입력한 내용과 모델이 생성하는 답변을 필터링하고 제어하는 안전장치입니다.
즉, AI가 잘못된 답변이나 위험한 내용을 내놓지 않도록 보호막 역할을 합니다.

🔑 Guardrails 주요 기능

유해 콘텐츠 차단
욕설, 혐오 표현, 성적인 내용, 폭력적인 내용 등을 자동으로 차단
특정 주제 제한
민감하거나 허용하지 않은 주제(예: 의료 조언, 법률 상담, 레시피 등)는 답변하지 않도록 설정
개인정보 보호(PII)
이메일, 전화번호, 주소 같은 개인정보를 자동 감지 후 마스킹 처리
환각(Hallucination) 줄이기
모델이 근거 없는 답변을 하지 않도록 맥락 기반 사실 확인(grounding) 적용
금지어(Word Filter)
직접 정의한 특정 단어·문구를 차단
정규식(Regex) 필터
예: 신용카드 번호, 주민번호 등 특정 패턴 데이터 차단 가능
다중 가드레일
상황별로 여러 가드레일을 동시에 적용 가능
모니터링
위반 로그를 저장해 추후 분석 및 정책 강화 가능

⚙️ 사용 사례 예시

1. 제한된 주제 차단

사용자 요청: “오늘 저녁에 먹을 요리 레시피 추천해줘.”
Guardrail 동작: “죄송하지만, 이 주제는 답변할 수 없습니다.”

2. 개인정보 마스킹

사용자 요청: “danny@example.com 으로 메일을 보내줘.”
Guardrail 동작: 이메일 주소를 [PII 제거됨] 으로 자동 변환

🛠️ Guardrails 설정 방법

가드레일 생성 – 이름과 차단 메시지 설정
(예: “죄송하지만, 해당 질문에는 답변할 수 없습니다.”)
필터 규칙 설정
- 콘텐츠 필터: 욕설, 성적, 폭력, 혐오 표현 등
- 금지 주제: 의료, 법률, 요리 레시피 등
- 금지 단어/정규식: 특정 단어, 신용카드 번호 등
- PII 필터: 이메일, 전화번호 등 개인정보 마스킹
- Grounding: 모델 답변이 실제 문서와 일치하는지 검증
테스트 – 입력 프롬프트로 가드레일이 제대로 작동하는지 확인
모델에 적용 – Anthropic, Claude, Sonnet 등 지원되는 FM(기초 모델)에 연결
다중 적용 가능 – 여러 가드레일을 동시에 사용해 강화된 제어 가능

✅ Guardrails를 사용하는 이유

책임 있는 AI: 위험하거나 불필요한 답변을 차단
개인정보 보호: 민감한 사용자 정보 자동 제거
법적·윤리적 리스크 방지: 규제 준수 및 기업 신뢰 확보
출력 품질 개선: 더 정확하고 신뢰할 수 있는 응답 제공

👉 한마디로, Guardrails는 AI 안전벨트 역할을 합니다.
사용자와 기업 모두를 보호하면서 안전하고 신뢰할 수 있는 AI 서비스를 운영할 수 있습니다.

📝 Guardrails 요약표

구분	설명	예시
목적	모델과 사용자 간 상호작용 제어	잘못된 답변 방지
콘텐츠 필터	혐오, 욕설, 성적, 폭력 차단	“폭력적인 이야기” 요청 → 차단
금지 주제	특정 주제 제한	의료/법률 상담, 레시피
PII 보호	개인정보 자동 마스킹	이메일, 전화번호 제거
금지어 필터	특정 단어/문구 차단	비속어 차단
정규식 필터	패턴 기반 정보 차단	신용카드 번호
Grounding	답변의 사실성 확인	근거 없는 생성 방지
다중 가드레일	여러 규칙을 함께 적용	개인정보+유해콘텐츠 동시 필터링
모니터링	위반 로그 기록	보안 정책 강화
차단 메시지	사용자에게 보여줄 문구 설정	“답변할 수 없습니다.”

✅ 시험 대비 포인트 (AWS 자격증)

Bedrock Guardrails 핵심:
콘텐츠 필터링 + 개인정보 보호(PII) + Grounding(환각 방지)
PII → 이메일, 전화번호, 주소, 신용카드 등 자동 마스킹
Grounding → “AI가 지어낸 답변(hallucination)을 줄이는 기능”
실무 적용: Guardrails는 다중 적용 가능하며 로그 모니터링 지원
시험 문제 유형 예시

“Bedrock 모델이 사용자의 이메일 주소를 그대로 출력하지 않게 하려면 어떤 기능을 사용해야 하는가?”
정답 → Guardrails의 PII Protection

Author: Danny Ki

Link: https://kish191919.github.io/2025/08/20/KO-AWS-Certified-AI-Practitioner-9/

Copyright Notice: All articles on this blog are licensed under CC BY-NC-SA 4.0 unless otherwise stated.

AWS AWS_AI_PRACTITIONER KOREAN

Related Articles

(한국어) AWS Certified AI Practitioner (1) - IT & AWS 기초

📚 IT & AWS 기초 요약1. 기본 IT 용어 네트워크(Network): 케이블, 라우터, 서버 등이 연결되어 데이터가 오가는 길. 라우터(Router): 인터넷에서 데이터를 어디로 보낼지 길잡이 역할을 하는 장치. 스위치(Switch): 네트워크 안에서 데이터가 정확한 서버나 컴퓨터로 가도록 도와주는 장치. 2. 클라우드 컴퓨팅의 5가지 핵심 특징 즉시 자원 사용(On-demand self service) → 필요한 자원을 바로 얻을 수 있음. 넓은 네트워크 접근(Broad network access) → 인터넷만 있으면 여러 기기에서 접근 가능. 자원 공유(Multi-tenancy & Resource pooling) → 여러 사용자가 안전하게 같은 자원 공유. 빠른 확장성(Rapid elasticity & Scalability) → 필요에 따라 서버나 자원을 늘리거나 줄일 수 있음. 사용량 기반 과금(Measur...

(한국어) AWS Certified AI Practitioner (10) - Agents (에이전트)

🤖 Amazon Bedrock – Agents (에이전트)📌 에이전트란?Amazon Bedrock의 에이전트(Agents) 는 단순히 질문에 답변하는 모델이 아니라, 여러 단계를 계획하고 실행할 수 있는 고급 기능입니다.즉, 사람이 “생각하고 → 계획하고 → 행동하는” 과정을 흉내 내서 실제 작업까지 자동으로 수행할 수 있습니다. 에이전트는 단순 텍스트 생성 외에도 다음과 같은 일을 할 수 있습니다: AWS 인프라 생성 (서버, S3, Lambda 등) 애플리케이션 배포 자동화 데이터베이스/시스템 작업 수행 외부 API 및 사내 시스템 연동 🔑 Bedrock Agents 주요 특징 멀티스텝 작업 실행: 단순 질의응답이 아니라, 여러 단계를 거쳐 복잡한 업무를 수행 작업 순서 제어: 각 단계가 올바른 순서로 실행되고, 데이터가 단계 간 잘 전달됨 액션 그룹(Action Groups): API, Lambda 함수 등 미리 정의된 작업 단위를 사용 ...

(한국어) AWS Certified AI Practitioner (11) - CloudWatch

📊 Amazon Bedrock & CloudWatch📌 CloudWatch란?Amazon CloudWatch는 AWS 리소스와 애플리케이션을 모니터링하는 서비스입니다.CloudWatch는 다음과 같은 기능을 제공합니다: Logs (로그) → 이벤트나 요청 내역을 기록 (디버깅에 유용) Metrics (지표) → 시스템 성능을 수치로 모니터링 Alarms (알람) → 특정 기준을 넘었을 때 알림 전송 Dashboards (대시보드) → 모니터링 정보를 시각화 👉 시험에 자주 나오는 포인트: CloudWatch Logs: 이벤트·로그 기록 CloudWatch Metrics: CPU, 메모리, 지연 시간 같은 성능 수치 CloudWatch Alarms: 기준치 초과 시 알림 CloudWatch Dashboards: 모니터링 결과 시각화 🔑 Bedrock + CloudWatch 연동1. 모델 호출(Invocation) 로깅 Bedrock...

(한국어) AWS Certified AI Practitioner (12) - Pricing & Model Improvement

📘 Amazon Bedrock – Pricing & Model Improvement1️⃣ Pricing Options🔹 On-Demand (즉시 사용, 사용량만큼 결제) 방식: 전기요금처럼 쓴 만큼만 지불 (Pay-as-you-go) 요금 기준 텍스트 모델 → 입력/출력 토큰 수 임베딩 모델 → 입력 토큰 수 이미지 모델 → 생성된 이미지 수 사용 가능 모델: Base Models 전용 ✅ 장점: 유연성, 사용량 예측이 어려운 경우 적합 ❌ 단점: 장기간 사용 시 비용 부담 ↑ 🔹 Batch Mode (묶음 처리, 최대 50% 할인) 방식: 여러 요청을 한 번에 묶어서 처리 → 결과는 Amazon S3에 단일 파일 저장 할인 혜택: 최대 50% 저렴 ✅ 장점: 대량 처리에 유리, 비용 절감 효과 큼 ❌ 단점: 실시간 응답 불가, 결과 지연 발생 적합 상황: 즉각적인 응답 필요 없고, 대량 요청을 처리할 때 🔹...

(한국어) AWS Certified AI Practitioner (13) - AI Stylist Demo

👗 Amazon Bedrock End-to-End Use Case (AI Stylist Demo)📌 왜 이 데모가 중요한가?앞에서 Amazon Bedrock의 여러 기능을 살펴봤지만, 실제로는 콘솔에서 클릭만 하는 것으로 끝나지 않습니다.실제 애플리케이션에서 Bedrock을 활용하려면 API 호출을 통해 Bedrock 기능을 불러오고, 이를 기반으로 서비스를 만들어야 합니다. AWS에서는 이를 보여주기 위해 AI Stylist라는 데모 애플리케이션을 제공합니다.이 데모를 통해 실제 사용자가 어떻게 Bedrock 기반 앱을 경험하는지 확인할 수 있습니다. 🔗 Try the AI Stylist Demo 📎 Demo Video: Your browser does not support the video tag. 👠 AI Stylist 동작 방식 사용자가 질문을 입력합니다. 예: “저는 컨설턴트인데, 다음 주 뉴욕 출장을 가는데 첫 출근 날 무슨...

(한국어) AWS Certified AI Practitioner (14) - 프롬프트 엔지니어링

📝 프롬프트 엔지니어링 (Prompt Engineering)프롬프트 엔지니어링은 AI 모델이 더 정확하고 원하는 답변을 내도록 질문(프롬프트)을 설계하고 최적화하는 기술을 말합니다.단순히 “AWS를 요약해줘” 같은 질문을 던지는 것보다, 구체적으로 지시, 맥락, 입력 데이터, 출력 형식을 포함하면 훨씬 좋은 결과를 얻을 수 있습니다. 1. 기본 개념 (Naïve Prompt vs. 개선된 Prompt) Naïve Prompt (단순 프롬프트)예: “AWS를 요약해줘.”👉 모델이 알아서 답하긴 하지만, 원하는 수준의 답변이 아닐 수 있음. Prompt Engineering (프롬프트 엔지니어링)👉 프롬프트를 설계하고 개선하여 원하는 답변을 얻는 방법.👉 4가지 핵심 요소: Instructions (지시사항) – 모델이 어떤 일을 해야 하는지 (예: “요약문 작성”) Context (맥락) – 모델이 참고할 추가 정보 (예: “AWS 초보자를 가르치는 상황”) ...