(νκ΅μ΄) AWS Certified AI Practitioner (6) - Amazon Bedrock RAG & Knowledge Base
π Amazon Bedrock β RAG & Knowledge Base
1. π RAGλ 무μμΌκΉ?
RAG (Retrieval-Augmented Generation) μ
μΈλΆ λ°μ΄ν°μμ μ 보λ₯Ό κ²μ(Retrieve) νκ³ β μ΄λ₯Ό ν둬ννΈμ μΆκ°(Augment) νμ¬ β λͺ¨λΈμ΄ λ μ νν λ΅λ³μ μμ±(Generate) νλ λ°©λ²μ΄μμ.
- κ²μ(Retrieval): λͺ¨λΈμ΄ νμ΅νμ§ λͺ»ν μ΅μ λ°μ΄ν°λ νΉμ λλ©μΈ λ°μ΄ν°λ₯Ό κ°μ Έμμ.
- μ¦κ°(Augmentation): κ²μν λ°μ΄ν°λ₯Ό μ§λ¬Έκ³Ό ν©μ³μ λͺ¨λΈμ μ λ¬ν΄μ.
- μ₯μ : λͺ¨λΈμ μλ‘ νμ΅(Fine-tuning)νμ§ μκ³ λ μ΅μ μ§μμ λ°μν μ μμ΄μ.
2. π λμ λ°©μ (Step-by-Step)
- λ°μ΄ν° μ μ₯μ
- Amazon S3, Confluence, SharePoint, Salesforce, μΉμ¬μ΄νΈ λ±μ λ¬Έμλ₯Ό μ μ₯
- λ²‘ν° μλ² λ© μμ±
- Bedrockμ΄ λ¬Έμλ₯Ό μμ μ‘°κ°μΌλ‘ λλκ³
- Amazon Titan, Cohere κ°μ μλ² λ© λͺ¨λΈλ‘ μ«μ 벑ν°λ‘ λ³ν
- λ²‘ν° λ°μ΄ν°λ² μ΄μ€ μ μ₯
- λ³νλ 벑ν°λ₯Ό OpenSearch, Aurora, Neptune, S3 Vectors κ°μ λ²‘ν° DBμ μ μ₯
- 쿼리 μ²λ¦¬
- μ¬μ©μκ° μ§λ¬Ένλ©΄ β μ§λ¬Έλ 벑ν°λ‘ λ³ν β DBμμ μ μ¬ν λ²‘ν° κ²μ
- ν둬ννΈ μ¦κ°
- κ²μλ κ²°κ³Όλ₯Ό μλ μ§λ¬Έκ³Ό ν©μ³μ λͺ¨λΈμ μ λ¬
- λ΅λ³ μμ±
- Claude, Titan Text, Llama κ°μ λͺ¨λΈμ΄ λ§₯λ½μ μ΄ν΄νκ³ λ΅λ³ + μΆμ² μ 곡
3. π μ£Όμ κ΅¬μ± μμ
κ΅¬μ± μμ | μ€λͺ | AWS / μΈλΆ μ΅μ |
---|---|---|
λ°μ΄ν° μμ€ | μλ³Έ λ°μ΄ν° μ μ₯ μμΉ | Amazon S3, Confluence, SharePoint, Salesforce, μΉμ¬μ΄νΈ |
μλ² λ© λͺ¨λΈ | ν μ€νΈλ₯Ό 벑ν°λ‘ λ³ν | Amazon Titan, Cohere |
λ²‘ν° DB | λ²‘ν° μ μ₯ λ° κ²μ | OpenSearch, Aurora, Neptune, S3 Vectors / Pinecone, Redis, MongoDB |
κΈ°μ΄ λͺ¨λΈ | μ΅μ’ λ΅λ³ μμ± | Claude, Titan Text, Llama λ± |
4. π AWS λ²‘ν° DB λΉκ΅ (μν ν¬μΈνΈ!)
μλΉμ€ | νΉμ§ | νμ© μ¬λ‘ |
---|---|---|
OpenSearch | μ€μκ° κ²μ, KNN μ§μ, μλ²λ¦¬μ€ λͺ¨λ μμ | λκ·λͺ¨ μ€μκ° κ²μ & λΆμ |
Aurora PostgreSQL | RDBμ λ²‘ν° κ²μ ν΅ν© (pgvector) | κΈ°μ‘΄ SQL μμ€ν μ RAG κ²°ν© |
Neptune Analytics | κ·Έλν κΈ°λ° κ²μ (GraphRAG) | κ΄κ³ μ€μ¬ λ°μ΄ν°, κ·Έλν λΆμ |
S3 Vectors | μ λΉμ©, λμ λ΄κ΅¬μ±, λΉ λ₯Έ 쿼리 | μ₯κΈ° λ³΄κ΄ λ° λΉμ© μ΅μ ν |
β μν κΏν
- βμ€μκ° λκ·λͺ¨ κ²μβ β OpenSearch
- βκ·Έλν κ΄κ³ μ€μ¬β β Neptune
- βμ λΉμ©/κ³ λ΄κ΅¬μ±β β S3 Vectors
5. π μ KNN κ²μμ΄ μ€μνκ°?
RAGμμ KNN (k-Nearest Neighbors) κ²μμ κ°μ₯ μ€μν λ¨κ³μμ.
- λ¬Έμμ μ§λ¬Έμ 벑ν°λ‘ λ³ν β μλ‘μ β거리βλ₯Ό κ³μ° β κ°μ₯ κ°κΉμ΄ kκ° λ¬Έμ κ²μ
- 거리 κ³μ° λ°©λ²: μ½μ¬μΈ μ μ¬λ(Cosine Similarity), μ ν΄λ¦¬λ 거리 λ±
- AWS μνμμλ βsemantic searchβ, βvector similarity searchβ = KNN κ²μμ μλ―Ένλ€κ³ 보면 λΌμ.
- OpenSearchμ Approximate k-NN μ λκ·λͺ¨ μ€μκ° κ²μμ μμ£Ό μΆμ λΌμ.
6. π‘ λνμ μΈ νμ© μ¬λ‘
- κ³ κ° μλΉμ€ μ±λ΄ β μ ν λ§€λ΄μΌ, FAQ, νΈλ¬λΈμν λ¬Έμ κΈ°λ° λ΅λ³
- λ²λ₯ 리μμΉ β νλ‘, λ²λ Ή, κ·μ λ¬Έμλ₯Ό κ²μν΄ μ νν μΆμ²μ ν¨κ» μ 곡
- ν¬μ€μΌμ΄ Q&A β μ§λ³, μΉλ£, μ°κ΅¬ λ Όλ¬Έ λ°μ΄ν°λ₯Ό κΈ°λ°μΌλ‘ λ΅λ³
7. π§ͺ μ€μ΅ μμ β βλ΄ λ¬Έμμ λννκΈ°β
λͺ©ν: μ λ‘λν λ¬Έμλ₯Ό κΈ°λ°μΌλ‘ μ§λ¬Έ-λ΅λ³ μ±λ΄ λ§λ€κΈ°
μ μ°¨
- AWS Console β Knowledge Bases μ΄λ
- βChat with your documentβ μ ν
- λ¬Έμ μ λ‘λ
- μ§λ¬Έ μ λ ₯ β μ: βWWWλ₯Ό λ°λͺ ν μ¬λμ λꡬμΌ?β
- λͺ¨λΈμ΄ λ¬Έμ κ²μ β κ΄λ ¨ λ¬Έλ¨ μ°Ύμμ λ΅λ³ μμ± (μΆμ² ν¬ν¨)
μν ν: λ΅λ³ν λ°μ΄ν°κ° μμ λ βμ 곡λ λ°μ΄ν°μ ν΄λΉ λ΄μ©μ΄ μμ΅λλ€β λΌκ³ μλ΅ν΄μΌ ν¨
8. π μν λλΉ ν΅μ¬ μμ½
- RAG μ μ: μΈλΆ λ°μ΄ν° κ²μ + ν둬ννΈ μ¦κ° β λ μ νν λ΅λ³
- Bedrock μ₯μ : μλ² λ© μμ±, KB κ΄λ¦¬, FM μ°κ²° μλν
- λ²‘ν° DB μ΅μ : OpenSearch, Aurora, Neptune, S3 Vectors
- λ°μ΄ν° μμ€: S3, Confluence, SharePoint, Salesforce, μΉνμ΄μ§
- μ¬μ© μ¬λ‘: μ±λ΄, λ²λ₯ κ²μ, μλ£ μ§μ Q&A
- μν μμ£Ό λμ€λ ν€μλ
- βvector similarity searchβ = k-NN
- βProvisioned Throughputβ = 컀μ€ν λͺ¨λΈ νμ
- βFine-tuning vs RAGβ β Fine-tuning = λͺ¨λΈ μ체 μμ , RAG = λ°μ΄ν° μΆκ°λ§
β μΆκ° μν ν¬μΈνΈ
- Fine-tuning μ λͺ¨λΈ κ°μ€μΉ λ³κ²½, λΉμ© β, λ°μ΄ν° νμ β
- RAG λ κ°μ€μΉ λ³κ²½ μμ, μ΅μ λ°μ΄ν° λ°μ, λΉμ© β
- Bedrock KB λ S3, Confluence, Salesforce λ± λ€μν μμ€μ μ§μ μ°κ²° κ°λ₯
- Aurora (pgvector) λ κΈ°μ‘΄ SQL DBλ₯Ό μ¬μ©νλ κΈ°μ μμ μμ£Ό μΈκΈλ¨
All articles on this blog are licensed under CC BY-NC-SA 4.0 unless otherwise stated.