(ํ๊ตญ์ด) AWS Certified AI Practitioner (12) - Pricing & Model Improvement
๐ Amazon Bedrock โ Pricing & Model Improvement
1๏ธโฃ Pricing Options
๐น On-Demand (์ฆ์ ์ฌ์ฉ, ์ฌ์ฉ๋๋งํผ ๊ฒฐ์ )
- ๋ฐฉ์: ์ ๊ธฐ์๊ธ์ฒ๋ผ ์ด ๋งํผ๋ง ์ง๋ถ (Pay-as-you-go)
- ์๊ธ ๊ธฐ์ค
- ํ ์คํธ ๋ชจ๋ธ โ ์ ๋ ฅ/์ถ๋ ฅ ํ ํฐ ์
- ์๋ฒ ๋ฉ ๋ชจ๋ธ โ ์ ๋ ฅ ํ ํฐ ์
- ์ด๋ฏธ์ง ๋ชจ๋ธ โ ์์ฑ๋ ์ด๋ฏธ์ง ์
- ์ฌ์ฉ ๊ฐ๋ฅ ๋ชจ๋ธ: Base Models ์ ์ฉ
- โ ์ฅ์ : ์ ์ฐ์ฑ, ์ฌ์ฉ๋ ์์ธก์ด ์ด๋ ค์ด ๊ฒฝ์ฐ ์ ํฉ
- โ ๋จ์ : ์ฅ๊ธฐ๊ฐ ์ฌ์ฉ ์ ๋น์ฉ ๋ถ๋ด โ
๐น Batch Mode (๋ฌถ์ ์ฒ๋ฆฌ, ์ต๋ 50% ํ ์ธ)
- ๋ฐฉ์: ์ฌ๋ฌ ์์ฒญ์ ํ ๋ฒ์ ๋ฌถ์ด์ ์ฒ๋ฆฌ โ ๊ฒฐ๊ณผ๋ Amazon S3์ ๋จ์ผ ํ์ผ ์ ์ฅ
- ํ ์ธ ํํ: ์ต๋ 50% ์ ๋ ด
- โ ์ฅ์ : ๋๋ ์ฒ๋ฆฌ์ ์ ๋ฆฌ, ๋น์ฉ ์ ๊ฐ ํจ๊ณผ ํผ
- โ ๋จ์ : ์ค์๊ฐ ์๋ต ๋ถ๊ฐ, ๊ฒฐ๊ณผ ์ง์ฐ ๋ฐ์
- ์ ํฉ ์ํฉ: ์ฆ๊ฐ์ ์ธ ์๋ต ํ์ ์๊ณ , ๋๋ ์์ฒญ์ ์ฒ๋ฆฌํ ๋
๐น Provisioned Throughput (์์ฝ์ , ์์ ์ ์ฑ๋ฅ ๋ณด์ฅ)
- ๋ฐฉ์: ํฌ์ค์ฅ ์ ์ก์ ์ฒ๋ผ ์ผ์ ๊ธฐ๊ฐ(1~6๊ฐ์ ๋ฑ) ์ฒ๋ฆฌ ์ฉ๋ ์์ฝ
- ๋ณด์ฅ ์ฑ๋ฅ: ๋ถ๋น ์ต๋ ์ ๋ ฅ/์ถ๋ ฅ ํ ํฐ ์ ๋ณด์ฅ
- ์ฌ์ฉ ๊ฐ๋ฅ ๋ชจ๋ธ: Base, Fine-tuned, Custom Models
- โ ์ฅ์ : ์์ ์ ์ธ ์ฑ๋ฅ ๋ฐ ์ฉ๋ ํ๋ณด, ์ปค์คํ ๋ชจ๋ธ ์ฌ์ฉ ๊ฐ๋ฅ
- โ ๋จ์ : ๋น์ฉ ์ ๊ฐ ํจ๊ณผ๋ ๊ฑฐ์ ์์ โ ๋ชฉ์ ์ โ์ฑ๋ฅ ๋ณด์ฅโ
๐ ๊ฐ๊ฒฉ ์ต์ ๋น๊ตํ
์ต์ | ๊ฒฐ์ ๋ฐฉ์ | ์๊ธ ๊ธฐ์ค | ์ฌ์ฉ ๊ฐ๋ฅ ๋ชจ๋ธ | ์ฅ์ | ๋จ์ | ์ ํฉํ ๊ฒฝ์ฐ |
---|---|---|---|---|---|---|
On-Demand | ์ฌ์ฉํ ๋งํผ ๊ฒฐ์ | - ํ
์คํธ: ์
๋ ฅ/์ถ๋ ฅ ํ ํฐ - ์๋ฒ ๋ฉ: ์ ๋ ฅ ํ ํฐ - ์ด๋ฏธ์ง: ์์ฑ ์ |
Base Models ์ ์ฉ | ์ ์ฐ์ฑ โ ์์ธก ๋ถ๊ฐ ์ํฌ๋ก๋ ์ ํฉ |
์ฅ๊ธฐ ์ฌ์ฉ ์ ๋น์ฉ โ | ๊ฐ๋ ์ฌ์ฉ / ์ฌ์ฉ๋ ์์ธก ์ด๋ ค์ |
Batch Mode | ์ฌ๋ฌ ์์ฒญ ๋ฌถ์ ์ฒ๋ฆฌ | ๊ฒฐ๊ณผ Amazon S3์ ์ ์ฅ | Base Models ์ ์ฉ | ์ต๋ 50% ํ ์ธ ๋๋ ์ฒ๋ฆฌ ์ ๋ฆฌ |
์ค์๊ฐ ์ฒ๋ฆฌ ๋ถ๊ฐ ์ง์ฐ ๋ฐ์ |
๋๋ ์์ฒญ / ์ฆ๊ฐ ์๋ต ๋ถํ์ |
Provisioned Throughput | ์ผ์ ๊ธฐ๊ฐ ์ฉ๋ ์์ฝ | ๋ถ๋น ํ ํฐ ์ฒ๋ฆฌ๋ ๋ณด์ฅ | Base, Fine-tuned, Custom Models | ์์ ์ ์ฑ๋ฅ ๋ณด์ฅ ์ปค์คํ ๋ชจ๋ธ ๊ฐ๋ฅ |
๋น์ฉ ์ ์ฝ ํจ๊ณผ ๊ฑฐ์ ์์ | ์ปค์คํ ๋ชจ๋ธ / ์ฑ๋ฅ ๋ณด์ฅ ํ์ |
2๏ธโฃ Model Improvement Techniques (์ ๋น์ฉ โ ๊ณ ๋น์ฉ)
1. Prompt Engineering
- ํ๋กฌํํธ ์ค๊ณ ์ต์ ํ๋ง์ผ๋ก ๊ฐ์
- ์ถ๊ฐ ์ฐ์ฐ ์์ โ ๊ฐ์ฅ ์ ๋ ด
2. Retrieval Augmented Generation (RAG)
- ์ธ๋ถ ์ง์ DB(Vector DB) ํ์ฉ
- ๋ชจ๋ธ ์ฌํ์ต ์์ โ ๋น์ฉ ์ ์
- ๋จ, ๋ฒกํฐ DB ๊ตฌ์ถยท์ด์ ๋น์ฉ ๋ฐ์
RAG = โ๋ชจ๋ธ + ๊ฒ์๊ธฐ๋ฅโ โ ๋ชจ๋ธ์ด ๋ชจ๋ฅด๋ ๊ฒ๋ ์ธ๋ถ์์ ์ฐพ์์ ๋๋ํ๊ฒ ๋ตํ๋ ๋ฐฉ๋ฒ์ด์์.
3. Instruction-based Fine-tuning
- ๋ผ๋ฒจ๋ง๋ ๋ฐ์ดํฐ๋ก ๋ชจ๋ธ์ ํน์ ์ง์นจ์ ๋ง๊ฒ ์กฐ์
- ์ถ๊ฐ ์ฐ์ฐ ํ์ โ ๋น์ฉ ์ฆ๊ฐ
4. Domain Adaptation Fine-tuning
- ๋๋ฉ์ธ ํนํ ๋ฐ์ดํฐ์ ์ผ๋ก ๋๊ท๋ชจ ์ฌํ์ต
- ๋ฐ์ดํฐ ์ค๋น + ์ฐ์ฐ ์ง์ฝ์ โ ๊ฐ์ฅ ๋น์ฉ ๋์
3๏ธโฃ Cost Optimization Tips
- ํ ํฐ ์ ๊ด๋ฆฌ โ ๋น์ฉ ์ ๊ฐ์ ํต์ฌ
- ํ๋กฌํํธ๋ ์งง๊ณ ๊ฐ๊ฒฐํ๊ฒ
- ์ถ๋ ฅ๋ ๋ถํ์ํ๊ฒ ๊ธธ์ง ์๊ฒ
- Batch Mode ํ์ฉ โ ์ต๋ 50% ์ ๊ฐ
- ์์ ๋ชจ๋ธ ์ ํ โ ์ผ๋ฐ์ ์ผ๋ก ๋ ์ ๋ ด
- ํ์ดํผํ๋ผ๋ฏธํฐ(Temperature, Top-K, Top-P) ์กฐ์
- ์ฑ๋ฅ์๋ ์ํฅ ์ฃผ์ง๋ง ๋น์ฉ์๋ ์ํฅ ์์
๐ ์ต์ข ์ ๋ฆฌ (์ํ/์ค๋ฌด ํฌ์ธํธ)
- On-Demand = ์ ์ฐ์ฑ / Batch = ๋๋ยทํ ์ธ / Provisioned = ์ฑ๋ฅ ๋ณด์ฅ
- ๋น์ฉ ์์: Prompt Engineering < RAG < Instruction Fine-tuning < Domain Adaptation
- ๋น์ฉ ์ ๊ฐ ํต์ฌ: ํ ํฐ ์ ๊ด๋ฆฌ + Batch ํ์ฉ
All articles on this blog are licensed under CC BY-NC-SA 4.0 unless otherwise stated.