DATABRICKS-Fundamentals-4
1. Databricks Workspace๋?
Databricks Workspace๋
๐ Databricks ํ๋ซํผ์ ์ฌ์ฉํ๋ ๋ชจ๋ ์์
์ ์ถ๋ฐ์ ์
๋๋ค.
- ์ฝ๋ ์์ฑ (Notebook)
- ๋ฐ์ดํฐ ์ฒ๋ฆฌ (Spark / SQL)
- ํด๋ฌ์คํฐ ์์ฑ ๋ฐ ๊ด๋ฆฌ
- ์ํฌํ๋ก์ฐ(Job) ์์ฑ
- ๋ฐ์ดํฐ ๊ฑฐ๋ฒ๋์ค, ML, SQL ๋ถ์
๐ Databricks์์ ํ๋ ๋ชจ๋ ์์ ์ Workspace์์ ์์ํฉ๋๋ค.
2. Workspace ํ ํ๋ฉด ๊ฐ์
์๋จ(Home) ์์ญ
- ์ต๊ทผ ์ฌ์ฉํ ํญ๋ชฉ (Recent)
- ์ฆ๊ฒจ์ฐพ๊ธฐ (Favorites)
- ๋น ๋ฅธ ์์์ฉ ๋ฐ๋ก๊ฐ๊ธฐ
๊ฐ์ ํ
๐ ์ด๋ฐ์๋ ๊ฑฐ์ ์ฌ์ฉํ์ง ์์
๐ ์ค์ ์์ ์ ์ผ์ชฝ ๋ฉ๋ด๊ฐ ํต์ฌ
3. ์ผ์ชฝ ๋ฉ๋ด (Left Navigation Bar)
๋ฉ๋ด ํ์ฅ/์ถ์
- ๊ธฐ๋ณธ์ ์ถ์ ์ํ์ผ ์ ์์
- ๋ง์ฐ์ค๋ฅผ ๊ฐ์ ธ๊ฐ๋ฉด ์๋ ํ์ฅ
- โ๏ธ ๊ฐ์ ์์๋ ํญ์ ํ์ฅ ์ํ ์ถ์ฒ
4. Workspace ๋ฉ๋ด (๊ฐ์ฅ ์ค์ โญ)
์ญํ
๐ ์ฝ๋์ ํ์ผ์ด ์ ์ฅ๋๋ ๊ณต๊ฐ
๊ตฌ์กฐ
1 | Workspace |
Users > ๋ด ํ ๋๋ ํ ๋ฆฌ
- ๊ฐ์ธ ์์ ๊ณต๊ฐ
- ์์ฑ ๊ฐ๋ฅ ํญ๋ชฉ:
- ๐ Folder
- ๐ Notebook (Python / SQL / Scala)
- ๐ File
- ๐ Dashboard
- ๐ Alert
์ค์ ํฌ์ธํธ
๐ โNotebook์ ๊ฒฐ๊ตญ Workspace ์์ ์ ์ฅ๋๋คโ
5. Repos (์์ค์ฝ๋ ๊ด๋ฆฌ)
๊ธฐ๋ฅ
- GitHub / GitHub Enterprise
- Azure DevOps
- Bitbucket ๋ฑ ์ฐ๋ ๊ฐ๋ฅ
ํ์ฉ
- Git ๊ธฐ๋ฐ ๊ฐ๋ฐ
- Commit / Pull / Push ๊ฐ๋ฅ
- ํ์ ํ์ ๊ธฐ๋ฅ
์ค๋ฌด ํ
๐ ๊ฐ์ธ ํ์ต: Workspace
๐ ํ/ํ๋ก์ ํธ: Repos ํ์
6. Catalog (Catalog Explorer)
์ญํ
๐ ๋ฉํ๋ฐ์ดํฐ ๊ด๋ฆฌ ํ๋ฉด
ํ์๋๋ ํญ๋ชฉ:
- Databases
- Tables
- Views
- Functions
์ดํ ํ์ต ์ฃผ์
- Unity Catalog
- ๋ฐ์ดํฐ ๊ถํ ๊ด๋ฆฌ
7. Workflow (Jobs)
์ญํ
๐ ๋ฐฐ์น ์์ & ํ์ดํ๋ผ์ธ ๊ด๋ฆฌ
๊ฐ๋ฅํ ์์ :
- Job ์์ฑ
- Task ๊ฐ ์์กด์ฑ ์ค์
- ์ค์ผ์ค๋ง (Cron)
- ์ฌ์๋ / ์คํจ ์ฒ๋ฆฌ
ํ์ ๊ธฐ๋ฅ
- Jobs
- Job Runs
- Delta Live Tables (DLT)
8. Compute (ํด๋ฌ์คํฐ ๊ด๋ฆฌ)
์ญํ
๐ Spark ์คํ์ ์ํ ์ปดํจํธ ๋ฆฌ์์ค ๊ด๋ฆฌ
์์ฑ ๊ฐ๋ฅํ ๋ฆฌ์์ค:
- All-purpose Cluster
- Job Cluster
- SQL Warehouse
- Cluster Pool
- Cluster Policy
ํต์ฌ ๋ฉ์์ง
๐ Azure Portal์ด ์๋๋ผ Databricks์์ ํด๋ฌ์คํฐ ์์ฑ
9. Data Ingestion
๋ชฉ์
๐ ์ธ๋ถ ๋ฐ์ดํฐ๋ฅผ Databricks๋ก ๊ฐ์ ธ์ค๊ธฐ
๋ฐฉ์
- Native Spark Connectors
- Partner Tools (Fivetran ๋ฑ)
์ค์ ํฌ์ธํธ
๐ โDatabricks๋ ์ฒ๋ฆฌ ํ๋ซํผ, ์์ง์ ๋๊ตฌ ์ ํโ
10. Delta Live Tables (DLT)
๊ฐ๋
- Declarative ETL
- ํ์ดํ๋ผ์ธ ์ ์ ๊ธฐ๋ฐ ์ฒ๋ฆฌ
์์น
- Workflow ๋ฉ๋ด ํ์
์ดํ ์ฌํ ์ฃผ์
11. SQL ๋ฉ๋ด
Databricks๋ ์๋ฒ๋ฆฌ์ค ๋ฐ์ดํฐ ์จ์ดํ์ฐ์ค ์ญํ ๋ ์ํ
๊ฐ๋ฅํ ์์ :
- SQL Warehouse ์์ฑ
- SQL Editor
- Dashboard
- Alert
- Query History
SQL ์ค์ฌ ๋ถ์๊ฐ ๋์ ๊ธฐ๋ฅ
12. Machine Learning ๋ฉ๋ด
ML ๊ด๋ จ ๊ธฐ๋ฅ ์ ๊ณต:
- Experiments
- Models
- Feature Store
- MLflow
๋ฐ์ดํฐ ์์ง๋์ด โ ML ์์ง๋์ด ํ์ฅ ํฌ์ธํธ
13. Marketplace
๊ธฐ๋ฅ
- ์ธ๋ถ ๋ฐ์ดํฐ ๊ตฌ๋งค/๊ตฌ๋
- ๋ฌด๋ฃ/์ ๋ฃ ๋ฐ์ดํฐ์
๊ธฐ๋ฐ ๊ธฐ์
- Delta Sharing
14. Partner Connect
๋ชฉ์
๐ ์ธ๋ถ ์๋ฃจ์ ๊ณผ ์ํด๋ฆญ ์ฐ๋
ํํธ๋ ์์:
- Data Ingestion
- Visualization (Tableau ๋ฑ)
- Security
- Governance
- ML Tools
15. ์ฐ์ธก ์๋จ ๋ฉ๋ด
ํญ๋ชฉ
- User Settings
- Admin Settings
- Manage Account (Admin Console)
- Logout
๊ด๋ฆฌ์๋ Admin Settings ์์ฃผ ์ฌ์ฉ
16. ๊ฐ์์ฉ ํต์ฌ ์์ฝ (ํ ๋ฌธ์ฅ์ฉ)
- Workspace = Databricks์ ๋ชจ๋ ์์ ์์์
- ์ฝ๋ ์ ์ฅ = Workspace
- ์คํ ํ๊ฒฝ = Compute
- ์๋ํ = Workflow
- ๋ฉํ๋ฐ์ดํฐ = Catalog
- SQL ๋ถ์ = SQL ๋ฉ๋ด
- ML = Machine Learning ๋ฉ๋ด
17. ์ถ์ฒ ๊ฐ์ ํ๋ฆ
- Workspace UI ์ ์ฒด ๊ตฌ์กฐ ์ค๋ช
- Workspace โ Notebook ์์ฑ
- Compute โ Cluster ์์ฑ
- Notebook ์คํ
- Workflow โ Job ๋ง๋ค๊ธฐ
๋ง๋ฌด๋ฆฌ
Databricks Workspace๋ ๋จ์ํ UI๊ฐ ์๋๋ผ
๐ ๋ฐ์ดํฐ ์์ง๋์ด๋ง ์์
์ ์ปจํธ๋กค ํ์์
๋๋ค.
