DATABRICKS-Fundamentals-1
1. Apache Spark๋?Apache Spark๋๐ ๋ถ์ฐ ํด๋ฌ์คํฐ ํ๊ฒฝ์์ ๋๊ท๋ชจ ๋ฐ์ดํฐ๋ฅผ ๋น ๋ฅด๊ฒ ์ฒ๋ฆฌํ๊ธฐ ์ํ ๋ฐ์ดํฐ ์ฒ๋ฆฌ ์์ง(Engine) ์
๋๋ค. Spark๋ ๋ค์ ์์
์ ํ๋์ ํตํฉ๋ ํ๋ ์์ํฌ์์ ์ฒ๋ฆฌํ ์ ์์ต๋๋ค. ๋ฐฐ์น ๋ฐ์ดํฐ ์ฒ๋ฆฌ (Batch Processing) ์คํธ๋ฆฌ๋ฐ ๋ฐ์ดํฐ ์ฒ๋ฆฌ (Stream Processing) ๋จธ์ ๋ฌ๋ (Machine Learning) ๊ทธ๋ํ ์ฒ๋ฆฌ (Graph Processing) SQL ๊ธฐ๋ฐ ๋ฐ์ดํฐ ๋ถ์ ๐ ์ํ ํฌ์ธํธ Spark๋ ๋ฐ์ดํฐ๋ฒ ์ด์ค๊ฐ ์๋๋ค Spark๋ ์คํ ๋ฆฌ์ง ์์คํ
์ด ์๋๋ค Spark๋ ๋ฐ์ดํฐ ์ฒ๋ฆฌ ์์ง(Processing Engine) ์ด๋ค 2. Spark๊ฐ ์ ๊ณตํ๋ ์ฃผ์ API (Unified Framework)Spark๋ ํ๋์ ์์ง ์์์ ์ฌ๋ฌ API๋ฅผ ์ ๊ณตํฉ๋๋ค. (1) Spark SQL & DataFrame API SQL ๊ธฐ๋ฐ ๋ฐ์ดํฐ ์ฒ๋ฆฌ ANSI SQL ํธํ ๊ฐ์ฅ ๋ง์ด ์ฌ์ฉ๋จ โญโญ...
Interview_Q&A_1
.toc-grid{ display:grid; grid-template-columns:1fr 1fr; /* ํ๋ฉด ๋ฐ๋ฐ */ gap:6px 20px; align-items:start; } @media (max-width:760px){ .toc-grid{ grid-template-columns:1fr; } } /* ์น์
ํ์ดํ์ ๋ ์นผ๋ผ ์ ์ฒด๋ฅผ ์ฐจ์ง */ .toc-section{ grid-column:1 / -1; margin:12px 0 6px; font-size:1.1rem; font-weight:700; } /* ๋งํฌ ๊ณตํต ์คํ์ผ */ .toc-grid a{ display:block; padding:2px 0; word-break:keep-all; } ๋ด ์๊ฐ ๋ฐ ์ ๋ฐ์ ์ธ ์ง๋ฌธ ๋์ ์๊ฐ ์ ์ด์งํ๋? ๋ณด์์ด๋ ๊ทธ๋ฆฌ๊ณ ์ง์๋๊ธฐ? ์ต๊ทผ ํ๋ก์ ํธ ์ด์ - ๋ฐ์ดํฐ ๋ณผ๋ฅจ์ฆ๊ฐ 3~4TB ์ด์ - ์คํค๋ง ๋ณ๊ฒฝ ๋ฐ์ดํฐ ์จ์ดํ์ฐ์ค ์ค๊ณ ๋ฐ์ดํฐ ์จ์ดํ์ฐ...
TERADATA(3)-History View
๐ Teradata Studio โ SQL History ์ฐฝ ์์ ์ ๋ฆฌTeradata SQL History ์ฐฝ ์ค์ , ์ปฌ๋ผ ์ ํ, ๋
ธํธ ๊ธฐ๋ฅ, ๋ณต์ ๋ฐฉ๋ฒ ๐ 1. SQL History ์ฐฝ ๋ณต์ํ๊ธฐSQL History ์ฐฝ์ ์ค์๋ก ๋ซ์๊ฑฐ๋ ์ฌ๋ผ์ก๋ค๋ฉด: Window โ Reset Perspective ๋ฅผ ๋๋ฌ์ฃผ๋ฉด ๊ธฐ๋ณธ ๋ ์ด์์์ผ๋ก ๋ณต์๋ฉ๋๋ค.โ History ์ฐฝ, Result Viewer ๋ฑ ๋ชจ๋ ํจ๋์ด ์๋ ์์น๋ก ๋์์ต๋๋ค. ๐ 2. SQL History ์ฐฝ ์ปฌ๋ผ(Columns) ์ปค์คํฐ๋ง์ด์งSQL History๋ ๊ธฐ๋ณธ์ ์ผ๋ก ๋งค์ฐ ๋ง์ ์ปฌ๋ผ์ ๋ณด์ฌ์ค๋๋ค.์: Timestamp, Source, User, Destination, Row Count, Result, SQL Statement ๋ฑ ํ์ ์๋ ์ปฌ๋ผ์ด ๋ง์ผ๋ฉด ํ๋ฉด์ด ๋ณต์กํด์ง๋ฏ๋ก ์ํ๋ ํญ๋ชฉ๋ง ์ ํํ ์ ์์ต๋๋ค. ๐ง ์ค์ ๊ฒฝ๋กWindow โ Preferences โ Teradata Datatools โ SQL His...
TERADATA(2)-Customizing the Interface and Result Set Viewer
๐ Teradata Studio ํ๊ฒฝ ์ค์ ๋ฐ ํ๋ฉด ์ปค์คํฐ๋ง์ด์งTeradata Studio ๋ทฐ ๋ณ๊ฒฝ / ํฐํธ ์์ / Result Viewer ์ค์ / ํ ์์ ๋ณ๊ฒฝ ๋ฑ ๐ 1. ํ๋จ ์ฐฝ(History ๋ฑ) ์จ๊ธฐ๊ธฐ / ๋ณด์ด๊ธฐTeradata Studio์์ ํ๋จ์ SQL History ๋๋ ๊ธฐํ ์ฐฝ์ด ๊ณต๊ฐ์ ๋ง์ด ์ฐจ์งํ ๋: ์ฐฝ ์ฐ์ธก ์๋จ์ minimize( โ ) ๋ฒํผ ํด๋ฆญ โ ์ฐฝ์ด ์ ํ ๋ค์ ๋ณด๊ณ ์ถ์ ๋๋ ์๋ ๋ํน๋ ํญ์ ํด๋ฆญํ๋ฉด ๋ค์ ๋ํ๋จ โ ํ๋ฉด์ ๋๊ฒ ์ฐ๊ณ ์ถ์ ๋ ๋งค์ฐ ์ ์ฉํ ๊ธฐ๋ฅ ๐ 2. ํฐํธ ํฌ๊ธฐ / ์คํ์ผ ๋ณ๊ฒฝํ๊ธฐ๊ฒฝ๋ก:Window โ Preferences โ General โ Appearance โ Colors and Fonts ์ฌ๊ธฐ์ ๋ค์ํ UI ์์์ ํฐํธ์ ์์์ ์กฐ์ ํ ์ ์์ต๋๋ค. ๐ธ ํฐํธ ์ข
๋ฅ ์ค๋ช
๊ธ์ ์์ A ์์ด์ฝ์ด ์์ผ๋ฉด โํฐํธ ๊ด๋ จโ A๊ฐ ์์ผ๋ฉด ๋ฐฐ๊ฒฝ์/์ ๊ฒฝ์ ๊ฐ์ โ์์...
TERADATA(1)-Overview of Teradata Studio Modules
๐ Teradata Studio ๊ธฐ๋ณธ ํ๋ฉด ์ดํดํ๊ธฐ๊ธฐ์ด UI ์ค๋ช
+ SQL ์คํ ๋ฐฉ๋ฒ + ํธ๋์ญ์
๋ชจ๋ ๊ฐ๋
๐ 1. Teradata Studio ์ฒซ ํ๋ฉด ๊ตฌ์ฑTeradata Studio๋ฅผ ์คํํ๋ฉด ๋ค์๊ณผ ๊ฐ์ ์ฃผ์ ์์ญ์ ๋ณด๊ฒ ๋ฉ๋๋ค. ๐น 1) ์๋จ ๋ฉ๋ด(File / Edit / Window ๋ฑ)์ผ๋ฐ์ ์ธ ํ์ผ ๊ด๋ฆฌ, ๋ณด๊ธฐ ์ค์ , ํ๊ฒฝ์ค์ ๋ณ๊ฒฝ ๋ฑ์ ์ํํฉ๋๋ค. ๐น 2) Studio Toolbar์ฟผ๋ฆฌ ์คํ, ์ ์ฅ, ์ ์ฐ๊ฒฐ ์์ฑ ๋ฑ ์์ฃผ ์ฌ์ฉํ๋ ๊ธฐ๋ฅ ์์ด์ฝ๋ค์ด ์์นํฉ๋๋ค. ๐น 3) Data Source Explorer (์ข์ธก ์์ญ)Teradata์ ์ฐ๊ฒฐ๋ ๋ฐ์ดํฐ๋ฒ ์ด์ค / ์ ์ / ํ
์ด๋ธ / ๋ทฐ ๋ฑ์ ํ์ํ ์ ์๋ ๊ฐ์ฅ ์ค์ํ ํจ๋์
๋๋ค. ๐น 4) Project ExplorerSQL ํ์ผ์ด๋ ํ๋ก์ ํธ๋ฅผ ๋ก์ปฌ์ ์ ์ฅํ์ฌ ๊ด๋ฆฌํ ๋ ์ฌ์ฉํฉ๋๋ค. ๐น 5) SQL Editor (์ค์ ์๋จ)SQL์ ์์ฑํ๋ ๊ณต๊ฐ์
๋๋ค.์: 1...
Coding_Quiz_Python_1
1. Two SumLink : https://leetcode.com/problems/two-sum/description/?difficulty=EASY Hash Map (๋์
๋๋ฆฌ ์ด์ฉ)๋ณด์กฐ ๊ณต๊ฐ์ ์ด์ฉํด ๋น ๋ฅด๊ฒ ์ฐจ์ด๋ฅผ ์ฐพ๋ ๋ฐฉ์. ์๊ฐ ๋ณต์ก๋: O(n) ๊ณต๊ฐ ๋ณต์ก๋: O(n) 1234567891011class Solution: def twoSum(self, nums: List[int], target: int) -> List[int]: num_map = {} for index, num in enumerate(nums): diff = target - num if diff in num_map: return [num_map[diff], index] num_map[num] = index Sorting + Two Pointers...
Databricks CV Anomaly Detection
๐๏ธ Databricks + Computer Vision Anomaly Detection & Model DeploymentA complete guide to anomaly detection with Databricks and Apache Spark โFrom data ingestion to real-time serving โ build and deploy scalable computer vision anomaly detection models.โ ๐ Full Project:๐ View Jupyter Notebooks on GitHub ๐ One-Line SummaryThis project provides a full pipeline for computer visionโbased anomaly detection, covering data ingestion, preprocessing, model training, deployment, and RES...
(ํ๊ตญ์ด) AWS ML Associate (6) - Amazon S3 ํต์ฌ ์ ๋ฆฌ
Amazon S3 ๋ณด์ (Amazon S3 Security)Amazon S3๋ ๋จ์ํ ์ ์ฅ์ ์๋น์ค์ง๋ง, ๋ณด์(Security) ์ ์ ๋๋ก ์ค์ ํ์ง ์์ผ๋ฉด ๋ฐ์ดํฐ ์ ์ถ(Data Leak)๊ณผ ๊ฐ์ ์ฌ๊ฐํ ๋ฌธ์ ๊ฐ ๋ฐ์ํ ์ ์์ต๋๋ค. AWS Certified Machine Learning Engineer โ Associate ์ํ์์๋ ์์ฃผ ์ถ์ ๋๋ ์ฃผ์ ์ด๋ฏ๋ก ๊ผญ ์ดํดํด์ผ ํฉ๋๋ค. 1. S3 ๋ณด์ ์ ํ๐น User-Based (IAM ๊ธฐ๋ฐ) IAM PoliciesIAM(Identity and Access Management)์์ ํน์ ์ฌ์ฉ์(User) ๋๋ ๊ทธ๋ฃน(Group)์ ๋ํด ์ด๋ค API ํธ์ถ(API Calls)์ ํ์ฉํ ์ง ์ ์ํฉ๋๋ค.โ ์: s3:GetObject ๊ถํ ๋ถ์ฌ. ๐น Resource-Based (๋ฆฌ์์ค ๊ธฐ๋ฐ) Bucket Policies JSON ๊ธฐ๋ฐ ์ ์ฑ
์ผ๋ก, ๋ฒํท ์ ์ฒด์ ๋ํ ์ ๊ทผ ๊ถํ์ ์ค์ ํฉ๋๋ค. Cross-Account Access(๊ณ์ ...
(ํ๊ตญ์ด) AWS ML Associate (5) - Amazon S3 ํต์ฌ ์ ๋ฆฌ
Amazon S3 ํต์ฌ ์ ๋ฆฌ ์ ์ค์ํ๊ฐ?Amazon S3(Simple Storage Service)๋ AWS์ ํต์ฌ ์คํ ๋ฆฌ์ง ์๋น์ค๋ก, โ์ฌ์ค์ ๋ฌดํ๋(virtually unlimited)โ ํ์ฅ์ฑ์ ์ ๊ณตํ๋ ๊ฐ์ฒด ์คํ ๋ฆฌ์ง(Object Storage) ์
๋๋ค. ๋๋ถ๋ถ์ ๋ฐ์ดํฐ/AI ์ํฌ๋ก๋๊ฐ S3๋ฅผ ์ค์ฌ์ผ๋ก ์ฐ๊ฒฐ๋๋ฉฐ, ๋ค๋ฅธ AWS ์๋น์ค์์ ํตํฉ์ฑ์ด ๋งค์ฐ ๋ฐ์ด๋ฉ๋๋ค. 1) S3๊ฐ ์ฐ์ด๋ ๊ณณ (Use Cases) ๋ฐฑ์
& ์คํ ๋ฆฌ์ง(Backup & Storage): ์ฅ๊ธฐ ๋ณด๊ด, ์ค๋
์ท ์ ์ฅ. ์ฌํด๋ณต๊ตฌ(Disaster Recovery, DR): ๋ค๋ฅธ ๋ฆฌ์ (Region) ์ผ๋ก ๋ณต์ ํด RTO/RPO ๊ฐ์ . ์์นด์ด๋ธ(Archive): ์ ๋น์ฉ ๋ณด๊ด(S3 Glacier ๊ณ์ด) ํ ํ์ ์ ๋ณต์. ํ์ด๋ธ๋ฆฌ๋ ์คํ ๋ฆฌ์ง(Hybrid Cloud Storage): ์จํ๋ ๋ฏธ์ค + ํด๋ผ์ฐ๋ ์ฐ๋. ์ ํ๋ฆฌ์ผ์ด์
/๋ฏธ๋์ด ํธ์คํ
(App/Media Host...
