🏛️ Lakehouse Arquitetura Medalhão
Pipeline de dados completo implementando a Arquitetura Medalhão no Databricks Serverless, com ingestão a partir do Supabase (PostgreSQL).
Fluxo Geral
flowchart LR
A[(Supabase\nPostgreSQL)] -->|pg8000\nSession Pooler| B[000\nExtração]
B -->|CSVs| C[/Volume\nlanding/dados/]
C --> D[002\nBronze]
D -->|Delta| E[003\nSilver]
E -->|Delta| F[004\nGold]
style A fill:#3ecf8e,color:#000
style C fill:#f0a500,color:#000
style D fill:#cd7f32,color:#fff
style E fill:#c0c0c0,color:#000
style F fill:#ffd700,color:#000
Camadas
| Camada | Schema | Formato | Descrição |
|---|---|---|---|
| Landing | landing |
CSV | Dados brutos extraídos do Supabase |
| Bronze | bronze |
Delta | Ingestão raw com metadados |
| Silver | silver |
Delta | Dados padronizados e com Data Quality |
| Gold | gold |
Delta | Modelo dimensional para análise |
Início Rápido
- Execute o notebook 001 para criar a infraestrutura
- Configure a dependência
pg8000no ambiente do Job - Execute o notebook Extract_notebook para extrair os dados do Supabase
- Execute 002 → 003 → 004 em sequência
- Depois execute o 005 para apagar todos os dados e começar do zero