🏛️ Lakehouse Arquitetura Medalhão

Pipeline de dados completo implementando a Arquitetura Medalhão no Databricks Serverless, com ingestão a partir do Supabase (PostgreSQL).

Fluxo Geral

flowchart LR
    A[(Supabase\nPostgreSQL)] -->|pg8000\nSession Pooler| B[000\nExtração]
    B -->|CSVs| C[/Volume\nlanding/dados/]
    C --> D[002\nBronze]
    D -->|Delta| E[003\nSilver]
    E -->|Delta| F[004\nGold]

    style A fill:#3ecf8e,color:#000
    style C fill:#f0a500,color:#000
    style D fill:#cd7f32,color:#fff
    style E fill:#c0c0c0,color:#000
    style F fill:#ffd700,color:#000

Camadas

Camada	Schema	Formato	Descrição
Landing	`landing`	CSV	Dados brutos extraídos do Supabase
Bronze	`bronze`	Delta	Ingestão raw com metadados
Silver	`silver`	Delta	Dados padronizados e com Data Quality
Gold	`gold`	Delta	Modelo dimensional para análise

Início Rápido

Execute o notebook 001 para criar a infraestrutura
Configure a dependência pg8000 no ambiente do Job
Execute o notebook Extract_notebook para extrair os dados do Supabase
Execute 002 → 003 → 004 em sequência
Depois execute o 005 para apagar todos os dados e começar do zero