Ir para o conteúdo

Visão Geral da Arquitetura

Arquitetura Medalhão

A Arquitetura Medalhão organiza os dados em camadas progressivas de qualidade, cada uma com responsabilidade bem definida.

flowchart TD
    SB[(Supabase\nPostgreSQL\n11 tabelas)] -->|pg8000\nSession Pooler IPv4| EX

    subgraph EX[" 000 — Extração "]
        direction LR
        PY[Python\npg8000] --> CSV[CSVs\n/Volumes/workspace/\nlanding/dados]
    end

    EX --> BR

    subgraph BR[" 002 — Bronze "]
        direction LR
        RD[spark.read.csv] --> MT[+ metadados\ndata_hora_bronze\nnome_arquivo]
        MT --> DL1[Delta Tables\nbronze.*]
    end

    BR --> SL

    subgraph SL[" 003 — Silver "]
        direction LR
        RN[renomear_colunas_managed\ncd_ → CODIGO_\nnm_ → NOME_] --> DL2[Delta Tables\nsilver.*]
    end

    SL --> GL

    subgraph GL[" 004 — Gold "]
        direction LR
        DIM[Dimensões\ndim_carro\ndim_cliente\ndim_localidade\ndim_tempo] --> FT[Fato\nfato_sinistro]
    end

    style SB fill:#3ecf8e,color:#000
    style DL1 fill:#cd7f32,color:#fff
    style DL2 fill:#c0c0c0,color:#000
    style FT fill:#ffd700,color:#000

Princípios Adotados

  • Managed Tables — todas as tabelas Delta são gerenciadas pelo Unity Catalog
  • Overwrite + Schema Evolution — reprocessamento seguro com overwriteSchema: true
  • SCD Tipo 1 — dimensões atualizadas via MERGE (sem histórico)
  • Rastreabilidade — cada registro carrega metadados de origem e timestamp de processamento