002 — Bronze
Lê os CSVs do Volume, adiciona metadados de auditoria e persiste como tabelas Delta na camada Bronze.
Passos
- Listar arquivos em
/Volumes/workspace/landing/dados/ - Ler cada CSV com
spark.read.csveinferSchema=true - Adicionar colunas de metadado com
withColumn - Salvar como Delta Managed Table em
bronze.*
Metadados adicionados
df = df.withColumn("data_hora_bronze", current_timestamp())
.withColumn("nome_arquivo", lit("apolice.csv"))
Escrita Delta
df.write \
.format("delta") \
.mode("overwrite") \
.option("overwriteSchema", "true") \
.saveAsTable("bronze.apolice")
overwriteSchema obrigatório
Sempre usar .option("overwriteSchema", "true") para evitar DELTA_METADATA_MISMATCH quando o schema da fonte mudar.