Plataforma de Dados Moderna · Em Produção

Engenharia de dados,
sem a complexidade.

Conectores, catálogo, pipelines, qualidade e observabilidade — unificados em uma plataforma pensada para times que precisam de controle, simplicidade e escala real.

0
Anos em TI
0
Grandes clientes
0
Connectors enterprise
Trajetória técnica
Itaú · Mercedes-Benz · PagSeguro · Cielo · Gerdau · Sabesp · TIM · BrasilSeg · Mapfre · Vitru (Uniasselvi/Unicesumar) · Itaú · Mercedes-Benz · PagSeguro · Cielo · Gerdau · Sabesp · TIM · BrasilSeg · Mapfre · Vitru (Uniasselvi/Unicesumar) ·
Sobre

Raí Brito

Senior Data Engineer · Cloud Platforms

Mais de 16 anos em tecnologia, com 5 anos dedicados à engenharia de dados moderna: construindo arquiteturas Big Data em produção, liderando migrações de larga escala para cloud e entregando pipelines que processam centenas de milhões de registros com confiabilidade.

Trajetória em empresas como Itaú, BrasilSeg, Mapfre, Mercedes-Benz, PagSeguro, Cielo, Sabesp, TIM, Gerdau e Vitru (Uniasselvi / Unicesumar) — combinando expertise em GCP, Azure, Databricks, Spark e Python com visão de arquitetura e produto.

Além de atuar em projetos enterprise, construo e mantenho a Brito's Data — minha plataforma proprietária em produção, com deploy contínuo, multi-tenant e arquitetura cloud-native. Demonstra capacidade de arquitetar e operar produtos de dados ponta a ponta: desde DevOps e segurança até UX e observabilidade.

São Paulo, Brasil · disponível remoto
Bacharelado em Computação · Pós-graduação · Uninove
AWS Cloud Practitioner · Astronomer Airflow · Power BI DA-100

Números em Produção

9.4M
Registros processados
Kardex Vitru/Protheus
900+
Colunas migradas
MongoDB → Unity Catalog
2.8M
Rows ingeridas
BigQuery → Delta Lake
26+
Deploys produção
Brito's Data Platform

Experiência em Destaque

Senior Data Engineer

Vitru · Uniasselvi · Unicesumar

Migração da Psicometria 2.0 (TRI 3PL, Random Forest) para Databricks, pipelines de ingestão Protheus/Oracle → Unity Catalog, análise GA4/BigQuery e LGPD data dictionary.

Databricks · Azure Data Factory · Unity Catalog · Spark · Python · R

Senior Data Engineer · CXP ISA

Gerdau

Dashboard corporativo "Visão 360 do Cliente" com SVG canvas customizado — KPIs de Market Share, IQF, Leadtime — e migração MongoDB → Unity Catalog com 900+ colunas.

Power BI · DAX · Salesforce · SAP ECC · Databricks

Senior Data Engineer · FastData

TIM

Migração Java → Python/GCP de serviços críticos (Contract, BillingProfile, Customer) com CAS atomic writes, AckDeadlineExtender e validação forense em escala (~108M registros).

GCP · Cloud Run · Pub/Sub · Bigtable · Dataproc · Python

Data Engineer · IoT Platform

Sabesp

Implementação de arquitetura de streaming com MQTT + Spark Streaming para ingestão de telemetria IoT em tempo real, com processamento distribuído e persistência em data lake.

Spark Streaming · MQTT · Kafka · Python · Scala

Data Engineer

Mercedes-Benz · PagSeguro · Cielo

Arquitetura e implementação de pipelines Big Data com Spark/Scala, streaming Kafka, ingestão Nifi/StreamSets, ETL com AWS (S3, Athena, SQS), Elasticsearch e Hadoop.

Spark · Hadoop · Hive · Impala · Kafka · Elasticsearch · AWS

BI Analyst · Data Analyst

Itaú · BrasilSeg · Mapfre

Estruturas de BI corporativo, modelagem de DW, dashboards Power BI/MicroStrategy/Tableau, ETL com SSIS, SQL Server, análises operacionais e estratégicas em grande volume.

Power BI · MicroStrategy · SQL Server · SSIS · SSAS · Tableau

Plataforma

Tudo em um só lugar

Brito's Data unifica conectores, catálogo, pipeline builder, data quality e observabilidade — sem o peso de configurar cinco ferramentas separadas.

Core

Multi-source Connectors

BigQuery, PostgreSQL, SQL Server, Oracle e Delta Lake nativamente. Credenciais criptografadas via Fernet, teste de conexão em um clique, sync seletivo por schema.

Engine

Spark Engine Embutido

Apache Spark 3.5 com Delta Lake rodando em containers isolados. Z-Order, OPTIMIZE, MERGE INTO, Time Travel via Delta versions e schema evolution automática.

Develop

Notebooks Databricks-grade

Editor de notebooks com sessão Spark persistente, syntax highlight, autocomplete, sidebar de catálogo, execução célula a célula em Python e SQL.

Build

Pipeline Builder Visual

Construção drag-and-drop de pipelines com React Flow — source, transform, sink — agendamento via Airflow integrado e versionamento automático.

Transform

dbt Projects Nativo

Suporte a projetos dbt diretamente integrados — parse, run, test, docs. Conecta no seu repo Git, versionamento de models e DAG visual de dependências.

Governance

Catálogo + Stats Column-Level

Estatísticas por coluna direto do _delta_log: null_count, min, max, distinct count, version e file count. Sem queries adicionais — mesma técnica do Databricks Unity Catalog.

Killer Feature

Linhagem Column-Level (OpenLineage spec v2)

Linhagem nativa coluna a coluna entre fontes e destinos — a mesma capacidade do Unity Catalog. Eventos emitidos automaticamente em cada carga, com schema_facet, columnLineage e IDENTITY transformations. Visualização interativa com filtro por profundidade e tipo.

Operations

Quality + Observability

Regras nativas (unique, not_null, ranges, custom SQL), scores por tabela, alertas em falhas. Execuções, logs e latências em tempo real, com lineage visual e histórico completo.

Stack Técnica

Construída com tecnologias modernas

Frontend

  • Next.js 14
  • React 18
  • TypeScript
  • Tailwind CSS
  • React Flow

Backend

  • FastAPI
  • Python 3.11
  • SQLAlchemy
  • Pydantic
  • Firebase Auth

Data & Processing

  • Apache Spark 3.5
  • Delta Lake
  • PostgreSQL 16
  • Apache Airflow 2.9
  • dbt Core
  • OpenLineage spec v2

Cloud & Infra

  • Google Cloud Platform
  • Docker Compose · buildx
  • Cloudflare DNS
  • Nginx · Let's Encrypt TLS
  • Firebase Authentication
Serviços

Como posso ajudar seu time

Atuação sob medida — da arquitetura cloud à implementação de plataformas de dados completas, passando por mentoria técnica e treinamentos para engenheiros.

Consultoria Técnica

Arquitetura de dados, cloud (GCP/Azure/AWS), migrações legacy → modern stack, performance tuning e code review para seu time.

  • Diagnóstico de arquitetura (Spark, dbt, Airflow)
  • Migração legacy (Oracle/Synapse) → modern stack
  • Performance tuning e otimização de custo cloud
  • Governança: OpenLineage, Catalog, Quality

Entre em contato para discutir escopo.

Treinamento & Mentoria

Capacitação para engenheiros júnior e pleno em Python, Spark, dbt, Airflow, cloud e boas práticas de engenharia de dados moderna.

  • Workshops personalizados
  • Mentoria 1:1
  • Code reviews guiados
  • Preparação para certificações

Entre em contato para discutir escopo.

Audit Express

Auditoria técnica focada (5-10h) — análise rápida da sua arquitetura ou pipeline crítico, com diagnóstico priorizado e plano de ação enxuto.

  • Análise de pipeline ou stack
  • Identificação de bottlenecks
  • Roadmap priorizado (quick wins)
  • Relatório técnico executivo

Entrega em 1-2 semanas.

Vamos conversar?

Para projetos enterprise, audit técnico ou implementação Brito's Data — vamos avaliar como posso ajudar seu time.

Baseado em São Paulo · Disponível para projetos remotos e híbridos