Brito's Data — Plataforma de Engenharia de Dados

Sobre

Raí Brito

Senior Data Engineer · Cloud Platforms

Mais de 16 anos em tecnologia, com 5 anos dedicados à engenharia de dados moderna: construindo arquiteturas Big Data em produção, liderando migrações de larga escala para cloud e entregando pipelines que processam centenas de milhões de registros com confiabilidade.

Trajetória em empresas como Itaú, BrasilSeg, Mapfre, Mercedes-Benz, PagSeguro, Cielo, Sabesp, TIM, Gerdau e Vitru (Uniasselvi / Unicesumar) — combinando expertise em GCP, Azure, Databricks, Spark e Python com visão de arquitetura e produto.

Além de atuar em projetos enterprise, construo e mantenho a Brito's Data — minha plataforma proprietária em produção, com deploy contínuo, multi-tenant e arquitetura cloud-native. Demonstra capacidade de arquitetar e operar produtos de dados ponta a ponta: desde DevOps e segurança até UX e observabilidade.

São Paulo, Brasil · disponível remoto

Bacharelado em Computação · Pós-graduação · Uninove

AWS Cloud Practitioner · Astronomer Airflow · Power BI DA-100

Números em Produção

9.4M

Registros processados
Kardex Vitru/Protheus

900+

Colunas migradas
MongoDB → Unity Catalog

2.8M

Rows ingeridas
BigQuery → Delta Lake

26+

Deploys produção
Brito's Data Platform

Experiência em Destaque

Senior Data Engineer

Vitru · Uniasselvi · Unicesumar

Migração da Psicometria 2.0 (TRI 3PL, Random Forest) para Databricks, pipelines de ingestão Protheus/Oracle → Unity Catalog, análise GA4/BigQuery e LGPD data dictionary.

Databricks · Azure Data Factory · Unity Catalog · Spark · Python · R

Senior Data Engineer · CXP ISA

Gerdau

Dashboard corporativo "Visão 360 do Cliente" com SVG canvas customizado — KPIs de Market Share, IQF, Leadtime — e migração MongoDB → Unity Catalog com 900+ colunas.

Power BI · DAX · Salesforce · SAP ECC · Databricks

Senior Data Engineer · FastData

TIM

Migração Java → Python/GCP de serviços críticos (Contract, BillingProfile, Customer) com CAS atomic writes, AckDeadlineExtender e validação forense em escala (~108M registros).

GCP · Cloud Run · Pub/Sub · Bigtable · Dataproc · Python

Data Engineer · IoT Platform

Sabesp

Implementação de arquitetura de streaming com MQTT + Spark Streaming para ingestão de telemetria IoT em tempo real, com processamento distribuído e persistência em data lake.

Spark Streaming · MQTT · Kafka · Python · Scala

Data Engineer

Mercedes-Benz · PagSeguro · Cielo

Arquitetura e implementação de pipelines Big Data com Spark/Scala, streaming Kafka, ingestão Nifi/StreamSets, ETL com AWS (S3, Athena, SQS), Elasticsearch e Hadoop.

Spark · Hadoop · Hive · Impala · Kafka · Elasticsearch · AWS

BI Analyst · Data Analyst

Itaú · BrasilSeg · Mapfre

Estruturas de BI corporativo, modelagem de DW, dashboards Power BI/MicroStrategy/Tableau, ETL com SSIS, SQL Server, análises operacionais e estratégicas em grande volume.

Power BI · MicroStrategy · SQL Server · SSIS · SSAS · Tableau

Plataforma

Tudo em um só lugar

Brito's Data unifica conectores, catálogo, pipeline builder, data quality e observabilidade — sem o peso de configurar cinco ferramentas separadas.

Core

Multi-source Connectors

BigQuery, PostgreSQL, SQL Server, Oracle e Delta Lake nativamente. Credenciais criptografadas via Fernet, teste de conexão em um clique, sync seletivo por schema.

Engine

Spark Engine Embutido

Apache Spark 3.5 com Delta Lake rodando em containers isolados. Z-Order, OPTIMIZE, MERGE INTO, Time Travel via Delta versions e schema evolution automática.

Develop

Notebooks Databricks-grade

Editor de notebooks com sessão Spark persistente, syntax highlight, autocomplete, sidebar de catálogo, execução célula a célula em Python e SQL.

Build

Pipeline Builder Visual

Construção drag-and-drop de pipelines com React Flow — source, transform, sink — agendamento via Airflow integrado e versionamento automático.

Transform

dbt Projects Nativo

Suporte a projetos dbt diretamente integrados — parse, run, test, docs. Conecta no seu repo Git, versionamento de models e DAG visual de dependências.

Governance

Catálogo + Stats Column-Level

Estatísticas por coluna direto do _delta_log: null_count, min, max, distinct count, version e file count. Sem queries adicionais — mesma técnica do Databricks Unity Catalog.

Killer Feature

Linhagem Column-Level (OpenLineage spec v2)

Linhagem nativa coluna a coluna entre fontes e destinos — a mesma capacidade do Unity Catalog. Eventos emitidos automaticamente em cada carga, com schema_facet, columnLineage e IDENTITY transformations. Visualização interativa com filtro por profundidade e tipo.

Operations

Quality + Observability

Regras nativas (unique, not_null, ranges, custom SQL), scores por tabela, alertas em falhas. Execuções, logs e latências em tempo real, com lineage visual e histórico completo.

Stack Técnica

Construída com tecnologias modernas

Frontend

Next.js 14
React 18
TypeScript
Tailwind CSS
React Flow

Backend

FastAPI
Python 3.11
SQLAlchemy
Pydantic
Firebase Auth

Data & Processing

Apache Spark 3.5
Delta Lake
PostgreSQL 16
Apache Airflow 2.9
dbt Core
OpenLineage spec v2

Cloud & Infra

Google Cloud Platform
Docker Compose · buildx
Cloudflare DNS
Nginx · Let's Encrypt TLS
Firebase Authentication

Serviços

Como posso ajudar seu time

Atuação sob medida — da arquitetura cloud à implementação de plataformas de dados completas, passando por mentoria técnica e treinamentos para engenheiros.

Consultoria Técnica

Arquitetura de dados, cloud (GCP/Azure/AWS), migrações legacy → modern stack, performance tuning e code review para seu time.

Diagnóstico de arquitetura (Spark, dbt, Airflow)
Migração legacy (Oracle/Synapse) → modern stack
Performance tuning e otimização de custo cloud
Governança: OpenLineage, Catalog, Quality

Entre em contato para discutir escopo.

Mais Procurado

Implementação de Plataforma

Deploy da Brito's Data na sua cloud, adaptada ao seu stack. Conectores customizados, treinamento do time e suporte contínuo.

Deploy em cloud própria
Conectores sob medida
Treinamento do time
Suporte contínuo

Entre em contato para discutir escopo.

Treinamento & Mentoria

Capacitação para engenheiros júnior e pleno em Python, Spark, dbt, Airflow, cloud e boas práticas de engenharia de dados moderna.

Workshops personalizados
Mentoria 1:1
Code reviews guiados
Preparação para certificações

Entre em contato para discutir escopo.

Audit Express

Auditoria técnica focada (5-10h) — análise rápida da sua arquitetura ou pipeline crítico, com diagnóstico priorizado e plano de ação enxuto.

Análise de pipeline ou stack
Identificação de bottlenecks
Roadmap priorizado (quick wins)
Relatório técnico executivo

Entrega em 1-2 semanas.

Engenharia de dados,
sem a complexidade.

Raí Brito

Tudo em um só lugar

Multi-source Connectors

Spark Engine Embutido

Notebooks Databricks-grade

Pipeline Builder Visual

dbt Projects Nativo

Catálogo + Stats Column-Level

Linhagem Column-Level (OpenLineage spec v2)

Quality + Observability

Construída com tecnologias modernas

Frontend

Backend

Data & Processing

Cloud & Infra

Como posso ajudar seu time

Consultoria Técnica

Implementação de Plataforma

Treinamento & Mentoria

Audit Express

Vamos conversar?

Engenharia de dados, sem a complexidade.

Raí Brito

Tudo em um só lugar

Multi-source Connectors

Spark Engine Embutido

Notebooks Databricks-grade

Pipeline Builder Visual

dbt Projects Nativo

Catálogo + Stats Column-Level

Linhagem Column-Level (OpenLineage spec v2)

Quality + Observability

Construída com tecnologias modernas

Frontend

Backend

Data & Processing

Cloud & Infra

Como posso ajudar seu time

Consultoria Técnica

Implementação de Plataforma

Treinamento & Mentoria

Audit Express

Vamos conversar?

Engenharia de dados,
sem a complexidade.