Prazer, meu nome é

Rafaella Duarte

Engenheira de Dados Desenvolvedora Python

Mais sobre mim
Sobre mim

Engenheira de Dados. Curiosa por natureza.

Profile Picture <

Comecei como estagiária em 2021, desenvolvendo meus primeiros scrapers e pipelines, e hoje atuo como engenheira de dados, evoluindo continuamente com stacks modernas do ecossistema. Sou formada em Ciências Econômicas, o que me ajuda a olhar para dados além da técnica e estruturar melhor problemas antes de propor soluções.

Fora do trabalho, sou movida por curiosidade. Desenvolvo um projeto pessoal de catalogação de aves em Uberlândia, organizando características morfológicas e comportamentais e expandindo para uma base nacional e, futuramente, global. Já criei um assistente com RAG e LLMs para identificação de espécies a partir de descrições textuais.

Também ensino matemática para crianças e, durante a graduação, trabalhei com artesanato em papel, produzindo cadernos e restaurando livros — algo que ainda mantenho como hobby.

Sou leitora de ficção científica, especialmente Androides Sonham com Ovelhas Elétricas?, de Philip K. Dick, que me interessa pelas reflexões sobre consciência e identidade.

<

Perfil Técnico

Atuo há mais de 3 anos com engenharia de dados, construindo e operando pipelines em produção de ponta a ponta — desde a coleta de dados via APIs públicas e web scraping até a modelagem, armazenamento e disponibilização para sistemas e áreas de negócio.

Nesse período, trabalhei com dados em larga escala, em pipelines que vão desde o processamento de bases com centenas de milhões de registros históricos até fluxos contínuos de eventos em sistemas de produção, em contextos como marketplaces e dados jurídicos.

Tenho uma atuação bem completa no ciclo de dados: ingestão de fontes heterogêneas, mensageria, modelagem relacional e não relacional, construção de Data Warehouses em cloud e desenvolvimento de APIs para consumo de dados. Mais recentemente, venho me aprofundando em LLMs, RAG e embeddings para classificação e extração de informação em dados não estruturados.

No dia a dia, meu foco está em construir pipelines que sejam observáveis, resilientes e, principalmente, úteis para quem realmente vai consumir esses dados.

Certificações

Airflow Fundamentals Databricks Fundamentals

Hard Skills

Linguagens & Processamento

Data Processing & Orchestration

Data Storage & Databases

Streaming & Messaging

Cloud & Data Platforms

Data Engineering Practices

Tools & DevOps

Curriculo

Um pouco das minhas conquistas.

“Simple things should be simple, complex things should be possible.”. Alan Kay

Educação

Especialização em Engenharia de Dados

2026 - 2028

Pós-graduação

Pontifícia Universidade Católica de Minas Gerais - PUC Minas

Bacharelado em Ciências Econômicas

2019 - 2025

Bacharelado

Universidade Federal de Uberlândia - UFU

Experiência

Engenheira de Dados

Jan 2025 — Atual

E-xyon

Responsável por todo o ciclo de dados jurídicos, da ingestão via APIs públicas e web scraping até modelagem em SQL Server (300 M+ processos), Data Warehouse no BigQuery e classificação semântica com LLMs e RAG.

Tecnologias: Python • SQL Server • BigQuery • FastAPI • GCP • LLMs / RAG • ETL

Desenvolvedora Python ETL (Freelancer)

Jan 2024 — Dez 2024

Flow2Go

Desenvolvedora end-to-end: construiu scrapers com bypass de captcha para portais jurídicos (CNA/CNSA), enriqueceu e padronizou dados em MongoDB, e disponibilizou tudo via API REST.

Tecnologias: Python • Web Scraping • MongoDB • FastAPI • ETL

Engenheira de Dados

Nov 2022 — Out 2023

Linx

Automatizou e operou pipelines de coleta para 10+ marketplaces (Amazon, Magalu, Mercado Livre…), gerenciando um catálogo de 60 M+ produtos com arquitetura orientada a filas via RabbitMQ e ingestão no S3 e BigQuery.

Tecnologias: Python • RabbitMQ • Elasticsearch • BigQuery • Amazon S3 • Web Scraping

Analista de Dados (Estágio)

Jan 2021 — Nov 2022

Nodis (Grupo StoneCo)

Iniciou a carreira construindo pipelines ETL e scrapers para marketplaces, integrando dados com VTEX via API e produzindo dashboards de KPIs no Google Data Studio.

Tecnologias: Python • PostgreSQL • MongoDB • Elasticsearch • Data Studio • ETL

Portfolio

Confira alguns de meus trabalhos.

"Without data, you’re just another person with an opinion.”

W. Edwards Deming