Sobre mim

Engenheira de Dados. Curiosa por natureza.

Comecei como estagiária em 2021, construindo meus primeiros scrapers e pipelines, e hoje atuo como engenheira de dados, evoluindo continuamente e acompanhando as stacks e práticas mais modernas do ecossistema. Sou formada em Ciências Econômicas, o que me ajuda a olhar para dados além da técnica e entender bem o problema antes de desenvolver soluções.

Fora do trabalho, sou movida por curiosidade. Gosto de observar aves e atualmente desenvolvo um projeto pessoal focado na catalogação de espécies da região de Uberlândia, reunindo características como formato de bico, tipo de pena, patas, alimentação e tamanho médio. A ideia é expandir essa base para todo o Brasil, que possui mais de 1.900 espécies de aves, e futuramente para uma escala global, considerando que existem mais de 10.000 espécies no mundo. Como parte disso, já criei um assistente com RAG e LLMs para identificação de aves a partir de descrições textuais.

Também ensino matemática para crianças, algo que considero extremamente gratificante. Durante a graduação, trabalhei com artesanato em papel como renda extra, produzindo cadernos e restaurando livros, atividade que hoje mantenho como hobby.

Sou leitora de ficção científica, especialmente Androides Sonham com Ovelhas Elétricas?, do Philip K. Dick, um livro que sempre me faz refletir sobre o que significa ser humano.

Perfil Técnico

Atuo há mais de 3 anos construindo e operando pipelines de dados em produção, acompanhando todo o ciclo, desde a coleta com APIs públicas e web scraping até a modelagem, armazenamento analítico e disponibilização para sistemas e áreas de negócio. Já trabalhei com bases de grande volume, na casa de centenas de milhões de registros e com dezenas de milhares de eventos processados por dia, em contextos bem diferentes, como marketplaces e dados jurídicos.

Tenho uma atuação bem completa, passando por ingestão em fontes heterogêneas e mensageria, modelagem relacional e não relacional, construção de Data Warehouses em cloud e desenvolvimento de APIs para servir os dados. Mais recentemente, tenho me aprofundado no uso de LLMs, RAG e embeddings para classificação e extração de informação em dados não estruturados, uma área que vem ganhando bastante espaço no meu trabalho.

No dia a dia, me preocupo em construir pipelines que sejam observáveis, resilientes e, principalmente, úteis para quem realmente vai consumir esses dados.

Cerfificações

Hard Skills

Linguagens

Banco de Dados

Cloud e Data Platform

Processamento de Dados e Orquestração

Mensageria

Ferramentas

Engenharia de Dados

ETL/ELT
Data Pipeline
Web Scraping
Modelagem de dados
Data Warehouse & Lakes
APIs RESTful
Arquitetura Medalhão
Ingestão de Dados em Batch
Processamento de Dados
Qualidade de Dados
Otimização de Queries

Download CV

Curriculo

Um pouco das minhas conquistas.

“Simple things should be simple, complex things should be possible.”. Alan Kay

Educação

Especialização em Engenharia de Dados

2026 - 2028

Pós-graduação

Pontifícia Universidade Católica de Minas Gerais - PUC Minas

Bacharelado em Ciências Econômicas

2019 - 2025

Bacharelado

Universidade Federal de Uberlândia - UFU

Experiência

Engenheira de Dados

Jan 2025 — Atual

CLT · Integral

Legal Data | E-xyon

Responsável por todo o ciclo de dados jurídicos, da ingestão via APIs públicas e web scraping até modelagem em SQL Server (300 M+ processos), Data Warehouse no BigQuery e classificação semântica com LLMs e RAG.

Tecnologias: Python • SQL Server • BigQuery • FastAPI • GCP • LLMs / RAG • ETL

Desenvolvedora Python ETL

Jan 2024 — Dez 2024

Freelancer · Meio Período

Flow2Go

Desenvolvedora end-to-end: construiu scrapers com bypass de captcha para portais jurídicos (CNA/CNSA), enriqueceu e padronizou dados em MongoDB, e disponibilizou tudo via API REST.

Tecnologias: Python • Web Scraping • MongoDB • FastAPI • ETL

Engenheira de Dados

Nov 2022 — Out 2023

CLT · Integral

Linx | StoneCo

Automatizou e operou pipelines de coleta para 10+ marketplaces (Amazon, Magalu, Mercado Livre…), gerenciando um catálogo de 60 M+ produtos com arquitetura orientada a filas via RabbitMQ e ingestão no S3 e BigQuery.

Tecnologias: Python • RabbitMQ • Elasticsearch • BigQuery • Amazon S3 • Web Scraping

Analista de Dados

Jan 2021 — Nov 2022

Estágio · Meio período

Nodis Tecnologia | StoneCo

Iniciou a carreira construindo pipelines ETL e scrapers para marketplaces, integrando dados com VTEX via API e produzindo dashboards de KPIs no Google Data Studio.

Tecnologias: Python • PostgreSQL • MongoDB • Elasticsearch • Data Studio • ETL

Portfolio

Confira alguns de meus trabalhos.

"Without data, you’re just another person with an opinion.”

W. Edwards Deming

Prazer, meu nome é

Rafaella Duarte

Sobre mim

Engenheira de Dados. Curiosa por natureza.

Perfil Técnico

Cerfificações

Hard Skills

Linguagens

Banco de Dados

Cloud e Data Platform

Processamento de Dados e Orquestração

Mensageria

Ferramentas

Engenharia de Dados

Curriculo

Um pouco das minhas conquistas.

Educação

Especialização em Engenharia de Dados

Pontifícia Universidade Católica de Minas Gerais - PUC Minas

Bacharelado em Ciências Econômicas

Universidade Federal de Uberlândia - UFU

Experiência

Engenheira de Dados

Legal Data | E-xyon

Desenvolvedora Python ETL

Flow2Go

Engenheira de Dados

Linx | StoneCo

Analista de Dados

Nodis Tecnologia | StoneCo

Portfolio

Confira alguns de meus trabalhos.

Pipeline de Dados Empresariais (CNPJ) no GCP (2010–2020)

Assistente de Identificação de Aves com RAG e LLM

Pipeline de Dados de Arboviroses com Databricks e PySpark (2020–2025)

Scraper de Imobiliárias com Apache Airflow

Automação de Relatórios Econômicos com Airflow e PostgreSQL

API REST de Gestão de Livros e Leituras com FastAPI

Meu site de Receitas

Prazer, meu nome é

Rafaella Duarte

Sobre mim

Engenheira de Dados. Curiosa por natureza.

Perfil Técnico

Cerfificações

Hard Skills

Linguagens

Banco de Dados

Cloud e Data Platform

Processamento de Dados e Orquestração

Mensageria

Ferramentas

Engenharia de Dados

Curriculo

Um pouco das minhas conquistas.

Educação

Especialização em Engenharia de Dados

Pontifícia Universidade Católica de Minas Gerais - PUC Minas

Bacharelado em Ciências Econômicas

Universidade Federal de Uberlândia - UFU

Experiência

Engenheira de Dados

Legal Data | E-xyon

Desenvolvedora Python ETL

Flow2Go

Engenheira de Dados

Linx | StoneCo

Analista de Dados

Nodis Tecnologia | StoneCo

Portfolio

Confira alguns de meus trabalhos.

Pipeline de Dados Empresariais (CNPJ) no GCP (2010–2020)

Assistente de Identificação de Aves com RAG e LLM

Pipeline de Dados de Arboviroses com Databricks e PySpark (2020–2025)

Scraper de Imobiliárias com Apache Airflow

Automação de Relatórios Econômicos com Airflow e PostgreSQL

API REST de Gestão de Livros e Leituras com FastAPI

Meu site de Receitas

Aplicação para Facilitar o Planejamento de Refeições Balanceadas