Sobre mim

Engenheira de Dados. Curiosa por natureza.

Comecei como estagiária em 2021, desenvolvendo meus primeiros scrapers e pipelines, e hoje atuo como engenheira de dados, evoluindo continuamente com stacks modernas do ecossistema. Sou formada em Ciências Econômicas, o que me ajuda a olhar para dados além da técnica e estruturar melhor problemas antes de propor soluções.

Fora do trabalho, sou movida por curiosidade. Desenvolvo um projeto pessoal de catalogação de aves em Uberlândia, organizando características morfológicas e comportamentais e expandindo para uma base nacional e, futuramente, global. Já criei um assistente com RAG e LLMs para identificação de espécies a partir de descrições textuais.

Também ensino matemática para crianças e, durante a graduação, trabalhei com artesanato em papel, produzindo cadernos e restaurando livros — algo que ainda mantenho como hobby.

Sou leitora de ficção científica, especialmente Androides Sonham com Ovelhas Elétricas?, de Philip K. Dick, que me interessa pelas reflexões sobre consciência e identidade.

Perfil Técnico

Atuo há mais de 3 anos com engenharia de dados, construindo e operando pipelines em produção de ponta a ponta — desde a coleta de dados via APIs públicas e web scraping até a modelagem, armazenamento e disponibilização para sistemas e áreas de negócio.

Nesse período, trabalhei com dados em larga escala, em pipelines que vão desde o processamento de bases com centenas de milhões de registros históricos até fluxos contínuos de eventos em sistemas de produção, em contextos como marketplaces e dados jurídicos.

Tenho uma atuação bem completa no ciclo de dados: ingestão de fontes heterogêneas, mensageria, modelagem relacional e não relacional, construção de Data Warehouses em cloud e desenvolvimento de APIs para consumo de dados. Mais recentemente, venho me aprofundando em LLMs, RAG e embeddings para classificação e extração de informação em dados não estruturados.

No dia a dia, meu foco está em construir pipelines que sejam observáveis, resilientes e, principalmente, úteis para quem realmente vai consumir esses dados.

Certificações

Hard Skills

Linguagens & Processamento

Data Processing & Orchestration

Data Storage & Databases

Streaming & Messaging

Cloud & Data Platforms

Data Engineering Practices

ETL/ELT Pipelines
Data Modeling (Dimensional / Lakehouse)
Data Quality & Validation
Batch & Incremental Processing
API Integration (REST)
Query Optimization
Medallion Architecture
Web Scraping & Data Ingestion

Tools & DevOps

Download CV

Curriculo

Um pouco das minhas conquistas.

“Simple things should be simple, complex things should be possible.”. Alan Kay

Educação

Especialização em Engenharia de Dados

2026 - 2028

Pós-graduação

Pontifícia Universidade Católica de Minas Gerais - PUC Minas

Bacharelado em Ciências Econômicas

2019 - 2025

Bacharelado

Universidade Federal de Uberlândia - UFU

Experiência

Engenheira de Dados

Jan 2025 — Atual

E-xyon

Responsável por todo o ciclo de dados jurídicos, da ingestão via APIs públicas e web scraping até modelagem em SQL Server (300 M+ processos), Data Warehouse no BigQuery e classificação semântica com LLMs e RAG.

Tecnologias: Python • SQL Server • BigQuery • FastAPI • GCP • LLMs / RAG • ETL

Desenvolvedora Python ETL (Freelancer)

Jan 2024 — Dez 2024

Flow2Go

Desenvolvedora end-to-end: construiu scrapers com bypass de captcha para portais jurídicos (CNA/CNSA), enriqueceu e padronizou dados em MongoDB, e disponibilizou tudo via API REST.

Tecnologias: Python • Web Scraping • MongoDB • FastAPI • ETL

Engenheira de Dados

Nov 2022 — Out 2023

Linx

Automatizou e operou pipelines de coleta para 10+ marketplaces (Amazon, Magalu, Mercado Livre…), gerenciando um catálogo de 60 M+ produtos com arquitetura orientada a filas via RabbitMQ e ingestão no S3 e BigQuery.

Tecnologias: Python • RabbitMQ • Elasticsearch • BigQuery • Amazon S3 • Web Scraping

Analista de Dados (Estágio)

Jan 2021 — Nov 2022

Nodis (Grupo StoneCo)

Iniciou a carreira construindo pipelines ETL e scrapers para marketplaces, integrando dados com VTEX via API e produzindo dashboards de KPIs no Google Data Studio.

Tecnologias: Python • PostgreSQL • MongoDB • Elasticsearch • Data Studio • ETL

Portfolio

Confira alguns de meus trabalhos.

"Without data, you’re just another person with an opinion.”

W. Edwards Deming

Prazer, meu nome é

Rafaella Duarte

Sobre mim

Engenheira de Dados. Curiosa por natureza.

Perfil Técnico

Certificações

Hard Skills

Linguagens & Processamento

Data Processing & Orchestration

Data Storage & Databases

Streaming & Messaging

Cloud & Data Platforms

Data Engineering Practices

Tools & DevOps

Curriculo

Um pouco das minhas conquistas.

Educação

Especialização em Engenharia de Dados

Pontifícia Universidade Católica de Minas Gerais - PUC Minas

Bacharelado em Ciências Econômicas

Universidade Federal de Uberlândia - UFU

Experiência

Engenheira de Dados

E-xyon

Desenvolvedora Python ETL (Freelancer)

Flow2Go

Engenheira de Dados

Linx

Analista de Dados (Estágio)

Nodis (Grupo StoneCo)

Portfolio

Confira alguns de meus trabalhos.

Pipeline de Dados Empresariais (CNPJ) no GCP (2010–2020)

API REST de Gestão de Livros e Leituras com FastAPI

Assistente de Identificação de Aves com RAG e LLM

Pipeline de Dados de Vendas com Airflow, dbt e Arquitetura Medallion

Pipeline de Dados de Arboviroses com Databricks e PySpark (2020–2025)

Scraper de Imobiliárias com Apache Airflow

Automação de Relatórios Econômicos com Airflow e PostgreSQL

Meu site de Receitas

Prazer, meu nome é

Rafaella Duarte

Sobre mim

Engenheira de Dados. Curiosa por natureza.

Perfil Técnico

Certificações

Hard Skills

Linguagens & Processamento

Data Processing & Orchestration

Data Storage & Databases

Streaming & Messaging

Cloud & Data Platforms

Data Engineering Practices

Tools & DevOps

Curriculo

Um pouco das minhas conquistas.

Educação

Especialização em Engenharia de Dados

Pontifícia Universidade Católica de Minas Gerais - PUC Minas

Bacharelado em Ciências Econômicas

Universidade Federal de Uberlândia - UFU

Experiência

Engenheira de Dados

E-xyon

Desenvolvedora Python ETL (Freelancer)

Flow2Go

Engenheira de Dados

Linx

Analista de Dados (Estágio)

Nodis (Grupo StoneCo)

Portfolio

Confira alguns de meus trabalhos.

Pipeline de Dados Empresariais (CNPJ) no GCP (2010–2020)

API REST de Gestão de Livros e Leituras com FastAPI

Assistente de Identificação de Aves com RAG e LLM

Pipeline de Dados de Vendas com Airflow, dbt e Arquitetura Medallion

Pipeline de Dados de Arboviroses com Databricks e PySpark (2020–2025)

Scraper de Imobiliárias com Apache Airflow

Automação de Relatórios Econômicos com Airflow e PostgreSQL

Meu site de Receitas

Pipeline de Dados Empresariais (CNPJ)

Sistema de Identificação de Aves com RAG

Pipeline de Dados de Arboviroses

Pipeline de Dados Imobiliários

Pipeline de Dados de Vendas

API RESTful de Gestão de Leituras

Automação de Relatórios Econômicos

Aplicação Web de Planejamento de Refeições