← Voltar para Carreiras
SeniorData Engineering📍 São Paulo - SP (Híbrido)Tempo Integral

Engenheiro de Dados Senior

🏥 Transforme o Setor de Saúde com Dados

A dokz é uma FinTech especializada em gestão de honorários médicos que está revolucionando a forma como profissionais de saúde gerenciam pagamentos de procedimentos médicos no Brasil. Estamos construindo uma plataforma digital que traz transparência, eficiência e automação para um setor que historicamente sofre com processos manuais e falta de visibilidade.

🚀 Sobre a Posição

O Desafio

Você será responsável por modernizar e escalar nossa plataforma de dados que processa milhões de procedimentos médicos de sistemas hospitalares Oracle TASY, transformando dados complexos em insights acionáveis para profissionais de saúde.

  • 📍Modelo: Híbrido em São Paulo - SP (presença ocasional para colaboração com time e clientes)
  • 📍Senioridade: 5-7 anos de experiência em data engineering

💼 Responsabilidades Principais

🔧 Modernização de Pipelines

  • • Otimizar pipelines ETL que extraem 52+ tabelas Oracle
  • • Implementar orquestração com Airflow ou AWS Step Functions
  • • Adicionar processamento paralelo para reduzir latência
  • • Evoluir arquitetura batch para processamento real-time

📈 Escalabilidade

  • • Projetar arquitetura para crescimento de 10K para 100K+ usuários
  • • Implementar Data Lakehouse (Delta Lake/Apache Iceberg)
  • • Criar CDC para sincronização incremental com Oracle
  • • Otimizar custos de infraestrutura AWS

Qualidade de Dados

  • • Implementar framework de qualidade (Great Expectations, dbt)
  • • Adicionar validação de schemas e testes automatizados
  • • Criar data lineage tracking e documentação
  • • Estabelecer SLAs e monitoramento de data freshness

👥 Liderança Técnica

  • • Mentoria técnica para engenheiros júnior/pleno
  • • Definir melhores práticas de engenharia de dados
  • • Participar de decisões arquiteturais e code reviews
  • • Colaborar com equipes de backend, mobile e produto

🛠️ Stack Tecnológico

Tecnologias Atuais

Linguagens e Frameworks:

Python 3.8+pandascx_Oracle

Cloud (AWS):

LambdaS3PostgreSQLDynamoDBCDK

Dados:

Oracle Database52+ tabelas TASYSupabase

🚀 Roadmap Tecnológico

Orquestração:

Apache AirflowAWS Step Functions

Qualidade:

Great ExpectationsdbtSoda

Lakehouse:

Delta LakeApache Iceberg

Streaming:

KafkaAWS Kinesis

🎯 Requisitos

Obrigatórios

  • 5-7 anos de experiência como Engenheiro de Dados
  • Python avançado - pandas, numpy, boto3, SQLAlchemy
  • SQL expert - Otimização, índices, window functions
  • AWS intermediário/avançado - Lambda, S3, RDS, DynamoDB, IAM, VPC
  • Pipelines ETL/ELT - Design escalável, incremental loads, CDC
  • Performance - Profiling, debugging, otimização de custos

Diferenciais

  • +Dados de saúde - HIPAA, LGPD, sistemas TASY/MV
  • +Oracle Database - PL/SQL, tuning, stored procedures
  • +Apache Airflow - DAGs, operators customizados
  • +AWS Glue - ETL jobs, crawlers, Data Catalog
  • +Supabase - PostgreSQL managed, real-time subscriptions
  • +Data Quality - Great Expectations, dbt tests
  • +Streaming - Kafka, Kinesis, Flink
  • +Data Lakehouse - Delta Lake, Iceberg, Hudi

🎁 O Que Oferecemos

💰 Remuneração

  • • Salário competitivo
  • • Vale refeição/alimentação
  • • Plano de saúde
  • • Plano odontológico
  • • Auxílio home office
  • • Day off de aniversário

📚 Desenvolvimento

  • • Budget para educação
  • • Cursos e certificações AWS
  • • Conferências (re:Invent, etc)
  • • Mentoria técnica
  • • Acesso a tech moderna

🌟 Cultura

  • • Startup em crescimento
  • • Impacto social real
  • • Time de alta performance
  • • Ambiente colaborativo
  • • Flexibilidade híbrida

Pronto para o desafio?

Junte-se a nós e ajude a transformar a gestão de honorários médicos no Brasil!