
Cientista de Dados, Pleno
Comerc Energia
full-time
Posted on:
Location Type: Hybrid
Location: São Paulo • 🇧🇷 Brazil
Visit company websiteJob Level
Mid-LevelSenior
Tech Stack
AirflowAWSAzureCloudDockerGoogle Cloud PlatformNumpyPandasPySparkPythonScikit-LearnSparkSQL
About the role
- Desenvolver, treinar e validar modelos preditivos e de machine learning aplicados às soluções da empresa;
- Participar da construção de arquiteturas modernas de IA, incluindo uso de LLMs, RAG e pipelines de ML;
- Colaborar na criação de produtos de dados e serviços inteligentes para apoiar jornadas corporativas;
- Desenvolver APIs e serviços em Python (FastAPI) para disponibilizar modelos e funcionalidades de dados;
- Construir e manter pipelines de dados eficientes usando Python, SQL e Spark/PySpark;
- Trabalhar com formatos modernos de dados (Parquet, Delta, Iceberg) e arquiteturas baseadas em camadas;
- Implementar boas práticas de MLOps, incluindo versionamento, testes e monitoramento de modelos;
- Utilizar ferramentas como MLflow, Airflow ou Prefect para automação e rastreabilidade;
- Realizar análises estatísticas, testes de hipótese e extração de insights para apoiar decisões de negócio;
- Seguir padrões de governança e documentar modelos, dados e fluxos de forma clara;
- Contribuir com o time em revisões de código e discussões técnicas;
- Acompanhar tendências, ferramentas e boas práticas de IA para aprimorar continuamente o trabalho.
Requirements
- Ensino superior completo em Ciências da Computação, Estatística, Engenharia, Matemática Aplicada, Sistemas de Informação ou áreas correlatas.
- Desejável pós-graduação em Machine Learning, IA, Engenharia de Dados ou áreas afins.
- Inglês intermediário.
- Experiência em Python (pandas, numpy, scikit-learn, statsmodels, pydantic, FastAPI) e SQL.
- Vivência com pipelines distribuídos (Spark/PySpark) e dados estruturados em formatos modernos.
- Experiência em Machine Learning, Deep Learning básico, NLP com LLMs e construção de soluções aplicadas.
- Noções de RAG, embeddings e tokenização (não precisa ser especialista).
- Conhecimento em MLOps (Docker, MLflow, Airflow/Prefect, GitHub Actions/GitLab CI).
- Experiência com cloud (AWS, Azure ou GCP).
- Familiaridade com boas práticas de governança de dados e documentação.
Benefits
- Vale Refeição
- Vale Transporte
- Assistência Médica
- Assistência Odontológica
- Vale Cultura
- Wellhub
- Galena
- PLR
- Day Off de Aniversário
- Seguro de Vida
- muito mais...
Applicant Tracking System Keywords
Tip: use these terms in your resume and cover letter to boost ATS matches.
Hard skills
PythonSQLMachine LearningDeep LearningNLPMLOpsData PipelinesStatistical AnalysisData GovernanceData Documentation
Soft skills
CollaborationCommunicationCode ReviewTechnical Discussions
Certifications
Bachelor's Degree in Computer ScienceBachelor's Degree in StatisticsBachelor's Degree in EngineeringBachelor's Degree in Applied MathematicsBachelor's Degree in Information SystemsPostgraduate in Machine LearningPostgraduate in AIPostgraduate in Data Engineering