Tech Stack
AWSAzureFlaskGoogle Cloud PlatformNumpyPandasPythonScikit-Learn
About the role
- Projetar, desenvolver e implantar pipelines de Machine Learning voltados para aplicações com LLMs.
- Implementar e otimizar sistemas de RAG, incluindo configuração de bancos de dados vetoriais, estratégias de chunking e embedding, e processos de recuperação de informação.
- Desenvolver e manter integrações com APIs de LLMs de mercado (Azure, OpenAI, Google Vertex AI, entre outras).
- Colaborar com equipes de produto para garantir a integração eficiente dos dados nas aplicações.
- Monitorar e avaliar a performance dos modelos, propondo melhorias contínuas.
- Manter-se atualizado(a) com as tendências e avanços em IA Generativa e LLMs.
- Escrever código limpo, testável e bem documentado, seguindo boas práticas de engenharia de software.
- Participar de projetos inovadores de IA Generativa com entrega de soluções escaláveis e confiáveis.
- Trabalho 100% remoto com necessidade de disponibilidade para visitas eventuais ao cliente em São Paulo/SP e dedicação durante horário comercial (9h00 às 18h00).
Requirements
- Sólida experiência com Python e bibliotecas como Pandas, NumPy, Scikit-learn.
- Vivência prática com APIs de LLMs (Azure, OpenAI, Google Vertex AI).
- Experiência em sistemas RAG, incluindo arquitetura e componentes (vector stores, retrieval, generation).
- Conhecimentos em engenharia de software: controle de versão (Git), testes automatizados e desenvolvimento de APIs (FastAPI, Flask).
- Familiaridade com ambientes de nuvem (AWS, Azure ou GCP).
- Inglês Intermediário.
- Formação superior em Ciência da Computação, Engenharia, Estatística, Matemática ou áreas correlatas.
- Experiência profissional relevante como Engenheiro(a) de Machine Learning, Engenheiro(a) de Software com foco em IA ou posição similar.
- Disponibilidade para visitas eventuais ao cliente em São Paulo/SP.
- Disponibilidade para dedicação 100% durante o horário comercial (9h00 às 18h00).
- Disponibilidade para início imediato.