Apply

Ready to go for it?

AI Apply speeds things up—apply directly if you prefer.

FREE ACCESS
5,000–10,000 jobs/day
JobTailor Logo

See all jobs on JobTailor

Search thousands of fresh jobs every day.

Discover
  • Fresh listings
  • Fast filters
  • No subscription required
Create a free account and start exploring right away.
Leega

Senior AI Engineer – Agentes, Plataforma & RAG

Leega

AI Engineer building generative AI applications for Guanabara. Collaborating to enhance AI systems with structured agents and semantic layers.

Posted 6/10/2026full-timeRemote • 🇧🇷 BrazilMid-LevelSeniorWebsite

Tech Stack

Tools & technologies
JavaScriptNeo4jPythonReact

About the role

Key responsibilities & impact
  • Você vai construir a plataforma de agentes de IA da Guanabara e o ecossistema que distribui IA generativa governada à companhia.
  • Orquestração de agentes — construir agentes com LangGraph no padrão Supervisor/ReAct, com memória de curto/longo prazo e estado durável (PostgresSaver).
  • Camada semântica e RAG — evoluir a camada semântica determinística (Cube.js) e a recuperação semântica com Qdrant (busca vetorial + re-ranking) que ancoram as respostas em dado real.
  • Skills, subagentes e MCP — criar e versionar skills (SKILL.md), subagentes e ferramentas MCP (FastMCP) para o Claude Code, em fluxo spec-driven, conectando agentes a sistemas corporativos.
  • Verificação e avaliação — manter o verificador (LLM-as-judge) e suítes de eval (offline/online) com amostragem de traces para pegar drift de qualidade.
  • Plataforma de modelos — operar o gateway LiteLLM (Virtual Keys, budget, RBAC, roteamento multi-provider) otimizando custo e latência.
  • Adaptação e serving de modelos — quando RAG e prompting não bastam, fazer fine-tuning supervisionado e PEFT (LoRA/QLoRA), quantização e destilação; servir modelos abertos/privados com vLLM e roteamento SLM↔LLM.
  • Governança e segurança — aplicar guardrails de PII (Presidio), defesa contra prompt injection e observabilidade ponta a ponta (Langfuse).

Requirements

What you’ll need
  • Experiência construindo aplicações de IA generativa em produção (agentes ou RAG).
  • Python e design de APIs (FastAPI/FastMCP).
  • Frameworks de agentes (LangGraph, LangChain) e function calling estruturado (Pydantic).
  • RAG e vector databases (Qdrant ou similares).
  • Gateways/roteamento de LLMs (LiteLLM) e o Model Context Protocol (MCP).
  • Fine-tuning e adaptação de modelos: PEFT (LoRA/QLoRA), quantização e serving (vLLM).
  • Autoria de skills e agentes para o Claude Code — central nesta posição.
  • Camadas semânticas (Cube.js) como fonte de recuperação determinística.
  • Fine-tuning avançado: instruction tuning, destilação, fine-tuning de embeddings e roteamento SLM↔LLM.
  • Guardrails de PII (Presidio) e defesa contra prompt injection.
  • Observabilidade e avaliação (Langfuse, LLM-as-judge, evals).
  • GraphRAG / Neo4j como evolução híbrida sob demanda.
  • Plataformas de automação (n8n) e integração com sistemas corporativos.

Benefits

Comp & perks
  • Trabalho Remoto
  • Tempo de Projeto: 6 meses, com possibilidade de extensão/internalização.

ATS Keywords

✓ Tailor your resume
Applicant Tracking System Keywords

Tip: use these terms in your resume and cover letter to boost ATS matches.

Hard Skills & Tools
PythonFastAPILangGraphLangChainPydanticQdrantLiteLLMPEFTLoRAvLLM