
Cientista de Dados
Attus Procuradoria Digital
full-time
Posted on:
Location Type: Remote
Location: Brasil
Visit company websiteExplore more
About the role
- Desenvolver modelos de classificação e regressão para previsão de: probabilidade de êxito, tipo de sentença, comportamento do processo ao longo da tramitação;
- Criar e testar diferentes abordagens: modelos clássicos (Logistic Regression, XGBoost, Random Forest), modelos baseados em NLP, embeddings, Transformers e modelos híbridos (estatística + semântica textual);
- Analisar petições iniciais e outras peças para extrair: entidades jurídicas (NER), emas, fundamentos, pedidos e características relevantes, similaridades entre processos;
- Criar features semânticas e estruturadas para alimentar os modelos;
- Atualizar-se em metodologias e algoritmos de vanguarda para otimizar acurácia e demais métricas relevantes, no contexto de predição de sentenças jurídicas;
- Realizar análises exploratórias profundas (EDA) de dados jurídicos fornecidos pelo sistema;
- Testar diferentes estruturas de dados para melhorar performance dos modelos;
- Construção de provas de conceito (POCs) com LLMs voltadas para: sumarização de peças, andamentos e decisões; geração assistida de textos jurídicos (minutas, pareceres preliminares etc.); apoio aos procuradores com agentes especializados;
- Trabalhar com RAG (Retrieval-Augmented Generation) conectado a bases jurídicas; semantic Search para captura de entendimento jurídico; ajuste fino (fine-tuning) ou instrução de modelos generativos para tarefas específicas e benchmarking de modelos abertos e proprietários;
- Validar modelos usando métricas robustas (AUC, F1, KS etc.);
- Aplicar técnicas de explicabilidade/representatividade das variáveis decisoras;
- Gerar relatórios técnicos explicando: metodologia, interpretação dos resultados, relevância das variáveis, limitações e próximos passos, documentar versões, experimentos e procedimentos de treinamento;
- Especificar requisitos técnicos para integração dos modelos;
- Entregar artefatos e orientações técnicas sobre input/output dos modelos;
Requirements
- Experiência sólida em Machine Learning aplicado a texto (NLP);
- Proficiência em Python e bibliotecas: Scikit-learn, pandas, numpy, TensorFlow ou PyTorch, HuggingFace Transformers;
- Conhecimento em tópicos de NLP: Tokenização, embeddings, vetorização, modelos semânticos;
- Conhecimento prático com LLMs e IA Generativa, incluindo: RAG, Embeddings vetoriais, Ajuste/afinamento ou adaptação de LLMs e Aplicações com modelos GPT-like;
- SQL (preferencialmente PostgreSQL);
- Facilidade de aprendizado;
- Empatia com a lógica do cliente;
- Foco na melhor experiência para o cliente;
- Busca do aprendizado constante;
- Colaboração, saber oferecer e pedir ajuda;
- Ética, para nós é inegociável;
- Curioso(a), experimental e orientado(a) a pesquisa aplicada;
- Consegue decompor problemas jurídicos complexos em soluções de IA;
- Excelente comunicação com equipes técnicas e jurídicas;
- Proatividade, autonomia e pensamento estruturado.
Benefits
- Vaga 100% remota.
- Kit boas-vindas ecológico.
- Empresa cultura sustentável.
- Campanhas perenes.
- Incentivo a compostagem.
- Plano de saúde.
- Seguro de vida.
- Ambiente fraterno e colaborativo.
- Ginástica Laboral.
- FreeDay.
- Auxilio-Leitura.
- Vale-alimentação.
- Cartão Caju presente + bate papo dos aniversariantes.
- Lives Virtuais de Confraternização.
- Momento Off.
- Desenvolvimento contínuo.
- Programa de Inovação.
- Auxílio-educação.
- Dual Screen.
- Parcerios descontos (farmácias/nutricionistas e psicólogos).
- App de bem-estar Clude.
- Totalpass.
- Auxílio home office.
- Folga na formatura.
- Presente para novos filhos dos colaboradores.
- Presente retorno licença paternal.
Applicant Tracking System Keywords
Tip: use these terms in your resume and cover letter to boost ATS matches.
Hard Skills & Tools
Machine LearningNLPPythonScikit-learnpandasnumpyTensorFlowPyTorchHuggingFace TransformersSQL
Soft Skills
facilidade de aprendizadoempatiafoco na experiência do clientecolaboraçãoéticacuriosidadepensamento estruturadoproatividadeautonomiacomunicação