Tech Stack
AirflowAWSAzureDockerKerasKubernetesPySparkPythonPyTorchScikit-LearnSparkSQLTensorflow
About the role
- Conduzir análises exploratórias de dados (EDA) para descobrir padrões e insights relevantes.
- Desenvolver modelos preditivos utilizando bibliotecas como TensorFlow, Keras, Scikit-Learn e outras.
- Realizar experimentação e otimização de modelos, incluindo ajuste de hiperparâmetros e validação cruzada.
- Implementar técnicas de feature engineering para melhorar a performance dos modelos.
- Aplicar métodos de Processamento de Linguagem Natural (NLP) e Deep Learning em projetos relevantes.
- Trabalhar em colaboração com a equipe de engenharia de dados para garantir a integridade e acessibilidade dos dados.
- Criar visualizações de dados impactantes utilizando ferramentas como Power BI, Matplotlib e Seaborn.
- Desenvolver e manter pipelines de MLOps, incluindo CI/CD para modelos de Machine Learning.
- Integrar soluções com APIs e implementar chatbots quando necessário.
- Apresentar resultados e insights para stakeholders de forma clara e eficaz.
Requirements
- Proficiência em linguagens de programação como Python, SQL, SAS e PySpark.
- Experiência com bibliotecas de Machine Learning, incluindo TensorFlow, Keras, Scikit-Learn, Spark MLlib, XGBoost, PyTorch, LightGBM, CatBoost, Prophet e Statsmodels.
- Sólido entendimento de Data Science, incluindo Data Wrangling, processamento de grandes conjuntos de dados, estatística e testes de hipóteses.
- Conhecimento em engenharia de dados com ferramentas como Hive e Airflow.
- Experiência com sistemas de gerenciamento de banco de dados, preferencialmente SQL Server.
- Familiaridade com computação em nuvem, especialmente AWS e Azure, e com ferramentas como Databricks e Docker.
- Habilidade em MLOps e gerenciamento de pipelines de machine learning utilizando ferramentas como MLflow, Kubernetes e AWS SageMaker.