Cientista de Dados (Data Scientist)

Descrição do cargo

A Lett atua no setor de Trade Marketing Digital, fornecendo soluções para aproximar e integrar grandes marcas e varejistas para criar uma jornada de compras perfeita.

Nossas soluções se enquadram para todas as categorias que comercializa produtos através de e-commerce. Atualmente, temos no nosso portfólio de clientes grandes indústrias de 7 países da América Latina, como a Nestlé, Mondelez, Ambev e Whirlpool, além de parcerias com mais de 300 varejistas, como Pão de Açúcar, Magazine Luiza, Super Nosso e Araújo.

Temos em nossa stack as tecnologias mais modernas para o desenvolvimento de sistemas escaláveis e distribuídos, dentre elas, infraestrutura em nuvem na AWS, Docker, microsserviços e arquitetura serverless, integração contínua utilizando Jenkins CI, sistemas desenvolvidos em Python, Go, Java, Node.JS, Vue.JS e muito mais.


Alguns dos desafios do nosso Squad de Ciência de Dados são:

  • Modelar, gerenciar e compreender dados em diferentes fontes e destinos com paradigmas diversos de aquisição e armazenamento (bancos de dados, relatórios, APIs).
  • Escalar código utilizando técnicas de paralelismo/concorrência e computação distribuída na nuvem.
  • Planejar, priorizar e executar experimentos para justificar a aplicação de modelos, bibliotecas e técnicas de aprendizado de máquina e de processamento no geral.
  • Estimar quantidade de recursos e prazos de entrega para experimentos.
  • Propor soluções baseadas em experimentos e pesquisa; e manter comunicação técnica e não-técnica com outras equipes.
  • Atualizar-se sobre os modelos de negócios e arquiteturas existentes na Lett para identificar possíveis pontos de melhoria e análises relevantes.

Requisitos

O que nós esperamos de você?

  • Curiosidade e flexibilidade! Ciência de dados é sobre soluções novas e construção de ferramentas. Esperamos que você não tenha medo de aprender coisas novas.
  • Conhecimento de estruturas de dados e complexidade! Processamos quantidades massivas de dados. Compreender complexidade de código, como funcionam estruturas de dados e como operá-las é essencial!
  • Estatística e álgebra linear em dia! É necessário conhecer bem sobre o processo de experimentação, saber expressar resultados com métricas que fazem sentido e compreender os parâmetros que os modelos diversos requerem para cada problema.
  • Experiência em serviços de nuvem! Experiência comprovada em utilizar serviços de nuvem. É necessário entender ambientes de computação na nuvem, saber se virar em sistemas unix e navegar em plataformas de nuvem.
  • Bibliotecas e ferramentas de ML e dados! Pandas, SKlearn, Scipy e Numpy são são essenciais. Conhecer outras ferramentas para análise, processamento e visualização de dados locais e em nuvem é um bônus.
  • SQL e NoSQL! A sua experiência com manipulação de dados nos bancos acelera o processo de desenvolvimento e diminui a dependência de outras equipes!
  • Python! Você precisa estar confortável com a linguagem base; módulos; threads e processos; e ambientes virtuais.
  • Keras/TF! (ou pyTorch ou mxNet)! Redes neurais são uma ferramenta computacional indispensável. Você precisa entender sobre tipos de arquitetura de redes neurais diferentes (CNNs, RNNs, LSTMs, MLPs…), sobre viés de dados e sampling, sobre o processo de treinamento e validação, sobre funções de loss e métricas, sobre processamento em GPU; e principalmente sobre saber se não tem uma ferramenta estatística/computacional mais simples pra testar antes!
  • Extração de features e pré processamento! Nenhum modelo faz mágica sozinho! É indispensável compreender a natureza dos dados de entrada, lidar com ruído e pré processar para extrair features mais compreensivas.
  • Aprendizado não supervisionado! Métodos de mineração, clusterização e descoberta de dados. Temos muitas oportunidades de análises em dados não rotulados!
  • English (Intermediate or advanced)! Most articles and resources for ML are published in english; and pretty much every tool’s reference and documentation as well. Text comprehension is a must!

Você ganha pontos extras se tiver:

  • Experiência com classificação de imagens ou NLP no geral.
  • Experiência com dados de e-commerce no geral.
  • Experiência com ferramentas de fluxos de dados e orquestração.
  • Experiência com serviços da AWS, especialmente EC2, S3, Lambda e SageMaker.
  • Artigo ou conteúdo público sobre data science.
  • Repositórios públicos com coisas legais!
  • Docker!
  • PostgreSQL!
  • ElasticSearch!
  • Certificação formal ( Mestrado/Doutorado na área ) é um bônus!

O que nós oferecemos:

  • Salário compatível com o Mercado
  • Vale refeição/alimentação
  • Vale transporte
  • Plano de saúde
  • Horários flexíveis
  • Um ambiente desafiador e que incentiva o aprendizado constante e muita interação entre nossos colaboradores
  • Acesso a mais de 7000 cursos online através do Pluralsight
  • Podemos considerar trabalho 100% remoto