Descrição da empresa
Como é o dia a dia de #Cropwiser?
Nenhum dia é igual ao outro e a gente ama esse dinamismo. Aliamos um ambiente de startup com forte liberdade e autonomia com a solidez de uma empresa global líder de mercado. Por isso, se você quer protagonizar a evolução do agro, trabalhar em um time de alta performance e viver um ambiente que valoriza inovação e novas ideias, chega mais! Estávamos à sua espera.
E o desafio de ser Staff Engineer?
Estamos à procura de uma pessoa Staff Site Reliability Engineer (SRE) altamente qualificada e apaixonada por tecnologia para integrar nosso time global.
Nesta posição de liderança técnica, você será responsável por projetar, construir e otimizar sistemas distribuídos de grande escala, garantindo a confiabilidade, segurança e performance. Você terá a oportunidade de trabalhar de forma colaborativa com diversas equipes, liderando iniciativas de impacto para promover automação, desempenho e excelência operacional. Seu conhecimento técnico profundo, visão estratégica e habilidade de influenciar dentro da organização serão cruciais para resolver desafios complexos de confiabilidade e orientar equipes de engenharia na adoção das melhores práticas de SRE e DevOps.
Descrição da vaga
Bora traduzir em atividades?
- Projetará infraestruturas escaláveis e autônomas para suportar cargas de trabalho de alta demanda;
- Desenvolverá pipelines de CI/CD inovadores, garantindo entregas rápidas, seguras e eficientes;
- Liderará a adoção de infraestrutura como código (IaC) com Terraform, CloudFormation ou Ansible, estabelecendo melhores práticas em toda a organização;
- Definirá métricas de confiabilidade (SLOs, SLIs, SLAs) para maximizar a resiliência dos sistemas;
- Conduzirá post-mortems, promovendo aprendizados contínuos e implementando ações preventivas para incidentes;
- Arquiteturará soluções escaláveis e resilientes, preparando os sistemas para falhas e garantindo sua continuidade;
- Projetará soluções altamente disponíveis em nuvens como AWS, Azure ou Google Cloud.
- Criará plataformas de observabilidade integrando métricas, logs e rastreamento distribuído com ferramentas como Prometheus, Grafana, Datadog e ELK Stack;
- Trabalhará para otimizar custos de infraestrutura, mantendo um equilíbrio entre eficiência e performance;
- Atuará como mentor técnico, orientando pessoas engenheiras e times de desenvolvimento;
- Definirá as melhores práticas para resposta a incidentes e resiliência de sistemas, promovendo uma cultura de confiabilidade em toda a organização;
- Colaborará estreitamente com equipes multifuncionais, garantindo que as práticas de SRE sejam adotadas de maneira eficaz e integrada.
Qualificações
E o que você precisa ter pra fazer isso bem?
- Mais de 8 anos de experiência em SRE, DevOps ou Engenharia de Infraestrutura, com expertise em sistemas de grande escala e missão crítica;
- Experiência sólida na arquitetura, automação e escalabilidade de sistemas distribuídos na nuvem;
- Proficiência em Kubernetes (EKS, AKS, GKE) e orquestração de contêineres em ambientes corporativos;
- Experiência com automação de CI/CD usando ferramentas como GitHub Actions, GitLab CI, Jenkins ou ArgoCD;
- Expertise em infraestrutura como código (IaC) usando Terraform, CloudFormation ou Ansible;
- Habilidades avançadas em linguagens de programação como Python, Go ou Bash para automação e desenvolvimento de ferramentas;
- Conhecimento profundo em redes, balanceamento de carga, DNS e práticas de segurança;
- Experiência com ferramentas de monitoramento, rastreamento e logging para sistemas distribuídos;
- Experiência prática com respostas a incidentes, engenharia do caos e testes de falha controlados;
- Habilidade em liderar discussões técnicas, mentorando engenheiros e definindo padrões arquiteturais;
- Inglês avançado, capacitando o trabalho em um ambiente global.
Qualificações Desejáveis:
- Experiência em arquiteturas multi-cloud e híbridas;
- Certificações em AWS, Kubernetes (CKA, CKS) ou outras certificações relevantes para SRE/DevOps;
- Conhecimento em escalabilidade de bancos de dados (SQL, NoSQL, Redis, Memcached);
- Familiaridade com AIOps e soluções de observabilidade baseadas em aprendizado de máquina;
- Experiência com arquiteturas serverless e computação de borda;
- Capacidade de desenvolver e implementar estratégias SRE em larga escala;
- Diagnóstico e resolução de desafios técnicos complexos de forma eficaz;
- Trabalhar bem em ambientes multifuncionais, alinhando objetivos técnicos e de negócios;
- Exercer grande performance em ambientes dinâmicos e de alta criticidade;
- Traduzir conceitos técnicos complexos para públicos executivos e operacionais com clareza.
Informações adicionais
Além do ecossistema f#d@, o que você ganha com isso?
- Muita atenção à sua saúde física e mental, com plano de saúde, odontológico, acompanhamento psicológico, nutricional e Wellhub para você e seus dependentes;
- Cuidado para que você também tenha projetos incríveis fora do trabalho, com apoio para questões jurídicas e financeiras (EAP), auxílio creche e licença maternidade/paternidade estendida;
- Boost no seu desenvolvimento, via plataformas para desenvolvimento pessoal e técnico;
- Benefícios de mercado, mas que a gente adora, tipo seguro de vida, vale Alimentação/Refeição (Ifood);
- Ah, e claro, seu horário é flexível independente da modalidade de trabalho, e se você optar por trabalhar remotamente, temos benefício flexível ($$).