Especialista de Sistemas de TI (Site Reliability Engineer)

Light Brasil

Rio de Janeiro

BRL 80.000 - 120.000

Descrição da oferta de emprego

Estamos em busca de umEspecialista de Sistemas de TI que facilitará o desenvolvimento e implantação de iniciativas inovadoras dentro da Light, identificando oportunidades tecnológicas, colaborando com equipes para gerar ideias criativas, coordenar a pesquisa e o desenvolvimento de novas soluções, além de garantir a integração eficiente de tecnologias inovadoras nos processos existentes que garantam a entrega de valor.

A nossa empresa é feita por gente. Nós já fazemos parte do seu dia. Agora, queremos que você faça parte do nosso dia a dia.

Traga a sua energia para a Light!

Seus desafios serão:

Projetar, implementar e manter sistemas escaláveis, confiáveis e altamente disponíveis, garantindo o desempenho e a continuidade operacional dos serviços;
Desenvolver e gerenciar ferramentas de monitoramento e alertas para identificar proativamente problemas de infraestrutura e aplicações;
Implementar práticas de observabilidade, incluindo logging, tracing e métricas para suportar diagnósticos precisos e rápidos;
Automatizar tarefas operacionais, como deploys, gestão de infraestrutura e resposta a incidentes, utilizando ferramentas e scripts customizados;
Conduzir análises post-mortem para identificar a causa raiz de falhas e propor melhorias para evitar reincidências;
Trabalhar em colaboração com equipes de desenvolvimento para incorporar práticas de confiabilidade desde o início do ciclo de vida dos sistemas;
Garantir implementações seguras e eficientes, alinhadas com práticas DevSecOps, utilizando ferramentas como Jenkins, GitLab, ou Azure DevOps;
Projetar e implementar pipelines de CI/CD para entrega contínua e consistente de aplicações;
Otimizar o uso de infraestrutura em ambientes on-premises e cloud, promovendo práticas de FinOps e eficiência de custos;
Propor e implementar estratégias de recuperação de desastres e continuidade de negócios;
Conduzir avaliações de capacidade e planejamento para suportar o crescimento das aplicações;
Participar ativamente na definição e evolução de SLAs, SLOs e SLIs para os sistemas sob sua responsabilidade;
Garantir a conformidade com políticas internas de governança e regulamentações externas;
Atuar como ponto de contato técnico em situações de alta criticidade, oferecendo suporte para resolução rápida de incidentes.

O que é necessário você ter:

Ensino superior completo em TI, Engenharia ou áreas correlatas;
Diferencial: MBA ou pós-graduação relacionados a SRE, DevOps ou Cloud Computing;
Experiência avançada com administração de sistemas Linux e Windows;
Experiência com infraestrutura como código (IaC) utilizando ferramentas como Terraform, Ansible ou CloudFormation;
Proficiência em linguagens de script, como Python, Shell Script ou Go;
Experiência com orquestração de containers usando Kubernetes, OpenShift ou Docker Swarm;
Conhecimento em plataformas de monitoramento, como Prometheus, Grafana, ELK Stack ou Datadog;
Familiaridade com práticas de gerenciamento de configuração e automação;
Experiência em plataformas de nuvem (AWS, Azure, Google Cloud) e ferramentas nativas para gerenciar ambientes;
Conhecimento avançado em redes, segurança e balanceamento de carga;
Experiência em resposta a incidentes e gerenciamento de crises;
Habilidades analíticas e capacidade de resolução de problemas complexos;
Experiência com práticas ágeis e colaboração em times multidisciplinares;
Certificações em SRE, DevOps ou Cloud são diferenciais desejáveis;
Proatividade, senso de urgência e habilidade para gerenciar múltiplas prioridades.

O que temos para você:

Vale Alimentação;
Vale Refeição;
Assistência médica;
Assistência odontológica;
Participação nos Lucros ou Resultados;
Previdência privada;
Seguro de vida;
Convênio com empresas parceiras;
Programa de treinamentos.

Informações extras:

Local de Trabalho: Av Marechal Floriano, 168, Centro.