Pular para o conteúdo principal

Site Reliability Engineer (SRE)

Descrição da vaga

Que tal impactar vidas fazendo parte de uma empresa que impulsiona soluções inovadoras e o avanço tecnológico no Brasil? 🌎


Se você compartilha desse propósito, confira a nossa oportunidade e venha com a gente: #ComeWithUs #BeAttus!

 

Mas antes de tudo, um ponto muito importante. 

 

Reconhecida pelo GPTW como uma das melhores empresas para se trabalhar, a Attus leva às Procuradorias de Estados e Municípios soluções inteligentes para a gestão de processos judiciais e consultivos.


Sobre a vaga_ 

Somos uma empresa de tecnologia com a missão de revolucionar a advocacia pública com soluções inovadoras que otimizam processos e potencializam resultados, e a visão de ser a solução líder do setor. Buscamos um(a) Site Reliability Engineer (SRE) para garantir a confiabilidade, disponibilidade e performance dos nossos sistemas críticos.

Procuramos um(a) profissional com autonomia para estabelecer e evoluir as práticas de confiabilidade da empresa — de observabilidade e SLOs à resposta a incidentes e automação — tratando a operação como engenharia. Mais do que reagir a problemas, esperamos alguém que defina padrões, antecipe falhas e reduza o trabalho manual com automação e Inteligência Artificial.

 

Essa vaga é a sua cara?

Responsabilidades e atribuições

Nessa vaga, você irá... 


➡ Definir e acompanhar indicadores de confiabilidade (SLI, SLO, SLA) e operar com base em Error Budget;

➡ Estabelecer estratégias de alta disponibilidade, resiliência e disaster recovery (RTO/RPO);

➡ Conduzir capacity planning e análise de performance dos serviços;

➡ Atuar na confiabilidade e performance de aplicações em Kubernetes;

➡ Estruturar e evoluir a observabilidade dos sistemas (logs, métricas, traces e alertas);

➡ Criar dashboards e alertas com foco em visibilidade e ação, reduzindo ruído e falsos positivos;

➡ Detectar problemas antes do cliente, instrumentando os serviços;

➡ Estabelecer e conduzir o processo de resposta a incidentes (classificação, severidade, on-call);

➡ Liderar ou apoiar troubleshooting de aplicações e ambientes distribuídos;

➡ Conduzir análise de causa raiz (RCA) e post-mortems, propondo prevenção;

➡ Desenvolver e manter runbooks operacionais;

➡ Automatizar tarefas operacionais e respostas a incidentes (self-healing), eliminando trabalho manual repetitivo;

➡ Utilizar IA para análise de logs, detecção de anomalias, troubleshooting e otimização (AIOps);

➡ Buscar continuamente "automatizar antes de repetir", evoluindo a maturidade operacional;

➡ Trabalhar junto a desenvolvimento e plataforma na melhoria contínua da confiabilidade;

➡ Disseminar a cultura de confiabilidade e boas práticas entre as equipes;

➡ Aplicar boas práticas de segurança em ambientes produtivos (segredos, acessos, segregação);

➡ Garantir rastreabilidade (logs, auditoria e eventos);

➡ Apoiar conformidade com padrões como ISO 27001 e práticas de DevSecOps;

➡ Integrar confiabilidade e segurança (Security by Design).


Faz sentido para você? Vamos ver o que não pode faltar para você vir para esse time! 

Requisitos e qualificações

Os requisitos técnicos e comportamentais para esta vaga são: 

 

Técnico_

➡ Experiência ou conhecimento em observabilidade (Grafana, Prometheus, Elastic, Dynatrace ou similares)

➡ Experiência ou conhecimento em Kubernetes e containers (Docker)

➡ Conhecimento em Linux e redes (HTTP, DNS, TLS/SSL)

➡ Conhecimento em scripts e automação (Shell, Python ou similares)

➡ Capacidade analítica e foco em resolução de problemas

➡ Uso de IA no dia a dia e mentalidade de automação ("automatizar antes de repetir")

➡ Perfil organizado, autônomo e com boa comunicação técnica sólida como Desenvolvedor Full Stack em nível pleno/sênior, com projetos em produção;

 

Comportamental_

➡ Facilidade de aprendizado;

➡ Busca do aprendizado constante;

➡ Empatia com a lógica do cliente;

➡ Foco na melhor experiência para o cliente;

➡ Colaboração, saber oferecer e pedir ajuda;

Boa capacidade de comunicação para interagir com diferentes áreas;

➡ Proatividade e organização;

➡ Alinhamento com nossos valores: Honestidade e Ética, Excelência e Cuidado com as Entregas, Reconhecimento, Respeito e Educação.

 

É um grande diferencial se você tem..

➡ Experiência com SLI, SLO e Error Budget

➡ Experiência com troubleshooting de sistemas distribuídos

➡ Experiência com ambientes críticos e alta disponibilidade

➡ Experiência com ferramentas APM (Dynatrace, Datadog)

➡ Conhecimento em OpenTelemetry e instrumentação

➡ Conhecimento em Kafka, Elasticsearch ou Redis

➡ Experiência com automação de incidentes (self-healing) e IaC (Terraform, Ansible)

➡ Conhecimento em Chaos Engineering e Service Mesh

➡ Experiência com IA aplicada à operação (AIOps, copilots técnicos)

➡ Vivência em ambientes regulados (governo, jurídico ou financeiro)


Se identificou? Candidate-se para a oportunidade e venha potencializar você também! 🤩

 

Informações adicionais

Por último, mas não menos importante! Confira nossos, (seussss possíveis) benefícios... 🥁 

 

🩺 Saúde e Bem-Estar

🏆Plano de saúde: Cuidado completo com sua saúde.

🏆Seguro de vida: Segurança e tranquilidade para você e sua família.

🏆Parcerias com descontos: Acesso a farmácias, nutricionistas e psicólogos com condições especiais.

🏆App de bem-estar (Clude): Incentivo à prática de atividades físicas e ao bem-estar.

🏆Total Pass: Tenha acesso a uma ampla rede de academias mais próximas a você.

🏆Ginástica Laboral: Pausas ativas para cuidar do corpo durante o trabalho.


💰 Benefícios Financeiros e Auxílios

🏆Vale-alimentação: Para a modalidade de contrato CLT.

🏆Cartão Caju: Com presente especial no mês do seu aniversário.

🏆Auxílio home office: Suporte para montar um ambiente de trabalho confortável e produtivo.

🏆Auxílio-educação: Incentivo para seu desenvolvimento acadêmico e profissional.

🏆Auxílio-leitura: Estímulo para você expandir seus conhecimentos.


🚀 Desenvolvimento e Carreira

🏆Desenvolvimento contínuo: Programas e ações para impulsionar sua carreira.

🏆Programa de Inovação: Espaço para você trazer suas ideias e fazer a diferença.

🏆Dual Screen: Ferramentas adequadas para uma melhor produtividade.


🧘‍♀️ Flexibilidade e Qualidade de Vida

🏆Vaga 100% remota: Trabalhe de onde você se sentir melhor.

🏆FreeDay

🏆Momento Off: Incentivamos pausas para desconexão e descanso.

🏆Folga na sua formatura: Celebramos suas conquistas com você.

🏆Presente para novos filhos dos colaboradores: Um mimo para celebrar a chegada do novo membro da família.

🏆Presente de retorno da licença paternal: Um apoio na volta dessa fase importante.


🌱 Cultura e Engajamento

🏆Ambiente fraterno e colaborativo: Um time que se ajuda e cresce junto.

🏆Kit de boas-vindas ecológico: Comece sua jornada conosco de forma sustentável.

🏆Cultura sustentável: Com ações práticas como o incentivo à compostagem.

🏆Lives Virtuais de Confraternização: Momentos para celebrar e conectar com a equipe.

🏆Campanhas perenes: Ações de engajamento que acontecem o ano todo.

Etapas do processo

  1. Etapa 1: Cadastro
  2. Etapa 2: Mapeamento Comportamental 🧘
  3. Etapa 3: Vídeo apresentação 📹
  4. Etapa 4: Teste técnico para Site Reliability Engineer (SRE)
  5. Etapa 5: Bate papo Cultural
  6. Etapa 6: Bate papo Técnico
  7. Etapa 7: Entrevista 🎉
  8. Etapa 8: Contratação

Sobre a Attus Procuradoria Digital

A Attus, empresa integrante do Grupo Eloware, possui uma solução de procuradoria digital com inteligência artificial para gestão da execução fiscal, cobrança extrajudicial, contencioso judicial e consultivo.


Reunindo expertise, inovação e tecnologia, Attus simplifica as atividades dos procuradores de forma segura, potencializa sua produtividade e incrementa os resultados da procuradoria.


Inserida em uma forte cultura de inovação e humanização, a empresa foi certificada como um ótimo lugar para se trabalhar pela Great Place to Work (GPTW). Em 2025 atingimos a expressiva pontuação de 90% de confiança, reforçando nosso cuidado e zelo com nosso time de colaboradores.


Venha fazer parte da equipe Attus! 🚀