Consultor SRE Senior

Lisboa, Portugal

Tipo de Vaga

Tempo Inteiro

Espaço de Trabalho

Regime Híbrido

Sobre a Empresa

Na Sourcing Trust, comprometemo-nos a fornecer soluções tecnológicas inovadoras, fiáveis e personalizadas que capacitam as empresas a prosperar num panorama digital em rápida evolução. Com foco na excelência, integridade e colaboração, construímos parcerias duradouras através da compreensão das necessidades únicas de cada cliente e da oferta de suporte especializado em todas as fases. A nossa equipa dedica-se a promover um ambiente de trabalho positivo e inclusivo, onde a contribuição de cada colaborador é valorizada, incentivando o crescimento contínuo, a aprendizagem e o sucesso partilhado. Junte-se a nós e faça parte de uma organização apaixonada, impulsionada pela inovação e pela excelência.

Sobre a Vaga

Procuramos um Consultor SRE Sénior com forte especialização em arquitetura para desenhar e liderar soluções de Site Reliability Engineering em ambientes cloud-native complexos. A função exige profundo conhecimento em arquitetura cloud, observability, Kubernetes e melhores práticas SRE para garantir fiabilidade, escalabilidade e performance da plataforma.

Requisitos

Requisitos

Licenciatura em Engenharia Informática ou qualificação equivalente.
Certificação AWS Certified Solutions Architect - Associate (obrigatória).
Pelo menos uma das seguintes certificações/formações:
- Kubernetes - Getting Started com Google Kubernetes Engine (formação certificada)
- AWS Certified Developer – Associate
- AWS Certified Cloud Practitioner
- AI - Certified AI Practitioner
- Grafana Concept and Basic Configuration (formação certificada)
- Monitoring Key Systems com Prometheus Exporters (formação certificada)
6+ anos de experiência em funções SRE, DevOps, Cloud Architecture ou Platform Engineering.
Experiência comprovada no desenho de arquiteturas cloud escaláveis e sistemas altamente disponíveis.
Experiência avançada em Kubernetes, Helm charts e plataformas de containers.
Forte experiência com stacks de observability: Grafana, Prometheus, distributed tracing.
Experiência na implementação de princípios SRE: SLOs/SLIs, error budgets, redução de toil, reliability engineering.
Domínio de Infrastructure as Code (Terraform, CloudFormation) e práticas GitOps.
Experiência com multi-cloud (AWS, GCP, Azure) e arquiteturas híbridas.
Sólidas competências de programação/scripting (Python, Go, Bash) para automação e tooling.
Experiência em liderar discussões de arquitetura técnica e mentoria de equipas de engenharia.

Responsabilidades Principais

Arquitetar plataformas SRE cloud-native com foco em escalabilidade, resiliência e observability.
Desenhar e implementar soluções compreensivas de observability usando stacks Grafana/Prometheus.
Definir e governar SLOs/SLIs, reliability budgets e objetivos de nível de serviço.
Liderar o desenho de plataformas Kubernetes e estratégias de orquestração de containers.
Impulsionar implementações de automação e GitOps para otimizar operações de plataforma.
Realizar architecture reviews, capacity planning e disaster recovery planning.
Fazer mentoria de engenheiros SRE e equipas de desenvolvimento em best practices de fiabilidade e cloud.
Colaborar com equipas de segurança, desenvolvimento e operações no design de sistemas e resposta a incidentes.

Preferenciais / Valorizados

Experiência com AIOps e soluções AI-driven observability.
Desenho avançado de dashboards e estratégias de alerting em Prometheus/Grafana.
Implementações de chaos engineering e testes de resiliência.
Experiência com arquiteturas service mesh (Istio, Linkerd).

Requisitos Linguísticos

Inglês fluente (escrito e falado).

Candidata-te Agora