Sobre a Empresa
Na Sourcing Trust, comprometemo-nos a fornecer soluções tecnológicas inovadoras, fiáveis e personalizadas que capacitam as empresas a prosperar num panorama digital em rápida evolução. Com foco na excelência, integridade e colaboração, construímos parcerias duradouras através da compreensão das necessidades únicas de cada cliente e da oferta de suporte especializado em todas as fases. A nossa equipa dedica-se a promover um ambiente de trabalho positivo e inclusivo, onde a contribuição de cada colaborador é valorizada, incentivando o crescimento contínuo, a aprendizagem e o sucesso partilhado. Junte-se a nós e faça parte de uma organização apaixonada, impulsionada pela inovação e pela excelência.
Sobre a Vaga
Procuramos um Consultor SRE Sénior com forte especialização em arquitetura para desenhar e liderar soluções de Site Reliability Engineering em ambientes cloud-native complexos. A função exige profundo conhecimento em arquitetura cloud, observability, Kubernetes e melhores práticas SRE para garantir fiabilidade, escalabilidade e performance da plataforma.
Requisitos
Requisitos
Licenciatura em Engenharia Informática ou qualificação equivalente.
Certificação AWS Certified Solutions Architect - Associate (obrigatória).
Pelo menos uma das seguintes certificações/formações:
Kubernetes - Getting Started com Google Kubernetes Engine (formação certificada)
AWS Certified Developer – Associate
AWS Certified Cloud Practitioner
AI - Certified AI Practitioner
Grafana Concept and Basic Configuration (formação certificada)
Monitoring Key Systems com Prometheus Exporters (formação certificada)
6+ anos de experiência em funções SRE, DevOps, Cloud Architecture ou Platform Engineering.
Experiência comprovada no desenho de arquiteturas cloud escaláveis e sistemas altamente disponíveis.
Experiência avançada em Kubernetes, Helm charts e plataformas de containers.
Forte experiência com stacks de observability: Grafana, Prometheus, distributed tracing.
Experiência na implementação de princípios SRE: SLOs/SLIs, error budgets, redução de toil, reliability engineering.
Domínio de Infrastructure as Code (Terraform, CloudFormation) e práticas GitOps.
Experiência com multi-cloud (AWS, GCP, Azure) e arquiteturas híbridas.
Sólidas competências de programação/scripting (Python, Go, Bash) para automação e tooling.
Experiência em liderar discussões de arquitetura técnica e mentoria de equipas de engenharia.
Responsabilidades Principais
Arquitetar plataformas SRE cloud-native com foco em escalabilidade, resiliência e observability.
Desenhar e implementar soluções compreensivas de observability usando stacks Grafana/Prometheus.
Definir e governar SLOs/SLIs, reliability budgets e objetivos de nível de serviço.
Liderar o desenho de plataformas Kubernetes e estratégias de orquestração de containers.
Impulsionar implementações de automação e GitOps para otimizar operações de plataforma.
Realizar architecture reviews, capacity planning e disaster recovery planning.
Fazer mentoria de engenheiros SRE e equipas de desenvolvimento em best practices de fiabilidade e cloud.
Colaborar com equipas de segurança, desenvolvimento e operações no design de sistemas e resposta a incidentes.
Preferenciais / Valorizados
Experiência com AIOps e soluções AI-driven observability.
Desenho avançado de dashboards e estratégias de alerting em Prometheus/Grafana.
Implementações de chaos engineering e testes de resiliência.
Experiência com arquiteturas service mesh (Istio, Linkerd).
Requisitos Linguísticos
Inglês fluente (escrito e falado).
