Site Reliability Engineer (SRE) (Festanstellung) – Bangalore, Indien
Übersicht
Unser Kunde aus dem Finanzdienstleistungssektor stellt ein zwei festangestellte Site Reliability Engineers (SREs) in Bangalore um die Zuverlässigkeit, Skalierbarkeit, Beobachtbarkeit und operative Exzellenz der Plattform zu verbessern Wolke zuerst Serviceleistungen. Dies ist eine praxisorientierte Ingenieursrolle mit Schwerpunkt auf Produktionsstabilität, Automatisierung und kontinuierlicher Verbesserung in einem regulierten Umfeld.
Rollendetails
- Ort: Bangalore, Indien
- Beschäftigungsverhältnis: Festanstellung (2 Stellen)
- Arbeitsmodell: Vor Ort/Hybrid (abhängig von den Richtlinien des Kunden)
Key Responsibilities
- Besitzen und verbessern ServicezuverlässigkeitVerfügbarkeit, Latenz und Leistung auf kritischen Plattformen.
- Aufbauen und verbessern Überwachung, Alarmierung und Beobachtbarkeit (Metriken, Protokolle, Traces) zur Reduzierung der mittleren Reparaturzeit (MTTR) und zur Verhinderung eines erneuten Auftretens.
- Blei Vorfallreaktion und Nachuntersuchungen von Vorfällen (RCA), die zu dauerhaften Lösungen und Verbesserungen der Zuverlässigkeit führen.
- Automatisieren Sie operative Aufgaben und reduzieren Sie die Arbeitsbelastung durch Skripterstellung und Werkzeuge.
- Unterstützung und Verbesserung CI / CD-Pipelines und Release-Praktiken, um sichere und häufige Bereitstellungen zu ermöglichen.
- Zusammenarbeit mit den Engineering- und Infrastrukturteams zur Implementierung bewährter Verfahren zur Gewährleistung der Zuverlässigkeit (SLOs/SLIs, Fehlerbudgets, Kapazitätsplanung).
- Beteiligen Sie sich an Cloud-Architekturentscheidungen in den gesamten Bereichen AWS und Azuremit Fokus auf Resilienz und Kosten-Nutzen-Verhältnis.
- Sicherstellen, dass der Plattformbetrieb den in Finanzdienstleistungen typischen Sicherheits- und Compliance-Anforderungen entspricht.
Erforderliche Fähigkeiten und Erfahrungen
- Nachgewiesene Erfahrung als SRE / DevOps / Produktionsingenieur Unterstützung geschäftskritischer Systeme.
- Strong Cloud-Erfahrung mit AWS und Azure (praktische Arbeit in einem Produktionsumfeld).
- Solide Linux- und Netzwerk-Grundlagen (DNS, TLS, Lastverteilung, Routing-Konzepte).
- Erfahrungen mit Infrastruktur als Code (z. B. Terraform, CloudFormation, ARM/Bicep).
- Starke Automatisierungs-/Skripting-Kenntnisse (z. B. Python, Bash, PowerShell).
- Erfahrung mit Containern und Orchestrierung (z. B. Docker, Kubernetes).
- Erfahrung mit Observability-Tools (z. B. CloudWatch/Azure Monitor, Prometheus/Grafana, ELK/Splunk, Datadog/New Relic – eine beliebige relevante Kombination).
- Ich bin es gewohnt, in Bereitschaftsdiensten und im Support-Team zu arbeiten und größere Zwischenfälle ruhig und methodisch zu bewältigen.
Schön zu haben
- Erfahrung in Finanzdienstleistungen oder anderen regulierten Umgebungen.
- Fundiertes Verständnis von SRE-Praktiken: SLO/SLIFehlerbudgets, Kapazitätsplanung, Chaostests, Zuverlässigkeitstechnikmuster.
- Erfahrung mit Service Mesh, API-Gateways oder verteiltem Tracing in Microservices-Umgebungen.
- Kenntnisse der Sicherheitsgrundlagen in Cloud-Umgebungen (IAM, Geheimnismanagement, Härtung).
