Site Reliability Engineer (SRE) (m/w/d)

Frankfurt am Main

Berufserfahren

Vollzeit

Site Reliability Engineer (SRE) (m/w/d)

ATLAS ist die Servicegesellschaft der Deutschen Vermögensberatung AG (DVAG). Bei uns arbeiten heißt, Vieles und Viele bewegen zu können – auf Projektebene und im zwischenmenschlichen Bereich. Gestaltungsfreiheiten dafür gibt es ohne Ende. Wer offen ist und neugierig bleibt, kann hier - im Herzen Frankfurts - Großes leisten. Wir handeln leistungsorientiert für unsere Vermögensberater und Kunden und helfen ihnen, ihre Ziele zu erreichen. Doch genauso unterstützen wir die Menschen, die bei uns arbeiten.

Als (Senior) Site ReliabilityEngineer (SRE) in der Abteilung IT Plattformübernehmen Sie eine entscheidende Rolle bei der Gewährleistung der nachhaltigen Betriebssicherheit unserer unternehmenskritischen Anwendungen. In dieser lateralen Führungsrolle arbeiten Sie eng mit den SREs in den Anwendungsentwicklungsteams zusammen, um Best Practices zu etablieren, die Zuverlässigkeit zu verbessern und operative Exzellenz zu fördern. Neben der strategischen Ausrichtung und dem Mentoring ist auch die operative Mitwirkung im Tagesgeschäft ein wichtiger Bestandteil Ihrer Aufgaben. Wir suchen eine Persönlichkeit mit ausgeprägter Hands-on-Mentalität, die bereit ist, sich aktiv in die Lösung komplexer Probleme einzubringen.

Ihre Aufgaben

Laterale Führung und Mentoring: Sie agieren als Mentor und Fachexperte für SRE-Themen innerhalb der IT-Organisation, insbesondere für die SREs in den Entwicklungsteams. Sie fördern den Wissensaustausch und die Weiterentwicklung der SRE-Kompetenzen.
Entwicklung und Implementierung von SRE-Strategien: In enger Zusammenarbeit mit den Entwicklungsteams und der IT Plattformdefinieren und implementieren Sie SRE-Prinzipien, Praktiken und Tools, um die Zuverlässigkeit, Performance und Effizienz unserer Anwendungen zu optimieren.
Definition und Überwachung von SLOs/SLAs: Sie unterstützen die Entwicklungsteams bei der Definition von Service Level Objectives(SLOs) und Service Level Agreements (SLAs) für kritische Anwendungen und etablieren Mechanismen zur kontinuierlichen Überwachung und Einhaltung.
IncidentManagement und Post-Mortem-Analysen: Sie wirken bei der Lösung von Incidentsmit und fördern eine Kultur der transparenten Post-Mortem-Analysen, um aus Vorfällen zu lernen und präventive Maßnahmen abzuleiten
Automatisierung und Infrastruktur als Code: Sie treiben die Automatisierung wiederkehrender operativer Aufgaben voran und fördern den Einsatz von Infrastructure asCode (IaC) Praktiken zur Verbesserung der Stabilität und Reproduzierbarkeit unserer Infrastruktur.
Etablierung von Monitoring und Alerting: Sie unterstützen bei der Konzeption und Implementierung von umfassenden Monitoring- und Alerting-Systemen, um Probleme frühzeitig zu erkennen und proaktiv zu handeln.
Operative Mitwirkung und Troubleshooting: Sie packen aktiv mit an, wenn es um die Behebung von Incidentsund die Durchführung von operativen Aufgaben geht. Die Analyse und das Troubleshooting komplexer Probleme in unserer Microservice-Architektur gehören ebenfalls zu Ihrem Verantwortungsbereich
Förderung einer DevOps-Kultur: Sie sind ein aktiver Verfechter der DevOps-Kultur und fördern die enge Zusammenarbeit und den Wissensaustausch zwischen Entwicklungs- und Betriebsteams

Ihr Profil

Abgeschlossenes Studium der Informatik, einer vergleichbaren Fachrichtung oder entsprechende Berufserfahrung.
Fundierte Erfahrung im Bereich Site ReliabilityEngineering (SRE) oder in einer vergleichbaren Rolle im operativen Umfeld komplexer IT-Systeme.
Erfahrung in der Zusammenarbeit mit agilen Entwicklungsteams und ein tiefes Verständnis für den Softwareentwicklungszyklus.
Erfahrung mit Automatisierungswerkzeugen und Scripting-Sprachen und der Nutzung von Monitoring- und Logging-Tools (OpenTelemetry).
Vertrautheit mit Cloud-Umgebungen (Azure) und Containerisierungstechnologien(Kubernetes) und Erfahrung mit modernen Microservice-Architekturen und deren spezifischen Herausforderungen im Betrieb.
Ausgeprägte analytische Fähigkeiten und eine strukturierte Herangehensweise bei der Problemlösung mit einer ausgeprägten Hands-on-Mentalität und die Bereitschaft, sich aktiv in operative Aufgaben und das Troubleshooting proaktiv einzubringen.
Hervorragende Kommunikations- und Kollaborationsfähigkeiten, um effektiv mit verschiedenen Teams und Stakeholdern zusammenzuarbeiten.

Ihre Benefits

Aufgabenvielfalt: Spannende Aufgaben, viel Raum für Eigeninitiative und ein hoher Stellenwert der persönlichen Weiterentwicklung zeichnen uns aus.
Vergütung: Unsere attraktiven Vergütungspakete honorieren Leistung.
Urlaub: Mitarbeitende genießen einen Jahresurlaub auf Basis von 30 Tagen (bei einer regulären 5-Tage-Woche) zzgl. 24. und 31.12..
Arbeitsplätze: Bei uns stehen moderne Arbeitsplätze bereit inklusive hochwertiger IT-Ausstattung.
Zusatzleistungen: Zusätzlich bieten wir eine Vielzahl von Zusatzleistungen, wie z.B. vergünstigtes Deutschlandticket, EGYM Wellpass, Jobrad, Gesundheitsbausteine, Betriebliche Altersversorge, Corporate Benefits und vieles mehr.
Homeoffice: Unsere Mitarbeitenden haben die Möglichkeit aus dem Homeoffice heraus zu arbeiten.
Verpflegung: Für die Mittagspause und den kleinen Hunger bietet unser Restaurant im Haus abwechslungsreiche Gerichte sowie freie Getränke und Kaffeebars in allen Stockwerken.
Lage: Unsere Präsenz im Herzen Frankfurts bietet hervorragende Anbindung mit Fahrrad, Bus und Bahn.

Wenn Sie sich in diesem Profil wiedererkennen, sollten wir uns kennenlernen.

Bitte geben Sie in Ihrer Bewerbung Ihre Gehaltsvorstellung sowie Ihren frühstmöglichen Eintrittstermin an.

Sie haben vor oder während Ihres Bewerbungsprozesses Fragen an unser Recruiting Team? Dann nehmen Sie gerne Kontakt auf mit Hagen Corvers.

Wir freuen uns auf Sie.

Noch Fragen?

Wir freuen uns, Sie kennenzulernen

Hagen Corvers

Recruiting Manager