Shopware ist ein führendes E-Commerce-System, das es Unternehmen weltweit ermöglicht, im digitalen Handel schnell und effizient zu skalieren. Als zukunftsweisende Open-Source-Lösung wird Shopware bereits von einigen der größten europäischen Marken, Einzelhändlern und Herstellern im B2C- und B2B-Bereich eingesetzt.
Wir suchen einen Site Reliability Engineer (SRE) (m/w/d) mit umfassender Erfahrung in Go (Golang) und Platform-as-a-Service (PaaS)-Umgebungen. Du bist verantwortlich für die Skalierbarkeit, Zuverlässigkeit und Performance unserer cloudbasierten Produkte und Infrastruktur, während du Arbeitsabläufe automatisierst und die Systemeffizienz optimierst. Deine Expertise in verteilten Systemen, Cloud-Plattformen und Observability-Tools wird uns dabei helfen, eine hohe Verfügbarkeit und nahtlose Deployments für unsere Anwendungen sicherzustellen.
Egal von wo aus du arbeitest, du bist ein fester Bestandteil des Teams. Daher suchen wir europaweit nach einem Site Reliability Engineer(m/w/d)!
Du designst, implementierst und wartest skalierbare, resiliente und sichere PaaS-Lösungen.
Du entwickelst zuverlässige Automatisierungsskripte mit Go, um Deployment, Monitoring und Incident Response zu optimieren.
Du stellst durch proaktives Monitoring und Alarming eine hohe Verfügbarkeit und Performance der Services sicher.
Du analysierst und behebst komplexe Infrastrukturprobleme und führst Root-Cause-Analysen durch.
Du baust und optimierst CI/CD-Pipelines für automatisiertes Testing und Deployments.
Du arbeitest eng mit Entwicklungsteams zusammen, um die Service-Zuverlässigkeit zu verbessern und die Developer Experience zu optimieren.
Du implementierst Observability-Tools (Logs, Metriken, Traces), um bessere Einblicke in das System zu erhalten.
Du nimmst an On-Call-Rotationen teil, um schnell auf Vorfälle zu reagieren und Ausfallzeiten zu minimieren.
Du setzt dich für Best Practices in den Bereichen Site Reliability, Security und DevOps-Methodologien ein.
Du bist erfahren in Go (Golang) und hast Kenntnisse in der Entwicklung skalierbarer und wartbarer Codebasen.
Du hast fundiertes Wissen über Container-Technologien und Container-Orchestrierung (Containerd, Kubernetes) sowie über Cloud-Plattformen (idealerweise AWS, GCP, Azure).
Du hast Erfahrung mit Infrastructure-as-Code (IaC)-Tools wie Terraform.
Du bist vertraut mit Monitoring- und Logging-Lösungen wie Prometheus, Grafana, ELK, OpenTelemetry und Datadog.
Du hast praktische Erfahrung mit CI/CD-Tools wie ArgoCD und GitHub Actions.
Du bist versiert in der Fehleranalyse und Problemlösung bei verteilten Systemen und netzwerkbezogenen Problemen.
Du kennst die bewährten Sicherheitspraktiken in Cloud-Umgebungen.
Du besitzt ausgezeichnete Problemlösungsfähigkeiten und fühlst dich in einem schnelllebigen, kollaborativen Umfeld wohl.
Du hast Erfahrung im Incident Management und in der Durchführung von Post-Mortem-Analysen.
Unternehmenskultur: Offene Kultur, flache Hierarchien, Eigeninitiative wird gefördert.
Arbeitsverträge: Unbefristete Anstellungen bieten langfristige Sicherheit.
Flexibilität: Flexible Arbeitszeiten und Optionen für mobiles Arbeiten und Full-Remote-Verträge.
Ausstattung: Freie Wahl der Arbeits-Hardware.
Onboarding: Gut strukturiertes Onboarding mit Unterstützung durch einen persönlichen "Buddy".
Arbeitsumfeld: Inspirierendes Umfeld mit engagierten Kollegen und einer dynamischen Gemeinschaft.
Entwicklungsmöglichkeiten: Vielfältige Chancen für persönliches Wachstum und Entwicklung.
Zusatzleistungen: Attraktive Benefits wie betriebliche Altersvorsorge, Gesundheitsprogramme und regelmäßige Teamevents.
... und vieles mehr!
Einen detaillierten Einblick bekommst du auf unserer Karriereseite.
Deine Ansprechperson für diese Stelle ist Carmen Bouraine und steht dir bei Fragen gerne zur Verfügung!