Deskripsi Pekerjaan
Kami mencari Site Reliability Engineer yang berpengalaman untuk bergabung dengan tim kami di Jakarta. Anda akan bertanggung jawab memastikan ketersediaan, keandalan, dan kinerja sistem kami. Ini adalah kesempatan untuk bekerja dengan teknologi terbaru dan berkontribusi pada infrastruktur yang mendukung jutaan pengguna.
Tanggung Jawab
- Memantau dan menjaga ketersediaan sistem 24/7
- Mengotomatiskan tugas operasional dan deployment
- Menganalisis dan menyelesaikan insiden secara cepat
- Mengoptimalkan kinerja dan skalabilitas infrastruktur
- Menerapkan praktik terbaik untuk keamanan dan keandalan
- Berkolaborasi dengan tim pengembangan untuk meningkatkan kualitas layanan
- Membuat dokumentasi teknis dan prosedur operasional
- Melakukan analisis akar masalah dan pencegahan insiden berulang
Kualifikasi
- Pengalaman minimal 3 tahun sebagai SRE atau DevOps Engineer
- Menguasai Linux, Docker, Kubernetes, dan CI/CD
- Pemahaman mendalam tentang jaringan dan keamanan
- Pengalaman dengan cloud platform (AWS, GCP, atau Azure)
- Kemampuan scripting dalam Python, Bash, atau Go
- Pengalaman dengan monitoring tools seperti Prometheus, Grafana, atau Datadog
- Kemampuan analisis dan pemecahan masalah yang kuat
- Kemampuan komunikasi yang baik dalam bahasa Inggris