Deskripsi Pekerjaan
Bergabunglah dengan tim kami sebagai Reliability Engineer di Jakarta! Kami mencari profesional berpengalaman yang siap mengoptimalkan kinerja sistem dan memastikan ketersediaan layanan yang tinggi untuk klien kami. Dengan lingkungan kerja yang inovatif dan tim yang berdedikasi, ini adalah kesempatan ideal untuk membangun karir di bidang keandalan sistem.
Tanggung Jawab
- Mengembangkan dan mengimplementasikan strategi keandalan untuk sistem infrastruktur IT.
- Memantau kinerja sistem secara real-time dan mengidentifikasi potensi risiko.
- Membuat dan menjalankan rencana pemulihan bencana (DRP) dan prosedur mitigasi.
- Mengoptimalkan kinerja sistem dengan menggunakan alat monitoring dan analisis.
- Mengelola dan mengkoordinasikan tim operasional untuk memastikan uptime yang tinggi.
- Menyediakan dukungan teknis untuk tim pengembangan dan operasional.
- Mengikuti perkembangan terbaru dalam teknologi keandalan sistem.
- Melaporkan dan menganalisis metrik keandalan secara berkala.
Kualifikasi
- S1/S2 Teknik Komputer, Teknik Elektro, atau bidang terkait.
- Minimal 3 tahun pengalaman sebagai Reliability Engineer atau peran terkait.
- Pengalaman dengan sistem monitoring (Prometheus, Grafana, Nagios).
- Familiaritas dengan konsep SLA, SLO, dan error budget.
- Kemampuan analisis masalah yang kuat dan pemecahan masalah.
- Pengalaman dengan cloud computing (AWS, GCP, Azure) adalah plus.
- Bahasa Inggris tingkat menengah (baca, tulis, bicara).
- Sertifikasi seperti Certified Reliability Engineer (CRE) adalah nilai tambah.