Belajar Kubernetes - Pengenalan dan Penjelasan Probe

#Pendahuluan

Di episode sebelumnya kita sudah belajar tentang berbagai metode untuk menghapus Pod di Kubernetes. Selanjutnya di episode 10 kali ini, kita akan coba bahas konsep penting untuk memastikan kesehatan dan ketersediaan aplikasi yaitu Probe.

Catatan: Disini saya akan menggunakan Kubernetes Cluster yang di install melalui K3s.

Probe adalah health check yang Kubernetes gunakan untuk menentukan apakah aplikasi kalian berjalan dengan benar. Mereka membantu Kubernetes membuat keputusan intelligent tentang kapan restart container, kapan mengirim traffic ke Pod, dan kapan aplikasi siap menerima request. Memahami Probe sangat penting untuk membangun aplikasi yang resilient dan highly available di Kubernetes.

#Apa Itu Probe?

Probe adalah diagnostic check yang Kubernetes lakukan pada container untuk menentukan status kesehatan mereka. Bayangkan Probe seperti dokter yang memeriksa vital sign kalian - mereka secara periodik memeriksa apakah aplikasi kalian sehat dan berfungsi dengan benar.

Kubernetes menyediakan tiga tipe Probe:

Liveness Probe - Memeriksa apakah container hidup dan berjalan
Readiness Probe - Memeriksa apakah container siap menerima traffic
Startup Probe - Memeriksa apakah aplikasi sudah berhasil start

Setiap tipe Probe memiliki tujuan berbeda dan membantu Kubernetes mengelola application lifecycle kalian secara efektif.

#Kenapa Kita Butuh Probe?

Tanpa Probe, Kubernetes tidak punya cara untuk mengetahui apakah aplikasi kalian benar-benar bekerja dengan benar. Container mungkin berjalan, tapi aplikasi di dalamnya bisa:

Deadlock - Process berjalan tapi tidak merespons
Crash - Aplikasi crash tapi container masih berjalan
Overload - Aplikasi terlalu sibuk untuk handle request baru
Starting up - Aplikasi masih initialize dan belum siap

Probe membantu Kubernetes mendeteksi situasi ini dan mengambil tindakan yang tepat:

Restart unhealthy container - Otomatis recover dari failure
Menghapus unhealthy Pod dari load balancing - Mencegah pengiriman traffic ke Pod yang rusak
Menunggu slow-starting application - Memberi aplikasi waktu untuk initialize

#Tipe-Tipe Probe

List Probe

Mari kita explore setiap tipe Probe secara detail:

#Liveness Probe

Liveness Probe menentukan apakah container berjalan dengan benar. Jika Liveness Probe gagal, Kubernetes akan kill container dan restart sesuai dengan restart policy Pod.

Use case untuk Liveness Probe:

Mendeteksi deadlock aplikasi
Recover dari application crash
Restart container yang ada di broken state
Handle memory leak dengan restart container secara periodik

Contoh skenario: Aplikasi kalian punya memory leak dan menjadi unresponsive setelah berjalan beberapa waktu. Liveness Probe bisa mendeteksi ini dan restart container secara otomatis.

#Readiness Probe

Readiness Probe menentukan apakah container siap menerima traffic. Jika Readiness Probe gagal, Kubernetes akan menghapus Pod dari Service endpoint, mencegah traffic dikirim ke Pod tersebut.

Use case untuk Readiness Probe:

Menunggu dependency tersedia (database, cache, dll)
Temporarily menghapus overload Pod dari load balancing
Mencegah traffic selama application update atau maintenance
Handle graceful shutdown scenario

Contoh skenario: Aplikasi kalian perlu connect ke database sebelum bisa serve request. Readiness Probe memastikan traffic hanya dikirim setelah database connection established.

Perbedaan kunci dari Liveness Probe: Readiness Probe failure tidak restart container - mereka hanya stop mengirim traffic ke container tersebut.

#Startup Probe

Startup Probe digunakan untuk container yang membutuhkan waktu lama untuk start. Probe ini disable Liveness dan Readiness Probe sampai aplikasi berhasil start.

Use case untuk Startup Probe:

Aplikasi dengan slow initialization
Legacy aplikasi yang butuh waktu untuk start
Aplikasi yang perlu load dataset besar saat startup
Mencegah premature restart selama initialization

Contoh skenario: Aplikasi kalian perlu load dataset 5GB ke memory saat startup, yang membutuhkan 2 menit. Startup Probe memberi waktu untuk initialize tanpa di-kill oleh Liveness Probe.

#Mekanisme Probe

Kubernetes support tiga mekanisme untuk melakukan Probe:

#HTTP GET Request

Kubernetes mengirim HTTP GET request ke path dan port yang di-specify. Probe succeed jika response status code antara 200 dan 399.

Terbaik untuk: Web aplikasi, REST API, HTTP service

#TCP Socket

Kubernetes mencoba membuka TCP connection ke port yang di-specify. Probe succeed jika connection established.

Terbaik untuk: Database, TCP service, aplikasi tanpa HTTP endpoint

#Exec Command

Kubernetes execute command di dalam container. Probe succeed jika command exit dengan status code 0.

Terbaik untuk: Custom health check, file-based check, complex validation logic

#Parameter Konfigurasi Probe

Semua Probe support parameter konfigurasi ini:

#initialDelaySeconds

Waktu tunggu sebelum melakukan Probe pertama setelah container start.

Default: 0 detik

#periodSeconds

Seberapa sering melakukan Probe.

Default: 10 detik

#timeoutSeconds

Berapa lama menunggu Probe complete sebelum dianggap gagal.

Default: 1 detik

#successThreshold

Minimum consecutive success agar Probe dianggap successful setelah failure.

Default: 1 (harus 1 untuk Liveness dan Startup Probe)

#failureThreshold

Jumlah consecutive failure sebelum mengambil tindakan (restart container atau remove dari Service).

Default: 3

#Contoh Praktis

Mari kita buat contoh praktis untuk setiap tipe Probe:

#Contoh 1: HTTP Liveness Probe

Buat Pod dengan HTTP Liveness Probe:

Apply konfigurasi:

Verifikasi Pod berjalan:

Cek status Probe:

Kalian akan melihat event yang menunjukkan Liveness Probe bekerja:

#Contoh 2: Simulasi Liveness Probe Failure

Mari kita buat Pod yang akan fail Liveness Probe:

Pod ini:

Membuat file /tmp/healthy
Sleep selama 30 detik
Menghapus file /tmp/healthy
Liveness Probe akan fail setelah file dihapus
Kubernetes akan restart container

Apply dan watch:

Setelah sekitar 30 detik, kalian akan melihat container restart:

Cek event:

Kalian akan melihat event yang menunjukkan Liveness Probe gagal dan container di-restart:

#Contoh 3: Readiness Probe

Buat Pod dengan Liveness dan Readiness Probe:

Buat Service untuk melihat bagaimana Readiness Probe mempengaruhi traffic:

Apply keduanya:

Cek endpoint:

Kalian akan melihat Pod IP ditambahkan ke endpoint hanya setelah Readiness Probe succeed:

#Contoh 4: Startup Probe untuk Slow-Starting Application

Buat Pod dengan Startup Probe:

Konfigurasi ini:

Memberi aplikasi sampai 5 menit untuk start (30 failure × 10 detik)
Liveness dan Readiness Probe di-disable sampai Startup Probe succeed
Setelah startup, Liveness dan Readiness Probe mengambil alih

#Contoh 5: TCP Socket Probe untuk Database

Buat Pod dengan TCP Socket Probe:

Ini memeriksa apakah MySQL menerima connection di port 3306.

#Contoh 6: Exec Command Probe

Buat Pod dengan custom health check script:

#Menggabungkan Multiple Probe

Di production, kalian biasanya menggunakan ketiga tipe Probe bersama-sama:

#Best Practice untuk Probe

#Gunakan Endpoint Berbeda untuk Probe Berbeda

Buat endpoint terpisah untuk Liveness dan Readiness:

/healthz - Liveness check (basic health)
/ready - Readiness check (dependency ready)

#Jaga Probe Check Tetap Lightweight

Probe check harus cepat dan tidak mengkonsumsi resource signifikan:

#Set Timeout yang Tepat

Beri Probe cukup waktu untuk complete, tapi tidak terlalu banyak:

#Gunakan Startup Probe untuk Slow Application

Jangan buat Liveness Probe menunggu terlalu lama - gunakan Startup Probe:

#Jangan Check External Dependency di Liveness Probe

Liveness Probe hanya harus check apakah aplikasi itu sendiri sehat:

Check external dependency di Readiness Probe:

#Set initialDelaySeconds dengan Tepat

Beri aplikasi kalian waktu untuk start sebelum Probe pertama:

#Gunakan Readiness Probe untuk Zero-Downtime Deployment

Readiness Probe memastikan traffic hanya dikirim ke ready Pod:

#Kesalahan Umum dan Pitfall

#Kesalahan 1: Tidak Ada Probe Sama Sekali

Menjalankan Pod tanpa Probe berarti Kubernetes tidak bisa mendeteksi failure.

Problem: Aplikasi crash tapi container tetap berjalan. Kubernetes tidak tahu dan tetap mengirim traffic.

Solusi: Selalu implementasikan setidaknya Liveness dan Readiness Probe.

#Kesalahan 2: Menggunakan Endpoint yang Sama untuk Liveness dan Readiness

Menggunakan endpoint yang sama tidak membedakan antara "app is alive" dan "app is ready".

Problem: Database down, Readiness fail, tapi Liveness juga fail dan restart container secara tidak perlu.

Solusi: Gunakan endpoint berbeda dengan logic berbeda.

#Kesalahan 3: Probe Timeout Terlalu Pendek

Setting timeout terlalu pendek menyebabkan false failure.

Problem: Probe timeout selama operasi normal, menyebabkan restart yang tidak perlu.

Solusi: Set realistic timeout berdasarkan response time aplikasi kalian.

#Kesalahan 4: Check External Dependency di Liveness Probe

Liveness Probe hanya harus check aplikasi itu sendiri.

Problem: Database temporarily unavailable, Liveness fail, container restart, tapi database masih unavailable - restart loop.

Solusi: Check external dependency hanya di Readiness Probe.

#Kesalahan 5: Tidak Menggunakan Startup Probe untuk Slow Application

Menggunakan initialDelaySeconds tinggi di Liveness Probe delay failure detection.

Problem: Aplikasi crash setelah startup, tapi Liveness Probe menunggu 5 menit sebelum check.

Solusi: Gunakan Startup Probe untuk initialization, jaga Liveness Probe responsive.

#Kesalahan 6: Probe Check Terlalu Mahal

Heavy Probe check mengkonsumsi resource dan memperlambat aplikasi.

Problem: Liveness Probe menjalankan complex database query setiap 5 detik, overload database.

Solusi: Jaga Probe check tetap lightweight dan cepat.

#Monitoring Status Probe

#Check Status Probe di Pod Description

Cari section Probe:

#Check Event untuk Probe Failure

Cari event seperti:

#Watch Pod Restart

Frequent restart menunjukkan Liveness Probe failure:

#Penutup

Pada episode 10 ini, kita telah membahas Probe di Kubernetes secara mendalam. Kita sudah belajar tentang tiga tipe Probe (Liveness, Readiness, dan Startup), tujuan mereka, dan cara mengkonfigurasi mereka secara efektif.

Key takeaway:

Liveness Probe - Restart unhealthy container
Readiness Probe - Kontrol traffic routing ke Pod
Startup Probe - Handle slow-starting application
Gunakan endpoint berbeda untuk tipe Probe berbeda
Jaga Probe check tetap lightweight dan cepat
Jangan check external dependency di Liveness Probe
Gunakan timeout dan failure threshold yang tepat
Kombinasikan ketiga Probe untuk production application

Probe sangat essential untuk membangun aplikasi resilient dan self-healing di Kubernetes. Dengan properly mengkonfigurasi Probe, kalian memastikan bahwa Kubernetes bisa otomatis mendeteksi dan recover dari failure, maintain high availability, dan menyediakan experience yang lebih baik untuk user kalian.

Bagaimana, makin jelas kan tentang Probe di Kubernetes? Pada episode berikutnya (Episode 11), kita akan membahas konsep fundamental lain yang membawa Kubernetes lebih dekat ke janji intinya yaitu infrastruktur yang dapat memperbaiki diri sendiri: ReplicationController.

ReplicationController adalah salah satu mekanisme paling awal di Kubernetes yang dirancang untuk memastikan bahwa sejumlah replika pod yang ditentukan selalu berjalan. Alih-alih membuat dan memantau pod satu per satu secara manual, Anda mendeklarasikan jumlah replika yang diinginkan, dan Kubernetes terus berupaya mempertahankan keadaan tersebut. Jika sebuah pod mengalami crash, terhapus, atau sebuah node gagal, ReplicationController secara otomatis membuat pod baru untuk menggantikannya.

Dengan kata lain, ReplicationController memperkenalkan ide penting di Kubernetes:

Keadaan yang diinginkan secara deklaratif.

Anda tidak memberi tahu Kubernetes bagaimana cara memulihkan diri ketika terjadi kerusakan—Anda cukup mendeklarasikan berapa banyak pod yang harus ada, dan Kubernetes memastikan sistem selalu kembali ke keadaan tersebut.