Belajar Kubernetes - Pengenalan dan Penjelasan Vertical Pod Autoscaler

#Pendahuluan

Di episode sebelumnya kita sudah belajar tentang Horizontal Pod Autoscaler (HPA) yang scale number Pod. Selanjutnya di episode 31 kali ini, kita akan coba bahas Vertical Pod Autoscaler (VPA), yang automatically adjust CPU dan memory request dan limit untuk container based on actual usage.

Catatan: Disini saya akan menggunakan Kubernetes Cluster yang di install melalui K3s.

Sementara HPA scale horizontally (more Pod), VPA scale vertically (bigger Pod). Setting right resource request challenging - terlalu rendah cause OOMKill dan throttling, terlalu tinggi waste resource. VPA solve ini dengan continuously analyzing usage dan recommending atau applying optimal resource value.

#Apa Itu Vertical Pod Autoscaler?

Vertical Pod Autoscaler (VPA) automatically adjust CPU dan memory request dan limit untuk container based on historical dan current resource usage.

Bayangkan VPA seperti tailor - dia measure actual size kalian (resource usage) dan adjust clothes kalian (resource request/limit) untuk fit perfectly. Instead of guessing size, VPA gunakan real data untuk right-size Pod kalian.

Karakteristik kunci VPA:

Automatic right-sizing - Adjust resource request/limit
Historical analysis - Gunakan past usage pattern
Recommendation mode - Suggest value tanpa applying
Auto mode - Apply change automatically
Initial mode - Set resource di Pod creation only
Prevent waste - Reduce over-provisioning
Prevent failure - Avoid under-provisioning
Work dengan Deployment - Compatible dengan standard workload

#VPA vs HPA

Memahami key difference:

Aspek	VPA	HPA
Scaling Direction	Vertical (resource size)	Horizontal (replica count)
What Change	CPU/Memory request/limit	Number Pod
Require Restart	Yes (di Auto/Recreate mode)	No
Use Case	Right-size resource	Handle traffic spike
Metric	Historical usage	Current metric
Response Time	Slower (require restart)	Faster (add Pod)
Best For	Stateful workload	Stateless workload

Bisa gunakan together:

VPA: Right-size individual Pod
HPA: Scale number Pod
Combine untuk optimal resource utilization

Warning

Peringatan: Jangan gunakan VPA dan HPA pada same CPU/memory metric simultaneously - mereka bisa conflict. Gunakan HPA untuk CPU/memory, VPA untuk resource lain, atau HPA untuk scaling dan VPA di recommendation mode.

#Kenapa Gunakan VPA?

VPA solve critical resource management challenge:

Eliminate guesswork - No need to estimate resource need
Optimize cost - Reduce over-provisioning waste
Prevent failure - Avoid OOMKill dari under-provisioning
Adapt to change - Adjust as application behavior evolve
Save time - No manual resource tuning
Improve efficiency - Better cluster utilization
Handle variability - Adapt ke workload change
Data-driven decision - Based on actual usage

Tanpa VPA, kalian either waste resource (over-provision) atau risk failure (under-provision), dan harus manually adjust as application change.

#Bagaimana VPA Bekerja

#VPA Component

VPA consist of tiga component:

1. Recommender:

Monitor resource usage
Analyze historical data
Calculate recommended value
Update VPA object dengan recommendation

2. Updater:

Check jika Pod need update
Evict Pod yang need resource change
Respect Pod Disruption Budget
Trigger Pod recreation

3. Admission Controller:

Intercept Pod creation
Apply VPA recommendation
Set resource request/limit
Work as mutating webhook

#VPA Control Loop

Monitor - Recommender watch Pod metric
Analyze - Calculate optimal resource value
Recommend - Update VPA object dengan recommendation
Decide - Updater check jika change needed
Evict - Updater evict Pod (jika Auto mode)
Apply - Admission Controller set new value on recreation

#Instalasi VPA

VPA tidak installed by default. Mari kita install.

#Prerequisite

Kubernetes cluster (1.11+)
Metrics Server installed
kubectl access

#Installation Step

Clone VPA repository:

Install VPA:

Ini install:

VPA CRD (CustomResourceDefinition)
VPA Recommender
VPA Updater
VPA Admission Controller

Verify installation:

Output:

Check VPA CRD:

Output:

#VPA Update Mode

VPA support different update mode:

#Off Mode (Recommendation Only)

VPA calculate recommendation tapi tidak apply:

Use case:

Testing VPA recommendation
Manual review sebelum applying
Learning resource pattern
Generating report

#Initial Mode

VPA set resource hanya ketika Pod created, never update running Pod:

Use case:

Set initial resource untuk new Pod
Avoid disrupting running Pod
Gradual rollout VPA

#Recreate Mode (Default)

VPA evict dan recreate Pod dengan new resource value:

Behavior:

Evict Pod ketika resource need adjustment
Deployment controller recreate Pod
Admission Controller apply new value
Cause brief downtime per Pod

Use case:

Automatic resource optimization
Stateless application
Ketika brief disruption acceptable

#Auto Mode

VPA automatically update Pod (currently same as Recreate):

Catatan

Auto mode currently behave seperti Recreate. In-place update (tanpa Pod restart) planned untuk future Kubernetes version.

#Membuat VPA

#Basic VPA Example

Create Deployment:

Create VPA:

Apply:

#VPA dengan Resource Policy

Control resource mana yang VPA bisa modify:

Resource Policy Option:

mode: Auto, Off (per container)
minAllowed: Minimum resource value
maxAllowed: Maximum resource value
controlledResources: Resource mana yang manage (cpu, memory)

#VPA untuk Specific Container

Target specific container di multi-container Pod:

#Melihat VPA Recommendation

#Get VPA Status

Output:

#Describe VPA

Output show recommendation:

Recommendation Field:

Lower Bound: Minimum recommended (avoid OOMKill)
Target: Recommended optimal value
Uncapped Target: Recommendation tanpa policy limit
Upper Bound: Maximum recommended (avoid waste)

#View VPA YAML

#Contoh Praktis

#Contoh 1: Web Application dengan VPA

#Contoh 2: Database dengan VPA (Recommendation Only)

#Contoh 3: Microservice dengan Multiple Container

#Contoh 4: VPA dengan Initial Mode

#Testing VPA

#Deploy Application

#Generate Load

Create load untuk trigger resource usage:

#Watch VPA Recommendation

#Check Pod Resource

Sebelum VPA:

Setelah VPA update (di Auto mode):

#VPA Limitation

#Current Limitation

1. Require Pod Restart:

VPA tidak bisa update resource in-place
Pod harus evicted dan recreated
Cause brief downtime

2. Not untuk Horizontal Scaling:

VPA adjust resource size, bukan replica count
Gunakan HPA untuk scaling replica

3. Conflict dengan HPA:

Jangan gunakan both pada same CPU/memory metric
Bisa cause scaling conflict

4. No Downscaling Protection:

VPA bisa reduce resource aggressively
Mungkin cause issue jika recommendation terlalu rendah

5. Limited History:

Recommendation based on recent history
Mungkin tidak capture long-term pattern

6. Experimental Status:

VPA masih beta/experimental
Not recommended untuk critical production workload tanpa testing

#Kesalahan Umum dan Pitfall

#Kesalahan 1: Menggunakan VPA dan HPA Together pada Same Metric

Problem: VPA dan HPA conflict ketika both target CPU/memory.

Solusi: Gunakan different metric atau mode:

#Kesalahan 2: No Min/Max Limit

Problem: VPA bisa set extreme value.

Solusi: Selalu set boundary:

#Kesalahan 3: Menggunakan Auto Mode pada Stateful Workload

Problem: Pod eviction cause data loss atau downtime.

Solusi: Gunakan Off atau Initial mode untuk stateful app:

#Kesalahan 4: No Initial Resource

Problem: VPA need baseline untuk start from.

Solusi: Selalu set initial request:

#Kesalahan 5: Ignore Recommendation

Problem: Running VPA di Off mode tapi never checking recommendation.

Solusi: Regularly review dan apply recommendation:

#Best Practice

#Start dengan Off Mode

Test VPA sebelum enable Auto mode:

#Set Appropriate Boundary

Define min/max based on workload:

#Gunakan Initial Mode untuk Gradual Rollout

Avoid disrupting running Pod:

#Monitor VPA Decision

Track VPA behavior:

#Combine dengan Pod Disruption Budget

Protect availability during update:

#Gunakan untuk Right-Sizing, Bukan Scaling

VPA untuk resource optimization, bukan traffic handling:

VPA: Right-size individual Pod
HPA: Scale untuk traffic
Cluster Autoscaler: Add node

#Document VPA Configuration

Add annotation explaining choice:

#Troubleshooting VPA

#VPA Not Providing Recommendation

Cause:

VPA component not running
Insufficient metric data
Target workload not found

Solusi:

#VPA Not Updating Pod

Cause:

UpdateMode adalah Off atau Initial
Pod Disruption Budget blocking eviction
Recommendation within current value

Solusi:

#Pod Constantly Restarting

Cause:

Recommendation oscillating
Min/max limit terlalu narrow
Workload highly variable

Solusi:

#VPA Recommendation Terlalu Tinggi/Rendah

Solusi:

#Uninstall VPA

Ini remove:

VPA Deployment
VPA CRD
VPA configuration

#Melihat Detail VPA

#Get VPA

#Describe VPA

#View VPA YAML

#Check VPA Component

#Menghapus VPA

Pod continue running dengan current resource value.

#Penutup

Pada episode 31 ini, kita telah membahas Vertical Pod Autoscaler (VPA) di Kubernetes secara mendalam. Kita sudah belajar bagaimana VPA automatically right-size Pod resource based on actual usage, different update mode, dan best practice untuk production use.

Key takeaway:

VPA automatically adjust CPU dan memory request/limit
Analyze historical usage untuk recommend optimal value
Empat update mode: Off, Initial, Recreate, Auto
Off mode: Recommendation only (no change)
Initial mode: Set resource di Pod creation only
Recreate/Auto mode: Evict dan recreate Pod dengan new value
Require VPA installation (not default di Kubernetes)
Resource policy define min/max boundary
Jangan combine VPA dan HPA pada same metric
VPA require Pod restart untuk apply change
Gunakan Off mode untuk testing dan stateful workload
Set min/max limit untuk prevent extreme value
Pod Disruption Budget protect availability
VPA adalah beta/experimental - test thoroughly
Best untuk right-sizing, bukan traffic scaling

Vertical Pod Autoscaler essential untuk optimizing resource utilization di Kubernetes. Dengan memahami VPA configuration dan limitation, kalian bisa automatically right-size Pod, reduce waste, dan prevent resource-related failure tanpa manual tuning.

Bagaimana, makin jelas kan tentang Vertical Pod Autoscaler di Kubernetes? Jadi, pastikan tetap semangat belajar dan nantikan episode selanjutnya!