Belajar Kubernetes - Pengenalan dan Penjelasan Computational Resources

#Pendahuluan

Di episode sebelumnya kita sudah belajar tentang Kubernetes Dashboard untuk managing cluster melalui web interface. Selanjutnya di episode 29 kali ini, kita akan coba bahas Computational Resources, specifically CPU dan memory management - salah satu aspek paling critical untuk running production workload di Kubernetes.

Catatan: Disini saya akan menggunakan Kubernetes Cluster yang di install melalui K3s.

Memahami resource request dan limit essential untuk cluster stability, efficient resource utilization, dan preventing satu application dari starving yang lain. Tanpa proper resource management, cluster kalian bisa become unstable, unpredictable, dan expensive.

#Apa Itu Computational Resources?

Computational Resources di Kubernetes refer ke CPU dan memory yang container bisa consume. Kubernetes allow kalian untuk specify berapa banyak resource ini yang container need (request) dan maximum yang bisa used (limit).

Bayangkan resource seperti restaurant reservation - request adalah guaranteed table kalian (minimum resource), sementara limit adalah maximum number orang yang bisa kalian bawa (maximum resource). Restaurant (node) need to know both untuk manage seating effectively.

Key resource type:

CPU - Measured in core (atau millicore)
Memory - Measured in byte (Ki, Mi, Gi)
Ephemeral Storage - Temporary disk space
Extended Resources - Custom resource (GPU, etc.)

#Request vs Limit

Memahami difference crucial.

#Request

Request define minimum amount resource guaranteed ke container.

Digunakan oleh scheduler untuk decide node mana yang bisa run Pod
Container guaranteed amount ini
Node harus punya available resource >= request
Digunakan untuk resource reservation
Affect Pod scheduling decision

#Limit

Limit define maximum amount resource yang container bisa use.

Container tidak bisa exceed amount ini
Jika exceeded, container throttled (CPU) atau killed (memory)
Digunakan untuk resource protection
Prevent resource exhaustion
Affect runtime behavior

#Relationship Antara Request dan Limit

Rule:

Request ≤ Limit (always)
Request = what you need
Limit = what you might need at peak

#Kenapa Harus Selalu Specify Resource?

Mari kita pahami kenapa resource specification critical.

#Problem 1: Unpredictable Scheduling

Tanpa request:

Issue:

Scheduler tidak tahu Pod requirement
Mungkin schedule di overloaded node
Bisa cause node resource exhaustion
Unpredictable performance

Dengan request:

Benefit:

Scheduler make informed decision
Pod scheduled di appropriate node
Predictable resource availability
Better cluster utilization

#Problem 2: Resource Starvation

Tanpa limit:

Issue:

Satu Pod bisa consume semua node resource
Pod lain starved of resource
Node become unstable
Cascading failure

Dengan limit:

Benefit:

Container tidak bisa exceed limit
Pod lain protected
Node remain stable
Predictable behavior

#Problem 3: Cost Inefficiency

Tanpa proper resource:

Over-provisioning waste money
Under-provisioning cause failure
No visibility into actual usage
Difficult to optimize cost

Dengan proper resource:

Right-sized allocation
Efficient resource utilization
Clear cost attribution
Easy to optimize

#Problem 4: Quality of Service (QoS)

Kubernetes assign QoS class based on resource:

Guaranteed (highest priority):

Request = Limit untuk semua container
Best performance guarantee
Last to be evicted

Burstable (medium priority):

Request < Limit
Bisa use extra resource ketika available
Evicted sebelum Guaranteed

BestEffort (lowest priority):

No request atau limit
Use whatever available
First to be evicted

Tanpa resource specification, Pod dapat BestEffort QoS - worst class.

#CPU Resources

CPU measured in core atau millicore.

#CPU Unit

#CPU Behavior

CPU is compressible:

Container bisa throttled jika exceeding limit
Container tidak killed untuk exceeding CPU limit
Performance degrade tapi container continue running

Contoh:

Behavior:

Guaranteed 250 millicore
Bisa burst up to 500 millicore
Jika trying to use lebih dari 500m, get throttled
Never killed untuk CPU usage

#CPU Throttling

Ketika container exceed CPU limit:

Throttled container show:

High CPU usage (near limit)
Increased response time
Degraded performance

#Memory Resources

Memory measured in byte dengan standard unit.

#Memory Unit

Catatan

Gunakan binary unit (Ki, Mi, Gi) untuk consistency dengan bagaimana operating system report memory.

#Memory Behavior

Memory is incompressible:

Container tidak bisa throttled untuk memory
Jika exceeding limit, container killed (OOMKilled)
Pod mungkin restarted depending on restart policy

Contoh:

Behavior:

Guaranteed 256 MiB
Bisa use up to 512 MiB
Jika trying to use lebih dari 512 MiB, get OOMKilled
Pod restarted jika restartPolicy allow

#OOMKilled (Out of Memory Killed)

Ketika container exceed memory limit:

#Contoh Resource Specification

#Basic Web Application

#Database Application

#Background Worker

#Microservice dengan Sidecar

#Quality of Service (QoS) Class

Kubernetes assign QoS class automatically based on resource specification.

#Guaranteed QoS

Requirement:

Setiap container punya request dan limit
Request = Limit untuk CPU dan memory

Karakteristik:

Highest priority
Best performance guarantee
Last to be evicted under pressure
Predictable resource allocation

#Burstable QoS

Requirement:

At least satu container punya request atau limit
Request < Limit (atau hanya satu specified)

Karakteristik:

Medium priority
Bisa burst above request ketika resource available
Evicted sebelum Guaranteed, setelah BestEffort
Flexible resource usage

#BestEffort QoS

Requirement:

No request atau limit specified

Karakteristik:

Lowest priority
No resource guarantee
First to be evicted under pressure
Unpredictable performance

Warning

Peringatan: Hindari BestEffort QoS di production. Selalu specify at least request untuk predictable behavior.

#Checking QoS Class

#Resource Quota

Limit total resource di namespace.

#Membuat Resource Quota

Apply quota:

Check quota usage:

Output:

#Quota Enforcement

Ketika quota exceeded:

#Limit Range

Set default dan min/max resource untuk container.

#Membuat Limit Range

Apply limit range:

#Limit Range Behavior

Tanpa resource specified:

Kubernetes apply default:

#Monitoring Resource Usage

#Menggunakan kubectl top

View node resource:

Output:

View Pod resource:

Output:

View Pod resource di namespace:

#Menggunakan Metrics Server

Metrics Server harus installed:

Verify Metrics Server:

#Viewing Resource Allocation

Check node allocatable resource:

Output show:

#Kesalahan Umum dan Pitfall

#Kesalahan 1: No Resource Specification

Problem: Pod tanpa resource dapat BestEffort QoS.

Solusi: Selalu specify at least request:

#Kesalahan 2: Limit Terlalu Rendah

Problem: Container frequently OOMKilled atau throttled.

Solusi: Monitor actual usage dan adjust:

#Kesalahan 3: Request Terlalu Tinggi

Problem: Pod tidak bisa scheduled karena over-requesting.

Solusi: Set request based on actual minimum need:

#Kesalahan 4: Request = Limit Always

Problem: Waste resource, prevent bursting.

Solusi: Allow bursting untuk variable workload:

#Kesalahan 5: Ignore Multi-Container Pod

Problem: Lupa set resource untuk semua container.

Solusi: Specify resource untuk setiap container:

#Best Practice

#Start dengan Monitoring

Sebelum set resource:

Deploy tanpa limit initially (dengan request)
Monitor actual usage untuk 1-2 minggu
Set limit based on observed peak usage + buffer
Continue monitoring dan adjust

#Gunakan Appropriate Ratio

CPU:

Request: baseline usage
Limit: 2-3x request untuk burstable workload
Limit: 1x request untuk consistent workload

Memory:

Request: minimum needed
Limit: 1.5-2x request (smaller buffer daripada CPU)
Memory leak bisa cause OOMKill

#Set Namespace Default

Gunakan LimitRange untuk consistent default:

#Gunakan Resource Quota

Prevent namespace resource exhaustion:

#Different Resource untuk Different Workload

Web server:

Database:

Batch job:

#Document Resource Decision

Add annotation explaining resource choice:

#Troubleshooting Resource Issue

#Pod Pending Karena Insufficient Resource

Solusi:

Reduce resource request
Add more node
Delete unused Pod
Scale down workload lain

#Pod OOMKilled

Solusi:

Increase memory limit
Fix memory leak di application
Optimize application memory usage
Gunakan memory profiling tool

#CPU Throttling

Solusi:

Increase CPU limit
Optimize application CPU usage
Scale horizontally (more replica)
Profile application untuk CPU hotspot

#Node Resource Pressure

Solusi:

Evict BestEffort Pod
Add more node
Reduce resource request
Implement resource quota

#Penutup

Pada episode 29 ini, kita telah membahas Computational Resources di Kubernetes secara mendalam. Kita sudah belajar kenapa resource request dan limit critical, bagaimana mereka affect scheduling dan runtime behavior, dan best practice untuk resource management.

Key takeaway:

Selalu specify resource untuk predictable behavior
Request guarantee minimum resource untuk scheduling
Limit prevent resource exhaustion dan protect node
CPU is compressible - throttled ketika exceeded
Memory is incompressible - OOMKilled ketika exceeded
QoS class determine eviction priority
Guaranteed QoS require request = limit
Burstable QoS allow flexible resource usage
BestEffort QoS should be avoided di production
Resource Quota limit namespace resource usage
Limit Range set default dan boundary
Monitor actual usage sebelum set limit
Different workload need different resource profile
Request affect scheduling, limit affect runtime
Gunakan kubectl top untuk monitor resource usage

Proper resource management fundamental untuk running stable, efficient Kubernetes cluster. Dengan memahami dan implementing resource request dan limit, kalian ensure predictable application behavior, efficient resource utilization, dan cluster stability.

Bagaimana, makin jelas kan tentang Computational Resources di Kubernetes? Jadi, pastikan tetap semangat belajar dan nantikan episode selanjutnya!