Belajar Kubernetes - Pengenalan dan Penjelasan Node Selector

#Pendahuluan

Di episode sebelumnya kita sudah belajar tentang CronJob, yang membuat Job berdasarkan time-based schedule. Selanjutnya di episode 16 kali ini, kita akan coba bahas Node Selector, konsep fundamental untuk kontrol dimana Pod run di cluster kalian.

Catatan: Disini saya akan menggunakan Kubernetes Cluster yang di install melalui K3s.

By default, Kubernetes scheduler otomatis place Pod di available node. Tapi kadang kalian butuh kontrol atas Pod placement - mungkin kalian ingin GPU workload di GPU node, atau production Pod di high-performance node. Node Selector menyediakan cara simple untuk achieve ini.

#Apa Itu Node Selector?

Node Selector adalah cara paling simple untuk constrain Pod agar run di specific node. Dia menggunakan label matching untuk select node dimana Pod harus di-schedule. Kalian add label ke node, kemudian specify label tersebut di Pod specification menggunakan nodeSelector.

Bayangkan Node Selector seperti filtering - kalian label node dengan karakteristik (GPU, SSD, high-memory), kemudian tell Pod untuk hanya run di node dengan specific label. Scheduler hanya consider node yang match semua specified label.

Karakteristik kunci Node Selector:

Label-based selection - Menggunakan key-value label untuk match node
Simple syntax - Mudah dipahami dan diimplementasikan
Equality matching - Hanya support exact label match
Multiple label - Bisa specify multiple label (AND logic)
Scheduling constraint - Pod tidak akan schedule jika tidak ada matching node
Node labeling - Require manual node labeling

#Kenapa Kita Butuh Node Selector?

Node Selector berguna untuk berbagai scenario dimana kalian butuh kontrol atas Pod placement:

Hardware requirement - Schedule GPU workload di GPU node
Storage type - Place Pod di node dengan SSD atau NVMe storage
Environment separation - Keep production dan development Pod terpisah
Geographic location - Schedule Pod di specific region atau zone
Node capability - Gunakan node dengan specific CPU architecture
Cost optimization - Gunakan cheaper node untuk non-critical workload
Compliance - Keep sensitive workload di specific node
Performance - Schedule high-performance app di powerful node

Tanpa Node Selector, kalian perlu:

Manually schedule Pod di specific node
Gunakan more complex affinity rule
Accept random Pod placement by scheduler

#Node Label

Sebelum menggunakan Node Selector, kalian perlu memahami node label. Label adalah key-value pair yang attached ke node.

#Melihat Node Label

Cek existing node label:

Lihat label untuk specific node:

#Built-in Node Label

Kubernetes otomatis add beberapa label ke node:

kubernetes.io/hostname - Node's hostname
kubernetes.io/os - Operating system (linux, windows)
kubernetes.io/arch - CPU architecture (amd64, arm64)
node.kubernetes.io/instance-type - Cloud instance type
topology.kubernetes.io/region - Cloud region
topology.kubernetes.io/zone - Cloud availability zone

#Menambahkan Custom Label

Add label ke node:

Contoh - label node dengan SSD storage:

Contoh - label node sebagai production:

Contoh - label node dengan GPU:

#Menghapus Label

Remove label dari node:

Contoh:

#Update Label

Update existing label:

Contoh:

#Menggunakan Node Selector

Setelah node dilabel, kalian bisa gunakan nodeSelector di Pod specification.

#Contoh 1: Basic Node Selector

Pertama, label node:

Buat Pod dengan node selector:

Apply konfigurasi:

Verify Pod placement:

Pod hanya akan schedule di node dengan label disktype=ssd.

#Contoh 2: Multiple Label Selector

Kalian bisa specify multiple label (semua harus match):

Pertama, label node dengan multiple label:

Buat Pod yang require both label:

Pod ini hanya schedule di node dengan BOTH disktype=ssd AND environment=production.

#Contoh 3: Menggunakan Built-in Label

Gunakan Kubernetes built-in label:

Pod ini hanya run di Linux node dengan AMD64 architecture.

#Node Selector dengan Deployment

Node Selector bekerja dengan semua Pod controller:

#Contoh 1: Deployment dengan Node Selector

Semua 3 replica hanya akan schedule di node dengan both label.

#Contoh 2: DaemonSet dengan Node Selector

DaemonSet ini hanya run di node yang dilabel dengan monitoring=enabled.

#Contoh 3: Job dengan Node Selector

Job ini run di node yang suitable untuk batch processing dengan high memory.

#Contoh Praktis

#Contoh 1: GPU Workload

Label GPU node:

Buat GPU workload:

#Contoh 2: Environment Separation

Label node by environment:

Production deployment:

Development deployment:

#Contoh 3: Storage Type Selection

Label node by storage type:

Database di SSD:

Log storage di HDD:

#Contoh 4: Geographic Placement

Label node by region:

Deploy ke specific region:

#Contoh 5: Cost Optimization

Label node by cost tier:

Critical workload di high-performance node:

Non-critical workload di standard node:

#Troubleshooting Node Selector

#Pod Stuck di Pending State

Jika Pod pending, cek apakah matching node exist:

Look for event seperti:

plaintext

Warning  FailedScheduling  Pod didn't match node selector

Cek available node dengan required label:

Jika tidak ada node yang match, either:

Add label ke node
Remove/modify nodeSelector

#Checking Pod Placement

Verify dimana Pod running:

Cek apakah Pod di expected node:

#Listing Pod by Node

Lihat semua Pod di specific node:

#Kesalahan Umum dan Pitfall

#Kesalahan 1: Typo di Label Name

Problem: Label name mismatch antara node dan Pod.

Solusi: Double-check label name:

#Kesalahan 2: Tidak Ada Matching Node

Problem: Tidak ada node yang punya required label.

Solusi: Verify node dengan required label exist:

#Kesalahan 3: Lupa Label New Node

Problem: Node baru ditambahkan tanpa required label.

Solusi: Buat checklist atau automation untuk labeling new node:

#Kesalahan 4: Menggunakan OR Logic

Problem: Expect OR logic, tapi nodeSelector gunakan AND.

Solusi: Node Selector hanya support AND logic. Untuk OR logic, gunakan Node Affinity (covered di next episode).

#Kesalahan 5: Overconstraining Pod

Problem: Terlalu banyak nodeSelector constraint prevent scheduling.

Solusi: Gunakan hanya necessary constraint:

#Kesalahan 6: Tidak Consider Node Capacity

Problem: Semua matching node full.

Solusi: Ensure enough capacity di labeled node:

#Best Practice

#Gunakan Meaningful Label Name

Pilih clear, descriptive label name:

#Document Labeling Strategy Kalian

Maintain documentation dari label schema kalian:

yaml

# Label Schema Documentation
# disktype: ssd | hdd | nvme
# environment: production | staging | development
# region: us-east | us-west | eu-central
# gpu: nvidia-tesla-v100 | nvidia-a100 | none

#Gunakan Consistent Label Value

Standardize label value across cluster kalian:

#Label Node During Provisioning

Automate node labeling during cluster setup:

#Combine dengan Resource Request

Selalu set resource request dengan nodeSelector:

#Gunakan untuk Critical Workload

Reserve nodeSelector untuk workload dengan specific requirement:

#Monitor Node Label Change

Track label change untuk audit purpose:

#Test Sebelum Production

Test nodeSelector di development dulu:

#Limitasi Node Selector

Node Selector simple tapi punya limitasi:

#Hanya Equality Matching

Tidak bisa gunakan operator seperti "not equal" atau "in":

Untuk advanced matching, gunakan Node Affinity (next episode).

#AND Logic Saja

Tidak bisa express OR logic:

#Tidak Ada Soft Preference

Node Selector adalah hard requirement. Pod tidak akan schedule jika tidak ada matching node.

Untuk soft preference, gunakan Node Affinity (next episode).

#Kapan Menggunakan Node Selector

Gunakan Node Selector saat:

Kalian butuh simple, straightforward node selection
Kalian punya clear, specific node requirement
Kalian ingin easy-to-understand Pod specification
Kalian menggunakan equality-based label matching

Consider Node Affinity saat:

Kalian butuh complex selection logic (OR, NOT, IN)
Kalian ingin soft preference (preferred tapi not required)
Kalian butuh more flexible matching operator
Kalian implement advanced scheduling strategy

#Penutup

Pada episode 16 ini, kita telah membahas Node Selector di Kubernetes secara mendalam. Kita sudah belajar apa itu Node Selector, cara label node, dan cara menggunakan nodeSelector untuk kontrol Pod placement.

Key takeaway:

Node Selector adalah cara paling simple untuk constrain Pod placement
Menggunakan label matching untuk select node
Require manual node labeling sebelum use
Support multiple label dengan AND logic
Bekerja dengan semua Pod controller (Deployment, DaemonSet, Job, dll)
Hanya support equality matching (key=value)
Pod tidak akan schedule jika tidak ada matching node
Perfect untuk hardware requirement, environment separation, dan cost optimization
Gunakan meaningful, consistent label name
Document labeling strategy kalian

Node Selector essential untuk kontrol Pod placement di Kubernetes. Dengan memahami Node Selector, kalian bisa ensure workload run di appropriate node, optimize resource usage, dan maintain environment separation.

Bagaimana, makin jelas kan tentang Node Selector di Kubernetes? Di episode 17 berikutnya, kita akan membahas bekerja dengan all keyword, yang menyediakan cara convenient untuk manage multiple Kubernetes resource sekaligus menggunakan kubectl get all dan kubectl delete all. Jadi, pastikan tetap semangat belajar dan nantikan episode selanjutnya!