Belajar Kubernetes - Pengenalan dan Penjelasan Observability

#Pendahuluan

Di episode sebelumnya, kita menjelajahi External Secret Manager, yang menyediakan secure secret management untuk Kubernetes application. Sekarang kita akan mendalami Observability, yang enable Anda untuk understand apa yang terjadi di dalam Kubernetes cluster Anda.

Catatan: Disini saya akan menggunakan Kubernetes Cluster yang di install melalui K3s.

Observability adalah ability untuk understand internal state dari system berdasarkan external output-nya. Di Kubernetes, observability terdiri dari tiga pillar: metrics, logs, dan traces. Pikirkan observability seperti punya X-ray vision untuk cluster Anda - Anda bisa lihat apa yang terjadi, diagnose problem, dan optimize performance.

#Memahami Observability

Observability berbeda dari monitoring. Monitoring memberitahu Anda ketika ada yang salah. Observability membantu Anda understand mengapa itu salah.

#Tiga Pillar Observability

1. Metrics

Quantitative measurement dari system behavior over time.

2. Logs

Detailed record dari event yang terjadi di system.

3. Traces

Record dari request yang flow melalui system.

#Mengapa Observability Penting

1. Troubleshooting

Quickly identify dan fix issue.

2. Performance Optimization

Understand bottleneck dan optimize.

3. Capacity Planning

Plan untuk future growth.

4. Security

Detect anomaly dan security issue.

5. Compliance

Meet audit dan compliance requirement.

#Metrics

Metrics adalah quantitative measurement yang di-collect di regular interval.

#Prometheus

Prometheus adalah de facto standard untuk Kubernetes metrics.

Installation

Prometheus Scrape Config

Instrumentation Example

Operations: System health
Developers: Application performance
Business: User experience

┌─────────────────────────────────────┐
│      Application                    │
│  (Instrumented with metrics)        │
└──────────────┬──────────────────────┘
               │
┌──────────────▼──────────────────────┐
│      Data Collection                │
│  - Prometheus (metrics)             │
│  - Fluentd (logs)                   │
│  - Jaeger (traces)                  │
└──────────────┬──────────────────────┘
               │
┌──────────────▼──────────────────────┐
│      Storage                        │
│  - Prometheus TSDB                  │
│  - Elasticsearch                    │
│  - Jaeger backend                   │
└──────────────┬──────────────────────┘
               │
┌──────────────▼──────────────────────┐
│      Visualization & Alerting       │
│  - Grafana (dashboards)             │
│  - Kibana (logs)                    │
│  - AlertManager (alerts)            │
└─────────────────────────────────────┘

#Monitoring vs Observability

Aspek	Monitoring	Observability
Focus	Known unknowns	Unknown unknowns
Approach	Predefined metrics	Exploratory analysis
Alerts	Threshold-based	Anomaly-based
Debugging	Limited	Comprehensive
Cost	Lower	Higher

#Kesimpulan

Pada episode 42 ini, kita telah membahas Observability di Kubernetes secara mendalam. Kita sudah belajar tentang metrics, logs, traces, dan best practice untuk implement observability.

Key takeaway:

Observability enable understanding system behavior
Tiga Pillar - Metrics, Logs, Traces
Prometheus - Metrics collection dan storage
Grafana - Metrics visualization
ELK Stack - Log aggregation dan analysis
Jaeger - Distributed tracing
Structured Logging - JSON formatted logs
Instrumentation - Add metrics ke application
Correlation ID - Connect related event
Alert - Notify pada anomaly
Dashboard - Visualize system state
Retention Policy - Manage storage
Monitor the Monitor - Ensure observability system health
Document Metrics - Help team understand data
Correlate Data - Connect metrics, logs, traces

Observability essential untuk operate production Kubernetes cluster securely dan efficiently.

Belajar Kubernetes - Pengenalan dan Penjelasan Observability

#Pendahuluan

#Memahami Observability

#Tiga Pillar Observability

#Mengapa Observability Penting

#Metrics

#Prometheus

#Common Kubernetes Metrics

#Querying Metrics

#Logging

#Container Logs

#Centralized Logging

#Structured Logging

#Traces

#Jaeger

#Trace Context

#Contoh Praktis

#Prometheus Alert Rules

#Grafana Dashboard

#Log Aggregation Query

#Kesalahan dan Jebakan Umum

#Kesalahan 1: Not Instrumenting Application

#Kesalahan 2: Collecting Too Much Data

#Kesalahan 3: Not Setting Up Alert

#Kesalahan 4: Ignoring Log Retention

#Kesalahan 5: Not Correlating Data

#Praktik Terbaik

#1. Gunakan Structured Logging

#2. Instrument Application

#3. Set Up Meaningful Alert

#4. Gunakan Correlation ID

#5. Monitor the Monitoring System

#6. Set Appropriate Retention

#7. Gunakan Dashboard untuk Visualization

#8. Document Metrics dan Alert

#Observability Stack

#Complete Stack

#Monitoring vs Observability

#Kesimpulan