1. π Pengertian Unsupervised Learning
6
π Definisi
Unsupervised Learning adalah metode Machine Learning di mana model belajar dari data tanpa label, sehingga sistem harus menemukan pola atau struktur sendiri.
π Narasi
Berbeda dengan supervised learning:
- Tidak ada βjawaban benarβ yang diberikan
- Model harus menemukan pola tersembunyi
- Digunakan untuk eksplorasi data
Contoh:
- Mengelompokkan pelanggan
- Analisis pola perilaku
2. π§ Konsep Dasar Unsupervised Learning
π Karakteristik
| Aspek | Penjelasan |
|---|---|
| Data | Tidak berlabel |
| Tujuan | Menemukan pola |
| Output | Cluster atau struktur |
π Narasi
Unsupervised Learning fokus pada:
- Similarity (kemiripan data)
- Struktur tersembunyi
- Hubungan antar data
3. π Jenis-Jenis Unsupervised Learning
7
π Klasifikasi
| Jenis | Deskripsi |
|---|---|
| Clustering | Mengelompokkan data |
| Dimensionality Reduction | Mengurangi fitur |
π Narasi
- Clustering β mencari kelompok data
- Dimensionality Reduction β menyederhanakan data
4. βοΈ Algoritma Clustering
πΉ 4.1 K-Means Clustering
6
π Konsep
Mengelompokkan data menjadi K cluster berdasarkan jarak ke centroid.
π Langkah K-Means
- Tentukan jumlah cluster (K)
- Pilih centroid awal
- Hitung jarak data ke centroid
- Update centroid
- Ulangi hingga stabil
π Narasi
K-Means sangat populer karena:
- Sederhana
- Cepat
- Mudah diimplementasikan
πΉ 4.2 Hierarchical Clustering
6
π Konsep
Membentuk cluster secara bertahap (tree/dendrogram).
π Jenis
| Jenis | Penjelasan |
|---|---|
| Agglomerative | Dari bawah ke atas |
| Divisive | Dari atas ke bawah |
π Narasi
Digunakan untuk analisis hubungan data secara hierarkis.
5. π Dimensionality Reduction
πΉ 5.1 Principal Component Analysis (PCA)
7
π Konsep
Mengurangi jumlah fitur dengan mempertahankan informasi penting.
π Narasi
PCA digunakan untuk:
- Visualisasi data
- Mengurangi kompleksitas
- Menghindari overfitting
6. π Pengukuran Kemiripan (Similarity)
π Metode
| Metode | Penjelasan |
|---|---|
| Euclidean Distance | Jarak garis lurus |
| Manhattan Distance | Jarak grid |
| Cosine Similarity | Sudut antar vektor |
π Narasi
Kemiripan menentukan bagaimana data dikelompokkan.
7. β οΈ Tantangan Unsupervised Learning
π Permasalahan
- Tidak ada label β sulit evaluasi
- Menentukan jumlah cluster (K)
- Sensitif terhadap noise
- Interpretasi hasil sulit
8. βοΈ Perbandingan Clustering vs Classification
π Tabel
| Aspek | Clustering | Classification |
|---|---|---|
| Label | Tidak ada | Ada |
| Tujuan | Kelompokkan data | Prediksi kelas |
| Metode | K-Means | KNN |
9. π‘ Studi Kasus
6
π Contoh
- Segmentasi pelanggan
- Analisis perilaku pengguna
- Deteksi anomali
10. βοΈ Tools Unsupervised Learning
π Tools
| Tools | Fungsi |
|---|---|
| Python | Bahasa utama |
| Scikit-learn | ML library |
| Matplotlib | Visualisasi |
11. π― Kesimpulan
- Unsupervised Learning bekerja tanpa label
- Digunakan untuk eksplorasi data
- Algoritma utama: K-Means, Hierarchical, PCA
- Berguna dalam analisis data besar
- Tantangan utama adalah evaluasi
π Aktivitas Pembelajaran
- Latihan: Clustering dataset sederhana
- Diskusi: βBagaimana menentukan jumlah cluster?β
- Praktikum: Implementasi K-Means di Python