Algoritma Unsupervised Learning


1. πŸ“Œ Pengertian Unsupervised Learning

https://images.openai.com/static-rsc-4/x7bYD-PEFofnH6K99raP5vQUFnAgQhPsJpJYVvA18KRGdiHkJ6jCLKcs5uD9T8X1TauCHNOm6UPCIIaEhmvDjJceb4lhTCHrDjTkxTWjUbkR99Rei8hFd74xpf92jCO9D1gXt7rRFBLEx2V0r9OwmhScalBsNlTiPUSC4TfBHNtWxDDtz1lotD7tmjHBJxdk?purpose=fullsize
https://images.openai.com/static-rsc-4/RJZOS535jFivlfrXFMVsex2tNprLuKofPsLZH3yol2agXdNMk64IzH61hn5FOCDlP3dhUVPSBCHfv59gdosCUUVsBde4v5BFfs5vz_wBBl9NwS34xy0k38knMcKJkXwkVyKsLSCpFYKln3hLWcAzFOMODDs1xKb1aGjriBuEzs0EgkrxLMLys27qH1rCFrxM?purpose=fullsize
https://images.openai.com/static-rsc-4/lV4bOeJEKqO-sz7iMwHp2aFXWC3-z7lHIToqi3NomeuIaaxhYYo_ZXshIz2_-a550_Uo7oZxF0MBvCume0AU8_hnU386OM6xWPWGOayVBRuCrGKLopRsQcmT7Bp_oNCnaEMmDV_kGzR1-JnNKsLL9gNuGU0MwShXFyxleQFJ4lL7gh3LcI_s51cf87_kIx9N?purpose=fullsize

6

πŸ”Ž Definisi

Unsupervised Learning adalah metode Machine Learning di mana model belajar dari data tanpa label, sehingga sistem harus menemukan pola atau struktur sendiri.

πŸ“– Narasi

Berbeda dengan supervised learning:

  • Tidak ada β€œjawaban benar” yang diberikan
  • Model harus menemukan pola tersembunyi
  • Digunakan untuk eksplorasi data

Contoh:

  • Mengelompokkan pelanggan
  • Analisis pola perilaku

2. 🧠 Konsep Dasar Unsupervised Learning

πŸ“Š Karakteristik

AspekPenjelasan
DataTidak berlabel
TujuanMenemukan pola
OutputCluster atau struktur

πŸ“– Narasi

Unsupervised Learning fokus pada:

  • Similarity (kemiripan data)
  • Struktur tersembunyi
  • Hubungan antar data

3. πŸ”„ Jenis-Jenis Unsupervised Learning

https://images.openai.com/static-rsc-4/oOONAmsVWjBxOvUy8_oKPE9mQw6Jjk7Skp3SoCumCqcnSAsubqRtF2uqscn1Ugu48pqD7PzqSEgx9UPy-odhm9pah-9CRioitsjiQWd-b2zlxxe0opnn5s5pZfmHHKogScvysQ78yo1FiUI_P8rsUnVv5NgvQoc_kBTHRownDKW_hv50QugMbfHcdbtWapY6?purpose=fullsize
https://images.openai.com/static-rsc-4/vTeFQJfbLw-0soxCmBrFSj4JvioQxHJsDG702eiXvFRgwC0WLb99JDZdd2Q6SXvx2z9sqooKB3uVbTZyC4Q7Cu4zaadAdJf9dJpL8Waxcw0PkD7-AF_wrlscXvKBUNcxIBYc7PSXkPCwyY8cmfuODh_KQ7ECCnfdz5YlgD-w9a3oxIYApBK06-cH_TNAcEVv?purpose=fullsize
https://images.openai.com/static-rsc-4/RoUNnjIfrXdef0cmHKBD4G1Nv9IqHJwxSMdMOBVjri4-WU9fAGwGUX5gwn7MtG4JRoPw5EhAldX9B34JcxOBvZnmRizXvALzH10ObK-rKcM2tuvsPYSgL4LDlaO0hGZjN3BurpDUu8q7BfT84tkLqpkX2GNdTvN2VrJnQIlEhfPlfQugbvLzt4O2jPom72U1?purpose=fullsize

7

πŸ“Š Klasifikasi

JenisDeskripsi
ClusteringMengelompokkan data
Dimensionality ReductionMengurangi fitur

πŸ“– Narasi

  • Clustering β†’ mencari kelompok data
  • Dimensionality Reduction β†’ menyederhanakan data

4. βš™οΈ Algoritma Clustering


πŸ”Ή 4.1 K-Means Clustering

https://images.openai.com/static-rsc-4/EM6ombhV41F_Hg23hB0hj5tMgiX05mSOH2wTWtZbsVLaCnGodYRGvOCdLW9fXV5n8OYAf2vzzIrr730GJQiolV9UtEaqKa66fE5p8uEkjTLCTI4-MJyXLW7glvrEBt6g8bQJdviqi5gnQLOA1kbQ2NLd4MxwgQeu_93-Txu0wi7zih6BtQ5ZeCDH0TNnV36_?purpose=fullsize
https://images.openai.com/static-rsc-4/GhhHEjpi8ejVxBPBNEnVIfez5ZITT5d6hQu-GZ7LVYri49izKn8EVKVeP5U1fAR1tr1ZeXXxatRfaZF2g9wHmKgbqcCfOujGz37Qh_1wYNBEt-u6k3xWQz48BSb7jC8CypGXvHp89C7t0LM89d8B7Nabc2i4z1So6uXlF9hQJH2_wlWkXDlL6ZvOwsI1qmXN?purpose=fullsize
https://images.openai.com/static-rsc-4/BKVaSG2oaUxhk2gBh30c8K1zU0D4boEZ0c9XRLH5p_cC8-QJCrBtoxr-94t9aF_iqnlm9eIAw_zcbd3PsZ3je9-oXdnSdNKJwSj8YQP-1Uxso83D_35BZVflGB_BiIau_Kvlu0iBsj8S_Y5AtdvHGMU0I1sxamFUIC9zgSkaGuf3Z2VSDtw7WMeXn4awDXoU?purpose=fullsize

6

πŸ“Œ Konsep

Mengelompokkan data menjadi K cluster berdasarkan jarak ke centroid.


πŸ“Š Langkah K-Means

  1. Tentukan jumlah cluster (K)
  2. Pilih centroid awal
  3. Hitung jarak data ke centroid
  4. Update centroid
  5. Ulangi hingga stabil

πŸ“– Narasi

K-Means sangat populer karena:

  • Sederhana
  • Cepat
  • Mudah diimplementasikan

πŸ”Ή 4.2 Hierarchical Clustering

https://images.openai.com/static-rsc-4/ULbwuyZvWuwJ6Bs4XujOGAJwPMQVCdyfgzJUxjq7HvPpOPhL01DTLrL6hwtzy_r8lZeBFrJY7NlRRHqPCXRYeeObVFMJN3LVff5ApMXjI_yJN1yC2vdx6pVBCwSXsusDcWZFuFl6lfcGkapL7ANTUh8DG5St9LL7ZA7YrSjg-KQRdqC5Xkh0pPAn2iKVeSYP?purpose=fullsize
https://images.openai.com/static-rsc-4/hgVDFUBJuh_ScdKXIEufrKgAk7kxWGiWqn0bniyBpuWSXeDM9EXJBOIN7p-5Fjc4YXpazrOh-p9kKMfOKwkeuAkmWltgcKCmRilPY-bpmfrU39vp5ox62tOWtLFOWCOcQLWaz8yjEf-26_QH3u3gwA9xxtBGrJQR5a9-AW-H0rJwDr_4hFqJ94SQ4QXIUX51?purpose=fullsize
https://images.openai.com/static-rsc-4/botpFcAgeNfbr7ySERrC66bc5uYu1Gl_tyMpSyml52wxNF0FlXLBndpx-YwG3fIk9GI7KcLvdHYpovhk_-kI3mkkX05IfLMyqTrR0Z0a4BR9_SsqqPItT0NAk6SGfJCrpwcfgYiVPbVCBHLwi_ra7Uuo7p_mrzntclWqYB--pfpuhEUyxRzKO3i4GaZZquUw?purpose=fullsize

6

πŸ“Œ Konsep

Membentuk cluster secara bertahap (tree/dendrogram).


πŸ“Š Jenis

JenisPenjelasan
AgglomerativeDari bawah ke atas
DivisiveDari atas ke bawah

πŸ“– Narasi

Digunakan untuk analisis hubungan data secara hierarkis.


5. πŸ“‰ Dimensionality Reduction


πŸ”Ή 5.1 Principal Component Analysis (PCA)

https://images.openai.com/static-rsc-4/Y4W7F8opNgK3waATQ203U9Ss63gYw8KmkBwJlauaLtmM9_JJmW87K9MR2K4jokcjt1beHVj34-gU5GoBD00QQ97cSHZW6pWc4zu2K7Z6G7mE8zRImjl1-9wPkjv0zByWTMGFgw_L3Hs9cVm1wsDwalUnLQOvwlYeCsWIvTFjVgSyl8jRMlK6klTl_CMP4tus?purpose=fullsize
https://images.openai.com/static-rsc-4/mQX4_XTflPkLWcnM02IFSAJnQ_gNKBeXllzlX3uHnqoHgkUE0ZUCdB9xS5MeebxYmz9QPMsAd-I7BqMvi4kIiksdRc0PW6GL5ya7l1MoSKKZptJrB5rT0daqFkwhHhbfWTYRCX58gII-bXstFgk6Ef_b2QGumeQag5OmpczkT4FliGXcPPGVq2WW614US92o?purpose=fullsize
https://images.openai.com/static-rsc-4/Y6iG3JVpO-biNStqEvUorFxKBGcoXhOtgKQrzc96HJXLcin_kDm58f3y3c1hiCVnf05NbSiB2zuC65FwMu9n3h7OO2sPfbPFECRK0BmXC8LL8V5y53g_i6fmHck9e6el9G000rVd4ig3TDxoqUhZhp7yn1Ivrnw0zY5Bz44-VAKQfQ-PNAudZ3W3nqIMfE1d?purpose=fullsize

7

πŸ“Œ Konsep

Mengurangi jumlah fitur dengan mempertahankan informasi penting.


πŸ“– Narasi

PCA digunakan untuk:

  • Visualisasi data
  • Mengurangi kompleksitas
  • Menghindari overfitting

6. πŸ“ Pengukuran Kemiripan (Similarity)

πŸ“Š Metode

MetodePenjelasan
Euclidean DistanceJarak garis lurus
Manhattan DistanceJarak grid
Cosine SimilaritySudut antar vektor

πŸ“– Narasi

Kemiripan menentukan bagaimana data dikelompokkan.


7. ⚠️ Tantangan Unsupervised Learning

πŸ” Permasalahan

  • Tidak ada label β†’ sulit evaluasi
  • Menentukan jumlah cluster (K)
  • Sensitif terhadap noise
  • Interpretasi hasil sulit

8. βš–οΈ Perbandingan Clustering vs Classification

πŸ“Š Tabel

AspekClusteringClassification
LabelTidak adaAda
TujuanKelompokkan dataPrediksi kelas
MetodeK-MeansKNN

9. πŸ’‘ Studi Kasus

https://images.openai.com/static-rsc-4/qe8EA9gVW0tBITjVxQQZ5hCbshc21CupyhqG7FtVciifjQ0tMDHBfCa4ALySvmOCNdpwi2W7ifqs3sG1-5vv-TFLjs4G1crV2aAurlk2xUhGozrSTLOVp8ceyKGreLza3PrDy0BRMJI9CSImP0Rfjn_GbeJ9sR1dLaNY7kIz8jSc7vwTgoDDCiadyKTrmOhb?purpose=fullsize
https://images.openai.com/static-rsc-4/uujUNUx0DdbWmpySh5yH9UQ7h6u4YS9qnuuanOIqYcFZSW5r4YCyP338E4mrW0wovJZkGebwf__cpQFA_D5cobBNyUftq_Q5w5mme6cYstmtj--jTiIXzYdQuRt_Rh0ketGXiaLDduEpbYzsPdAXYMhv9T6_DDFhwlLpsZ2LyXFIMrrAxk_VmmBKF7JmCLJY?purpose=fullsize
https://images.openai.com/static-rsc-4/U6t7-u3xr9VFrEzzI0T8gaf5RWyxLyrmeKdVZhcsEwSZGO3ZWQlCcCRlRST51uZ9OdBPzwCoRsKYJ3ROYTP5c1NaoF1Alxo3GNv_WO_2ERAk1OuY26MoWtaEeLwQKiCHGagwHwhEkatDMq0Hi1FtXAnjyHJtwvCOLfzwl1g4XGz_rLnlzAHc8EiL_xipHZ1H?purpose=fullsize

6

πŸ“– Contoh

  • Segmentasi pelanggan
  • Analisis perilaku pengguna
  • Deteksi anomali

10. βš™οΈ Tools Unsupervised Learning

πŸ“Š Tools

ToolsFungsi
PythonBahasa utama
Scikit-learnML library
MatplotlibVisualisasi

11. 🎯 Kesimpulan

  • Unsupervised Learning bekerja tanpa label
  • Digunakan untuk eksplorasi data
  • Algoritma utama: K-Means, Hierarchical, PCA
  • Berguna dalam analisis data besar
  • Tantangan utama adalah evaluasi

πŸ“š Aktivitas Pembelajaran

  • Latihan: Clustering dataset sederhana
  • Diskusi: β€œBagaimana menentukan jumlah cluster?”
  • Praktikum: Implementasi K-Means di Python