π’ 1. Pengantar Teknik Klasifikasi
6
π Apa Itu Teknik Klasifikasi?
Klasifikasi adalah salah satu teknik utama dalam Data Mining dan Machine Learning yang digunakan untuk mengelompokkan data ke dalam kategori atau kelas tertentu berdasarkan pola yang dipelajari dari data sebelumnya.
Teknik klasifikasi termasuk ke dalam:
- Supervised Learning
- Predictive Analytics
- Pattern Recognition
π― Tujuan Teknik Klasifikasi
<div style=”background:#eff6ff;padding:20px;border-radius:12px;border-left:5px solid #2563eb;”>
Tujuan Utama:
- Mengelompokkan data ke kelas tertentu
- Membuat prediksi
- Membantu pengambilan keputusan
- Mengenali pola data
- Meningkatkan otomatisasi sistem
</div>
π’ 2. Konsep Dasar Klasifikasi
6
π Diagram Proses Klasifikasi
Training Data
β
Learning Process
β
Classification Model
β
Prediction
π Penjelasan Tahapan
| Tahapan | Penjelasan |
|---|---|
| Training Data | Data pelatihan |
| Learning Process | Proses belajar model |
| Model | Hasil pembelajaran |
| Prediction | Prediksi data baru |
π’ 3. Contoh Kasus Klasifikasi
6
π§ Contoh 1 β Spam Email
Sistem menentukan:
- Spam
- Non-Spam
π Contoh 2 β Prediksi Kelulusan
Sistem menentukan:
- Lulus
- Tidak Lulus
π³ Contoh 3 β Fraud Detection
Sistem menentukan:
- Fraud
- Non-Fraud
π’ 4. Jenis-Jenis Teknik Klasifikasi
7
π Algoritma Klasifikasi Populer
| Algoritma | Fungsi |
|---|---|
| Decision Tree | Pohon keputusan |
| Naive Bayes | Probabilitas |
| K-Nearest Neighbor | Berdasarkan tetangga terdekat |
| Support Vector Machine | Pemisahan kelas |
| Neural Network | Deep Learning |
π’ 5. Decision Tree
6
π Pengertian Decision Tree
Decision Tree adalah algoritma klasifikasi berbentuk pohon keputusan.
π Struktur Decision Tree
Kehadiran?
/ \
Tinggi Rendah
/ \
Lulus Tidak Lulus
π― Kelebihan Decision Tree
| Kelebihan | Penjelasan |
|---|---|
| Mudah dipahami | Visual sederhana |
| Cepat | Proses efisien |
| Interpretatif | Mudah dijelaskan |
β οΈ Kekurangan
- Rentan overfitting
- Sensitif terhadap data noise
π’ Entropy dan Information Gain
π Rumus Entropy
Entropy(S)=ββi=1nβpiβlog2βpiβ
π Rumus Information Gain
Gain(S,A)=Entropy(S)ββvβValues(A)ββ£Sβ£β£Svββ£βEntropy(Svβ)
π’ 6. Naive Bayes
6
π Pengertian Naive Bayes
Naive Bayes adalah algoritma klasifikasi berbasis probabilitas dan Teorema Bayes.
π Rumus Bayes
P(Aβ£B)=P(B)P(Bβ£A)P(A)β
P(A)
P(Bβ£A)
P(Bβ£Β¬A)
P(Aβ£B)=P(B)P(Bβ£A)P(A)ββ0.68,P(B)β0.25P(B)=0.25P(B|A)P(A)=0.17P(A|B)~0.68Posterior = useful evidence / total evidence
π Contoh Penggunaan
- Filter spam email
- Analisis sentimen
- Prediksi penyakit
π― Kelebihan Naive Bayes
| Kelebihan | Penjelasan |
|---|---|
| Cepat | Training ringan |
| Efisien | Cocok big data |
| Akurat | Untuk teks |
π’ 7. K-Nearest Neighbor (KNN)
6
π Pengertian KNN
KNN mengklasifikasikan data berdasarkan tetangga terdekat.
π Cara Kerja KNN
- Menentukan nilai K
- Menghitung jarak
- Memilih tetangga terdekat
- Menentukan kelas mayoritas
π Rumus Euclidean Distance
d(x,y)=βi=1nβ(xiββyiβ)2β
β οΈ Kekurangan KNN
- Lambat pada data besar
- Sensitif terhadap noise
π’ 8. Support Vector Machine (SVM)
7
π Pengertian SVM
SVM adalah algoritma yang mencari hyperplane terbaik untuk memisahkan kelas data.
π Konsep SVM
Class A β β β β
------------------ Hyperplane
Class B β² β² β² β²
π― Kelebihan SVM
| Kelebihan | Penjelasan |
|---|---|
| Akurat | Performa tinggi |
| Efektif | Data kompleks |
| Cocok high dimension | Banyak fitur |
π’ 9. Neural Network
8
π Pengertian Neural Network
Neural Network meniru cara kerja otak manusia dalam memproses informasi.
π Struktur Neural Network
Input Layer
β
Hidden Layer
β
Output Layer
π Contoh Penggunaan
- Face recognition
- Speech recognition
- AI chatbot
- Image classification
π’ 10. Evaluasi Model Klasifikasi
7
π Mengapa Evaluasi Penting?
Untuk mengetahui seberapa baik model melakukan klasifikasi.
π’ Confusion Matrix
| Actual / Prediction | Positif | Negatif |
|---|---|---|
| Positif | TP | FN |
| Negatif | FP | TN |
π Penjelasan
- TP = True Positive
- TN = True Negative
- FP = False Positive
- FN = False Negative
π’ Accuracy
π Rumus Accuracy
Accuracy=TP+TN+FP+FNTP+TNβ
π’ Precision
Precision=TP+FPTPβ
π’ Recall
Recall=TP+FNTPβ
π’ F1-Score
F1=2ΓPrecision+RecallPrecisionΓRecallβ
π’ 11. Tahapan Implementasi Klasifikasi
8
π Workflow Klasifikasi
Data Collection
β
Preprocessing
β
Training Model
β
Testing
β
Evaluation
π’ 12. Tutorial Klasifikasi Menggunakan Python
6
π₯ Langkah 1 β Import Library
import pandas as pd
from sklearn.tree import DecisionTreeClassifier
π Langkah 2 β Membaca Dataset
data = pd.read_csv('dataset.csv')
βοΈ Langkah 3 β Training Model
model = DecisionTreeClassifier()
model.fit(X_train, y_train)
π Langkah 4 β Prediksi
prediction = model.predict(X_test)
π Langkah 5 β Evaluasi
from sklearn.metrics import accuracy_score
π’ 13. Studi Kasus Klasifikasi
5
π Kasus Prediksi Kelulusan Mahasiswa
Dataset:
- Kehadiran
- Nilai tugas
- Nilai UTS
- Nilai UAS
π Tujuan
Memprediksi:
- Lulus
- Tidak Lulus
π Hasil
Menggunakan Decision Tree:
- Accuracy 92%
- Prediksi cepat
- Membantu dosen memantau mahasiswa
π’ 14. Kelebihan dan Kekurangan Teknik Klasifikasi
5
| Kelebihan | Kekurangan |
|---|---|
| Prediksi cepat | Membutuhkan training data |
| Otomatisasi tinggi | Rentan overfitting |
| Akurasi tinggi | Sensitif noise |
| Membantu keputusan | Butuh preprocessing |
π’ 15. Penerapan Teknik Klasifikasi
5
| Bidang | Implementasi |
|---|---|
| Pendidikan | Prediksi kelulusan |
| Perbankan | Fraud detection |
| Kesehatan | Diagnosa penyakit |
| E-Commerce | Rekomendasi produk |
| Cyber Security | Spam detection |
π’ 16. Kesimpulan
6 <div style=”background:#111827;color:white;padding:25px;border-radius:14px;”>
β¨ Ringkasan Materi
Teknik klasifikasi merupakan metode penting dalam Data Mining untuk mengelompokkan data ke kelas tertentu.
Algoritma populer:
- Decision Tree
- Naive Bayes
- KNN
- SVM
- Neural Network
Klasifikasi digunakan dalam berbagai bidang seperti:
- pendidikan,
- kesehatan,
- bisnis,
- keamanan,
- dan Artificial Intelligence.
</div>