π’ 1. Pengantar Jenis Data dan Sumber Data
7
π Apa Itu Jenis Data?
Jenis data adalah klasifikasi atau kategori data berdasarkan bentuk, karakteristik, struktur, dan cara pengolahannya.
Dalam Data Mining, memahami jenis data sangat penting karena:
- menentukan metode analisis,
- menentukan algoritma yang digunakan,
- mempengaruhi proses preprocessing,
- dan mempengaruhi kualitas hasil analisis.
π Apa Itu Sumber Data?
Sumber data adalah asal atau tempat diperolehnya data yang akan digunakan dalam proses Data Mining.
Data dapat berasal dari:
- database,
- website,
- media sosial,
- sensor IoT,
- aplikasi mobile,
- transaksi bisnis,
- cloud computing,
- dan berbagai sistem informasi lainnya.
π’ 2. Pentingnya Memahami Jenis Data
6 <div style=”background:#eff6ff;padding:20px;border-radius:12px;border-left:5px solid #2563eb;”>
π― Mengapa Jenis Data Penting?
- Menentukan teknik analisis
- Menentukan algoritma Data Mining
- Mempermudah preprocessing
- Meningkatkan akurasi model
- Mempermudah visualisasi data
- Mengurangi kesalahan analisis
</div>
π’ 3. Klasifikasi Jenis Data
5
π Diagram Jenis Data
DATA
βββ Structured Data
βββ Semi-Structured Data
βββ Unstructured Data
π’ 4. Structured Data
6
π Pengertian Structured Data
Structured Data adalah data yang memiliki format terstruktur dan tersimpan dalam tabel atau database relasional.
Data jenis ini:
- mudah dicari,
- mudah dianalisis,
- mudah diproses oleh sistem komputer.
π Contoh Structured Data
| NIM | Nama | Nilai |
|---|---|---|
| 101 | Andi | 90 |
| 102 | Budi | 85 |
| 103 | Citra | 95 |
π― Karakteristik Structured Data
| Karakteristik | Penjelasan |
|---|---|
| Memiliki schema | Struktur jelas |
| Tersusun dalam tabel | Row dan column |
| Mudah di-query | Menggunakan SQL |
| Konsisten | Format data stabil |
π Contoh Penggunaan
- Sistem akademik
- Data transaksi bank
- Database pelanggan
- Sistem inventori
- Data penjualan
π’ 5. Semi-Structured Data
6
π Pengertian Semi-Structured Data
Semi-Structured Data adalah data yang tidak sepenuhnya berbentuk tabel tetapi masih memiliki struktur tertentu.
π Contoh Semi-Structured Data
JSON
{
"nama": "Andi",
"nilai": 90
}
XML
<mahasiswa>
<nama>Andi</nama>
<nilai>90</nilai>
</mahasiswa>
π― Karakteristik Semi-Structured Data
| Karakteristik | Penjelasan |
|---|---|
| Fleksibel | Struktur dapat berubah |
| Memiliki tag | XML/JSON |
| Mudah pertukaran data | API dan web service |
| Tidak selalu berbentuk tabel | Lebih dinamis |
π Contoh Penggunaan
- API web
- Data aplikasi mobile
- Data cloud
- Web service
- Konfigurasi sistem
π’ 6. Unstructured Data
6
π Pengertian Unstructured Data
Unstructured Data adalah data yang tidak memiliki format atau struktur tetap.
Jenis data ini paling banyak ditemukan di internet.
π Contoh Unstructured Data
- Foto
- Video
- Audio
- Komentar media sosial
- Dokumen PDF
- Chat WhatsApp
π― Karakteristik Unstructured Data
| Karakteristik | Penjelasan |
|---|---|
| Tidak memiliki schema | Tidak terstruktur |
| Kompleks | Sulit dianalisis |
| Volume besar | Sangat banyak |
| Beragam format | Multimedia |
π Contoh Penggunaan
- Analisis sentimen media sosial
- Face recognition
- Speech recognition
- Video analytics
π’ 7. Jenis Data Berdasarkan Nilai
7
π Jenis Data Berdasarkan Nilai
DATA
βββ Numerik
βββ Kategorikal
π’ 8. Data Numerik
π Pengertian
Data numerik adalah data berbentuk angka yang dapat dihitung secara matematis.
π Contoh
| Nama | Umur |
|---|---|
| Andi | 20 |
| Budi | 22 |
π― Jenis Data Numerik
| Jenis | Contoh |
|---|---|
| Integer | 1, 2, 3 |
| Float | 3.14, 9.5 |
| Continuous | Tinggi badan |
| Discrete | Jumlah mahasiswa |
π’ 9. Data Kategorikal
π Pengertian
Data kategorikal adalah data berbentuk kategori atau label.
π Contoh
| Nama | Gender |
|---|---|
| Andi | Laki-Laki |
| Citra | Perempuan |
π― Jenis Data Kategorikal
| Jenis | Penjelasan |
|---|---|
| Nominal | Tidak memiliki urutan |
| Ordinal | Memiliki tingkatan |
π Contoh
Nominal
- Warna
- Jenis kelamin
Ordinal
- Ranking
- Tingkat pendidikan
π’ 10. Sumber Data dalam Data Mining
5
π Jenis Sumber Data
| Sumber Data | Contoh |
|---|---|
| Database | MySQL, PostgreSQL |
| Data Warehouse | BigQuery |
| Website | E-commerce |
| Media Sosial | Twitter, Instagram |
| Sensor IoT | Smart devices |
| Cloud Storage | Google Drive |
| Mobile Apps | Aplikasi Android |
π’ 11. Database sebagai Sumber Data
6
π Pengertian Database
Database adalah kumpulan data terorganisir yang disimpan secara sistematis.
π Jenis Database
| Database | Fungsi |
|---|---|
| MySQL | Web database |
| PostgreSQL | Enterprise database |
| MongoDB | NoSQL database |
| Oracle | Sistem enterprise |
| SQL Server | Microsoft database |
π’ 12. Media Sosial sebagai Sumber Data
6
π Data Media Sosial
Media sosial menghasilkan data sangat besar setiap hari.
π Jenis Data Media Sosial
- Komentar
- Like
- Share
- Hashtag
- Video
- Foto
π Penerapan
- Sentiment analysis
- Trend analysis
- Customer behavior analysis
π’ 13. IoT sebagai Sumber Data
6
π Pengertian IoT
Internet of Things (IoT) adalah perangkat yang saling terhubung melalui internet dan menghasilkan data secara otomatis.
π Contoh Data IoT
| Perangkat | Data |
|---|---|
| Smartwatch | Detak jantung |
| CCTV | Video |
| GPS | Lokasi |
| Sensor suhu | Temperatur |
π’ 14. Big Data sebagai Sumber Data
7
π Karakteristik Big Data
| Karakteristik | Penjelasan |
|---|---|
| Volume | Data sangat besar |
| Velocity | Data sangat cepat |
| Variety | Jenis data beragam |
| Veracity | Validitas data |
| Value | Nilai informasi |
π’ 15. Tantangan Pengelolaan Data
6
| Tantangan | Penjelasan |
|---|---|
| Data Kotor | Data tidak valid |
| Missing Value | Data kosong |
| Data Besar | Sulit diproses |
| Privasi | Risiko kebocoran data |
| Integrasi | Data berbeda format |
π’ 16. Tutorial Sederhana Identifikasi Jenis Data
5
π₯ Langkah 1 β Membuka Dataset
- Buka file CSV atau Excel
- Perhatikan isi kolom dataset
π Langkah 2 β Identifikasi Jenis Data
| Kolom | Jenis Data |
|---|---|
| Nama | Kategorikal |
| Umur | Numerik |
| Gender | Kategorikal |
| Nilai | Numerik |
βοΈ Langkah 3 β Menentukan Teknik Analisis
| Jenis Data | Teknik |
|---|---|
| Numerik | Statistik |
| Kategorikal | Classification |
| Teks | Text Mining |
| Gambar | Computer Vision |
π’ 17. Studi Kasus
6
π Kasus Analisis Mahasiswa
Dataset:
- Nama mahasiswa
- Nilai
- Kehadiran
- Aktivitas LMS
π Jenis Data
| Data | Jenis |
|---|---|
| Nama | Kategorikal |
| Nilai | Numerik |
| Kehadiran | Numerik |
| Komentar LMS | Teks |
π Hasil Analisis
- Prediksi kelulusan
- Analisis performa mahasiswa
- Identifikasi mahasiswa berisiko
π’ 18. Kesimpulan
5 <div style=”background:#111827;color:white;padding:25px;border-radius:14px;”>
β¨ Ringkasan Materi
Jenis data dan sumber data merupakan dasar penting dalam Data Mining.
Mahasiswa perlu memahami:
- jenis data,
- struktur data,
- sumber data,
- dan karakteristik data,
agar dapat menentukan metode analisis yang tepat dan menghasilkan model Data Mining yang akurat. </div>