Back to IF3270 Pembelajaran Mesin

Machine Learning Paradigms: Supervised, Unsupervised, and Reinforcement Learning

Questions/Cues

  • Apa perbedaan utama supervised vs unsupervised learning?
  • Mengapa reinforcement learning disebut “berbasis hadiah”?
  • Contoh aplikasi unsupervised learning di industri?
  • Bagaimana agent berinteraksi dengan lingkungan di RL?
  • Kapan menggunakan semi-supervised learning?

Reference Points

  • Lecture_ML_Overview.pptx (Slides 17-18, 22)
  • Machine_Learning_Textbook.pdf (Halaman 58-63)

Pembelajaran Terawasi (Supervised Learning)

Pembelajaran terawasi melibatkan pelatihan model menggunakan dataset yang telah dilabeli, dimana setiap contoh pelatihan terdiri dari pasangan fitur (input) dan label (output target). Tujuan utamanya adalah mempelajari fungsi pemetaan dari input ke output sehingga dapat memprediksi label untuk data baru yang belum pernah dilihat.

Contoh aplikasi: Sistem rekomendasi produk e-commerce yang memprediksi rating pengguna berdasarkan histori pembelian. Dalam kasus ini, fitur berupa data pembelian dan demografi pengguna, sedangkan label adalah rating numerik (1-5). Model akan belajar pola hubungan antara karakteristik pengguna dan preferensi rating mereka.

Proses pembelajaran mengikuti siklus: 1) Koleksi data berlabel, 2) Pemilihan algoritma (misal: Decision Tree, SVM), 3) Pelatihan model hingga konvergensi, 4) Validasi menggunakan data tes. Tantangan utamanya termasuk kebutuhan data berlabel yang mahal dan risiko overfitting jika model terlalu kompleks.

Pembelajaran Tidak Terawasi (Unsupervised Learning)

Paradigma ini bekerja dengan data tanpa label, bertujuan menemukan pola atau struktur intrinsik dalam dataset. Algoritma unsupervised learning melakukan eksplorasi otomatis untuk mengidentifikasi kelompok data serupa (clustering), hubungan asosiatif (association rules), atau reduksi dimensi.

Contoh nyata: Segmentasi pelanggan retail berdasarkan perilaku belanja. Tanpa mengetahui kategori sebelumnya, algoritma seperti K-Means mengelompokkan pelanggan dengan karakteristik pembelian serupa. Hasilnya membantu perusahaan merancang strategi pemasaran yang lebih personalisasi.

Teknik utama mencakup:

  • Clustering: Pengelompokan data berdasarkan kesamaan (contoh: DBSCAN, Hierarchical Clustering)
  • Asosiasi: Menemukan hubungan antara variabel (contoh: Apriori untuk analisis keranjang belanja)
  • Reduksi Dimensi: PCA atau t-SNE untuk visualisasi data kompleks

Pembelajaran Penguatan (Reinforcement Learning - RL)

RL melatih agent untuk mengambil keputusan optimal melalui interaksi berulang dengan lingkungan, menggunakan mekanisme reward (penghargaan) dan punishment (hukuman). Berbeda dengan paradigma lain, RL tidak memerlukan dataset statis tetapi belajar dari pengalaman dinamis.

Komponen utama:

  • Agent: Entitas pembuat keputusan
  • Environment: Dunia tempat agent beroperasi
  • State: Representasi kondisi lingkungan saat ini
  • Action: Keputusan yang diambil agent
  • Reward: Umpan balik numerik untuk setiap aksi

Contoh implementasi: Sistem kontrol lampu lalu lintas adaptif yang meminimalkan kemacetan. Agent (sistem kontrol) belajar dengan mencoba berbagai durasi hijau-merah, menerima reward tinggi ketika mengurangi antrian dan penalty ketika terjadi kemacetan panjang.

Perbandingan dan Pemilihan Paradigma

AspekSupervisedUnsupervisedReinforcement
Data InputBerlabelTanpa labelInteraktif
Umpan BalikLangsung (label)Tidak adaReward tertunda
Kompleksitas KomputasiMenengahVariatifSangat Tinggi
Aplikasi KhasPrediksi harga, klasifikasiSegmentasi pasar, anomaly detectionRobotika, game AI
Semi-supervised learning menjadi solusi hybrid ketika hanya sebagian data berlabel, memanfaatkan kedua pendekatan untuk meningkatkan akurasi dengan biaya pelabelan lebih rendah.

Summary

Machine learning memiliki tiga paradigma utama dengan karakteristik unik:

  • Supervised learning membutuhkan data berlabel untuk pelatihan model prediktif, cocok untuk tugas klasifikasi dan regresi
  • Unsupervised learning mengeksplorasi pola tersembunyi dalam data tanpa label, ideal untuk segmentasi dan reduksi kompleksitas
  • Reinforcement learning mengembangkan agent yang belajar optimal melalui trial-and-error dalam lingkungan dinamis.

Faktor penentu pemilihan paradigma meliputi ketersediaan data berlabel, sifat masalah, dan kebutuhan interaksi real-time. Pendekatan hybrid seperti semi-supervised learning menjembatani keterbatasan data berlabel.