Algoritma Machine Learning dan Di Mana Digunakan?
Machine Learning dapat dikelompokkan menjadi dua tugas learning yang luas: diawasi dan tidak diawasi.
Learning yang diawasi
Suatu algoritma menggunakan data pelatihan dan umpan balik dari manusia untuk mempelajari hubungan input yang diberikan dengan output yang diberikan.Misalnya,seorang praktisi dapat menggunakan biaya pemasaran dan ramalan cuaca sebagai data input untuk memprediksi penjualan kaleng.Anda dapat menggunakan learning yang terawasi ketika data keluaran diketahui.Algoritma akan memprediksi data baru.
Ada dua kategori learning terawasi:
- Tugas klasifikasi
- Tugas regresi
Klasifikasi
Bayangkan anda ingin memprediksi jenis kelamin pelanggan untuk iklan.Anda akan mulai mengumpulkan data tentang tinggi badan,berat badan,pekerjaan,gaji,keranjang pembelian,dll dari database pelanggan anda.Anda tahu jenis kelamin setiap pelanggan anda,itu hanya bisa laki-laki atau perempuan.Tujuan pengklasifikasi adalah untuk menetapkan kemungkinan menjadi laki-laki atau perempuan(yaitu,label)berdasarkan informasi(yaitu,fitur yang telah Anda kumpulkan).Saat model mempelajari cara mengenali pria atau wanita,anda dapat menggunakan data baru untuk membuat prediksi.Misalnya,anda baru saja mendapat informasi baru dari pelanggan yang tidak dikenal,dan anda ingin tahu apakah itu laki-laki atau perempuan.Jika pengklasifikasi memprediksi laki-laki = 70%,itu berarti algoritma yakin pada 70% bahwa pelanggan ini adalah laki-laki,dan 30% adalah perempuan.
Label dapat terdiri dari dua atau lebih kelas.Contoh machine learning di atas hanya memiliki dua kelas,tetapi jika pengklasifikasi perlu memprediksi objek,ia memiliki lusinan kelas (misalnya : kaca,meja,sepatu, dll yang setiap objek mewakili kelas).
Label dapat terdiri dari dua atau lebih kelas.Contoh machine learning di atas hanya memiliki dua kelas,tetapi jika pengklasifikasi perlu memprediksi objek,ia memiliki lusinan kelas (misalnya : kaca,meja,sepatu, dll yang setiap objek mewakili kelas).
Regresi
Ketika output adalah nilai kontinu,tugasnya adalah regresi.Misalnya,seorang analis keuangan mungkin perlu memperkirakan nilai saham berdasarkan berbagai fitur seperti ekuitas,kinerja saham sebelumnya,indeks makroekonomi.Sistem akan dilatih untuk memperkirakan harga saham dengan kesalahan seminimal mungkin.- Algoritma : Regrasi Linier.
- Deskripsi : Menemukan cara untuk menghubungkan setiap fitur dengan output untuk membantu memprediksi nilai masa depan.
- Tipe : Regresi.
- Algoritma : Regresi logistik.
- Deskripsi : Perpanjangan regresi linier yang digunakan untuk tugas klasifikasi.Variabel output 3 adalah biner (misalnya,hanya hitam atau putih) daripada kontinu(misalnya,daftar warna potensial yang tak terbatas).
- Tipe : Klasifikasi.
- Algoritma : Naive Bayes.
- Deskripsi : Metode Bayesian adalah metode klasifikasi yang menggunakan teorema Bayesian.Teorema memperbarui pengetahuan sebelumnya dari suatu peristiwa dengan probabilitas independen dari setiap fitur yang dapat mempengaruhi peristiwa tersebut.
- Tipe : Regresi klasifikasi.
- Algoritma : Support vector machine.
- Deskripsi : Support Vector Machine,atau SVM,biasanya digunakan untuk tugas klasifikasi. Algoritma SVM menemukan hyperplane yang membagi kelas secara optimal.Ini paling baik digunakan dengan pemecah non-linear.
- Tipe : Regresi.
- Algoritma : Random forest
- Deskripsi : Algoritma ini dibangun di atas pohon keputusan untuk meningkatkan akurasi secara drastis. Random Forest menghasilkan berkali-kali pohon keputusan sederhana dan menggunakan metode 'suara mayoritas' untuk memutuskan label mana yang akan dikembalikan.Untuk tugas klasifikasi, prediksi akhir akan menjadi prediksi dengan suara terbanyak;sedangkan untuk tugas regresi,prediksi rata-rata semua pohon adalah prediksi akhir.
- Tipe : Regresi klasifikasi.
- Algoritma : AdaBoost
- Deskripsi : Teknik klasifikasi atau regresi yang menggunakan banyak model untuk menghasilkan keputusan tetapi menimbangnya berdasarkan keakuratannya dalam memprediksi hasil.
- Tipe : Regresi klasifikasi.
- Algoritma : Gradient-boosting trees.
- Deskripsi : Pohon penguat gradien adalah teknik klasifikasi/regresi yang canggih.Ini berfokus pada kesalahan yang dilakukan oleh pohon sebelumnya dan mencoba untuk memperbaikinya.
- Tipe : Regresi klasifikasi.
Learning tanpa pengawasan
Dalam learning tanpa pengawasan,algoritma mengeksplorasi data input tanpa diberikan variabel output eksplisit(mis: mengeksplorasi data demografis pelanggan untuk mengidentifikasi pola).Anda dapat menggunakannya ketika anda tidak tahu cara mengklasifikasikan data dan anda ingin algoritma menemukan pola dan mengklasifikasikan data untuk anda.
- Nama Algoritma : K-means clustering.
- Deskripsi : Menempatkan data ke dalam beberapa kelompok(k)yang masing-masing berisi data dengan karakteristik yang sama(sebagaimana ditentukan oleh model,tidak terlebih dahulu oleh manusia).
- Tipe : Clustering
- Nama Algoritma : Gaussian mixture model.
- Deskripsi : Sebuah generalisasi dari k-means clustering yang memberikan lebih banyak fleksibilitas dalam ukuran dan bentuk kelompok (cluster).
- Tipe : Clustering.
- Nama Algoritma : Hierarchical clustering.
- Deskripsi : Membagi klaster di sepanjang pohon hierarki untuk membentuk sistem klasifikasi.
- Tipe : Clustering.
- Nama Algoritma : Recommender system.
- Deskripsi : Bantuan untuk menentukan data yang relevan untuk membuat rekomendasi.
- Tipe : Clustering
- Nama Algoritma : PCA/T-SNE
- Deskripsi : Sebagian besar digunakan untuk mengurangi dimensi data.Algoritme mengurangi jumlah fitur menjadi 3 atau 4 vektor dengan varian tertinggi.
- Tipe : Dimension Reduction.
Post a Comment