JENIS JENIS MACHINE LEARNING (Jarot S Suroso)
Machine Learning terdapat banyak jenis dan tipe nya berdasarkan hasil yang akan didapatkan dengan melihat kondisi Data yang diperoleh.
- Supervised Learning
Supervised Learning (pembelajaran terarah) adalah salah satu metode pembelajaran mesin dimana hasil yang diharapkan pengguna, sudah diketahui atau dimiliki informasinya oleh sistem. Hal ini berarti bahwa metode pembelajaran ini bekerja dengan memanfaatkan kembali data-data dan hasil output yang pernah dimasukkan oleh pengguna atau dikerjakan oleh sistem sebelumnya.Pada metode ini, pola input dan pola output dibutuhkan untuk mengenali suatu informasi dalam bank memori. Ketika suatu pola input dibentuk, sistem akan meneruskan rangsangan data hingga ke bank memori dan sistem output. Sistem output yang menerima rangsangan data akan menampilkan pola output dan mencocokkan polanya dengan pola input. Jika pola cocok, data akan ditampilkan dari bank memori dalam bentuk output. Apabila pola input dan pola output tidak ada yang cocok, maka output akan error. Dan jika nilai error cukup besar, pembelajaran lebih lanjut perlu dilakukan.
Beberapa contoh sistem algoritma yang menerapkan metode Supervised Learning adalah algoritma Hebbian (Hebb Rule), algoritma Perceptron, algoritma Adaline, algoritma Boltzman, algoritma Hapfield, dan algoritma Backpropagation.
Contoh Studi Kasus pemecahan masalah dengan metode Supervised Learning adalah misalnya kita ingin memilah email mana yang termasuk spam dan mana yang bukan. Saat pertama kali kita memutuskan suatu email dari pengirim tertentu adalah spam, sistem tidak memiliki data pemilahan sehingga semua email diterima sebagaimana mestinya. Namun setelah kita menandai email dari suatu pengirim adalah spam, sistem akan secara otomatis terus memasukkan email tersebut ke folder spam sampai kita membatalkan stempel atau pilihan spam pada si pengirim email tersebut.
- Unsupervised Learning
Unsupervised Learning (pembelajaran tidak terarah) adalah metode lain dalam materi pembelajaran mesin. Konsep yang metode ini gunakan jauh berbeda dengan metode Supervised Learning dimana pada metode ini hasil yang diharapkan tidak dapat diketahui oleh siapapun. Dengan kata lain, hasil yang akan ditampilkan hanya bergantung kepada nilai bobot yang disusun pada awal pembangunan sistem dan tentu masih dalam ruang lingkup tertentu. Tujuan utama dari metode pembelajaran ini adalah agar para penggunanya dapat mengelompokkan objek-objek yang dinilai sejenis dalam ruang atau area tertentu. Metode pembelajaran ini sangat cocok digunakan untuk mencari atau mengklasifikasi suatu pola dari banyak objek sejenis yang tidak sepenuhnya sama.
Beberapa contoh sistem algoritma yang menggunakan metode Unsupervised Learning adalah algoritma kompetitif, algoritma Hebbian, algoritma Kohonen, algoritma Neocognitron.
Contoh Studi Kasus pemecahan masalah dengan metode Unsupervised Learning adalah misal suatu pusat perbelanjaan ingin melakukan bongkar muat terhadap satu truk berisi sepatu campur. Agar dapat dijual sepatu-sepatu tersebut perlu dikelompokkan brand dan ukurannya. Dalam hal ini, pihak pusat perbelanjaan tidak perlu memasukkan datanya terlebih dahulu karena data yang ada di lapangan saat itulah yang langsung diproses untuk mengelompokkan sepatu-sepatu tersebut sesuai brand dan ukurannya.
- Semi-supervised Learning
Ini merupakan gabungan dari supervised learning dan unsupervised learning. Di sini dataset untuk pelatihan sebagian memiliki label dan sebagian tidak. Google Photos adalah contoh implementasi yang sering kita gunakan. Pada Google Photos kita bisa memberi tag atau label untuk setiap orang yang ada dalam sebuah foto. Alhasil, ketika kita mengunggah foto baru dengan wajah orang yang sebelumnya sudah kita beri label, Google Photos akan secara otomatis mengenali orang tersebut.
Salah satu contoh dari model semi supervised learning adalah Deep Belief Network (DBNs). DBNs adalah model grafis dengan multiple layer yang dapat belajar teknik mengekstrak data training secara efisien. Dua jenis layer pada DBNs adalah visible atau input layer dan hidden layer.
Menurut Geron, DBNs berdasar pada komponen unsupervised yang disebut restricted Boltzmann machine (RBMs). RBMs dilatih secara berurutan dengan algoritma unsupervised learning, kemudian seluruh sistem disesuaikan dengan teknik supervised learning.
Campbell dalam tulisannya menyatakan bahwa pendekatan DBNs telah berhasil menyelesaikan pemodelan akustik pada speech recognition. DBNs menunjukkan sifat perkiraan yang kuat, peningkatan kinerja, dan merupakan parameter yang efisien.
- Reinforcement Learning
Reinforcement Learning dikenal sebagai model yang belajar menggunakan sistem reward dan penalty. Menurut Winder, reinforcement learning adalah teknik yang mempelajari bagaimana membuat keputusan terbaik, secara berurutan, untuk memaksimalkan ukuran sukses kehidupan nyata. Entitas pembuat keputusan belajar melalui proses trial dan eror.
Reinforcement learning memiliki empat komponen, yaitu action, agent, environment, dan reward. Action adalah setiap keputusan yang diambil. Misal, saat kita berkendara, action yang kita lakukan adalah mengendalikan kemudi, menginjak gas, dan mengerem. Agent adalah entitas yang membuat keputusan, contohnya adalah perangkat lunak, atau robot, atau bahkan manusia. Environment adalah sarana untuk berinteraksi, yang dapat menerima action dan memberikan respon berupa hasil maupun data berupa satu set observasi baru. Reward diberikan saat agent berhasil menyelesaikan tantangan. Mekanisme feedback ini membuat agent belajar tentang tindakan mana yang menyebabkan kesuksesan (menghasilkan reward), atau kegagalan (menghasilkan penalti). Keempat komponen ini merepresentasikan Markov decision process (MDP).
Model reinforcement learning belajar agar terus mendapatkan reward dan menghindari penalti. AlphaGo, sebuah program yang dikembangkan oleh Google DeepMind adalah contoh terkenal dari reinforcement learning. AlphaGo dibuat untuk memainkan permainan Go, sebuah permainan papan kuno yang berasal dari Cina. AlphaGo mempelajari setiap langkah dalam jutaan permainan Go, untuk terus mendapatkan reward yaitu memenangkan permainan. AlphaGo terkenal setelah menjadi program komputer pertama yang berhasil mengalahkan seorang pemain Go profesional yang juga merupakan juara dunia.
(Jarot S. Suroso)