K-nearest neighbor

K-nearest neighbor, juga dikenal sebagai algoritma KNN, adalah algoritma non-parametrik yang mengklasifikasikan titik-titik data berdasarkan kedekatan dan asosiasinya dengan data lain yang tersedia. Algoritma ini mengasumsikan bahwa titik-titik data yang sama dapat ditemukan berdekatan satu sama lain. Akibatnya, ia berusaha untuk menghitung jarak antara titik data, biasanya melalui jarak Euclidean, dan kemudian menetapkan kategori berdasarkan kategori atau rata-rata yang paling sering.

Kemudahan penggunaan dan waktu kalkulasi yang rendah menjadikannya algoritme yang disukai oleh para ilmuwan data, tetapi seiring dengan bertambahnya dataset pengujian, waktu pemrosesan menjadi lebih lama, sehingga kurang menarik untuk tugas klasifikasi. KNN biasanya digunakan untuk mesin rekomendasi dan pengenalan citra.