Indeks Jaccard

Irisan dan gabungan himpunan A dan B
Irisan per Gabungan sebagai ukuran kemiripan dalam deteksi objek pada citra—operasi penting dalam penglihatan komputer

Indeks Jaccard (disebut juga koefisien kemiripan Jaccard) adalah ukuran kemiripan dan keragaman himpunan sampel. Indeks ini dikembangkan oleh Paul Jaccard (awalnya bernama coefficient de communauté)[1] dan dirumuskan secara mandiri oleh T. Tanimoto.[2] Karenanya, istilah indeks Tanimoto atau koefisien Tanimoto juga dipakai dalam bidang-bidang tertentu. Namun, keduanya juga secara umum mengambil rasio Irisan per Gabungan (bahasa Inggris: Intersection over Union/IoU). Indeks ini bisa diukur sebagai berikut:

Kemiripan atribut biner tak simetri

Klasifikasi biner

Lihat pula

Referensi

  1. ^ Jaccard, Paul (Februari 1912). "The Distribution of the Flora in the Alpine Zone". New Phytologist (dalam bahasa Inggris). 11 (2): 37–50. doi:10.1111/j.1469-8137.1912.tb05611.x. ISSN 0028-646X. 
  2. ^ Tanimoto, T.T. (17 November 1958). "An Elementary Mathematical theory of Classification and Prediction". Internal IBM Technical Report. 1957 (8?). 

Bacaan lebih lanjut

  • Tan, P.N., Steinbach, M., dan Kumar, V. (2005). Introduction to Data Mining. ISBN 0-321-32136-7. 
  • Jaccard, P. (1901). "Étude comparative de la distribution florale dans une portion des Alpes et des Jura". Bulletin de la Société vaudoise des sciences naturelles. 37: 547–579. 
  • Jaccard, P. (1912). "The Distribution of the flora in the alpine zone". New Phytologist. 11 (2): 37–50. doi:10.1111/j.1469-8137.1912.tb05611.x.