Deteksi objek

Objek yang dideteksi dengan modul Deep Neural Network OpenCV menggunakan model YOLOv3 yang dilatih pada dataset COCO yang mampu mendeteksi objek dari 80 kelas umum

Deteksi objek adalah teknologi komputer yang terkait dengan visi komputer dan pemrosesan gambar yang berhubungan dengan pendeteksian contoh objek semantik dari kelas tertentu (seperti manusia, bangunan, atau mobil) dalam gambar dan video digital.[1] Domain deteksi objek yang diteliti dengan baik meliputi deteksi wajah dan deteksi pejalan kaki. Deteksi objek memiliki aplikasi di banyak bidang visi komputer, termasuk pengambilan gambar dan pengawasan video.

Penggunaan

Deteksi pada objek di jalan

Deteksi objek banyak digunakan dalam tugas-tugas visi komputer seperti anotasi gambar,[2] penghitungan kendaraan,[3] pengenalan aktivitas,[4] deteksi wajah, pengenalan wajah, ko-segmentasi objek video. Ia juga digunakan dalam pelacakan objek, misalnya pelacakan bola selama pertandingan sepak bola, pelacakan pergerakan tongkat kriket, atau pelacakan seseorang dalam video.

Seringkali, gambar uji diambil sampelnya dari distribusi data yang berbeda, sehingga membuat tugas deteksi objek menjadi jauh lebih sulit.[5] Untuk mengatasi tantangan yang disebabkan oleh kesenjangan domain antara data pelatihan dan data uji, banyak pendekatan adaptasi domain tanpa pengawasan telah diusulkan.[5][6][7][8][9] Solusi sederhana dan langsung untuk mengurangi kesenjangan domain adalah dengan menerapkan pendekatan penerjemahan gambar ke gambar, seperti cycle-GAN.[10] Di antara penggunaan lainnya, deteksi objek lintas domain diterapkan dalam mengemudi otonom, di mana model dapat dilatih pada sejumlah besar adegan permainan video, karena label dapat dibuat tanpa tenaga kerja manual.

Referensi

  1. ^ Dasiopoulou, Stamatia, et al. "Knowledge-assisted semantic video object detection." IEEE Transactions on Circuits and Systems for Video Technology 15.10 (2005): 1210–1224.
  2. ^ Ling Guan; Yifeng He; Sun-Yuan Kung (1 March 2012). Multimedia Image and Video Processing. CRC Press. hlm. 331–. ISBN 978-1-4398-3087-1. 
  3. ^ Alsanabani, Ala; Ahmed, Mohammed; AL Smadi, Ahmad (2020). "Vehicle Counting Using Detecting-Tracking Combinations: A Comparative Analysis". 2020 the 4th International Conference on Video and Image Processing. hlm. 48–54. doi:10.1145/3447450.3447458. ISBN 9781450389075. 
  4. ^ Wu, Jianxin; Osuntogun, Adebola; Choudhury, Tanzeem; Philipose, Matthai; Rehg, James M. (2007). "A Scalable Approach to Activity Recognition based on Object Use". 2007 IEEE 11th International Conference on Computer Vision. hlm. 1–8. doi:10.1109/ICCV.2007.4408865. ISBN 978-1-4244-1630-1. 
  5. ^ a b Oza, Poojan; Sindagi, Vishwanath A.; VS, Vibashan; Patel, Vishal M. (2021-07-04). "Unsupervised Domain Adaptation of Object Detectors: A Survey". arΧiv:2105.13502 [cs.CV]. 
  6. ^ Khodabandeh, Mehran; Vahdat, Arash; Ranjbar, Mani; Macready, William G. (2019-11-18). "A Robust Learning Approach to Domain Adaptive Object Detection". arΧiv:1904.02361 [cs.LG]. 
  7. ^ Soviany, Petru; Ionescu, Radu Tudor; Rota, Paolo; Sebe, Nicu (2021-03-01). "Curriculum self-paced learning for cross-domain object detection". Computer Vision and Image Understanding (dalam bahasa Inggris). 204: 103166. arXiv:1911.06849alt=Dapat diakses gratis. doi:10.1016/j.cviu.2021.103166. ISSN 1077-3142. 
  8. ^ Menke, Maximilian; Wenzel, Thomas; Schwung, Andreas (October 2022). "Improving GAN-based Domain Adaptation for Object Detection". 2022 IEEE 25th International Conference on Intelligent Transportation Systems (ITSC). hlm. 3880–3885. doi:10.1109/ITSC55140.2022.9922138. ISBN 978-1-6654-6880-0. 
  9. ^ Menke, Maximilian; Wenzel, Thomas; Schwung, Andreas (2022-08-31). "AWADA: Attention-Weighted Adversarial Domain Adaptation for Object Detection". arΧiv:2208.14662 [cs.CV]. 
  10. ^ Zhu, Jun-Yan; Park, Taesung; Isola, Phillip; Efros, Alexei A. (2020-08-24). "Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks". arΧiv:1703.10593 [cs.CV]. 

Pranala luar