Pada sesi praktik ini, peserta akan menggunakan YOLO versi 5, sebuah algoritma deep learning yang telah dilatih sebelumnya (pretrained model) untuk melakukan object detection. YOLO v5 mampu mengenali berbagai objek umum seperti manusia, hewan, dan kendaraan, karena sudah memahami fitur visual seperti tepi dan bentuk. Alih-alih membangun model dari nol, peserta akan melakukan fine-tuning pada YOLO dengan dataset baru, yang jauh lebih efisien. Langkah awal dimulai dari menyiapkan dataset berupa gambar atau video, dengan objek sederhana seperti botol atau buku. Gambar lebih variatif tapi memerlukan labeling manual yang intensif, sedangkan video mempermudah proses labeling karena bisa menggunakan interpolasi bounding box. Dalam praktik ini, akan digunakan sebuah video berdurasi sekitar satu menit untuk mendeteksi bagian tubuh seperti mata, kepala, dan tangan. Data dari video ini akan diekstrak beberapa detik saja untuk melatih model sebelum diaplikasikan ke seluruh video. Tahap selanjutnya adalah dataset preprocessing.
Dataset Preparation
0/3
Video editting dan CVAT installation
0/5
Labeling
0/6
YOLO Environment Setup
0/6
Training and Evaluation
0/5
Evaluation
0/4
About Lesson