Course Content
Data Analysis with R
About Lesson

Pada video ini ditunjukkan tiga contoh data frame order yang masing-masing memiliki permasalahan data yang umum ditemui dalam analisis data, yaitu data hilang (missing value), data duplikat, dan inkonsistensi data. Pada data frame pertama, terdapat nilai NA dan not available pada kolom nama driver, tarif, dan jarak kilometer yang menunjukkan adanya data yang hilang. Pada data frame kedua, ditemukan ID order dan nama driver yang muncul lebih dari satu kali, menandakan adanya duplikasi data yang dapat menyebabkan hasil analisis seperti perhitungan rata-rata menjadi tidak akurat. Sementara itu, pada data frame ketiga terlihat inkonsistensi format data, seperti perbedaan format tanggal, perbedaan penulisan huruf pada nama pelanggan, serta ketidakkonsistenan informasi kota yang bercampur dengan nama provinsi, yang berpotensi menimbulkan error saat data diproses lebih lanjut.

0% Complete