Data Analysis with Python
About Lesson

Di modul kedua ini, peserta belajar mengenai data preprocessing, yaitu tahap awal dalam analisis data untuk menyiapkan data mentah agar siap digunakan. Materi mencakup identifikasi masalah pada data seperti duplikasi, inkonsistensi format, data hilang (missing values), dan outlier. Peserta diperkenalkan penggunaan library Python seperti pandas dan numpy untuk mengubah data mentah menjadi data frame, melakukan standarisasi penulisan, mapping kode, penghapusan duplikasi, imputasi nilai hilang menggunakan median, serta perbaikan outlier. Setelah data dibersihkan dan distandarisasi, peserta juga diajarkan menyimpan data bersih untuk digunakan pada proses analisis selanjutnya, sehingga data siap diolah secara efektif dan akurat.

0% Complete