Analyze Crime Data in Boston with Python
Assalamualaikum temen-temen!
Apa kabar nih? Semoga dalam keadaan yang baik yaa Aamiin… Jumpa lagi nih bareng aku, kali ini kita akan melakukan analisis data kejahatan yang ada di kota Boston dengan Python! Yukk langsung aja~
Apa itu Database?
Database adalah kumpulan data yang terorganisir, yang umumnya disimpan dan diakses secara elektronik dari suatu sistem komputer. Pada saat pangkalan data menjadi semakin kompleks, maka pangkalan data dikembangkan menggunakan teknik perancangan dan pemodelan secara formal. (Wikipedia)
Kali ini saya akan menggunakan database yang ada di Kaggle yaitu data Crimes in Boston atau Laporan Data Kejahatan di kota Boston untuk memperoleh insight dari data tersebut.
Boston sendiri adalah ibu kota dan kota terbesar di Massachusetts di Amerika Serikat. Kota ini menjadi salah satu kota tertua dan terkaya di AS dengan ekonomi berbasis di bidang pendidikan, perawatan kesehatan, keuangan dan teknologi. Kota ini mendapat julukan sebagai “Atena Amerika”.
Untuk melakukan analisisnya, saya akan menggunakan Google Colab dengan beberapa library Python seperti library Pandas, dan Numpy untuk analisis datanya. Lalu, menggunakan library Seaborn untuk visualisasi data, namun untuk membuat interactive heatmap saya akan menggunakan Folium.
Sebelum memulai analisis pada data, buka terlebih dahulu Google Colab. Kemudian buat Notebook baru dan muncul tampilan seperti berikut.
Dan download terlebih dahulu data yang akan digunakan pada link. Setelah berhasil, lakukan import file kedalam Google Colab seperti berikut.
Tahapan-tahapan yang akan kita lakukan :
- Mengimport Library dan Data yang akan digunakan,
muncul hasil seperti berikut
2. Menampilkan Informasi Data,
dengan hasil seperti berikut,
3. Melakukan Cleaning Data,
Beberapa hal yang saya lakukan dalam cleaning data adalah
- Menghapus kolom yang tidak akan digunakan dalam analisis data,
- Mengkonversi OCCURED_ON_DATE ke datatime,
- Mengisi NAN Value pada Kolom Shooting,
- Mengubah DAY_OF_WEEK menjadi Kategorik,
- Mengganti -1 dalam Lat dan Long dengan Nan,
sehingga akan menampilkan hasil seperti berikut,
4. Melakukan Visualisasi Data,
Berikut adalah beberapa hasil visualisasi dari data yang telah kita buat:
4.1 Jenis Kejahatan yang Terjadi di Kota Boston
Dari grafik terlihat bahwa ada 9 jenis kejahatan dengan Larceny (kejahatan keuangan) adalah kejahatan yang sangat sering terjadi di kota Boston dengan jumlah mencapai 25000 dari bulan Juni 2015 sampai September 2018 dibandingkan Homicide (pembunuhan) yang sangat jarang terjadi.
4.2 Akumulasi Kejahatan pada Tiap Tahun
Dapat dilihat bahwa mulai tahun 2017 dan 2018 tingkat kejahatan di kota Boston terus menurun secara berturut-turut menjadi 29,7% dan 19,2%.
4.3 Komparasi Jam yang Rawan Terjadi Kejahatan
Tingkat kejahatan rendah antara 1–8 pagi. Kemudian secara bertahap akan meningkat sepanjang hari dan memuncak sekitar jam 6 sore.
4.4 Komparasi Kejahatan di Tiap Minggu
Dari grafik diatas, ada beberapa variasi hari dalam seminggu, dengan hari Jumat memiliki tingkat kejahatan tertinggi dan Minggu memiliki tingkat kejahatan terendah.
4.5 Komparasi Kejahatan di Tiap Bulan
Terlihat bahwa bulan yang ada memiliki pengaruh yang berbeda-beda, dengan bulan-bulan musim dingin di bulan Februari-April memiliki tingkat kejahatan yang paling rendah, dan bulan-bulan musim panas / awal musim gugur di bulan Juni-Oktober memiliki tingkat kejahatan yang tertinggi. Ada juga lonjakan tingkat kejahatan di bulan Januari.
4.6 Persebaran Lokasi Kejahatan
Daerah dengan tingkat kejahatan tertinggi berada pada Longitude -71.050 sampai -71.100 sedangkan untuk daerah dengan kejahatan terendah berada di Longitude -71.125 sampai -71.175.
4.7 Persebaran Lokasi Kejahatan berdasarkan Distrik
Dari scatterplot diatas dapat diketahui bahwa distrik A1 dan D4 memiliki tingkat kejahatan yang tertinggi dengan area paling pada di kota Boston.
4.8 Peta Persebaran Kejahatan Tahun 2017
KESIMPULAN
- Larceny (kejahatan keuangan) sejauh ini merupakan jenis kejahatan serius yang paling umum terjadi di kota Boston.
- Kejahatan kemungkinan besar terjadi pada sore dan malam hari.
- Kejahatan kemungkinan besar terjadi pada hari Jumat dan paling tidak mungkin terjadi pada hari Minggu.
- Kejahatan paling mungkin terjadi di musim panas dan awal musim gugur, dan paling kecil kemungkinannya terjadi di musim dingin (kecuali Januari, yang tingkat kejahatannya lebih mirip dengan musim panas).
- Kejahatan paling sering terjadi dipusat kota, terutama distrik A1 dan D4.
Nah dari analisis di atas, kepolisian kota Boston dapat menentukan jam-jam patroli di daerah rawan kejahatan, atau dapat pemambahan pos polisi di daerah yang sering terjadi Kejahatan. Hal ini untuk mengurangi dan mencegah terjadi kejahatan di kota Boston.
Sekian dari Saya, semoga dapat bermanfaat :)
Wassalamualaikum Warahmatullahi Wabarakatuh
REFERENSI
- Fikri, Jamaluddin. 2019. Analisis Data Kejahatan di Boston Menggunakan Python. Dapat diakses pada : https://medium.com/purwadhikaconnect/analisa-data-kejahatan-di-boston-menggunakan-python-55c42934b739
- https://www.kaggle.com/AnalyzeBoston/crimes-in-boston