Analyze Crime Data in Boston with Python

SYAFIRA IRSALINA
5 min readDec 30, 2020

--

Photoby : Crime and Investigation UK

Assalamualaikum temen-temen!

Apa kabar nih? Semoga dalam keadaan yang baik yaa Aamiin… Jumpa lagi nih bareng aku, kali ini kita akan melakukan analisis data kejahatan yang ada di kota Boston dengan Python! Yukk langsung aja~

Apa itu Database?

Database adalah kumpulan data yang terorganisir, yang umumnya disimpan dan diakses secara elektronik dari suatu sistem komputer. Pada saat pangkalan data menjadi semakin kompleks, maka pangkalan data dikembangkan menggunakan teknik perancangan dan pemodelan secara formal. (Wikipedia)

Kali ini saya akan menggunakan database yang ada di Kaggle yaitu data Crimes in Boston atau Laporan Data Kejahatan di kota Boston untuk memperoleh insight dari data tersebut.

Boston sendiri adalah ibu kota dan kota terbesar di Massachusetts di Amerika Serikat. Kota ini menjadi salah satu kota tertua dan terkaya di AS dengan ekonomi berbasis di bidang pendidikan, perawatan kesehatan, keuangan dan teknologi. Kota ini mendapat julukan sebagai “Atena Amerika”.

Untuk melakukan analisisnya, saya akan menggunakan Google Colab dengan beberapa library Python seperti library Pandas, dan Numpy untuk analisis datanya. Lalu, menggunakan library Seaborn untuk visualisasi data, namun untuk membuat interactive heatmap saya akan menggunakan Folium.

Sebelum memulai analisis pada data, buka terlebih dahulu Google Colab. Kemudian buat Notebook baru dan muncul tampilan seperti berikut.

Tampilan Notebook pada Google Colab

Dan download terlebih dahulu data yang akan digunakan pada link. Setelah berhasil, lakukan import file kedalam Google Colab seperti berikut.

Tampilan Mengimport File ke Google Colab

Tahapan-tahapan yang akan kita lakukan :

  1. Mengimport Library dan Data yang akan digunakan,

muncul hasil seperti berikut

Hasil Teratas dari Data Kejahatan di Boston

2. Menampilkan Informasi Data,

dengan hasil seperti berikut,

Hasil Informasi Data Kejahatan di Boston

3. Melakukan Cleaning Data,

Beberapa hal yang saya lakukan dalam cleaning data adalah

  • Menghapus kolom yang tidak akan digunakan dalam analisis data,
  • Mengkonversi OCCURED_ON_DATE ke datatime,
  • Mengisi NAN Value pada Kolom Shooting,
  • Mengubah DAY_OF_WEEK menjadi Kategorik,
  • Mengganti -1 dalam Lat dan Long dengan Nan,

sehingga akan menampilkan hasil seperti berikut,

Hasil Cleaning Data

4. Melakukan Visualisasi Data,

Berikut adalah beberapa hasil visualisasi dari data yang telah kita buat:

4.1 Jenis Kejahatan yang Terjadi di Kota Boston

Plot Jumlah untuk Masing-Masing Jenis Kejahatan

Dari grafik terlihat bahwa ada 9 jenis kejahatan dengan Larceny (kejahatan keuangan) adalah kejahatan yang sangat sering terjadi di kota Boston dengan jumlah mencapai 25000 dari bulan Juni 2015 sampai September 2018 dibandingkan Homicide (pembunuhan) yang sangat jarang terjadi.

4.2 Akumulasi Kejahatan pada Tiap Tahun

Plot Akumulasi Kejahatan di Tiap Tahun

Dapat dilihat bahwa mulai tahun 2017 dan 2018 tingkat kejahatan di kota Boston terus menurun secara berturut-turut menjadi 29,7% dan 19,2%.

4.3 Komparasi Jam yang Rawan Terjadi Kejahatan

Plot Kejahatan berdasarkan Jam dalam Sehari

Tingkat kejahatan rendah antara 1–8 pagi. Kemudian secara bertahap akan meningkat sepanjang hari dan memuncak sekitar jam 6 sore.

4.4 Komparasi Kejahatan di Tiap Minggu

Plot Kejahatan berdasarkan Hari dalam Seminggu

Dari grafik diatas, ada beberapa variasi hari dalam seminggu, dengan hari Jumat memiliki tingkat kejahatan tertinggi dan Minggu memiliki tingkat kejahatan terendah.

4.5 Komparasi Kejahatan di Tiap Bulan

Plot Kejahatan berdasarkan Bulan dalam Setahun

Terlihat bahwa bulan yang ada memiliki pengaruh yang berbeda-beda, dengan bulan-bulan musim dingin di bulan Februari-April memiliki tingkat kejahatan yang paling rendah, dan bulan-bulan musim panas / awal musim gugur di bulan Juni-Oktober memiliki tingkat kejahatan yang tertinggi. Ada juga lonjakan tingkat kejahatan di bulan Januari.

4.6 Persebaran Lokasi Kejahatan

Plot Persebaran Lokasi Kejahatan di Boston

Daerah dengan tingkat kejahatan tertinggi berada pada Longitude -71.050 sampai -71.100 sedangkan untuk daerah dengan kejahatan terendah berada di Longitude -71.125 sampai -71.175.

4.7 Persebaran Lokasi Kejahatan berdasarkan Distrik

Plot Persebaran Lokasi Kejahatan di Boston berdasarkan Distrik

Dari scatterplot diatas dapat diketahui bahwa distrik A1 dan D4 memiliki tingkat kejahatan yang tertinggi dengan area paling pada di kota Boston.

4.8 Peta Persebaran Kejahatan Tahun 2017

Peta Persebaran Kejahatan di Boston Tahun 2017

KESIMPULAN

  • Larceny (kejahatan keuangan) sejauh ini merupakan jenis kejahatan serius yang paling umum terjadi di kota Boston.
  • Kejahatan kemungkinan besar terjadi pada sore dan malam hari.
  • Kejahatan kemungkinan besar terjadi pada hari Jumat dan paling tidak mungkin terjadi pada hari Minggu.
  • Kejahatan paling mungkin terjadi di musim panas dan awal musim gugur, dan paling kecil kemungkinannya terjadi di musim dingin (kecuali Januari, yang tingkat kejahatannya lebih mirip dengan musim panas).
  • Kejahatan paling sering terjadi dipusat kota, terutama distrik A1 dan D4.

Nah dari analisis di atas, kepolisian kota Boston dapat menentukan jam-jam patroli di daerah rawan kejahatan, atau dapat pemambahan pos polisi di daerah yang sering terjadi Kejahatan. Hal ini untuk mengurangi dan mencegah terjadi kejahatan di kota Boston.

Sekian dari Saya, semoga dapat bermanfaat :)

Wassalamualaikum Warahmatullahi Wabarakatuh

REFERENSI

  1. Fikri, Jamaluddin. 2019. Analisis Data Kejahatan di Boston Menggunakan Python. Dapat diakses pada : https://medium.com/purwadhikaconnect/analisa-data-kejahatan-di-boston-menggunakan-python-55c42934b739
  2. https://www.kaggle.com/AnalyzeBoston/crimes-in-boston

--

--

SYAFIRA IRSALINA
SYAFIRA IRSALINA

Written by SYAFIRA IRSALINA

Mahasiswa Statistika, Universitas Islam Indonesia

No responses yet