Paper Review: Konstruksi Sistem Analisis Data Lintasan Taksi Kota Menggunakan Platform Hadoop

Penulis Review: Nurul Khotimah dan Bryan Andreas Nday

Pembimbing/Editor: Amalia Zahra, S.Kom., Ph.D.

 

Latar belakang

Xie & Luo (2017) melakukan penelitian yang didasarkan pada fakta bahwa seiring perkembangan cloud computing, big data dan teknologi mobile, kota-kota besar mulai menerapkan sistem transportasi yang terintegrasi dan terkoneksi satu sama lain. Dalam fase ini, taksi domestik dipasangkan GPS yang menyimpan data perjalanan penumpang. Data ini kemudian dianalisis untuk mengoptimasi perkembangan layanan transportasi dalam suatu kota atau propinsi.

Sistem dibagi menjadi lima bagian yaitu source data, pemrosesan data, data storage, application data, dan user application. Data dari GPS berbentuk file diletakkan di bagian source data yang kemudian diproses dan disimpan dalam data storage. Setelah itu dilakukan parallel processing untuk menyusun dokumen yang telah disimpan pada data storage. Hasil dari pemrosesan ini disimpan di data mart. Untuk mengurangi error yang disebabkan oleh GPS positioning dan real time data, dilakukan juga preprocessing dengan menggabungkan files berukuran kecil.

 

Metode dan Hasil

Pada penelitian oleh Xie & Luo (2017), dataset yang digunakan adalah data lintasan taksi kota selama 9 hari. Data ini disimpan dalam format log. Track record kendaraan berisi lima informasi dasar seperti koordinat (longitude dan latitude), kecepatan, arah kendaraan (timur, tenggara, selatan, barat daya, barat, barat laut, utara, dan timur laut), status penumpang dalam taksi (isi atau kosong) dan waktu perolehan informasi. Metode perancangan sistem adalah dengan membangun sistem permintaan cepat ke data secara massif dan paralel untuk mengolah basisdata menggunakan Greenplum dan menggunakan algoritma SGD untuk clustering area di kota. Selain itu, penelitian tersebut menggunakan teknologi echarts dan teknologi D3.js untuk menunjukkan rute taksi dan analisis jalur lintasan. Sistem yang dibangun memiliki 5 layer. Layer pertama merupakan source data yang berasal dari semi-structured dan unstructured data, traffic committee GPS supervisory platform dan geographical traffic into platform. Layer kedua adalah data processing. Pada tahap ini digunakan sebuah model pemograman MapReduce. Data akan dipecah menjadi bagian-bagian yang lebih kecil sesuai kondisi ideal menjadi beberapa bongkahan berukuran 128M. Data ini masih berbentuk semi-structured JSON, dan akan dikonversi menjadi structured data dan diproses ke dalam database Greenplum, yaitu sistem penyimpanan data terpadu menggunakan prosesor paralel secara masif (massively parallel processing – MPP). Layer ketiga adalah data storage yang menggunakan sistem penyimpanan terdistribusi HDFS. Layer keempat adalah data application di mana aplikasi dibagi sesuai dengan kebutuhannya antara lain management application, sand table drill app, dan analysis app. Layer kelima adalah User Access, digunakan oleh developer, management analyst, dan salesman dalam mengakses hasil analisis. Penelitian tersebut menghasilkan analisis data lintasan dan rute. Sistem menggabungkan echart with D3.js untuk merealisasikan analisis taksi yang kosong dan memuat proporsi, key area dan pergerakan penumpang untuk menjadi dasar peraturan taksi.

Hasil yang dapat diperoleh dari analisis data jalur lintasan taksi tersebut digunakan sebagai pertimbangan manajer dalam mengatur sistem operasional taksi yang efektif karena langsung dapat mengetahui rasio dari keseluruhan taksi yang kosong dan berpenumpang di setiap waktu. Selain itu dengan mengetahui kecepatan setiap kendaraan, pedoman lalu lintas yang lebih efektif dapat disusun.

 

Kritik dan Saran

Adapun kritik dan saran kami terkait penelitian tersebut antara lain:

  1. Menambahkan atribut lain seperti volume arus lalu lintas untuk memprediksi di mana dan kapan sebuah taksi akan mengakhiri perjalanan saat itu dan mengidentifikasi taksi mana yang akan ditugaskan untuk permintaan penjemputan selanjutnya.
  2. Menggabungkan data ini dengan data tata kota seperti lokasi toko, restoran, kantor atau tempat umum lainnya pada bulan/tahun tersebut agar dapat dianalisis tempat apa yang menyebabkan kepadatan lalu lintas meningkat, atau data penentu lainnya, seperti acara yang berlangsung di dekat titik awal/akhir perjalanan, data penumpang, atau cuaca lokal.

 

Referensi

Xie, J., & Luo, J. (2017). Construction for the city taxi trajectory data analysis system by Hadoop platform. 2017 IEEE 2nd International Conference on Big Data Analysis (ICBDA)(, 527–531. https://doi.org/10.1109/ICBDA.2017.8078689

 

Amalaia Zahra