Geocoding

 

 

Dalam bidang Geographic Information Systems (GIS), proses mengenali konteks

geografis disebut dengan geoparsing. Geoparsing ini dapat dikelompokan kedalam

fitur Named Entity, namun geoparsing ini mengekstrak lebih banyak variasi dari

sebuah entitas geografis seperti nama jalan, nama propinsi, nama kota, nama desa,

nomor telepon, hingga kode pos. Proses pemberian atribut longitude dan latitude

untuk mengekstrak konteks geografis tadi disebut dengan geocoding. Proses ektraksi

alamat merupakan hal terpenting dari geoparsing, karena dengan mendapatkan alamat

kita dapat melakukan proses geocoding dengan akurat, selain itu kelengkapan dari

referensi data alamat dengan informasi lokasinya merupakan hal yang terpenting juga

agar proses geocoding dapat berjalan dengan sukses.

Beberapa perangkat lunak yang saat ini umum digunakan untuk melakukan proses geocoding diantaranya:

  • Google Maps API
  • Yahoo Maps API
  • Bing Maps API
  • OpenStreetMap API
  • Esri ArcGIS API

Layanan-layanan tersebut menyediakan fungsi untuk menemukan koordinat lokasi berdasarkan alamat yang dimasukan. Dalam memilih service tersebut biasanya

kita akan mempertimbangkan beberapa hal, seperti harga dan jumlah query yang

dapat dilakukan. Sebagai contoh Yahoo Maps API bersifat gratis namun layanan

geocoding nya terbatas pada 5.000 query per alamat IP per hari. Proses geocoding ini

membutuhkan waktu dan resource yang besar. Untuk menggunakan Google Maps

API kita membutuhkan API Key dan dapat digunakan secara gratis, namun ketika

kita menggunakan layanan ini, kita tidak mendapatkan hasil query yang lengkap

seperti data parsel (geometry) nya, yang kita dapatkan hanya sepasang koordinat

lokasi tanpa adanya data parsel dan struktur batas administrasi sesuai dengan kondisi

geografis Indonesia.

Pekerjaan untuk menghubungkan geocode dengan fitur geografis selain menggunakan alamat juga paling sering dikaitkan dengan layanan yang disediakan oleh gazetter . Permasalahannya, gazetteer tidak memiliki fungsi untuk menghasilkan hasil geocode, sebagai gantinya ia bertindak sebagai mekanisme penyimpanan setelah geocode ditentukan menggunakan metode lain. Dengan demikian, geocoder biasanya digunakan untuk menghasilkan geocode untuk fitur pada gazetteer yang berbasis alamat, menekankan hubungan penting diantara kedua

komponen sebagai bagian dari query spasial yang besar dan framework analisis.

Keadaan ini digambarkan pada Gambar 1, dimana geocoder dapat terdiri dari

banyak sumber data untuk gazetteer, yang terdiri dari beberapa sumber data.

 

Gambar 1 Gazetteer

 

Gazetteer merupakan kamus atau direktori geografis sekaligus referensi data set

untuk melakukan pencarian informasi sekitar tempat dan nama tempat (toponimi)

yang disertai peta atau atlas lengkap. Gazetteer ini berisi uraian geografis suatu

negara, wilayah, atau benua hingga statistik sosial atau bentang alamnya, seperti

pegunungan, perairan, atau jalan.

Hasil output dari referensi geografis ini ditentukan oleh proses algoritma untuk

merepresentasikan input nya. Pada banyak situasi, output yang dihasilkan berupa data

geografis yang sederhana seperti berupa point, namun tidak terbatas pada tipe objek

geografis valid lainnya. Algoritma pemrosesan tersebut menentukan data geografis

yang akan dikembalikan untuk input tertentu berdasarkan nilai atributnya dan nilai

atribut dalam kumpulan data referensi. Yang sejauh ini merupakan hal paling kompleks dari proses geocoding yang kebanyakan riset lain sedang kerjakan. Kunci dari topik permasalahan geocoding ini terdiri dari standarisasi dan normalisasi input menjadi format dan syntax yang kompatibel dengan data referensi geografis yang dikumpulkan, algoritma penyocokan yang memilih hasil query terbaik dari data referensi, dan mekanisme akhir dari generasi geocode yang menentukan apa yang akan dikembalikan berdasarkan fitur yang diseleksi sebagai hasil yang paling cocok.

Gambar 2 Algoritma Geocoding Deterministic

 

Gambar 2 menunjukan skema diagram bagaimana proses algoritma deterministic

yang dapat berjalan dengan menggunakan standarisasi, normalisasi dan relaksasi

atribut. Secara umum, kunci dari proses-proses tersebut adalah menentukan setiap

bagian dari input yang masuk dan mengubahnya menjadi versi data yang konsisten

dengan referensi data set. Setelah input yang masuk dijadikan kompatibel dengan referensi data set-nya, proses pencocokan akan memilih kandidat terbaik untuk digunakan untuk

menentukan output terakhir.

Oleh :

Raditya Fajar dan Abba Suganda Girsang

Abba Suganda Girsang S.T., M.Cs., Ph.D