Geocoding
Dalam bidang Geographic Information Systems (GIS), proses mengenali konteks
geografis disebut dengan geoparsing. Geoparsing ini dapat dikelompokan kedalam
fitur Named Entity, namun geoparsing ini mengekstrak lebih banyak variasi dari
sebuah entitas geografis seperti nama jalan, nama propinsi, nama kota, nama desa,
nomor telepon, hingga kode pos. Proses pemberian atribut longitude dan latitude
untuk mengekstrak konteks geografis tadi disebut dengan geocoding. Proses ektraksi
alamat merupakan hal terpenting dari geoparsing, karena dengan mendapatkan alamat
kita dapat melakukan proses geocoding dengan akurat, selain itu kelengkapan dari
referensi data alamat dengan informasi lokasinya merupakan hal yang terpenting juga
agar proses geocoding dapat berjalan dengan sukses.
Beberapa perangkat lunak yang saat ini umum digunakan untuk melakukan proses geocoding diantaranya:
- Google Maps API
- Yahoo Maps API
- Bing Maps API
- OpenStreetMap API
- Esri ArcGIS API
Layanan-layanan tersebut menyediakan fungsi untuk menemukan koordinat lokasi berdasarkan alamat yang dimasukan. Dalam memilih service tersebut biasanya
kita akan mempertimbangkan beberapa hal, seperti harga dan jumlah query yang
dapat dilakukan. Sebagai contoh Yahoo Maps API bersifat gratis namun layanan
geocoding nya terbatas pada 5.000 query per alamat IP per hari. Proses geocoding ini
membutuhkan waktu dan resource yang besar. Untuk menggunakan Google Maps
API kita membutuhkan API Key dan dapat digunakan secara gratis, namun ketika
kita menggunakan layanan ini, kita tidak mendapatkan hasil query yang lengkap
seperti data parsel (geometry) nya, yang kita dapatkan hanya sepasang koordinat
lokasi tanpa adanya data parsel dan struktur batas administrasi sesuai dengan kondisi
geografis Indonesia.
Pekerjaan untuk menghubungkan geocode dengan fitur geografis selain menggunakan alamat juga paling sering dikaitkan dengan layanan yang disediakan oleh gazetter . Permasalahannya, gazetteer tidak memiliki fungsi untuk menghasilkan hasil geocode, sebagai gantinya ia bertindak sebagai mekanisme penyimpanan setelah geocode ditentukan menggunakan metode lain. Dengan demikian, geocoder biasanya digunakan untuk menghasilkan geocode untuk fitur pada gazetteer yang berbasis alamat, menekankan hubungan penting diantara kedua
komponen sebagai bagian dari query spasial yang besar dan framework analisis.
Keadaan ini digambarkan pada Gambar 1, dimana geocoder dapat terdiri dari
banyak sumber data untuk gazetteer, yang terdiri dari beberapa sumber data.
Gambar 1 Gazetteer
Gazetteer merupakan kamus atau direktori geografis sekaligus referensi data set
untuk melakukan pencarian informasi sekitar tempat dan nama tempat (toponimi)
yang disertai peta atau atlas lengkap. Gazetteer ini berisi uraian geografis suatu
negara, wilayah, atau benua hingga statistik sosial atau bentang alamnya, seperti
pegunungan, perairan, atau jalan.
Hasil output dari referensi geografis ini ditentukan oleh proses algoritma untuk
merepresentasikan input nya. Pada banyak situasi, output yang dihasilkan berupa data
geografis yang sederhana seperti berupa point, namun tidak terbatas pada tipe objek
geografis valid lainnya. Algoritma pemrosesan tersebut menentukan data geografis
yang akan dikembalikan untuk input tertentu berdasarkan nilai atributnya dan nilai
atribut dalam kumpulan data referensi. Yang sejauh ini merupakan hal paling kompleks dari proses geocoding yang kebanyakan riset lain sedang kerjakan. Kunci dari topik permasalahan geocoding ini terdiri dari standarisasi dan normalisasi input menjadi format dan syntax yang kompatibel dengan data referensi geografis yang dikumpulkan, algoritma penyocokan yang memilih hasil query terbaik dari data referensi, dan mekanisme akhir dari generasi geocode yang menentukan apa yang akan dikembalikan berdasarkan fitur yang diseleksi sebagai hasil yang paling cocok.
Gambar 2 Algoritma Geocoding Deterministic
Gambar 2 menunjukan skema diagram bagaimana proses algoritma deterministic
yang dapat berjalan dengan menggunakan standarisasi, normalisasi dan relaksasi
atribut. Secara umum, kunci dari proses-proses tersebut adalah menentukan setiap
bagian dari input yang masuk dan mengubahnya menjadi versi data yang konsisten
dengan referensi data set. Setelah input yang masuk dijadikan kompatibel dengan referensi data set-nya, proses pencocokan akan memilih kandidat terbaik untuk digunakan untuk
menentukan output terakhir.
Oleh :
Raditya Fajar dan Abba Suganda Girsang