Paper Review: Cybersecurity in Big Data Era: From Securing Big Data to Data-Driven Security
oleh Diandra A. Firmansyah, Gagas Pandusarani, dan Mei Lanni
Editor: Amalia Zahra, S.Kom., Ph.D
1. Pendahuluan dan Latar Belakang
Selama 15 tahun terakhir, data telah meningkat secara eksponensial di berbagai aplikasi yang mengarah ke era big data. Perlu dicatat bahwa big data memiliki beberapa fitur istimewa yang dapat dimanfaatkan untuk berbagai tujuan. Salah satunya adalah penggunaan big data untuk mendeteksi risiko atau serangan. Peretasan pada awalnya mirip dengan perusakan publik terhadap berbagai hal. Peretas meretas untuk kesenangan dan ketenaran. Namun akhir-akhir ini, serangan lebih diperhitungkan dan memotivasi.
Gambar 1. Big data meningkat secara eksponensial membuat keamanan lebih sulit
Keamanan siber bertujuan untuk mengurangi serangan seminimal mungkin, karena tidak mungkin mengamankan setiap titik serangan. Jumlah penyerangan di luar sana melebihi jumlah orang yang mencoba untuk melindunginya. Ini karena ada begitu banyak informasi di luar sana yang dapat mengubah siapapun menjadi penyerang. Dengan pemikiran ini, keamanan siber kini telah melampaui cara tradisional yang hanya berfokus pada pencegahan ke paradigma PDR yang lebih mutakhir yaitu : Prevent, Detect dan Respond (PDR). Big data sekarang menjadi slogan umum yang digunakan untuk menghasilkan data dalam jumlah besar. Sejumlah besar data sedang dihasilkan pada tingkat yang mengkhawatirkan. Hal ini disebabkan oleh pertumbuhan internet. (Laney, 2001) datang dengan istilah tiga V yang dikaitkan dengan big data. Istilah-istilah tersebut adalah volume, velocity, dan variety. Selain 3 V, ada V keempat yaitu veracity. Volume mewakili fakta bahwa data yang dihasilkan sangat besar, kecepatan mewakili fakta bahwa data dihasilkan pada tingkat yang mengkhawatirkan, variety mewakili fakta bahwa data yang dihasilkan datang dalam semua jenis bentuk. Big data dapat dijelaskan secara sederhana sebagai data diam menurut Miloslavskaya & Tolstoy (2016).
Kami memiliki semakin banyak data yang datang, dan mereka bergerak dari terabyte ke petabyte, yang menjadi ranah asing (Rawat & Ghafoor, 2018, ). Jadi, kita perlu menemukan cara baru untuk mengakomodasi data ini, dan ada kebutuhan untuk mengembangkan model dan algoritma yang memungkinkan kita bekerja pada data ini, untuk mendapatkan wawasan darinya. Di sinilah Big Data Analytics (BDA) masuk. Makalah ini mengeksplorasi pekerjaan penelitian yang dilakukan pada keamanan data besar yang diaktifkan dan mengamankan data besar (yang secara kategoris disajikan pada Gambar. 2).
Gambar 2. Big data (analisis) sebagai solusi keamanan dan serangan keamanan yang unik untuk big data dalam sistem berkemampuan data besar yang khas.
2. Keamanan menggunakan Big Data
- Big Data Analytics (BDA) sebagai tool untuk memerangi berbagai serangan
Big Data Analytics (BDA) dapat membantu mempersiapkan, membersihkan data yang heterogen dengan catatan yang tidak lengkap dan sulit dilakukan oleh manusia. Analisis data biasanya sulit ketika datanya heterogen. Analis data menghadirkan platform yang ditargetkan untuk deteksi real-time dan visualisasi ancaman dunia maya yang disebut OwlSight. Platform ini memiliki beberapa blok bangunan (sumber data, analisis data besar, layanan web, dan visualisasi) dan mampu mengumpulkan data dalam jumlah besar dari berbagai sumber, menganalisis data, dan menampilkan hasil di dasbor yang bermakna. Berikut adalah contoh serangan yang dapat diselesaikan menggunakan big data analytics (BDA):
Gambar 3. Big data analytics (BDA) untuk memerangi berbagai serangan
- Machine Learning (ML) di Cybersecurity
Algoritma Machine Learning secara umum terbagi menjadi 3: supervised learning, semi-supervised learning, dan unsupervised learning. Penggunaan big data untuk membantu manusia mempelajari data triase, dan membantu melakukan identifikasi pola serangan pada data noise. Pendekatan yang dilakukan oleh SIEM (Security Information and Event Management) yang mengharuskan analis untuk membuat aturan korelasi peristiwa secara manual. Saat ini telah marak terjadi serangan menggunakan AI (artificial intelligence) untuk mengelabui model machine learning, maka kerjasama manusia dan mesin adalah salah satu cara efektif untuk memerangi serangan pada cybersecurity.
3. Mengamankan Big Data
- Access Control dan Teknik Encryption untuk Big Data
Kedua cara tersebut bisa dibilang pendekatan utama, dimana hak akses digunakan untuk membatasi akses terhadap data dan enkripsi yang menjaga kerahasiaan data. Enkripsi memastikan bahwa hanya entitas terpercaya yang berwenang yang dapat melihat data. Namun kontrol akses mencoba membatasi akses pada data. Enkripsi memberlakukan batasan yang sangat kuat atas kerahasiaan data. Berikut adalah teknik yang umum digunakan untuk mengamankan big data:
Gambar 4. Teknik pengamanan big data
Alternatif pengamanan Big Data
Contoh penerapan alternatif pengamanan big data pada catatan rekam medis dengan menggunakan pendekatan data hiding, image cryptography dan steganography. Contoh lain pengamanan big data model berdasarkan blockchain dengan menggunakan smart contract dan blockchain sebagai alternatif pengamanan.
4. Survei yang ada tentang Big Data dalam Keamanan Siber
Hasil dari rangkuman survey masalah keamanan dan privasi pada big data mengacu dalam hal kerahasiaan, privasi, dan kepercayaan. Dalam kerahasiaan dan privasi data, tantangan yang sangat jelas berupa kebijakan akses kontrol dan pengendalian big data. Penulis mencatat bahwa rata – rata hasil dari survei keamanan dan privasi pada big data dapat dicapai dengan teknik kriptografi dan terdapat salah satu tren lain yaitu Behavioural Detection Awareness (BDA).
5. Tren Penelitian dan Tantangan Penelitian Terbuka
Gambar 5. Tren penelitian, tantangan penelitian terbuka dan permasalahan
- Rangkuman Big Data sebagai Cyber Security Tool
Seiring dengan data yang dihasilkan oleh perangkat IoT, munculnya Bring Your Own Device (BYOD) telah membuat organisasi rentan terhadap berbagai serangan. Semua perangkat ini menghasilkan data, dengan demikian organisasi mulai merangkul BDA sebagai alat dalam pendekatan keamanan siber mereka. Menganalisis data yang melewati jaringan sangat penting untuk melindungi organisasi, namun beberapa perusahaan masih memiliki reservasi tentang penggunaan analitik data besar karena cenderung mahal. BDA juga cenderung menjadi bidang yang kompleks dan membutuhkan keahlian. Ada tantangan terbuka tentang bagaimana membedakan data sistem IoT, data pribadi dan data sensitif serta perlindungan masing-masing menggunakan analitik data besar.
- Peraturan Big Data
Sebagai hasil dari segudang pelanggaran data belakangan ini, peraturan baru seperti peraturan pelanggaran perlindungan keamanan di Kanada dan peraturan perlindungan data umum (GDPR) Eropa telah dilaksanakan. Aspek penting dari GDPR adalah hak untuk dilupakan, yang memberi individu kekuatan untuk memaksakan penghapusan informasi apa pun yang berkaitan dengan dirinya sendiri. Tren penelitian yang kami perkirakan di sini adalah data yang merusak diri sendiri. Namun pekerjaan sebelumnya telah dilakukan untuk ini. Geambasu et al., (2009) mengusulkan arsitektur yang bertujuan untuk memecahkan masalah privasi data pribadi. Arsitektur mereka memastikan bahwa salinan data tersebut akan menjadi usang. Ini adalah area penelitian yang mungkin banyak dilihat pertumbuhan di tahun-tahun mendatang, terutama karena munculnya blockchain dan penyimpanan data terdesentralisasi. masih ada tantangan untuk regulasi dan kebijakan big data termasuk situasi di mana data meninggalkan organisasi untuk penyimpanan cloud.
- Penyimpanan data yang terdesentralisasi dan context aware Data Storage
Pendekatan terdistribusi untuk menyimpan data adalah cara yang lebih aman untuk mencegah serangan. Metode ini juga tidak rentan terhadap masalah kegagalan titik tunggal.
- Applying Artificial Intelligence
Saat ini sedang tren sebuah Virus Polymorfic (sebuah virus yang dapat berubah-ubah) dan terdapat eksperimen dari EndGame yang menjelaskan bahwa AI lain dapat menemukan titik buta dari AI lainnya. Sehingga AI masih harus didampingi oleh manusia dalam pendeteksian malware.
- Scalability for cybersecurity techniques in big data era
Scalability melakukan pendekatan dalam perlindungan data untuk menemukan data yang penting dan melindunginya.
6. Kesimpulan
Dari hasil survei tren pendekatan utama pada keamanan big data terletak pada teknik kriptografi yang menjadi fokus rata-rata dalam keamanan big data dan tren selanjutnya metode Behavioural Detection Awareness (BDA) yang dijadikan sebagai acuan tools keamanan.
Referensi:
- Geambasu, R., Kohno, T., Levy, A. A., & Levy, H. M. (2009). Vanish: Increasing Data Privacy with Self-Destructing Data. Usenix Security Symposium, 316.
- Laney, D. (2001). 3D Data Management: Controlling Data Volume, Velocity, and Variety, 949, 4.
- Miloslavskaya, N., & Tolstoy, A. (2016). Application of big data, fast data, and data lake concepts to information security issues. Future Internet of Things and Cloud Workshops (FiCloudW), IEEE International Conference on, 148-153.
- Rawat, D. B., & Ghafoor, K. Z. (Eds.). (2018). Smart Cities Cybersecurity and Privacy. Elsevier Science.
(2022). Paper Review: Cybersecurity in Big Data Era: From Securing Big Data to Data-Driven Security. Journal of Information Technology,