Mahadata, data raya, data raksasa, atau data bandang (bahasa Inggris: big data) adalah istilah umum untuk segala himpunandata dalam jumlah yang sangat besar, rumit, dan tak terstruktur sehingga menjadikannya sukar ditangani apabila hanya menggunakan perkakas manajemen pangkalan data biasa atau aplikasi pengolah datatradisional belaka. Mahadata juga dapat diartikan sebagai pertumbuhan data dan informasi yang eksponensial dengan kecepatan dalam pertambahannya dan memiliki data yang beragam sehingga menyebabkan tantangan baru dalam pengolahan sejumlah data besar yang heterogen dan mengetahui bagaimana cara memahami semua data tersebut.[1]
Mahadata dapat diterapkan di semua aspek yang ada misalnya pada bidang bisnis, kesehatan, pariwisata, pemerintahan, kejahatan, dan lainnya. Dengan menggunakan alat untuk pengambilan ataupun pengolahan datanya misalnya dengan menggunakan perangkat lunak Gephi, Python, Netlytics, NiFi, dan Tableau. Dengan memahami bahwa mahadata itu penting, maka suatu organisasi akan dengan mudah mengolah dan menganalisis sekumpulan data atau suatu permasalahan yang sedang dihadapi baik dari internal maupun eksternal organisasinya. Organisasi tersebut dapat menghemat biaya, menghemat waktu, dan menciptakan sebuah keputusan yang tepat.[2]
Ciri khas
Mahadata pada dasarnya memiliki beberapa ciri khas sebagai berikut:[3]
Mahadata memiliki jumlah data yang sangat besar sehingga dalam proses pengolahan data dibutuhkan suatu penyimpanan yang besar dan dibutuhkan analisis yang lebih spesifik.
Mahadata memiliki bentuk format data yang beragam baik terstruktur ataupun tidak terstruktur dan bergantung pada banyaknya sumber data.
Keabsahan (Veracity)
Mahadata memiliki tentang keabsahan sebuah data apakah bisa dipercaya atau tidak. Sangat penting bahwa keabsahan sebuah data bisa dipercaya dan dipertahankan.
Nilai sebuah data menentukan keputusan yang diambil setelah memproses seluruh data.
Virtualisasi data
Virtualisasi data adalah pendekatan untuk menyatukan data dari berbagai sumber dalam satu lapisan sehingga aplikasi, alat pelaporan, dan pengguna akhir dapat mengakses data tanpa memerlukan perincian tentang sumber asli, lokasi, dan struktur data.[4]
Peralatan mahadata
Gephi
Gephi merupakan perangkat lunak sumber terbuka yang dapat digunakan untuk visualisasi dan analisis jaringan. Gephi dapat digunakan untuk membantu analis data untuk mengungkapkan pola dan tren, menyoroti secara spesifik mengenai outliers (orang ataupun suatu hal yang terpisah dari badan atau sistem utama) dan menceritakan mengenai data mereka.[5] Gephi dapat menggunakan render engine 3D untuk menampilkan grafik waktu nyata (real-timel skala besar dan dapat digunakan untuk memperluas eksplorasi visualisasi dan analisis data. Gephi memiliki kemampuan karena terdiri dari gabungan arsitektur yang fungsional dan fleksibel yang dapat dikustomisasi dan disesuaikan sesuai kebutuhan dengan segala jenis jaringan yang ada untuk:
Eksplor
Analisis
Visualisasi
Spatialize
Filter
Cluster
Manipulasi
Export
Gephi adalah hasil visualisasi dan manipulasi paradigma yang memperbolehkan pengguna untuk menemukan jaringan dan properti-properti data. Terlebih lagi, Gephi memang didesain untuk mengikuti dan menyesuaikan rantai dan alur dari sebuah himpunan data studi kasus yang memang memiliki banyak atribut. Gephi merupakan perangkat lunak yang dapat diakses bebas yang dapat didistribusikan dibawah GPL 3 (“GNU General Public License”). Paket atribut yang tersedia di Gephi dijalankan menggunakan Java pada platform NetBeans.
Python
Python merupakan bahasa pemrograman serbaguna yang bersifat menerjemahkan (interpret), berorientasi pada objek dan dapat dioperasikan pada semua sistem operasi seperti Linux, Windows, Mac, dan lainnya.[6] Python dibuat oleh seorang keturunan Belanda yang bernama Guido van Rossum. Tujuan utama python adalah lebih memusatkan pada keterbacaan kode dalam memahami sintaks. Sintaks tersebut berfungsi untuk mempermudah dan mempercepat pemrogram dalam proses pengodeannya dibandingkan Java atau C++.[7]
Pada pengaplikasian python, terdapat banyak fungsi bawaan. Misalnya pada python 3.6 yang memiliki 68 fungsi bawaan seperti abs(), all(), any(), ascii(), bin(), dan lainnya yang dapat memudahkan penggunanya dalam menyelesaikan suatu pekerjaan.[8]
Dengan menggunakan python, para pengguna dapat melakukan pemuatan kembali secara dinamis seperti mengubah, mengontruksi, dan memodifikasi tanpa menghentikan modul python, dapat melakukan kompilasi untuk kode bita portabel yang berdampak pada peningkatan kecepatan eksekusi dan menjaga kode sumber, dan juga dapat mengatur memori otomatis, yaitu kumpulan memori yang kotor sehingga dapat mencegah pencacatan kode.[7]
Netlytic
Netlytic adalah sebuah aplikasi berbasis web penganalisis teks berbasis cloud dan visualisasi jaringan sosial. Netlytic secara otomatis dapat meringkas volume teks yang besar dan menemukan serta memvisualisasikan jaringan sosial dari percakapan pada situs media sosial seperti Twitter, Youtube, komentar blog, forum daring, dan obrolan. Netlytic dirancang untuk membantu peneliti dan yang lainnya memahami operasi grup online, dan menemukan bagaimana informasi mengalir dalam jaringan.[9]
NiFi
Apache NiFi yang merupakan kepanjangan dari NiagaraFiles adalah sebuah proyek perangkat lunak dari Apache Software Foundation. Program ini dirancang untuk mengotomatisasi aliran data antara sistem perangkat lunak. Aliran data yang dimaksud disini yaitu aliran informasi otomatis yang terkelola antarsistem. Pola masalah ini sudah ada sejak perusahaan memiliki beberapa sistem, yaitu sistem yang mengambil data dan sistem yang menggunakan data. Masalah dan pola solusi ini telah didiskusikan dan diartikulasikan menjadi sebuah bentuk yang menyeluruh dan mudah dikonsumsi dalam Pola Integrasi Perusahaan (Enterprise Integration Patterns).[10]
Tableau
Software Tableau merupakan alat yang mendukung Business Intelligent yang dapat digunakan untuk membantu mengumpulkan, menyimpan, mengatur dan menganalisis data mentah sehingga menjadi sebuah informasi yang bernilai. Perangkat lunak Tableau terdiri dari beberapa versi, yaitu Tableau Desktop, Tableau Server, Tableau Online, Tableau Reader, dan Tableau Public.[11] Secara umum, tableu digunakan untuk menganalisis data secara visual.
Tableu merupakan sebuah solusi untuk menangani semua kebutuhan bisnis, seperti:
Tampilan (Dashboard)
Penemuan Data
Laporan Hasil Analisis (Analyst Level Reporting)
Laporan dengan (“Pixel Perfect”) untuk percetakan
Laporan Operasional
Kemampuan menangani mahadata
Pelayanan sendiri (Self Service)
Analisis tersemat (Embedded Analytics)
Pengolahan dan pelaporan OLAP (Online Analytical Analysis)
Peramalan dan prediksi analisis
Dalam fenomena Mahadata, perangkat lunak ini membantu dalam menerjemahkan data dengan skala besar ke dalam bentuk yang lebih mudah dipahami seperti grafik dan bagan yang unik. Mengingat pertumbuhan berbagai bentuk data yang terlalu banyak untuk ditangani dengan cara konvensional,[12] sehingga memerlukan sebuah cara agar dapat mengolah data yang banyak tadi menjadi sebuah informasi dengan cepat dan mudah dipahami. Selain itu, Tableu juga dapat menyederhanakan data yang kompleks dan berantakan sehingga data tersebut dapat menghasilkan pola–pola yang mengandung wawasan yang mendukung analisis pada data. Dengan data yang dimiliki, dapat dilihat pola dari suatu tren. Hal tersebut sangat membantu para analis khususnya dalam bidang bisnis.[13] Selain grafik dan bagan, Tableau juga dapat menghasilkan bentuk visualisasi berupa geocoding atau peta.[13]
Penerapan mahadata
Bidang bisnis
Salah satu kelebihan dari Gephi sebagai penganalisis jaringan sosial adalah kemudahan dalam penggunaannya. Tidak perlu kemampuan khusus untuk mengoperasikannya. Anda hanya perlu memasukkan data jaringan sosial ke Gephi dan menggunakan beberapa algoritme yang telah disediakan dalam Gephi. Anda dapat melihat jaringan yang terhubung dengan pengelompokkannya dalam bentuk visual untuk kemudian dianalisis agar mendapatkan beberapa implikasi bisnis penting.
Pada saat ini, media sosual merupakan sebuah tempat yang sangat kuat untuk mempromosikan sebuah merek atau produk. Hampir setiap merek hadir dalam media sosial terutama pada Facebook, Twitter, dan Instagram karena situs media sosial tersebut memiliki sangat banyak pengguna yang akan menganalisis performa merek yang hadir pada media sosial. Melalui Gephi, seseorang dapat menganalisis koneksinya di media sosial dan dapat dengan mudah menemukan implikasi bisnis seperti penyasaran (targeting), pemosisian (posisitioning), dan lain-lain berdasarkan klaster yang terbentuk pada Gephi.[14]
Salah satu impikasi pemasaran yang paling penting dari visualisasi jaringan Gephi adalah penyasaran (targeting). Anda akan dengat sangat mudah menemukan demografi masyarakat atau kelompok dan kemudian mengambil keputusan penyasaran dan pemosisian dari sebuah merek[15].
Bidang kesehatan
Mengetahui bahwa perkembangan penggunaan mahadata sudah sangat pesat dan kesadaran masyarakat dunia terhadap keefektifan penggunaan mahadata dalam aktivitasnya sehari-hari juga merambah pada dunia kesehatan, yaitu dunia kedokteran. Dalam industri kesehatan digital, mahadata menggunakan teknik ilmu data untuk menangkap dan menganalisis data yang sangat besar dan kompleks untuk memberikan dampak positif bagi hasil perawatan pasien dan mengoptimalkan proses bisnis.
Meskipun istilah mahadata merujuk pada volume data, itu bukanlah permasalahan utama karena mahadata juga dapat merujuk pada tingkat teknologi yang dibutuhkan organisasi untuk menangani dan fasilitas yang dibutuhkan untuk menyimpannya. Industri kesehatan menghasilkan data klinis, keuangan administratif, dan genom yang sangat besar sehingga memerlukan teknik mahadata untuk membantu mengaturnya.
Pada tahun 2009, terdapat sebuah penelitian mahadata pada bidang kesehatan, yaitu mengenai interaksi jaringan protein dalam melakukan prediksi kanker payudara menggunakan metode Analisis Jaringan Dinamis.[16] Pada penelitian dijelaskan bagaimana evolusi kelas-kelas yang terbentuk dari interaksi antarsel dalam tubuh sehingga bisa mendapatkan pengutuban pembentukan sel kanker payudara. Perangkat lunak Gephi dapat dimanfaatkan untuk menganalisis hal yang serupa dengan visualisasi yang bisa ditampilkan menggunakan perangkat lunak tersebut.
Secara umum, penggunaan mahadata dalam bidang kesehatan akan mengarah kepada 6 kategori informasi, yaitu:
Data web dan media sosial: seperti data interaksi yang didapatkan dari Facebook, Twitter, LinkedIn, blogs, health plan websites dan aplikasi dari smartphone.
Machine-to-machine data: Seperti informasi dalam sensor, meter dan perangkat lain.
Data Transaksi: seperti klaim layanan kesehatan dan catatan penagihan dalam format semi-terstruktur dan tidak terstruktur
Data Biometrik: seperti data sidik jari, genetika, tulis tangan, pemindaian retina, sinar-X dan gambar medis lainnya.
Data yang dihasilkan manusia' (Human-generated datal seperti data rekam medis elektronik (Electronic Medical Records/EMRs), catatan dokter, email, dan dokumen kertas lain.
Data Litbang Farmasi: terkait dengan mekanisme tindakan obat, perilaku target dit ubuh manusia dan efek samping dari segala tindak farmasi.
Bidang pariwisata
Mahadata saat ini merupakan alat perang terbaik untuk terus menjadi nomor satu di podium industri pariwisata baik secara lokal maupun internasional, dengan peningkatan layanan dan ditunjang dengan kemampuan beradaptasi secara maksimum untuk kebutuhan para pengunjung tempat pariwisata yang ada. Jejaring sosial dan portal pariwisata baru yang mengandalkan kolaborasi pengguna telah menjadi salah satu referensi utama ketika mengavaluasi atau merencanakan perjalanan. Mahadata dapat menjadi sumber inovasi bagi organisasi pariwisata dan industri pada umumnya. Potensi yang dimiliki dalam industri pariwisata sangat besar dan perusahaan tidak boleh meremehkan pentingnya mahadata.
Dengan pendekatan yang tepat, industri pariwisata dapat belajar banyak tentang pilihan konsumen dan menggunakan informasi dan wawasan ini untuk membangun hubungan dengan pelancong pada waktu yang tepat sangatlah penting. Tanpa informasi yang tepat dan pendekatan penargetan yang sangat baik, iklan tidak akan menghasilkan konversi apapun dan tidak akan ada ROI. Perjalanan adalah industri yang serbacepat, yang benar benar mendorong kebutuhan untuk analisis data yang cepat dan keputusan cepat. Di bidang pariwisata, tuntutan apapun perlu ditangani secara instan agar tetap relevan bagi wisatawan, yang membuat mahadata menjadi sangat penting.
Jejaring sosial dan portal pariwisata baru yang mengandalkan kolaborasi pengguna telah menjadi salah satu rujukan utama ketika mengevaluasi atau merencanakan perjalanan. Sangat penting untuk memantau semua pendapat dan pengalaman yang ditinggalkan wisatawan seperti sidik jari digital, dan karena itu, alat yang tepat diperlukan. Tidak ada keraguan tentang pentingnya menganalisis reputasi yang dibuat secara spontan di jejaring sosial atau di portal pariwisata tertentu. Di samping itu, pendapat pengguna dikondisikan oleh orang lain dan pengguna terlebih lagi memiliki pengaruh sosial atau bertindak dalam lingkungan yang dekat.
Teknik analisis sentiman adalah salah satu tugas khas pengolahan bahasa alami (Natural Language Processing/NLP), yang mengelola deteksi komentar positif, negatif dan netral yang ditulis dalam bahasa alami dengan tingkat keandalan yang tinggi. Emosi, pendapat, dan perasaan ini diambil dari konten yang dituangkan oleh pengunjung dan pengguna ke jaringan sosial dan platform analisis wisata. Prosedur ini dilakukan secara otomatis melalui mesin analisis sentimen. Pada dasarnya, ada dua model NLP: Linguistik, berdasarkan tata bahasa dan probabilitas, berdasarkan data. Dalam model linguistik, ada tingkat kedalaman yang berbeda. Dalam analisis leksikal, mesin mencapai tingkat yang lebih dangkal, mengklasifikasikan sebagai positif atau negatif sesuai dengan kata-kata umum seperti hebat, mengerikan, dll. Ada analisis yang lebih mendalam dalam memahami arti kata-kata menggunakan morfologi, sintaksis atau kontekstual informasi.
Dalam analisis yang lebih kompleks ini, dapat mengambil data melalui media sosial seperti Instagram, Twitter, dll dengan mengambil konten tulisan opini yang telah dibuat oleh pengguna, menggunakan analisis ini mesin akan mengolah model yang dapat mengenali struktur teks positif dengan kata-kata negatif atau mengenali penggunaan idiomatik dan kata-kata berbentuk sarkasme. Analisis lebih mendalam ini, tanpa diragukan lagi, merupakan revolusi bagi industri pariwisata, berkat ini diproses informasi, dapat memberdayakan dan meningkatkan layanannya secara maksimal karena mengetahui bagaimana persepsi dan opini masyarakat akan suatu hal, sudah sesuai ekspektasi dan perencanaan pemasaran atau masih dianggap belum memuaskan.
Pada tahun 2016, sudah tahun ketujuh berturut-turut hasil analisis data wisata di Amerika menunjuikan bahwa jumlah kedatangan wisatawan internasional (pengunjung satu malam) tumbuh sebesar 3,9% dan mencapai total 1.235 juta di seluruh dunia. Data ini menyoroti dampak industri pariwisata terhadap ekonomi global.[17]
Perusahaan di sektor pariwisata sudah banyak yang sadar akan peran mahadata jika ingin menjadi pemimpin di pasar, banyak yang sudah menjadi perusahan dengan ideologi data-driven. Itulah mengapa mereka mengakui Big Data sebagai senjata terbaik untuk terus berada di garis depan pariwisata internasional.
Rujukan
^Narendra, Albertus Pramukti (2015). "Data Besar, Data Analisis, dan Pengembangan Kompetensi Pustakawan". Record and Library Journal. Vol. 1 No. 2.