Visualisasi data dilihat oleh banyak bidang ilmu sebagai komunikasi visual modern.
Visualisasi data tidak berada di bawah bidang manapun, melainkan interpretasi di antara banyak bidang (misalnya, terkadang dilihat sebagai cabang modern dari statistik deskriptif oleh beberapa orang, tetapi juga sebagai dasar alat pengembangan oleh yang lain).
Visualisasi data mengikutkan pembuatan dan kajian dari representasi visual dari data, artinya "informasi yang telah diabstraksikan dalam bentuk skematis, termasuk atribut atau variabel dari unit informasi".
[1]
Tujuan utama dari visualisasi data adalah untuk mengkomunikasikan informasi secara jelas dan efisien kepada pengguna lewat grafik informasi yang dipilih, seperti tabel dan grafik.
Visualisasi yang efektif membantu pengguna dalam menganalisis dan penalaran tentang data dan bukti.
Ia membuat data yang kompleks bisa diakses, dipahami dan berguna. Pengguna bisa melakukan pekerjaan analisis tertentu, seperti melakukan pembandingan atau memahami kausalitas, dan prinsip perancangan dari grafik (contohnya, memperlihatkan perbandingan atau kausalitas) mengikuti pekerjaan tersebut.
Tabel pada umumnya digunakan saat pengguna akan melihat ukuran tertentu dari sebuah variabel, sementara grafik dari berbagai tipe digunakan untuk melihat pola atau keterkaitan dalam data untuk satu atau lebih variabel.
Visualisasi data adalah seni dan sains.
Laju di mana data dikeluarkan telah meningkat, dipicu oleh meningkatnya ekonomi berbasis informasi.
Data yang dibuat oleh aktivitas internet dan sejumlah sensor yang makin bertambah dalam lingkungan, seperti satelit dan kamera jalan, disebut sebagai "Big data".
Pemrosesan, analisis dan mengkomunikasikan data tersebut menciptakan berbagai tantangan analisis bagi visualisasi data.
Bidang ilmu data dan pelakunya yang disebut ilmuwan data telah muncul untuk membantu mengatasi tantangan tersebut.
Gambaran Umum
Visualisasi data mengacu pada teknik yang digunakan untuk mengkomunikasi data atau informasi dengan membuatnya sebagai objek visual (misalnya, titik, garis, atau batang) dalam grafik.
Tujuannya yaitu untuk mengkomunikasikan informasi secara jelas dan efisien kepada pengguna.
Ia merupakan salah satu tahap dalam analisis data atau ilmu data.
Menurut Friedman (2008) "tujuan utama dari visualisasi data adalah untuk mengkomunikasikan informasi secara jelas dan efektif dengan cara grafis.
Bukan berarti visualisasi data harus terlihat membosankan supaya berfungsi atau sangat canggih supaya terlihat menarik.
Untuk memaparkan ide secara efektif, bentuk estetis dan fungsionalitas harus berbarengan, menyediakan wawasan bagi kumpulan data yang kompleks dan jarang dengan mengkomunikasikan aspek-aspek kunci dengan cara yang intuitif.
Namun perancang terkadang gagal mencapai keseimbangan antara bentuk dan fungsi, menciptakan visualisasi data yang menawan yang gagal menyediakan tujuan utamanya -- untuk mengkomunikasikan informasi".
[2]
Fernanda Viegas dan Martin M. Wattenberg menyarankan bahwa sebuah visualisasi yang ideal tidak hanya harus mengkomunikasikan secara jelas, tetapi menstimulasi atensi dan keterlibatan penonton.
[3]
Profesor Edward Tufte menjelaskan bahwa pengguna dari tampilan informasi melakukan pekerjaan analitis tertentu seperti membuat perbandingan atau menentukan kausalitas.
Prinsip perancangan dari grafik informasi harus mendukung pekerjaan analitis, memperlihatkan perbandingan atau kausalitas.
[5]
Dalam bukunya tahun 1983 The Visual Display of Quantitative Information, Edward Tufte mendefinisikan 'tampilan grafik' dan prinsip-prinsip dari tampilan grafik yang efektif sebagai berikut:
"Keberhasilan dalam grafik statistik terdiri dari mengkomunikasikan ide yang kompleks dengan kejelasan, ketepatan dan efisiensi.
Tampilan grafis seharusnya:
memperlihatkan data
mendorong penglihat untuk berpikir tentang substansi bukan metodologi, rancangan grafik, teknologi dari produksi grafik atau hal lainnya
menghindari pengelabuan terhadap apa yang dikatakan oleh data
memberikan banyak angka dalam ruang yang kecil
membuat kumpulan data yang besar koheren
mendorong mata untuk membandingkan berbagai bagian berbeda dari data
membuka data pada beberapa tingkat kerincian, dari gambaran umum sampai struktur terakhir
melayani sebuah tujuan yang jelas: deskripsi, eksplorasi, tabulasi atau dekorasi
secara dekat berintegrasi dengan statistik dan deskripsi verbal dari sebuah kumpulan data.
Grafik menyingkap data.
Tentu saja grafik bisa lebih tepat dan membuka daripada komputasi statisik konvensional."
[6]
Sebagai contohnya, diagram Minard memperlihatkan kekalahan yang dialami oleh tentara Napoleon dalam periode 1812-1813.
Enam variabel dipaparkan: ukuran tentara, lokasinya dalam dua-dimensi (x dan y), waktu, arah pergerakan, dan temperatur.
Tampilan multivarian tersebut dalam dua dimensi menceritakan sebuah cerita yang dapat ditangkap langsung sementara mengidentifikasi sumber data untuk membangun sebuah kredibilitas.
Tufte menulis pada tahun 1983 bahwa: "Ia mungkin saja grafik statistik terbaik yang pernah dilukis."[6]
Dengan tidak menerapkan prinsip-prinsip tersebut bisa menghasilkan grafik menyesatkan, yang mengganggu pesan atau mendukung kesimpulan yang salah.
Menurut Tufte, sampah-grafik mengacu pada dekorasi tambahan dari grafik yang tidak meningkatkan pesan, atau efek tiga dimensi atau perspektif yang serampangan.
Secara sia-sia memisahkan kunci penjelasan dari gambar itu sendiri, membuat mata berpindah dari gambar ke penjelasan, adalah suatu bentuk dari "puing administratif". Rasio dari "data ke tinta" harus dimaksimalkan, menghapus tinta-tinta yang bukan data bila memungkinkan.
[6]
Congressional Budge Office menyimpulkan beberapa praktik terbaik dalam menampilkan grafik dalam presentasi bulan Juni 2014, yaitu: a) Kenali penonton anda; b) Merancang grafik yang dapat berdiri sendiri di luar konteks dari laporan; dan c) Merancang grafik yang mengkomunikasikan pesan kunci dalam laporan.
[7]
Pesan Kuantitatif
Penulis Stephen Few menjelaskan delapan tipe pesan kuantitatif yang pengguna coba pahami atau komunikasikan dari sekumpulan data dan grafik yang digunakan untuk membantu mengkomunikasikan pesan:
Rangkaian-waktu: sebuah variabel tunggal ditangkap selama periode waktu, seperti laju pengangguran selama 10 tahun. Sebuah grafik baris bisa digunakan untuk memperlihatkan tren ini.
Peringkat: Pembagian kategoris diperingkatkan secara terurut menaik atau menurun, seperti peringkat peformansi penjualan (ukuran) berdasarkan penjual (kategori, dengan setiap penjual sebagai pembagian kategoris) selama satu periode tunggal. Sebuah grafik batang bisa digunakan untuk memperlihatkan perbandingan antara penjual.
Sebagian-untuk-keseluruhan: Pembagian kategoris diukur sebagai sebuah rasio terhadap keseluruhan (misalnya, sebuah persentase dari 100%). Sebuah grafik lingkaran atau grafik batang dapat memperlihatkan perbandingan rasio, seperti kepemilikan saham direpresentasikan oleh kompetitor dalam sebuah pasar.
Deviasi: Pembagian kategori dibandingkan dengan sebuah referensi, seperti perbandingan pengeluaran aktual terhadap anggaran untuk beberapa departemen dari sebuah bisnis pada periode waktu tertentu. Grafik batang dapat memperlihatkan perbandingan nilai aktual terhadap jumlah yang diacu.
Distribusi frekuensi: Memperlihatkan jumlah observasi dari variabel tertentu terhadap rentang waktu tertentu, seperti jumlah tahun di mana pasar saham menguntungkan adalah antara interval seperti 0-10%, 11-20%, dll. Sebuah histogram, tipe dari grafik batang, bisa digunakan untuk analisis ini.
Korelasi: Perbandingan antara observasi direpresentasikan oleh dua variabel (X, Y) untuk menentukan apakah mereka condong bergerak ke arah yang sama atau berlawanan. Sebagai contohnya, memplotkan pengangguran (X) dan inflasi (Y) untuk sampel beberapa bulan. Sebuah scatter plot biasanya digunakan untuk menyampaikan pesan tersebut.
Perbandingan nominal: Membandingkan pembagian kategori tanpa urutan tertentu, seperti jumlah penjualan berdasarkan kode produk. Grafik batang bisa digunakan untuk pembandingan ini.
Geografis atau geospasial: Perbandingan dari sebuah variabel di peta atau letak, seperti laju pengangguran berdasarkan negara bagian atau jumlah orang pada lantai di sebuah bangunan. Bagan yang digunakan biasanya adalah sebuah cartogram.[8][9]
Analis yang meninjau sekumpulan data bisa mempertimbangkan apakah beberapa atau semua pesan dan tipe grafik di atas bisa diterapkan pada pekerjaan atau penonton mereka.
Proses uji coba untuk mengidentifikasi keterkaitan dan makna pesan pada data adalah bagian dari eksplorasi analisis data.
Persepsi visual dan visualisasi data
Seseorang bisa membedakan perbedaan antara panjang dua garis, orientasi bentuk, dan warna (corak) tanpa usaha pemrosesan yang signifikan; hal ini disebut sebagai "atribut pra-atensi."
Sebagai contohnya, mungkin membutuhkan waktu dan usaha ("pemrosesan atensi") untuk mengidentifikasi berapa kali angka "5" muncul dalam sekumpulan angka; tetapi jika angka tersebut berbeda dalam ukuran, orientasi, atau warna, instan dari angka tersebut dapat dilihat lebih cepat lewat pemrosesan pra-atensi.
[10]
Grafik yang efektif menggunakan kelebihan pemrosesan pra-atensi dan atribut dan kekuatan relatif dan atribut tersebut.
Sebagai contohnya, secara manusia dapat dengan mudah memroses perbedaan panjang garis daripada wilayah permukaan, akan lebih efektif menggunakan grafik batang (yang mengambil keuntungan panjang garis untuk memperlihatkan perbandingan) daripada grafik lingkaran (yang menggunakan wilayah permukaan).
[10]
Terminologi
Visualisasi data mengikutkan terminologi khusus, beberapa diturunkan dari statistik.
Sebagai contohnya, penulis Stephen Few mendefinisikan dua tipe data, yang digunakan secara kombinasi untuk mendukung analisis atau visualisasi yang bermakna:
Kategorial: label teks menjelaskan sifat dari data, seperti "Nama" atau "Umur". Istilah ini melingkupi data kualitatif (bukan angka).
Kuantitatif: Pengukuran angka, seperti "25" untuk merepresentasikan umur dalam tahun.
Sebuah tabel mengandung data kuantitatif diatur dalam baris dan kolom dengan label kategorial. Secara umum digunakan untuk melihat nilai ilmiah. Pada contoh di atas, tabel bisa memiliki label kolom kategorial merepresentasikan nama (sebuah variabel kualitatif) dan umur (variabel kuantitatif) dengan setiap baris dari data merepresentasikan satu orang (unit eksperimental atau pembagian kategori dari sampel).
Sebuah bagan biasanya digunakan untuk memperlihatkan keterkaitan antara data dan menggambarkan nilai yang dikodekan sebagai objek visual (misalnya, garis, batang, atau titik). Nilai numerik ditampilkan dalam sebuah wilayah yang digambarkan dengan satu atau lebih sumbu. Sumbu tersebut menyediakan skala (kuantitatif dan kategorial) yang digunakan untuk label dan memberi nilai ke objek visual. Banyak grafik disebut juga sebagai bagan.[11]
Perpustakaan KPI telah mengembangkan "Tabel Periodik dari Metode Visualisasi", sebuah bagan interaktif yang memperlihatkan berbagai metode visualisasi data.
Ia mengikutkan enam tipe dari metode visualisasi data: data, informasi, konsep, strategi, metafora dan gabungan.
[12]
Ada pendekatan berbeda dalam ruang lingkup visualisasi data.
Salah satu fokus umum yaitu pada presentasi informasi, seperti yang Friedman (2008) berikan.
Dalam cara ini Friendly (2008) menganggap dua bagian utama dari visualisasi data:
grafik statistik, dan kartografi tematik.
[1]
Dalam artikel "Data Visualization: Modern Approaches" (2007) memberikan ikhtisar tentang tujuh subjek dari visualisasi data:
[13]
Arsitektur Presentasi Data (APD) adalah sekumpulan keahlian yang mencoba mengidentifikasi, menempatkan, memanipulasi, memformat dan memberikan data dengan suatu cara untuk secara optimal mengkomunikasi makna dan memberikan pengetahuan.
Menurut sejarah, istilah APD diatribusikan ke Kelly Lautt:
[14]
"Arsitektur Presentasi Data adalah penerapan keahlian yang jarang digunakan untuk kesuksesan dan nilai dari Intelijensi Bisnis.
Arsitektur presentasi data mengawinkan ilmu angka, data dan statisik dalam menemukan informasi yang berharga dari data dan membuatnya berguna, berkaitan dan dapat diaksikan dengan seni dari visualisasi data, komunikasi, psikologi organisasi dan manajemen perubahan dengan tujuan untuk menyediakan solusi intelijensi bisnis dengan ruang lingkup data, pemilihan waktu penyampaian, format dan visualisasi yang secara efektif akan mendukung dan mengarahkan perilaku operasional, taktikal, dan strategik ke arah tujuan bisnis (atau organisasi) yang dapat dipahami.
APD bukanlah kemampuan teknologi informasi (TI) atau bisnis tetapi berada sebagai bagian ilmu keahlian yang terpisah.
Terkadang dianggap dengan visualisasi data, APD adalah keahlian yang lebih luas yang mengikutkan penentuan data apa dan pada waktu kapan dan dalam format apa akan dipresentasikan, tidak hanya cara terbaik menampilkan data yang telah dipilih sebelumnya (yaitu visualisasi data).
Kemampuan visualisasi data adalah salah satu elemen dari APD.
Objektif
PAD memiliki dua objektif utama:
Menggunakan data untuk menyediakan pengetahuan dengan cara yang seefisien mungkin (meminimalkan noise, kompleksitas, dan data yang tidak perlu terhadap kebutuhan dan peran penonton)
Menggunakan data untuk menyediakan pengetahuan dengan cara seefektif mungkin (menyediakan data yang relevan, berdasarkan waktu dan komplet untuk setiap anggota pengguna dengan cara yang jelas dan mudah dipahami sehingga menyingkap makna yang penting, dapat diaksikan dan dapat mempengaruhi pemahaman, perilaju dan keputusan)
Ruang lingkup
Dengan objektif di atas, pekerjaan sebenarnya dari arsitektur presentasi data terdiri dari:
Membuat mekanisme penyampaian yang efektif untuk setiap pengguna bergantung kepada peran, pekerjaan, lokasi dan akses mereka terhadap teknologi
Menentukan makna yang penting (pengetahuan yang berkaitan) yang dibutuhkan oleh setiap anggota pengguna di setiap konteks
Menentukan periode perbaruan dari data yang dibutuhkan (peredaran dari data)
Menentukan waktu yang tepat untuk presentasi data (kapan dan seberapa sering pengguna membutuhkan untuk melihat data)
Menemukan data yang tepat (wilayah subjek, pencapaian riwayat, luasnya, tingkat kerincian, dll)
Menggunakan analisis, pengelompokan, visualisasi, dan format presentasi lainnya yang tepat
Bidang ilmu terkait
Pekerjaan APD memiliki kesamaan dengan beberapa bidang lainnya, termasuk:
Analisis bisnis dalam menentukan tujuan bisnis, mengumpulkan kebutuhan, pemetaan pemrosesan.
Perbaikan proses bisnis yang mana tujuannya adalah untuk meningkatkan dan mempersingkat aksi dan keputusan dalam mendorong tujuan bisnis
Visualisasi data dengan menggunakan teori-teori visualisasi yang telah pakem untuk menambahkan atau menyoroti makna atau kepentingan dalam presentasi data.
Perancangan grafik atau pengguna: Saat istilah APD digunakan, ia menjadi semacam rancangan yang tidak mengindahkan beberapa rincian seperti selera warna, gaya, label dan perhatian estetika lainnya, kecuali elemen-elemen rancangan yang secara spesifik dibutuhkan atau menguntungkan bagi komunikasi makna, pengaruh, kesulitan atau informasi lain dari nilai bisnis. Sebagai contohnya,
memilih lokasi untuk berbagai elemen representasi data pada sebuah halaman presentasi (seperti portal perusahaan, dalam sebuah laporan atau situs web) dengan tujuan untuk memperlihatkan hierarki, prioritas, kepentingan atau sebuah progres yang rasional bagi pengguna adalah bagian dari kemampuan APD.
memilih untuk memberikan warna tertentu pada elemen grafis yang merepresentasikan data terhadap makna atau perhatian tertentu adalah bagian dari kemampuan APD.
Arsitektur informasi, arsitektur informasi fokus pada data tak-terstruktur dan transformasi langsung dari konten yang sebenarnya (data, untuk APD) menjadi entitas dan kombinasi baru.
Arsitektur solusi dalam menentukan rincian solusi yang optimal, termasuk ruang lingkup data yang digunakan, terhadap tujuan bisnis
Analisis statistik atau analisis data yang mana ia menciptakan informasi dan pengetahuan dari data
^Penggunaan formal, tercatat, publik yang pertama dari istilah arsitektur presentasi data adalah saat tiga acara formal dari Microsoft Office 2007 Launch bulan Desember, Januari, dan Februari tahun 2007-08 di Edmonton, Calgary dan Vancouver (Canada) yang dipresentasikan oleh Kelly Lautt menjelaskan sebuah sistem intelijensi bisnis yang dirancang untuk meningkatkan kualitas layanan di sebuah perusahaan bubur kertas. Istilah tersebut kemudian digunakan dan tercatat digunakan di publik pada tanggal 16 Desember 2009 dalam sebuah presentasi Microsoft Canada tentang nilai dari menggabungkan Intelijensi Bisnis dengan proses kolaborasi perusahaan.
Bacaan lebih lanjut
Chandrajit Bajaj, Bala Krishnamurthy (1999). Data Visualization Techniques.
William S. Cleveland (1993). Visualizing Data. Hobart Press.
William S. Cleveland (1994). The Elements of Graphing Data. Hobart Press.
Stewart Liff and Pamela A. Posey, Seeing is Believing: How the New Art of Visual Management Can Boost Performance Throughout Your Organization, AMACOM, New York (2007), ISBN 978-0-8144-0035-7