Mojibake

Artikel mojibake di Wikipedia bahasa Jepang dalam enkode UTF-8 yang ditampilkan dengan sistem operasi ber-enkode Windows-1252.

Mojibake (文字化け) adalah tampilan karakter komputer yang salah dan tak terbaca dengan baik ketika perangkat lunak gagal menampilkan teks dengan benar sesuai dengan pengodean karakter untuk karakter tersebut.

Sebagai contoh, teks bahasa Jepang yang dimaksudkan penulisnya untuk dibaca sebagai 文字化け akan ditampilkan salah sebagai "æ–‡å—化け" pada sistem operasi yang hanya diatur untuk menampilkan karakter dalam pengodean Windows-1252 atau ISO-8859-1 (umumnya disebut Western).

Arti harfiah mojibake adalah karakter hantu,[1] berasal dari gabungan kata moji (文字) yang berarti karakter, ditambah bake (化け, hantu) bentuk kata benda dari kata kerja bakeru (化ける, berubah/mengubah bentuk ke dalam bentuk/penampilan lain).

Saat mengembangkan Aldus PageMaker versi bahasa Jepang, pengembang perangkat lunak bernama Yoshiyuki Kubo menemui kesalahan dalam tampilan karakter yang dijelaskannya sebagai mojibake. Istilah tersebut lalu melekat dan meluas, dimulai dari kalangan pengembang/pemakai Macintosh.[2]

Penyebab

Mojibake sering disebabkan ketika pengodean karakter tak ternyatakan dengan benar di dalam dokumen, atau ketika dokumen dipindahkan dari sistem yang dipasang dengan pengodean karakter yang berbeda. Tampilan karakter yang salah terjadi ketika sistem aksara atau pengodean karakter salah menandai atau "mengasingkan" tulisan itu. Bila komputer itu tak memiliki perangkat lunak yang dibutuhkan untuk memproses karakter asing, maka komputer tersebut akan mencoba memprosesnya dengan pengodean terpasang. Akibatnya, tanda tanya, kotak, atau lambang-lambang aneh ditampilkan di layar.

Penjelajah web kemungkinan tidak dapat membedakan laman web yang dikodekan dengan EUC-JP dan laman web berikutnya yang dikodekan dengan Shift-JIS, kecuali bila bagan pengodean dinyatakan terang-terangan dalam tajuk HTTP yang dikirim dengan dokumen, atau dalam penanda meta HTML yang dipakai untuk menggantikan tajuk HTTP yang hilang bila peladen tidak dikonfigurasi untuk mengirim tajuk HTTP hyang layak. Ini mungkin dapat diselesaikan dengan cara heuristik dapat diterapkan untuk menebak set karakter apa yang coba ditampilkan, tetapi ini tak selalu berhasil.

Contoh

Pengodean berkas Pengaturan di penjelajah web Hasil
Contoh bahasa Arab:
Tampilan di penjelajah web: الإعلان العالمى لحقوق الإنسان
UTF-8 ISO 8859-1 الإعلان العالمى لحقوق الإنسان
KOI8-R О╩©ь╖ы└ь╔ь╧ы└ь╖ы├ ь╖ы└ь╧ь╖ы└ы┘ы┴ ы└ь╜ы┌ы┬ы┌ ь╖ы└ь╔ы├ьЁь╖ы├
ISO 8859-5 яЛПиЇй?иЅиЙй?иЇй? иЇй?иЙиЇй?й?й? й?и­й?й?й? иЇй?иЅй?иГиЇй?
CP 866 я╗┐╪з┘Д╪е╪╣┘Д╪з┘Ж ╪з┘Д╪╣╪з┘Д┘Е┘Й ┘Д╪н┘В┘И┘В ╪з┘Д╪е┘Ж╪│╪з┘Ж
ISO 8859-6 ُ؛؟ظ?ع?ظ?ظ?ع?ظ?ع? ظ?ع?ظ?ظ?ع?ع?ع? ع?ظ­ع?ع?ع? ظ?ع?ظ?ع?ظ?ظ?ع?
ISO 8859-2 اŮ?ŘĽŘšŮ?اŮ? اŮ?ؚاŮ?Ů?Ů? Ů?Ř­Ů?Ů?Ů? اŮ?ŘĽŮ?ساŮ?
Windows-1256 Windows-1252 ÇáÅÚáÇä ÇáÚÇáãì áÍÞæÞ ÇáÅäÓÇä
Contoh bahasa Swedia: Smörgås
Pengodean berkas Pengaturan di penjelajah web Hasil
MS-DOS 437 ISO 8859-1 Sm”rg†s
ISO 8859-1 Mac Roman SmˆrgÂs
UTF-8 ISO 8859-1 Smörgås
UTF-8 Mac Roman Smörgås
Contoh bahasa Rusia: Кракозябры
Pengodean berkas Pengaturan di penjelajah web Hasil
MS-DOS 855 ISO 8859-1 Æá ÆÖóÞ¢áñ
KOI8-R ISO 8859-1 ëÒÁËÏÚÑÂÒÙ
UTF-8 KOI8-R п я─п╟п╨п╬п╥я▐п╠я─я▀

Contoh Lain Mojibake

Contoh Mojibake
Teks awal
Bita mentah pengodean EUC-JP CA B8 BB FA B2 BD A4 B1
Bita hasil penerjemahan cara pengodean Shift-JIS
Bita hasil penerjemahan cara pengodean ISO-8859-1 Ê ¸ » ú ² ½ ¤ ±
Bita hasil penerjemahan cara pengodean GBK

Rujukan

  1. ^ Paul Hastings (2004-4-13). "ColdFusion: Article, Do You Want Coffee with That Mojibake? Character encodings and CFMX". ColdFusion Developer's Journal. Diarsipkan dari versi asli tanggal 2013-09-12. Diakses tanggal 2012-07-15. 
  2. ^ "漢字トーク V1.0( KanjiTalk 1.0 )". The Vintage Mac Museum. Diarsipkan dari versi asli tanggal 2006-02-24. Diakses tanggal 2012-07-15.  Berikut lampiran email mengenai masalah mojibake.

Pranala luar