Pengenalan tulisan tangan (Handwriting recognition) adalah kemampuan komputer untuk menerima dan menafsirkan input tulisan tangan yang dapat dimengerti dari sumber seperti dokumen kertas, foto, layar sentuh dan perangkat lainnya. Gambar dari teks tertulis dapat digunakan secara luring dari selembar kertas oleh pemindai optik (rekognisi karakter optik). Selain itu, gerakan ujung pena dapat dimengerti secara daring, misalnya dengan menggunakan permukaan layar komputer berbasis pena.
Pengenalan tulisan tangan memerlukan rekognisi karakter optik. Namun, sistem pengenalan tulisan tangan yang lengkap juga menangani format, melakukan segmentasi yang tepat ke dalam karakter dan menemukan kata yang paling masuk akal.
Pengenalan luring
Pengenalan tulisan tangan luring melibatkan konversi otomatis teks dalam gambar ke dalam kode-kode huruf yang digunakan dalam komputer dan aplikasi pengolahan teks. Data yang diperoleh formulir ini dianggap sebagai representasi statis dari tulisan tangan. Pengenalan tulisan tangan luring relatif sulit, orang yang berbeda memiliki gaya tulisan tangan yang berbeda pula. Seperti hari ini, mesin OCR berfokus pada teks mesin cetak dan ICR teks tangan yang dicetak. Tidak ada mesin OCR / ICR yang mendukung pengenalan tulisan tangan untuk hari ini.
Masalah teknik pengurangan domain
Mempersempit masalah domain dapat membantu meningkatkan keakuratan sistem pengenalan tulisan tangan. Bentuk kode ZIP misalnya, akan hanya berisi karakter 0-9. Hal ini akan mengurangi jumlah kemungkinan identifikasi.
Teknik utama:
Menentukan rentang karakter tertentu
Pemanfaatan bentuk khusus
Ekstraksi karakter
Pada masa lalu, pengenalan karakter luring sering melibatkan pemindaian bentuk atau dokumen tertulis. Ini berarti karakter individu yang terdapat dalam gambar hasil pindai perlu diekstrak. Terdapat alat yang mampu melakukan langkah ini. Namun, ada beberapa ketidaksempurnaan dalam langkah ini. Karakter paling umum yang terhubung bersama dikembalikan sebagai gambar-sub tunggal yang berisi kedua karakter. Hal ini menyebabkan masalah utama pada tahap pengenalan. Namun tersedia banyak algoritme yang dapat mengurangi risiko dari karakter yang terhubung.
Pengenalan karakter
Setelah ekstraksi dari karakter individu terjadi, mesin pengenal digunakan untuk mengidentifikasi karakter komputer yang cocok. Saat ini tersedia beberapa teknik pengenalan yang berbeda.
Jaringan saraf
Pengenalan jaringan saraf belajar dari pelatihan gambar awal yang telah ditetapkan. Jaringan yang telah terlatih kemudian membuat identifikasi karakter. Setiap jaringan saraf secara unik mempelajari properti yang membedakan gambar pelatihan. Kemudian mencari sifat serupa pada gambar sasaran untuk diidentifikasi. Jaringan saraf cepat untuk diatur, namun bisa tidak akurat jika memperlajari properti yang tidak penting dalam data sasaran.
Fitur ekstraksi
Fitur ekstraksi bekerja dengan cara yang sama dengan pengenalan jaringan saraf. Namun, pemrogram harus secara manual menentukan properti yang mereka anggap penting.
Beberapa contoh properti:
Aspek rasio
Persen piksel di atas titik setengah horizontal
Persen piksel ke kanan setengah titik vertikal
Jumlah coretan
Rata-rata jarak dari pusat gambar
Apakah tercermin sumbu y
Apakah tercermin x sumbu
Pendekatan ini memberikan pengenalan kontrol yang lebih atas properti yang digunakan dalam identifikasi. Namun setiap sistem yang menggunakan pendekatan ini memerlukan waktu pengembangan substansial yang lebih dari satu jaringan saraf karena properti tidak dipelajari secara otomatis.
Pengenalan daring
Pengenalan tulisan tangan daring melibatkan konversi otomatis teks seperti yang tertulis pada sebuah digitizer khusus atau PDA, di mana sebuah sensor mengambil gerakan ujung pena. Data semacam itu dikenal sebagai tinta digital dan dapat dianggap sebagai representasi dinamis dari tulisan tangan. Sinyal yang diperoleh dikonversikan ke dalam kode huruf yang digunakan dalam komputer dan aplikasi pengolahan teks.
Elemen-elemen dari pengenalan tulisan tangan dala jaringan biasanya meliputi:
permukaan yang sensitif akan sentuhan, yang dapat diintegrasikan dengan, atau berdekatan dengan, tampilan 'output.
aplikasi perangkat lunak yang menafsirkan gerakan stilus di permukaan menulis, menerjemahkan coretan yang dihasilkan menjadi teks digital.
Perangkat keras
Pada awal tahun 1980 diperkenalkan produk komersial memasukkan pengenalan tulisan tangan sebagai pengganti untuk inputpapan ketik. Contohnya termasuk terminal tulisan tangan seperti Pencept Penpad dan terminal Inforite point-of-sale. Dengan munculnya pasar konsumen yang besar untuk komputer pribadi, beberapa produk komersial diperkenalkan untuk menggantikan papan ketik dan tetikus pada komputer pribadi dengan sistem menunjuk tunggal / tulisan tangan, seperti dari PenCept, CIC, dan lain-lain. Komputer portabel komersial pertama yang tersedia tipe tablet adalah GRiDPad dari GRID Systems, dirilis pada bulan September1989. Operasi sistem ini didasarkan pada MS-DOS.
Pada awal 1990-an, pembuat perangkat keras termasuk NCR, IBM dan EO merilis komputer tablet PenPoint yang sistem opaerasi dikembangkan oleh GO Corp. PenPoint menggunakan pengenalan tulisan tangan dan pergerakan menyeluruh serta memberikan fasilitas untuk perangkat lunak pihak ketiga. Komputer tablet IBM adalah yang pertama yang mempegunakan nama ThinkPad dan menggunakan pengenalan tulisan tangan IBM. Sistem pengenalan kemudian dianggurkan ke Microsoft Windows untuk Pen Computing, dan Pen IBM OS/2. Tak satu pun dari mereka sukses secara komersial.
Kemajuan dalam elektronik memungkinkan daya komputasi yang diperlukan bagi pengenalan tulisan tangan untuk masuk ke dalam faktor bentuk yang lebih kecil dalam komputer tablet, dan pengenalan tulisan tangan sering digunakan sebagai metode input untuk PDAgenggam. PDA pertama yang menyediakan input tertulis adalah Apple Newton, yang mengarahkan masyarakat untuk keuntungan dari hubungan antar pengguna yang lancar. Namun, perangkat ini tidak sukses secara komersial, perangkat lunaknya tidak dapat dipercaya, yang mencoba untuk mempelajari pola pengguna menulis. Pada saat pelepasan Newton OS 2.0, dimana pengenalan tulisan tangan itu sangat meningkat, termasuk fitur unik yang masih belum ditemukan dalam sistem pengenalan saat ini seperti koreksi kesalahan modeless, sebagian besar kesan pertama yang didapat adalah negatif. Setelah penghentian Apple Newton, fitur ini telah dianggurkan pada Mac OS X 10.2 atau yang lebih baru dalam bentuk Inkwell (Macintosh).
Palm Inc. kemudian meluncurkan serangkaian PDA yang didasarkan pada sistem pengenalan Graffiti. Graffiti meningkatkan kegunaan dengan mendefinisikan satu set coretan, atau bentuk satu coretan, untuk masing-masing karakter. Ini memperkecil kemungkinan untuk input yang salah, walaupun menghafal pola coretan meningkatkan kurva pembelajaran bagi pengguna. Pengenalan tulisan tangan Graffiti ditemukan untuk menyalahi hak paten yang dimiliki oleh Xerox, dan Palm menggantikan Graffiti dengan versi lisensi pengenalan tulisan tangan CIC yang sementara juga mendukung bentuk unistroke, mendahului paten Xerox. Pengadilan menemukan pelanggaran hak cipta yang terbalik pada saat banding, dan kemudian terbalik lagi pada saat banding selanjutnya. Pihak-pihak yang terlibat kemudian merundingkan penyelesaian mengenai ini dan paten lain dari Graffiti (Palm OS).
Sebuah Tablet PC adalah komputer jinjing khusus yang dilengkapi dengan tablet digitizer dan stilus, dan memungkinkan pengguna untuk menulis tangan teks pada layar unit. Sistem operasi mengenali tulisan tangan dan mengkonversikannya menjadi teks yang diketik. Windows Vista dan Windows 7 mencakupi fitur personalisasi yang mempelajari pola tulisan pengguna dan kosakata untuk bahasa Inggris, Jepang, Cina Tradisional, Cina Sederhana dan Korea. Fitur termasuk personalization wizard yang menyarankan sampel tulisan tangan pengguna dan menggunakannya untuk melatih sistem guna pengenalan akurasi yang lebih tinggi. Sistem ini berbeda dari sistem pengenalan tulisan tangan kurang maju pada Windows Mobile OS untuk PDA.
Dalam beberapa tahun terakhir, beberapa usaha dilakukan untuk menghasilkan pena tinta yang mencakup unsur-unsur digital, misalnya seseorang menulis di atas kertas dan kemudian hasil teks disimpan secara digital. Yang paling terkenal menggunakan teknologi ini dikembangkan oleh Anoto, yang telah sukses di pasar pendidikan. Keberhasilan umum produk ini belum ditentukan.
Meskipun pengenalan tulisan tangan adalah bentuk input yang telah biasa digunakan publik secara luas, namun hal ini belum mencapai komputer meja atau komputer jinjing. Secara umum inputpapan ketik dianggap lebih cepat dan lebih handal. Pada tahun 2006, banyak PDA yang menawarkan input tulisan tangan, bahkan kadang-kadang menerima tulisan tangan kursif, tapi akurasi masih menjadi masalah, dan beberapa orang masih menemukan bahwa papan ketik yang sederhana lebih efisien.
Perangkat lunak
Modul perangkat lunak awal bisa memahami tulisan tangan cetak di mana karakter dipisahkan. Contoh komersial dari perusahaan ini seperti Communications Intelligence Corporation dan IBM. Pada awal tahun 1990-an, dua perusahaan Paragraph dan Lexicus hadir dengan sistem yang bisa memahami pengenalan tulisan tangan kursif. Paragraph berbasis di Rusia dan Lexicus didirikan oleh Ronjon Nag dan Chris Kortge yang masih menjadi mahasiswa di Universitas Stanford. Sistem The Paragraph Calligrapher ditempatkan dalam sistem Newton Apple, dan sistem tulisan tangan Lexicus dibuat tersedia secara komersial untuk PenPoint dan sistem operasi Windows. Lexicus diakuisisi oleh Motorola pada tahun 1993 dan terus mengembangkan pengenalan tulisan tangan cina dan sistem teks prediktif untuk Motorola.
Sebuah sistem pengenalan tulisan tangan modern dapat dilihat dalam sistem operasi Microsoft yang ada pada Tablet PC (terutama Windows XP Tablet PC Edition, Windows Vista, dan Windows 7). Hal ini didasarkan pada golongan Time delay neural network (TDNN), dijuluki Inferno, yang dibangun di Microsoft. Kemudian pada versi kaligrafi, peranti lunak pengenalan tulisan tangan digunakan pada Newton OS 2.0, yang pada tahun 1999 Microsoft dilisensi dari ParaGraph International terintegrasi sebagai pengenal sekunder dengan TDNN. Generasi baru perangkat lunak kaligrafi saat ini dikirim untuk Windows Mobile dengan PhatWare Corp, yang diperoleh ParaGraph pada tahun 2001.
Generasi ketiga dari teknologi pengenalan tulisan tangan, dibangun oleh Evernote Corporation (penerus divisi Pen & Internet Parascript) pada tahun 2000-2004, termasuk dalam perangkat lunak ritePen dan Evernote. ritePen juga mencakup teknologi fusi, yang memungkinkan menggabungkan riteScript dengan pengenalan tulisan tangan tertanam dalam Windows Vista untuk meningkatkan akurasi pengenalan masing-masing mesin pengenalan tulisan tangan.
CellWriter adalah pengenalan tulisan tangan Open Source Program yang ditulis untuk Linux. Hal ini dikembangkan oleh Michael Levin, bekerja di bawah University of Minnesota Undergraduate Research Opportunity Program. CellWriter dirancang untuk menjadi penulis tanggungan, sehingga pelatihan input dibutuhkan terlebuh dahulu sebelum digunakan. Ini mencakup mesin pengenalan kata bahasa Inggris untuk membantu akurasi pengenalan, papan ketik di layar dan kemampuan untuk fine tune atau mengkoreksi kesalahan melalui menu konteks. Tidak seperti mesin pengenal kebanyakan, kode sumber dan algoritme yang tersedia dan gratis untuk di unduh.
MyScript Builder adalah pengenal tulisan tangan SDK dari Vision Objects yang populer di kalangan perusahaan pegembang perangkat lunak untuk pena digital berbasis pada teknologi Anoto.
Penelitian
Pengenalan tulisan tangan memiliki komunitas akademisi aktif yang mempelajarinya. Konferensi terbesar untuk pengenalan tulisan tangan adalah International Conference on Frontiers in Handwriting Recognition (ICFHR), diselenggarakan pada tahun genap, dan International Conference on Document Analysis and Recognition (ICDAR), diselenggarakan pada tahun ganjil. Kedua konferensi ini diamati oleh IEEE. Daerah aktif penelitian meliputi:
Pengenalan daring
Pengenalan luring
Verifikasi tanda tangan
Interpretasi alamat pos
Pengolahan cek bank
Pengenalan penulis
Survei penelitian tentang pengenalan tulisan tangan oleh R Plamondon dan Sargur Srihari.
Catatan Sejarah Singkat
1915: Paten US pada pengenalan tulisan tangan dengan stilus
1957: tablet Stylator: Tom Dimond menunjukkan tablet elektronik dengan pena sebagai input komputer dan pengenalan tulisan tangan
1961: RAND Tablet diciptakan: lebih dikenal daripada sistem Stylator sebelumnya
1962: Pengenalan komputer dari tersambung / naskah tulisan tangan
1969: sistem GRAIL: pengenalan tulisan tangan dengan layar tinta elektronik, perintah isyarat
1973: Applicon CAD / CAM sistem komputer menggunakan pengenal Ledeen untuk pengenalan tulisan tangan
1980: Retail sistem pengenalan tulisan tangan: Pencept dan CIC keduanya menawarkan komputer PC untuk pasar konsumen menggunakan tablet dan pengenalan tulisan tangan, bukan papan ketik dan tetikus. Sistem Cadre pasar Inforite point-of-sale terminal menggunakan pengenalan tulisan tangan dan sebuah tablet elektronik kecil dan pena.
1989: Komputer pengenalan tulisan tangan portabel: GRiDPad dari GRID Systems.
1997: Sistem interpretasi alamat tulisan tangan pertama (HWAI) digunakan oleh Dinas Pos Amerika Serikat
2007: Sistem pengenalan penulis otomatis pertama: CEDAR-FOX.
Anoto Technology: Digital Pen and Paper, Anoto Group AB, http://www.anoto.com, retrieved 2008, Inforite Hand Character Recognition Terminal, Cadre Systems Limited, England, 1982-08-15
Handwriter (R) GrafText (TM) System Model GT-5000, Communication Intelligence Corporation, 1985
50 Years of Looking Forward, RAND Corporation, 1998
Dimond, Tom (1957), Devices for reading handwritten characters, Proceedings of Eastern Joint Computer Conference, pp. 232โ237, retrieved 2008
Computerized Graphic Processing System: System User's Manual, Applicon Incorporated, 1973
Newman, W.M. (1973), The Ledeen Character Recognizer, Principles of Incorporated, 1973
Ellis, T.O. (1969), RAND Tablet, NFP Corporation, RM-319873-ARPA, California
Interactive Computer Graphics, McGraw-Hill, pp. 575โ582
S. N. Srihari, C. Huang and H. Srinivasan, On the Discriminability of the Handwriting of Twins, Journal of Forensic Sciences, March 2008, vol. 53(2), pp. 430โ446