Пам'ять перекладівПам'ять перекладів (ПП; англ. translation memory, TM; іноді називається «Накопичувач перекладів») — база даних, що містить набір раніше перекладених текстів. Один запис в такій базі даних відповідає «одиниці перекладу» (англ. translation unit), за яку зазвичай береться одне речення (рідше — частина складносурядного речення, або абзац). Якщо чергове речення вихідного тексту точно збігається з реченням, що зберігається в базі (точна відповідність, англ. exact match), воно може бути автоматично підставлене у переклад. Нове речення може також трохи відрізнятися від того, що зберігається у базі (неточна відповідність, англ. fuzzy match). Таке речення може бути також підставлене у переклад, але перекладач буде повинен внести необхідні зміни. Крім прискорення процесу перекладу фрагментів та періодичних змін, внесених до вже перекладених текстів (наприклад, нових версій програмних продуктів або змін у законодавстві), системи ПП також забезпечують одноманітність перекладу термінології в однакових фрагментах, що особливо важливо при технічному перекладі. З другого боку, якщо перекладач регулярно підставляє до свого перекладу точні відповідності, витягнуті з баз перекладів, без контролю їх використання у новому контексті, якість перекладеного тексту може погіршитися. ХарактеристикиЗазвичай, програмним продуктам, що використовують бази ТМ, притаманні спільні функціональні можливості, характеристики.
We have just robbed a bank. He sat on the bank of the river.
Огляд програм пам'яті перекладівПершу програму, що використовувала базу ПП, — Translation Manager — створила компанія IBM. Спочатку компанія використовувала її виключно у власних цілях — для локалізації (адаптації на іноземні мови) власних програмних продуктів. Потім програма була запропонована ринку і довго була монополістом у галузі. Проста у використанні, швидка, вона забезпечувала гарні можливості для індивідуальних налаштувань користувача. Програма SDLX, розроблена англійською компанією SDL для своїх співробітників, мала недоліки пов’язані з незручностями етапів перекладу. Текст неможливо безпосередньо імпортувати в редактор — спочатку його потрібно видозмінити в SDL Edit — одній з 3 частин програми. Програма Déjà Vu користується у перекладачів в Європі популярністю завдяки своїй гнучкості та адаптивності. Окрім зручності, вона вирізняється співвідношенням ціна/якість. Спеціалісти відмічають, що від початку ця програма розроблялась в контакті з майбутніми юзерами. Відомо, що остання версія програми тестувалась також й російськими перекладачами. Їхні статті й відгуки були опубліковані в MultiLingual Computing & Technology. Популярна в Європі також програма STAR Transit. За своєю ідеологією вона зовсім не схожа на продукти класу: на відміну від їхнього принципу «Information at your fingertips», початкові дані STAR Transit зберігає в текстовому форматі у вигляді файлів, котрі користувач розміщує в директорії. Потім перекладач вказує які директорії/файли йому потрібні, а програма формує мережу посилань, з якими буде йти робота. В Росії та Україні STAR Transit не отримав широкого розповсюдження, а PROMT, офіційний дистриб’ютор Transit, переключився на розповсюдження Translator’s Workbench фірми Trados. Translator’s Workbench, або просто Trados, швидко отримав визнання в Україні й Росії, спочатку серед перекладацьких фірм, а потім й серед індивідуальних перекладачів. Великою перевагою є те, що він інтегрується в такі відомі програмні продукти як Word та інтернет-браузери і можна використовувати всі його інструменти. Trados є надзвичайно зручним для пересічного перекладача, що не знайомий з програмуванням, він зрозуміліший ніж інші програми типу. Всі елементи управління мають підказки. Цей продукт має всі корисні інструменти, які в інших продуктах є лише в частковій наявності. Наприкінці 2008 року з'явилася перша вітчизняна система ПП AnyMem, розроблена київською компанією Advanced International Translations. Переваги та недолікиПереваги
Недоліки
У кожній конкретній системі ПП дані зберігаються в своєму власному форматі (текстовий формат у Wordfast, база даних Access у Déjà Vu), але існує міжнародний стандарт TMX (англ. Translation Memory eXchange format), заснований на XML, який можуть створювати практично усі системи ПП. Завдяки цьому результати роботи перекладачів можна обмінювати між додатками; тобто перекладач, що працює з OmegaT, може використовувати ПП, створену у Trados і навпаки. Більшість систем ПП як мінімум підтримують створення і використання словників користувача, створення нових баз даних на основі паралельних текстів (англ. alignment), а також напівавтоматичне витягнення термінології з оригінальних та паралельних текстів. Популярні програмні системи ППВідповідно до недавніх оглядів використання систем ПП до найпопулярніших систем відносяться:[1]
У кінці 2008 року з'явилася перша вітчизняна система ПП AnyMem, розроблена київською компанією Advanced International Translations. Стандарти та формати пам'яті перекладів[3]TMXTranslation Memory Exchange Format — Обмін пам'яттю перекладів. Цей стандарт дозволяє взаємний обмін між різними постачальниками пам'яті перекладів. TMX є загальноприйнятим форматом у середовищі перекладачів та вважається найкращим під час імпорту й експорту пам'ятей перекладів. Остання версія цього стандарту (1.4b) дозволяє відновлювати оригінальні документи та документи перекладу з файлу TMX. TBXTermbase Exchange format — Обмін базами термінів. Це формат прийнятий LISA (Асоціація стандартів індустрії локалізації), котрий зараз переглядається та перевидається згідно з ISO 30042. Він дозволяє проводити обмін термінологічними даними, у тому числі детальною лексичною інформацією. Основна база TBX визначається стандартами ISO: ISO 12620, ISO 12200 та ISO 16642. ISO 12620 забезпечує реєстр чітко визначених «категорій даних» зі стандартизованими іменами, що функціонують як типи елементів даних або зумовлені значення. ISO 12200 (відомий також як MARTIF) забезпечує основу для стержневої структури TBX. ISO 16642 (відомий також як Terminological Markup Framework — Структура термінологічної розмітки) включає структурну метамодель для термінологічної мови розмітки (Terminology Markup Languages) у цілому. UTXUniversal Terminology eXchange — Універсальний обмін термінологією. Стандарт спеціально створений для користувацьких словників в машинному перекладі, але може використовуватись для загальних глосаріїв, доступних для людини. Ціллю UTX є прискорити обмін словниками, та їх повторне використання своєю надзвичайно простою та практичною специфікацією. SRXSRX створений для посилення формату TMX та задля більшої ефективності обміну пам'яттю перекладів поміж програмами. Можливість вказувати правила сегментації, що використовувались у попередньому перекладі, підвищує ефективність формату. GMX GILTОзначає Globalization, Internationalization, Localization, and Translation (Глобалізація, Інтернаціоналізація, Локалізація, Переклад). Стандарт GILT Metrics складається з трьох частин: GMX-V для показників обсягу, GMX-C для показників складності, а також GMX-Q для показників якості. Запропонований стандарт GILT Metrics має завдання квантифікувати обсяг робіт та вимоги якості для виконання будь-якого завдання GILT. OLIFВідкритий стандарт, сумісний із XML, що використовується для обміну термінологічними та лексичними даними. Хоч спочатку він був запропонований як засіб для обміну лексичними даними між приватними словниками машинного перекладу, поступово цей формат перетворився на загальніший стандарт для термінологічного обміну. XML Localisation Interchange File Format — XML формат для взаємообміну при локалізації, створений як єдиний формат файлів для взаємообміну, що може розпізнаватися будь-яким провайдером локалізації. XLIFF — це найкращий у сучасній індустрії перекладів засіб для обміну інформацією у форматі XML. TransWSTranslation Web Services Веб послуги для перекладу, визначає необхідні виклики для користування вебсервісами при відправленні та отриманні файлів та повідомлень, маючих відношення до проектів локалізації. Замислювався як детальна система автоматизації більшої частину процесу локалізації за допомогою сервісів Інтернету. xml:tmЦей підхід до пам'яті перекладів базується на концепції текстової пам'яті, що суміщає авторську пам'ять та пам'ять перекладів. Формат xml:tm був переданий Lisa OSCAR компанією XML-INTL. POGettext Portable Object format. Хоча, PO не часто розглядається як формат пам'яті перекладів, файли PO — це двомовні файли, що використовуються при запам'ятовуванні перекладів аналогічно пам'яті перекладів. Зазвичай, система пам'яті перекладів PO, складатиметься з різних файлів в дереві каталогів. Звичайними інструментами для роботи з файлами PO є GNU Gettext Tools та Translate Toolkit. Також існують програми редагування PO файлів, та звичайні текстові редактори, які теж можуть використовуватись для їх редагування. Див. такожПримітки
|