OmegaT
OmegaTは、Javaで記述されたコンピュータ翻訳支援ツールである。2000年にKeith Godfreyにより開発され、現在はDidier Briel、Aaron Madlon-Kayらにより開発が進められている、自由に使える、改変できるソフトウェアである。 OmegaTはプロの翻訳者向けに開発されている。主な機能の特徴として、正規表現を用いたカスタマイズ可能な分節化、参考訳文としての参照や訳文の蓄積が可能な翻訳メモリ、用語集や辞書ファイルの参照、Hunspellスペルチェック辞書を用いたインラインでの綴り確認機能などがある。 OmegaTはLinux、macOS、Windows(98 SE以降)上で動作し[1]、Java 1.5を必要とする(3.0以降はJava 1.6)。27の言語環境で使用可能である。2010年の調査によると[2]、プロの翻訳家458人のうち、Wordfast、Deja Vu、MemoQユーザー数の1/3、また最も利用されているTradosユーザー数の1/8がOmegaTを使用している。 歴史OmegaTは2000年にKeith Godfreyにより開発された。 当初はC++で記述されていたが、2001年2月[3]の最初のリリース版以降は、Javaで記述されている。この版では翻訳メモリにプロプライエタリな翻訳メモリ形式を用いており、整形されていないテキストファイルとHTMLファイルの翻訳と、ブロック単位の(つまり文単位でなく、段落単位の)分節化だけが可能であった。 開発とリリースOmegaTソースコードの開発情報はSourceForge.net上に公開されており、現在のプロジェクトマネージャーはDidier Brielである。他の多くのオープンソースプロジェクトと同様、OmegaTの新バージョンは高い頻度でリリースされ、その都度いくつかのバグ修正や機能改善がなされている。完成した取扱説明書(ユーザーマニュアル)が含まれる通常版(Standard)と、説明書に未記載の新しい機能を含む開発版(latest)が存在する。[4]最新のソースコードはSourceForgeのコードレポジトリで入手可能である[5]。 OmegaTのしくみOmegaTは、1つの翻訳作業ごとに、使用するファイル一式を含めたプロジェクトフォルダーを生成する。ユーザーは、未翻訳の原文文書をsourceフォルダーにコピーしておく。翻訳作業の最後には、翻訳されたファイルがtargetフォルダーに格納される。OmegaTは、原文文書にある翻訳可能な部分を、分節化した状態で、ユーザーが翻訳を入力する編集ウィンドウに表示する。 翻訳を開始する前に、既存の翻訳内容をtmフォルダーに、用語集をglossaryフォルダーに、StarDict形式の辞書をdictionaryフォルダーに置いておくこともできる。翻訳作業時に、OmegaTはこれらを自動的に参照する。 OmegaTは、いま翻訳している文章と、これまでの翻訳内容を自動的にチェックし、類似したものがあればそれを参考訳文ウィンドウに表示する。翻訳者はキーボードショートカットを使ってその内容を編集中の分節に挿入できる。あらかじめプロジェクトフォルダーに用語集と辞書ファイルを追加しておくと、OmegaTはその内容も参照する。Google Translateなどの機械翻訳の機能を有効にしておくと、随時、機械翻訳ウィンドウにその翻訳内容を表示する。 翻訳が終了すると、OmegaTがファイル一式の翻訳版を生成し、プロジェクト全体の現在の翻訳内容をTMXファイルに出力する。このファイルは今後の翻訳に流用が可能であり、また必要であればOmegaTや他の翻訳支援ツールを使用している他の翻訳者と交換できる。 OmegaTの機能OmegaTは、他の主要な翻訳支援ツールと同等の機能を多く持っている。翻訳メモリの生成、その追加や出力、翻訳メモリに存在する参考訳文の参照、用語集の参照、参照ファイル中の一致検索機能などである。 OmegaTには、他の翻訳支援ツールが必ずしも持っていない機能もある。例えば:
対応する文書形式いくつかのファイル形式であれば、OmegaTが直接翻訳できる。OmegaTはその拡張子でファイル形式を判断する。ファイルの拡張子と対応するエンコーディングは、デフォルトの設定に追記する形でカスタマイズが可能である。 整形された文書については、OmegaTは市販の他の翻訳支援ツールと同様、その整形情報をタグに変換することで処理できる。 翻訳が直接可能なファイル形式OmegaTで直接翻訳することができるのは、以下の形式である:
間接的に翻訳可能なファイル形式OmegaTが対応していない形式のファイルを扱うには、以下の2つの方法がある:
XLIFFによる対応Okapi FrameworkのRainbowを用いると、いくつかのファイル形式を、OmegaTが取り扱えるXLIFF形式に変換できる。Rainbowであれば、そのような文書からOmegaTプロジェクトフォルダーを生成でき、OmegaT上でより取り扱いやすくなる[7]。 Gettext POによる対応多くのファイル形式はGettext Portable Object (PO) ファイルに変換できる。POファイルはOmegaTで翻訳可能である。Debian Linux上で使用可能なpo4aは、LaTeXやTeX、POD形式のファイルをGettext PO形式へ変換できるプログラムである[8]。Translate Toolkitは、Mozilla .propertiesやdtdファイル、CSVファイル、特定のQuickTime .tsファイルやXLIFFファイルを、Gettext PO形式に変換できる。 Office Open XMLまたはODFによる対応バージョン97から2003までのMicrosoft Word、Excel,、PowerPoint文書ファイルは、Office Open XML形式(Microsoft Office 2007/2010)、またはODF(OpenOffice.org)形式に変換できる。完全に可逆な変換ではないため、形式情報が失われる可能性がある。 取り扱える翻訳メモリ、用語集の形式TMX形式の翻訳メモリOmegaTが内部で保持する翻訳メモリは、ユーザーは確認できないようになっている。しかし翻訳プロジェクトが自動保存されるたびに、新規の、または更新された翻訳内容が自動的に出力され、3つのTMX形式の翻訳メモリファイル(OmegaTネイティヴのTMX、レベル1 TMX、レベル2 TMX)が生成される。
生成されたレベル2 TMXファイルには、OmegaTの内部タグがTMXタグに挟まれた形で含まれ、このTMXタグによって、TMXレベル2に対応した他の翻訳支援ツールで参考訳文として使用できる。 バージョン1.4b以降のOmegaTであれば、レベル1とレベル2のTMXファイルをインポートできる。OmegaTへインポートされたレベル2 TMXファイルは、そこに含まれるレベル2タグをOmegaT自身が変換するため、ネイティヴTMXファイルと同じように扱える。 用語集OmegaTが使用できる用語集ファイルは、拡張子が.txtや.utf8であるタブ区切りで記述されたプレーンテキストファイルである。OmegaTは既定でglossary.txtファイルをUTF-8エンコーディングで作成する。通常、.txtの拡張子のファイルは文字コードを自動判別する(バージョン5.6.0からは文字コードを示すヒント情報を最初の行に記述することもできる)。用語集ファイルの構造はきわめて単純である。最初の列に原文の用語、2番目の列に対応する訳文の用語、そして3番目の列に(任意で)内容に関するコメントを加えることができる。このような形であるため、テキストエディターなどで簡単に作成できる。 用語データ交換の標準フォーマットであるTBXファイルや、標準的なCSVフォーマットで記述された構造化されたテキストにも、同様に対応している。 ユーザーのコミュニティによる貢献OmegaTプロジェクトOmegaTプロジェクトは、翻訳者たちの要望に着目する、コンピューターに詳しいメンバーのグループと言える。OmegaTのユーザーは、翻訳者からのニーズのうち、OmegaTプログラム本体ではまだ実現されていないものについては、対応が可能なツールをユーザー自身で開発し、公開することを推奨されている。[9] OmegaTのローカリゼーションOmegaTのユーザーインターフェースとドキュメントは、約30の言語に翻訳されている。興味があるボランティア翻訳者は、ユーザーインターフェース、「お手軽スタートガイド」− OmegaT起動時に表示される短いチュートリアル、および取扱説明書の全体(もしくは上記3つすべて)の翻訳に携わることができる。すべての言語ファイルと、取扱説明書の翻訳内容は、OmegaTの標準パッケージに含まれている。 ユーザーが作成したプログラムOmegaTのユーザーコミュニティの特徴として、OmegaT本体に機能が不足していると、その役割を果たすマクロやスクリプト、プログラムを作成しようという機運がユーザー間に生まれる、という点がある。(時にはそれがきっかけで、後にOmegaT本体の機能として実装されることもある。)OmegaTが段落単位の分節化だけに対応していたときは、あるユーザーが文章単位で分節化できるOpenOffice.orgマクロを作成した。OmegaTで翻訳メモリを自動的に活用する場合、翻訳メモリを結合する必要性が生まれたが、あるユーザーがTMX結合スクリプトを作成した。OmegaTに綴り確認(スペルチェック)機能が存在しなかった頃、複数のユーザーがスクリプトを作成し、OmegaTを用いた翻訳作業の流れに綴り確認を加えることに成功した。[10] 現在、OmegaTにはない機能を提供するツール群には、Trados TagEditorファイル用の変換ユーティリティや、2種類の単純な整列ツール、その場で用語を追加できるツール、そしてタグを自分で配置可能にするツールが含まれる。[11] OmegaTに関連したその他のソフトウェアAutshumato translation suiteAutshumatoには、コンピューター翻訳支援ツール、整列ツール、PDF抽出ツール、TMX編集ツール、収集データを基準にしたパブリック翻訳メモリなどが含まれる。The finished version will include a terminology manager and a machine translator. コンピューター翻訳支援ツールの部分はOmegaTが元になっており、実行にはOpenOffice.orgが必要である。その開発は、南アフリカ共和国の芸術文化科学技術省による支援を受けている。[12] BentenBentenは、EclipseをベースにしたXLIFF編集ツールである。翻訳メモリを参照するプロセスで、OmegaTのソースコードを使用している [13]。 BoltranBoltranは、スタンドアロン、Webベースで動作する、OmegaTプロジェクトの仕組みを模擬したコンピューター翻訳支援ツールである。OmegaTのソースコードを元にしている。従って、OmegaTが翻訳可能なあらゆる文書を、同じく翻訳可能である。また、OmegaTとほぼ同等の用語集と参考訳文の機能も持っている。現在、公開されているBoltranのサーバーは開発者のWebサイトのみである。しかし、誰であってもそこへ公開または非公開のBoltranサーバーをセットアップできる[14]。 OmegaT+OmegaT+は、OmegaT 1.4.5を元にしたコンピューター翻訳支援ツールである。OmegaT+はOmegaTと同じ仕組みで動作する。しかし、プロジェクトファイル群に互換性はない[15]。 関連項目
脚注
外部リンクユーザーグループ
|
Portal di Ensiklopedia Dunia