OmegaT
OmegaT是一个使用Java编程语言编写的计算机辅助翻译工具。它是自由软件,最初的开发由Keith Godfrey在2000年进行,目前的开发工作由Didier Briel带领的团队进行。OmegaT名称在德国是注册商标。 OmegaT适用于专业译员。它的功能包括使用正则表达式的可自定义分段,带有模糊匹配和匹配传播的翻譯記憶,术语库匹配,词典匹配和参考资料搜索以及使用Hunspell拼写词典的内联拼写检查功能。 OmegaT可运行于Linux、Mac OS X和Microsoft Windows 98 SE或更高版本,[4]并且需要Java 1.5。它的界面和文档被翻译成29种语言。在2010年对458名专业译员的调查[5]表明,OmegaT的用户数达到Wordfast、DejaVu和MemoQ的1/3,且达到了市场领导者塔多思的1/8。在Bing翻译的合作伙伴中,OmegaT是其中唯一一个免费的专业级辅助翻译工具[6] 。 历史OmegaT最初由Keith Godfrey开发于2000年。当时使用C++进行编写。 在2001年二月[7]首次公开发布的版本使用Java写成。在这个版本中使用专有翻译记忆库格式。它能翻译无格式的纯文本文件、HTML以及执行块级别的分割规则(即分割成段落而不是句子)。 开发和软件的发布OmegaT的开发托管在SourceForge。开发团队由Didier Briel领导。和许多开源项目一样,新版本的OmegaT会频繁发布,通常每个新版本含有2-3个错误修改和功能升级。这个指的是“标准”版本,其中总是含有完整的用户手册和包含一些还未写入用户手册的功能的“最新”版本。[8]可以从Sourceforge的代码版本库的更新源进行更新。[9] OmegaT的工作原理对于每个翻译任务,OmegaT会创建包含指定文件的项目文件夹的集合。用户把未翻译文档复制到其中的/source/子文件夹,而在翻译结束后,已翻译的文档会出现在/target/子文件夹中。OmegaT会在编辑窗格的片段中显示已分段的源文档的可翻译内容供用户翻译。 在开始翻译前,用户还可以复制以前的翻译记忆到/tm/子文件夹,复制术语库到/glossary/文件夹以及复制StarDict词典到/dictionary/文件夹,在翻译时OmegaT会自动查阅它们。 进行翻译时,OmegaT会自动检查以前的翻译以寻找类似的句子,找到后会显示在模糊匹配窗格中。译员可以使用快捷键把模糊匹配插入到编辑窗格。OmegaT还会查阅用户预先添加到项目文件夹的术语库和词典。如果启用了机器翻译,例如谷歌翻译,那么它会显示在单独的机器翻译窗格。 翻译结束后,OmegaT会创建已翻译的文件,并导出项目当前的翻译到TMX文件中,这样这些文件可以在以后翻译时重用或者和其他使用OmegaT或其他CAT工具的译员进行交换。 OmegaT的功能OmegaT拥有主流CAT工具具有的许多功能。包括创建,导入和导出翻译记忆,使用翻译记忆进行模糊匹配,查询术语表、索引定位和一致性搜索。 OmegaT还拥有其他CAT工具不具有的功能,包括:
支持的文档格式OmegaT支持直接翻译多种文件类型。OmegaT根据文件扩展名来确定文件类型。可以自定义文件扩展名关联的处理方式和首选的编码来覆盖默认设置。 OmegaT把格式转换成标签来处理含格式的文档,类似于其他商业的CAT工具。 直接支持的格式OmegaT可以直接翻译下列格式:
值得注意的是,OmegaT 还提供 MediaWiki 导入功能。 间接支持的格式有两种方式让OmegaT处理不支持的格式:
对于XLIFF的支持Okapi Framework中的Rainbow程序可以把某些文件格式转换成OmegaT支持的XLIFF格式。Rainbow还可以从这类文档中创建完整的OmegaT项目文件夹,便于OmegaT的处理。[11] 对于Gettext PO的支持一些文件格式可以转换为能在OmegaT中翻译的Gettext Portable Object (PO) 文件。Debian Linux 中的po4a程序可以把类似LaTeX、TeX以及POD的格式转换为Gettext PO。[12]Translate Toolkit可以把Mozilla .properties 和dtd文件、CSV 文件、某些Qt .ts文件以及某些XLIFF文件转换为Gettext PO。
对于Office Open XML和ODF的支持从版本97到2003的Microsoft Word、Excel以及PowerPoint文档可以转换为Office Open XML (Microsoft Office 2007/2010)或ODF (OpenOffice.org)格式。这种转换过程并不是无损的,可能导致某些格式的丢失。 对于Trados® .ttx文件的支持Trados® .ttx可以使用Okapi TTX Filter(页面存档备份,存于互联网档案馆)进行处理。 支持的翻译记忆和术语库格式TMX格式的翻译记忆OmegaT的内部翻译记忆格式对用户不可见,但每次它自动保存翻译项目时,会自动把所有新增和更新的翻译单元都导出并添加到三个外部的TMX翻译记忆:一个原生的OmegaT TMX、一个级别1的TMX以及一个级别2的TMX。
导出的级别2文件包含了封装在TMX标签中的OmegaT内部标签,这样的TMX文件可以在支持TMX级别2的CAT工具中生成匹配。在Trados和SDLX中测试通过。 OmegaT支持导入最高1.4b版本级别1和级别2的TMX文件。在OmegaT中导入级别2的文件会生成相同级别的匹配,因为OmegaT会把外部的TMX标签转换为TMX级别2的标签。对于由Transit创建的TMX文件测试又通过了。 术语库对于术语库,OmegaT主要使用tab分隔的UTF-8编码且扩展名为.txt的纯文本文件。术语库文件的结构非常简单:首列包含源语言词语,第二列包含对应的目标语言词语,第三列(可省略)与词语相关的上下文注释等。文本编辑器中可以很容易创建这样的术语库。 还支持使用标准CSV格式的类似结构的文件,对于TBX文件同样如此。 社区用户的参与OmegaT项目
The OmegaT Project is a sort of “computer literacy” group that focus on translators' needs. Users are encouraged to contribute tools written by themselves in response to translators' needs which are not yet addressed by the main OmegaT program itself.[13] OmegaT的本地化OmegaT的用户界面和文档已经被翻译为大约30种语言。志愿翻译人员可以翻译用户界面,“快速入门指南”简短向导或完整的用户手册(或者所有的三个部分)。所有的语言文件和用户手册的翻译都包含在标准的OmegaT发布程序中。 用户创建的程序OmegaT用户社区的特色是对于OmegaT的不足之处经常提示用户创建实现那些功能的宏、脚本和程序,尽管有时某些功能后来会成为OmegaT自身的一部分。当OmegaT只能进行段落分割时,有用户创建了OpenOffice.org宏进行根据句子进行分割。当在OmegaT中自动平衡多个TM仍需合并TM时,有用户创建了TMX合并脚本。当OmegaT没有提供拼写检查支持时,有多个用户创建脚本或找到解决方案作为OmegaT的一部分用来在翻译过程中提供拼写检查功能。[14] 当前提供了某些功能且尚未内置于OmegaT的工具包括一个用于Trados TagEditor文件的转换程序,两个简单的对齐器,一个不工作的术语添加工具以及一个把标签视为占位符的工具。[15] 基于OmegaT构建的其他软件Autshumato translation suiteAutshumato套件包含CAT工具,双语对齐器,PDF提取器,TMX编辑器和基于抓取数据的公共TM。最终的版本将包含术语管理器和机器翻译程序。其中的CAT工具是以OmegaT为基础构建的,且需要OpenOffice.org才能运行。它的开发资金由南非政府的艺术和文化部门提供。[16] BentenBenten是基于XLIFF的Eclipse。它使用OmegaT代码来处理翻译记忆匹配过程。它的部分开发资金由日本政府提供。[17] BoltranBoltran是模仿OmegaT项目工作流程的基于网络的独立CAT工具。它基于开源的OmegaT构建,因此能翻译任何OmegaT可以翻译的内容,且含有与OmegaT几乎等同的术语管理和模糊匹配能力。目前,唯一公开的Boltran服务器是开发者的网站,但在理论上任何人都可以建立公开或私有的Boltran服务器。[18] OmegaT+OmegaT+ 是在 2005 年从 OmegaT 的 1.4.5 版本派生而来的 CAT 工具。其工作方式类似于 OmegaT,同时开发了一些自己的功能,且使用了与 OmegaT 不兼容的项目格式[19]。在许多时候,这个名称容易让不了解的人误以为是 OmegaT 的增强版本,而实际上 OmegaT+ 只是 OmegaT 1.4.5 的增强版本,且从 2005 年至今 OmegaT 中已增加了大量功能增强和新特性。 用户评价另请参阅参考
外部链接
用户组
|