第1章 OmegaT について - はじめに

1. OmegaT の特徴
2. 各章の概要

1. OmegaT の特徴

OmegaT は、自由に使用できる、マルチプラットフォームのコンピューター翻訳支援ツールです。主に以下のような特徴があります:

  • 翻訳メモリ:OmegaT は、単語や分節をどのように翻訳したかを翻訳メモリに記憶していきます。同時に、それまでに記憶した翻訳内容をメモリから参照することができます。翻訳メモリは、同じ分節の繰り返しや、似通った表現が多く現れる翻訳に非常に便利です。OmegaT は翻訳メモリを使用して、以前行った翻訳内容を記憶し、翻訳しようとしている文章にもっとも適した翻訳の提案を行います。

    翻訳メモリは、以前翻訳した文書を更新するときに非常に便利です。変更されていない文章は、自動的に翻訳されます。更新された文章は未翻訳として扱われますが、翻訳済みの文章の中から翻訳候補が表示されるようになります。従って、元の文書の翻訳修正という点でも、とても簡単に扱えます。たとえば、翻訳会社や顧客から以前の翻訳メモリを受け取った場合、OmegaT はそれを参照用として使用できます。

    OmegaT が使用する翻訳メモリファイルは標準的な TMX フォーマットです。このファイル形式をサポートする他の翻訳ツールであれば、翻訳資産を相互使用できます。

  • 用語管理:翻訳の一貫性を保つ上で、用語管理は重要です。OmegaT には用語集(glossary)の機能があり、(たとえば特定分野向けの)2 言語間の対訳集として、1 単語または短いフレーズの対訳を翻訳中に参照することができます。現在翻訳している文章中に、用語集に登録済みの単語があった場合は、参照用として用語集ウィンドウにその対訳が表示されます。

  • 翻訳作業の流れ:翻訳対象は、ファイル1つのこともあれば、いろいろな形式のファイルを含んだたくさんのフォルダー、という場合もあるでしょう。OmegaT は、指定された翻訳対象ファイル群をファイルフィルター機能によって識別し、各ファイルのテキスト部分を抽出します。さらに、分節化機能によってそのテキスト部分を複数のまとまりに分割し、翻訳作業を行いやすいように順に表示します。翻訳中は、その翻訳内容を記憶すると共に、翻訳メモリからよく似た分節を探し出して提示します。翻訳し終えたら、訳文ファイルを生成して、適切なプログラムで開き、翻訳結果を完成形で見る…という具合です。

2. 各章の概要

この説明書は、チュートリアルとリファレンス両方の役割を兼ねることを意図しています。ここで簡単に、各章の概要をご紹介しましょう。

  • 5 分でわかる! OmegaT の使い方:初心者向けの短いチュートリアルですが、他の翻訳支援ツール経験者の方にも、おすすめです。新しいプロジェクトの作成から翻訳完了まで、一通りの流れを見ることができます。

  • OmegaT のインストールと実行:この章は、OmegaT を最初に使いはじめるときに役立つでしょう。OmegaT のインストールと Windows、Mac OS X、Linux 各 OS 上での実行について、詳しい手順がここにあります。また上級者向けの話題として、コマンドラインモードとその可能性についても説明しています。

  • ユーザーインターフェースメニューとキーボードショートカット:この2つの章は、OmegaT のユーザーインターフェースおよび、メニューとキーボードショートカットから利用できる機能について、説明しています。おそらく頻繁に参照されるでしょう。

  • プロジェクトの設定OmegaT のファイルとフォルダー:OmegaT にとってプロジェクトとは、コンピューター翻訳支援ツールとして OmegaT が取り扱う作業単位を指します。最初の章では、たとえば原文と訳文の言語設定のような、プロジェクトの設定について説明しています。もうひとつの章では、翻訳プロジェクトが含むさまざまなフォルダーやファイルとその役割について取り上げています。また OmegaT に関連付けられた個人設定ファイルとプログラムファイルについても、説明しています。

  • 翻訳入力行の動作:未翻訳の分節に関する翻訳入力行の動作設定をどのように行うか説明した、短い章です。

  • プレーンテキストを扱う整形されたテキストを扱う:この2つの章は、翻訳するテキストに関するいくつかの重要な点について説明しています。たとえば、文字エンコーディング(プレーンテキストファイルの場合)や、タグの取り扱い(整形されたテキストの場合)などです。

  • 翻訳メモリ:翻訳メモリを配置できるさまざまなフォルダーの役割について説明するとともに、翻訳メモリに関連する多彩な情報を提供します。

  • 原文の分節化:翻訳メモリツールは、分節と呼ばれるテキスト単位で処理を行います。OmegaT の分節は、段落単位か、あるいは分節化規則に基づく文単位です。段落単位の分節化はあまり使いませんが、いわゆる「文学的」なテキストの場合は役に立ちます。規則に基づく分節化は、たいていの場合、文単位の分節化を意味しています。分節化規則集には最初から多くの規則が定義されていますが、この章で説明される通り、ユーザーが独自に規則を追加することもできます。

  • 検索正規表現:OmegaT の検索は「『カンガルー』という単語を含む分節を一覧表示」といった感じで、簡単に使えます。その一方で、複雑な条件にも対応しています。たとえば、2個以上の連続するスペース文字を含む分節を検索したい、としましょう。この場合、「\s\s+」という正規表現パターンを使うことによって、問題の分節を検索することができます。正規表現は、分節化規則でも頻繁に使われています。

  • 用語集辞書機械翻訳綴り確認LanguageTool:OmegaT では辞書と用語集を幅広く活用できます。インターネットに接続していれば、Google Translate や Microsoft Translator のような機械翻訳サービスを OmegaT の中から利用できます。綴り確認機能を使うと、誤字脱字を検知し、翻訳中に修正することができます。オープンソースのツール LanguageTool は、文法や文体のありがちなミスを教えてくれます。

  • その他:「データを失わないために」など、その他の興味深い話題を扱います。

  • 付録は以下の情報を含みます

    • ウェブ上の OmegaT 情報:OmegaT のオンライン リソースに関する情報

    • 使用言語と言語コード:言語名と言語コードの ISO コード表

    • 編集ウィンドウのキーボードショートカット:編集ウィンドウで使えるショートカットの一覧

    • ショートカットのカスタマイズ:ショートカットをあなた好みにカスタマイズしましょう

    • トークナイザーとスクリプトの導入

    • チームプロジェクト

    • 法律上の表示と謝辞

  • キーワード索引:関連情報を探しやすいように、充実したキーワード索引つきです。