【翻訳支援ツール】 支援ツールの種類・効果
この記事は(社)日本翻訳連盟の機関誌「日本翻訳ジャーナル」2001年3/4月号5/6月号に連載したものです。その後 TransAssist、Tratoolなど、新しいツールが開発・発売されています。
翻訳支援ツール(1) 久徳省三
翻訳支援ツールは、広い意味ではCD辞書からパソコンまで含まれるが、ここでは最近急速に普及し、ユーザーの選択を迷わせている機械翻訳と翻訳メモリーと呼ばれているソフトウエアを取り上げる。いずれは、音声認識も重要な支援ツールになるであろう。
ご承知の通り、ITの世界はドッグイヤーと言われるほど、新製品の開発速度は速く、これが最新情報と思っても油断はできない。このジャーナルが出版される日には状況が異なっていることも考えられる。
2000年末現在、日本で市販されている翻訳支援ツールは100種類以上あると言われているが、それらは(1)機械翻訳 = TM、(2)翻訳メモリー(文例データベース検索機能) = TM、(3)その両者の機能を備えたもの = MT・TM に分けられる。
機械翻訳
機械翻訳は初のコンピューターが登場する10年以上前の1933年、ロシアの技術者トロヤンスキーによって提案されたもので、歴史は古い。
アメリカでは1950頃から大学を中心に研究・開発が進められ、1954にジョージタウン大学とIBMが共同で露英翻訳システムを発表している。
ヨーロッパ各国でも1959年頃から研究されてきた。日本では、1960年代中頃から研究を開始、九州大学の「KT-1」、通産省の電気試験所の「やまと」などが発表されている。1980年代には民間企業での研究開発が進められ、商品化されたきた。
この数年、インターネットの普及の結果、ウエブページの英文を読みたいと言うニーズが急増した。
従来企業内翻訳を含め、産業翻訳と言う限られた市場向けに商品を開発し販売してきた機械翻訳ソフトウエアメーカーの前に、にわかに潜在市場規模数千万ライセンスという巨大市場が現れた。
この結果、現在各社の機械翻訳ソフトウエアが市販されているが、その訳質はかんばしくない。
その主な原因は、外国語と日本語の構成が違うので、機械翻訳の設計思想が文法と構文解析であったが、実際に翻訳にかける原文は、文法通り正確な文章が少ないことにあるようだ。
最近のソフトウエアは、従来の文法中心から、文例中心に設計思想を変えたのでかなり改善されている。また、パソコンの処理速度と記憶容量が向上したので、いままでは設計者が加えたい機能を入れられなかった制約も減ったので、今後のソフトウエアの訳質はかなり良くなることが考えられる。
とは言え、意味の概略がつかめれば良いと言う個人ユーザーは別として、訳文一文字幾らと翻訳料金を貰う職業翻訳者にとっては、機械翻訳の成果物は商品にはならないであろう。
翻訳会社の中に、受注競争に負けると、相手は機械翻訳だから安くできると誤解している会社があるようだが、果たしてそうであろうか。
翻訳者にとって、現在の機械翻訳の利点はソフトウエアが訳語候補を自動的に表示、用語の統一、自動的に対訳集ができるといった程度の利用価値しか無い。
ソフトウエアが提供してくれるのは、部品であり、それを翻訳者が組み立てると考えるべきであろう。成果物は、翻訳者の知識、経験、技能によって違ってくる。ソフトウエアへの投資、原稿を電子化する手間、推敲により時間がかかることなどを考えると、かならずしもコスト低減にはならない。
翻訳メモリー
これは、以前に翻訳した類似訳文のデータベースを検索して、類似文は違う個所だけを訂正し、完全一致文はそのまま登録すればその文の翻訳ができるソフトウエアである。
この考え方は、パソコンがマルチタスクになった Windows 95 以来、翻訳者が利用してきたエディタの grep 検索を使った過去の訳文を参照する方法と類似しているが、より効率が良い。
1982年、Jochen Hummel と Iko Knyphausen が考案し、1984年に企業化した TRADOS が、世界の翻訳業界で最も普及しているようである。2000年末現在ライセンス数は 40,000と言う。
主に翻訳会社が社内でグループ翻訳をするのに利用されており、会社によっては、フリーランス翻訳者にソフトウエアと翻訳メモリーを支給して、在宅で作業をさせているケースもある。
翻訳メモリーに収録された訳文と合致している訳文は、合致率により翻訳料金を割り引く制度を採用しているので、クライアントと翻訳会社側には、時間短縮のほか経済的メリットがある。
ITマニュアルのローカリゼーションには欠かせぬ支援ツールとなっている。
主な類似ソフトウエアは Star 社のTRANSIT、SDL 社の SDLX などがある。
これらには、辞書も機械翻訳機能も含まれていない。
MT・TM
機械翻訳に翻訳メモリー機能を付加した支援ソフトウエアもあり、その主なものは、ノヴァ社の PC-Transer、富士通の ATLAS、ロゴヴィスタ社のLogoVista-X である。
類似文が多用されるマニュアルなどの英文和訳の場合、威力を発揮する。
その詳細は次号に述べる。
出典:シャープ株式会社・TRADOS [完]
翻訳支援ツール(2) 久徳省三
■MT・TM は翻訳者の救世主
前号では、翻訳支援ツールには、(1)機械翻訳 = TM、(2)翻訳メモリ(文例データベース検索機能) = TM、(3)その両者の機能を備えたもの = MT・TM にがあることを概説した。
ここでは、MT・TM の利用により、いかに作業効率が改善され、用語統一による成果物の品質が向上し、翻訳者のプレッシャーが軽減されるか、筆者の体験を公開する。
一部の例外を除き、在宅翻訳者の大多数はトライアルに合格し、登録した翻訳会社から受注し、作業をしているので、翻訳作業は毎回受験のようなものである。いかにトライアルの結果が良くても、成果物の品質が悪ければ、その翻訳会社から次の仕事は受注できない。
一方、ソースクライアント側の都合で、翻訳の仕事には納期があり、近年ますます納期は短くなっている。翻訳者は納期に間に合わせるために、睡眠時間を削って作業をしなければならない。連続1週間か2週間、平均睡眠時間が4時間で、作業中は受験のように集中することは人間工学的に無理がある。
MT・TM を活用すれば、原稿の電子化が必要なので、その分作業時間が増えることになるが、集中しなければならない時間は推敲のときだけになるので、大幅に縮小する。
個人差があるのは当然だが、パソコンの操作に抵抗を感じない筆者の場合、原稿の電子化のための OCR 操作や、TMのリライトは、テレビの野球中継をちらちら見ながらできる。
■MT・TM の機能
TM には、機械翻訳機能も、辞書も付いていないので、それを利用する翻訳者はあくまで前例のデータベースを利用するだけである。これに比べて、MT・TM には機械翻訳機能も辞書も付いているので、前例を参照しながら機械が下訳をやってくれる。
書類作成の際、既存の書類を参照するのは企業人の常識であるが、翻訳にもこれがあてはまるようである。だからこそ、TM がこれだけ普及したのであろう。
■MT・TM 活用のコツ
慣れてくると、原稿を少し読めば、これが MT・TM に適しているか否かは分かるようになる。適していない原稿を、電子化するのは時間の無駄である。基本的には、英文和訳で、内容が取扱説明書や仕様書のように類似文が頻発する原稿が適していると言える。
元原稿の量が、和文英訳で 3万字、英文和訳で1万語以上の長さであれば、作業日数は普通5日を超える。これが内容によっては、TM を使うと3日目から時間あたりの作業量は倍以上になる。
次に、分野別の自分の辞書を作り、MT に利用できるようにしておくことが肝要である。翻訳者であれば、自分の辞書は作っているだろうから、それを支援ソフトの要求する型式にして「ユーザ辞書」として登録すれば良い。
MT ソフトに組み込まれている辞書も含めて、市販の辞書は必ずしも現場
に適した訳語が収録されているとは言えない。辞書の編集者の大多数が実務の経験が無いアカデミック分野の先生たちであることが原因であろう。
ベテラン翻訳者の大多数は、MT の訳文を見て、これなら最初から自分で訳した方が良いと判断する。ほとんどの場合、原稿全文を一括して MT に訳させた結果である。確かにその通りで、現在の MT の訳文は読むに耐えないものである。ところが、これを一文ごと翻訳者がリライトして TM に登録すれば、その先は、類似文はその訳例が利用でき、読むに耐える直訳ができる。
■MT・TM 利用手順
筆者の場合、次の手順で利用している。
1.元原稿の電子化(スキャナとOCR使用)
2.一文翻訳 → リライト→ 翻訳メモリに登録(翻訳メモリ検索)(一文ずつMTにかけ、それをリライトすることにより、翻訳メモリをフルに活用)
3.対訳画面で推敲(訳ヌケをチェック)
4.訳文のみを出力し推敲 (訳文の不自然を改善する)
5.推敲後の訳文を原稿と対比して推敲
6.訳文を指定の形式ファイルに保存し納品
7.推敲後の訂正個所を翻訳メモリにも 反映(訂正)
8.対訳文をテキスト形式で出力・保存
マニュアルの場合は、目次の翻訳は全文翻訳後に [翻訳メモリ検索] をすれば自動的に転記される。全作業時間の約20%が原稿の電子化、60%が素訳、20%が推敲である。集中しなければならない時間は、全作業時間の20%である。 [完]


Comments