「単語単位のトークン化を使用する」の設定について

日本語から英語への翻訳において、「原文がアジア言語の場合に単語単位のトークン化を使用する」の設定の動きを確認させてください。

SDL Trados Blog の 「Trados Studio 2019 – 進歩した日本語原文の解析」というガイドを参考にさせて頂きましたが、どうもこのガイドの説明と実際の動きが合っていないように思えましたので、よろしくお願い致します。

例として、「実行条件」という原文と、「execution condition」という訳文をメモリに登録しました。

 

 ■ 単語単位のトークン化を使用しない場合 (チェックボックスをオフにした場合)

「実行条項」という原文を訳そうとすると、以下のようにメモリがヒットしてきます。

■ 単語単位のトークン化を使用する場合 (チェックボックスをオンにした場合)

「実行条項」という原文に対しては以下のようになり、メモリがヒットしてきません。

 

  

使用している Trados のバージョンは、2017 SR1 CU18 です。

メモリの検索設定は、以下のように、一致率の最小値は 70%、フラグメント一致は有効、にしています。

上記の例はたった 4 文字で、実際の翻訳の分節としては極端に短いので、なんで 82% になるんだろうとか、単純に文字でヒットさせても 75% にはなるんじゃないのとか、そういった細かいことはあまり気にしていません。私が気になっているのは、単語単位のトークン化を使用した方がメモリのヒットが少なくなっていることと、この設定が、解析だけでなく、実際のエディタでの作業にも影響していることです。

私は翻訳会社から翻訳を依頼される個人翻訳者という立場であるため、以下のように考えています。 

・解析時は、従来どおり文字ベースでマッチ率を計算して欲しい

・エディタでの作業時は、フラグメント一致の機能を使いたい

 これを実現してくれるのが「単語単位のトークン化を使用する」の設定かと思っていたのですが、違ったでしょうか???

 

従来どおり文字ベースでマッチ率を計算するには、この設定をオンとオフのどちらにすべきでしょうか。 

また、作業時にフラグメント一致 (upLIFT) の機能を使うには、この設定を変える必要があるでしょうか。

 

ちなみに、パッケージで渡される場合、翻訳者側ではこの設定を変更できません。ですので、もし設定が必要であるのであれば、翻訳会社さんにお願いするしかなく、それはそれでとても面倒なんじゃないかと思っています。

 

長くなりましてすみませんが、よろしくお願い致します。