2012年12月31日月曜日

OmegaT の参考訳文一致率が謎

謎というか、そういうものだというだけの話なんでしょうけれど。

例 1)

人間が見ると、明らかに最もよく似ていると思うであろう訳文が、そもそもヒットしていません。

例 2)

こちらはどう見ても三番目が一番似ているように見えます。

トークナイザーには SnowballEnglishTokenizer を指定しているのですが、順位三番目の参考訳文のトークナイザーの一致率にいたっては、わずか 16% です。

参考訳文のマッチング アルゴリズムって、翻訳メモリソフトにとっては割と肝だと思うのですが、どんな基準で比較しているのでしょうか?

0 件のコメント:

コメントを投稿