謎というか、そういうものだというだけの話なんでしょうけれど。
例 1)
人間が見ると、明らかに最もよく似ていると思うであろう訳文が、そもそもヒットしていません。
例 2)
こちらはどう見ても三番目が一番似ているように見えます。
トークナイザーには SnowballEnglishTokenizer を指定しているのですが、順位三番目の参考訳文のトークナイザーの一致率にいたっては、わずか 16% です。
参考訳文のマッチング アルゴリズムって、翻訳メモリソフトにとっては割と肝だと思うのですが、どんな基準で比較しているのでしょうか?
0 件のコメント:
コメントを投稿