« 「ひなちゃん」 お試し保育園 | トップページ | 選ばれる賃貸アパートになるように »

2020年12月10日 (木)

リリカRxListのイートモ訳と機械訳 出来上がり

先日から進めていたリリカRxListから英訳に役立ちそうなセンテンスをピックアップし、イートモ用に対訳化・編集しました。

イートモ訳と比較できるように、某機械翻訳による和訳を併記しました。

 

以前にクレストールのラベルについても某機械翻訳による和訳を併記しましたが、そのときは1世代前の翻訳システム(汎用NMT)だったようです。

ダウンロード - e382afe383ace382b9e38388e383bce383abe383bbe383a9e38399e383abe383bbdbe794a8e383bbe6b888.pdf

 

今回のリリカの件では最新の翻訳システム(汎用NT)による機械訳を併記しました(茶色の部分)。

ダウンロード - e383aae383aae382abe383bbrxliste383bbe382a4e383bce38388e383a2dbe794a8.pdf

※イートモは医学翻訳のプロになるための補助、あるいはプロとして活躍するための補助になるように作られた医学翻訳フリーランスのための参考資料です。英文と和文の対応がわかりやすく、日英間で相互利用できるように、意図的に主観を除いて可能な限り直訳的に作成しています。参照の際にはご注意ください。

確かに汎用NTのほうが性能が少し良くなっているようです。

でも、個人的な印象ですが、原文(英文)が複雑になると全然解読できていないので、原文と照合してチェックするという大きな手間がなくなりません。特に、対外的に出す文書(承認申請や海外パートナーとの情報交換)には原文との照合が必須なので、翻訳作業時間が機械翻訳によって大きく短縮されることはないでしょう。場合によっては機械訳を利用するのに時間がかかるとか、機械訳があるせいで翻訳スピードがアップしないということもあるかもしれません。

また、個人的な印象ですが、単語ベースならば機械訳が信用できるかというとそうでもないようです。

システムの性能がどうのことのよりも、教師データ(対訳コーパス)の質が悪いような印象です。総務省と進めている「翻訳バンク」で蓄積された質のいい大量の対訳データから作成されているそうですが、少なくとも医薬系に関しては教師データ(対訳コーパス)を見直さないとダメなんじゃないかと感じました。単なるイートモおじさんがそのような印象を持ったというだけですので、開発担当の方は気にせず開発を進めてください。

すべてにおいて裏をとる必要がありますが、文書の種類や文脈に応じてケースバイケースで利用すれば役に立つでしょう。

機械翻訳が使える環境で、翻訳メモリ(センテンスベースおよび用語ベース)を利用しながら訳出のスピードアップをはかるのが現在のところ最善じゃないかな。

私がまだ現役の医学翻訳者だったら迷わず機械翻訳を導入するでしょうが、今は単なるイートモおじさんなので、積極的に利用することはありません。機械翻訳は限界に近いようなので、機械翻訳からは離れて、しばらくイートモ制作に専念します。

 

 

« 「ひなちゃん」 お試し保育園 | トップページ | 選ばれる賃貸アパートになるように »

コメント

コメントを書く

コメントは記事投稿者が公開するまで表示されません。

(ウェブ上には掲載しません)

« 「ひなちゃん」 お試し保育園 | トップページ | 選ばれる賃貸アパートになるように »

フォト

イートモ

  • 収録対訳件数
    10月19日現在:56,215件(イートモ7.1から3558件の増量) 医学翻訳の友 イートモ・トップ|なりた医学翻訳事務所

相互リンク

サイト内検索
ココログ最強検索 by 暴想