機械翻訳(MT)

2018年11月17日 (土)

翻訳支援ツールはGOOD

フリーランス医学翻訳者のみなさん、こんにちは。

Medical Translator NARITAです。

 

このところ、MTと翻訳支援ツール(CAT)を試用してきました。

メムソースとトランスゲートを使ってみました。

当面の結論として、CATについては使わないという選択肢はない。

Medical Translator NARITAがこれから本格的に医薬系翻訳に参入しようとするという段階であれば、迷わず導入します。

実は10年ほど前からCATの必要性は感じていて、導入しなければと思っていたんですが、日々の翻訳仕事に追われてなかなか実現せずでした。そのうち翻訳仕事よりもイートモの比重のほうが大きくなって、翻訳仕事から引退して今に至る、です。もし現役バリバリのときにCATがあったら、年に1500~2000万円くらい稼いでいたかも。

値段は両方とも2000~3000円/月と安い。タダみたいなもんです。

NMTはまだボロボロですけどね。

 

昔は、翻訳していて、同じような表現を前にも翻訳したことがあると思ったときは過去の書類やパソコン中のファイルを開いて利用できる部分を探し出したわけです。

ですから、翻訳が済んだ原稿は捨てられずに山積みになっていた。でも、どういうわけか、欲しい情報が含まれる過去の翻訳原稿やPCファイルに短時間でたどり着くことができたんです。「あの書類の何ページあたりの何行目あたりに載っていたはず」って思い出せた。今よりも少しは記憶力などが良かったのかな?

CATがあればそんな必要はないしね。

さすが産業翻訳の作業プロセスを知っている人が開発したって感じがします。

でも、自分で作成した翻訳メモリは使いやすいけど、他人が作成した翻訳メモリについては、かなりの総合的な翻訳力がないと利用しにくいかもしれません。

 

それと、以前にも書いたけど、MTや翻訳メモリを使うことによって、原文読解の思考が中断されることが大きな問題かもです。慣れればいいのかな?

完全一致していれば、それこそ機械的に訳文として使えばいいということです。一致している部分を飛ばすってことです。でも、原文の読解と訳出を飛ばすってことは、翻訳者にとっては思考の流れが飛んでしまうってことなんです。

http://i-honyaku.cocolog-nifty.com/blog/2018/11/post-e66e.html

 

いずれにしても、CATを導入してもフリーランス医学翻訳者の収入が増えれなければ何にもならないわけです。

フリーランス医学翻訳者の収入が増えるように、CATをうまく使ってほしいです。

翻訳会社の儲けは増えるけど、フリーランス医学翻訳者の収入が減るようだったら、医学翻訳なんかやめたほうがいい。

機械翻訳の粗探し 最後

ニューラルMTの実力はだいたいわかったので、粗探しはもうやめと思ったのですが、

http://i-honyaku.cocolog-nifty.com/blog/2018/11/post-e66e.html

Summary of Safetyの文書ですから、安全性と言えば有害事象ということで、次の有害事象の項目を最後にしようと。

 

Mt11171

どこがニューラルMTなのかって感じ。ルールベース翻訳と変わんないんじゃね?

 

次、、、

Mt11172

32のセンテンスで、 tabulationを「タブレーション」と訳して、33では「表に示した」。

ニューラルMTの翻訳コーパスがまだ少ないから、ルールベース翻訳の時代にインストール?した辞書を元に訳出しているのかな?

そもそも登録されている辞書自体に間違いが多いんじゃないかな。 

preferred termやspecified、 investigatorなど、医薬系翻訳での重要用語・表現の訳しかたをみると、レベルの高い医薬系翻訳者による監修がないと、まずいでしょ。

 

次、、、

Mt11173_2

33のセンテンスと同じことが言えるけど、preferred termやspecified、 investigatorのような医薬系翻訳での重要用語・表現については、前後の用語などから判断して適切な訳語を選択するからニューラルMTなんじゃないの? マシンが人間のように判断すからニューラルだと思っていたけど、上のような訳じゃルールベース翻訳、つまり昔の翻訳ソフトと変わんない気がするよ。

 

最後、、、

Mt11174

the adverse events originally coded by WHO-ART were re-coded using MedDRA

NMTの訳は正しくないわけだけど、正しくないから、ポストエディターが修正することになるわけです。でも、WHO-ARTとMedDRAの違いを知っているポストエディターじゃないと、ちゃんと修正できないでしょ。特にoriginally codedの部分。

だから、NMT+翻訳メモリを実用化のレベルにまで高めて、そのレベルをキープするには、レベルの高い医薬系翻訳者やポストエディターを確保する必要があるってこと。

でも、能力のある人は大学や製薬会社の研究開発のほうに行くし、好き好んで医薬系翻訳やポストエディットなんかやらないよ。研究開発からはじき出された人やリタイヤした人はいるかもしれないけど、ちょっとね~。www これ以上は言わね。察してください。

2018年11月13日 (火)

機械翻訳の粗探し もういいや(お終い)

機械翻訳とCATツールの組み合わせで、

MTの実力とCATツールの利便性を試してきたわけですが、

MTの現在の実力はだいたいわかったし、

もういいかなと。

 

他に気になったこと、、、

Mt11130_3

上はメムソースの画面ですけどね。

トランスゲートもメムソースと同じように右側に翻訳メモリに類似または一致している訳が提示されるんです。

完全一致していれば、それこそ機械的に訳文として使えばいいということです。

一致している部分を飛ばすってことです。

でも、原文の読解と訳出を飛ばすってことは、翻訳者にとっては思考の流れが飛んでしまうってことなんです。

例えば、上の例で27~29のセンテンスに完全一致に近い訳文が翻訳メモリにあるとすると、27~29のセンテンスを飛ばして31から読解と訳出を再開するというのはかなり厳しい。

特に報告書や論文の場合はそう。

ソースクライアントや翻訳会社経営陣は、27~29のセンテンスの分が時間節約になるし、翻訳料を支払わなくてもいいし、って考えているはずです。

でも、「翻訳者の思考の流れが飛ぶ」っていうことは結構大きな問題なんじゃないかな。

Process1

だって、翻訳作業の大きな部分が原文の読解(解釈)なんだから、無視できないと思いますよ。70%とか30%とかは私の勝手なイメージだから、つっこまないように!

そのへんを医薬を扱う翻訳会社がどのように解決していくのか、外野から眺めていきますよ。

まぁ、せいぜいがんばれ。

2018年11月11日 (日)

翻訳会社 機械翻訳に必死やな(ちょっと修正と追記)

Rose_2

機械翻訳なんて、まだ海のものとも山のものともわからない代物。

フリーランス医学翻訳者は、しばらく様子見すべきです。

セミナーやるんだったら、どうぞ勝手にやってくださいって感じ。

フリーランス医学翻訳者は、白黒がはっきりするまで、翻訳仕事でみっちり稼いで、待っていればいいんですよ。

それからでも遅くない。

稼いだら無計画に浪費しないで、投資にまわして不労所得で生活できるようにしてくださいね。じゃないと、翻訳会社に一生依存することになりますよ。

現状、(フリーランス医学翻訳者にとって)そんなセミナーは聞くだけ人生の貴重な時間が削られます。

 

ちょっと反省・・・

MTを開発している人や誰よりも先に導入したい人には役立つかもしれないので、「無駄」はなくしました。

せっかく教えてくれたのに、言い方が強くなってごめんなさいね。

 

「稼いだら無計画に浪費しないで、投資にまわして不労所得で生活できるようにしてくださいね。じゃないと、翻訳会社に一生依存することになりますよ。」

についても、人それぞれいろいろ価値観があるので、余計なお世話でしょうから、普通の文字にしました。

でもね、30代や40代はばりばり仕事ができるし、翻訳会社もまるで社員や専属翻訳者のように扱ってくれるかもしれないけど、50を過ぎるといろいろな能力が衰えます。ピークはすぎる。60すぎたら医学翻訳だけで生活するのは厳しいでしょう。

能力が衰えても、翻訳会社は当然ながら何の保証もしれてくれません。戦力にならない医学翻訳者なんて、ふつうはお払い箱! だいたい翻訳会社自体がいつ消えてもおかしくない

だから、フリーランス医学翻訳者として生活していくならば、若いころに稼いだ金を元に不動産投資するとか別の事業を興すとかとか、十分な収入が入ってくるルートを確立しておくことをおすすめしたいというわけなのです。この医学翻訳ブログで類似の内容のことを何度も書いています。

 

稀勢の里が初日から負けたので、ちょっとイライラして強い調子の書き方になってしまいました。

今後の医薬翻訳業界はどうなるの?

日曜日も医学翻訳の仕事や勉強、お疲れさまです。

Medical Translator NARITAです。

 

さて、最近よく書いていることですが、医薬専門の翻訳会社までニューラルMTの導入に前のめりになっているようだね。

最近の翻訳業界の動きや翻訳祭イン関西でそのように強く感じております。

http://i-honyaku.cocolog-nifty.com/blog/2018/10/jtf-6a54.html

翻訳会社というのは昔から自分のところの翻訳成果物を過大評価する傾向が強いからから、過去の翻訳資産を翻訳メモリとしてそのまま使っちゃうのかな?

これまではMTやCATに慎重だったから、ゴミの増殖が少なかったけど、、、。

こんなふうにならないといいけどな~。

Gomi

http://www.aamt.info/japanese/about/index.phpから引用(やや改変)

  
医学翻訳の仕事を引退したMedical Translator NARITAのおっさんが勝手に心配しているだけだから、翻訳会社の経営陣の方々は気にしないで進めてください。

そうならないように、良い方向に向かって、医薬系翻訳者が豊かな生活を送れるようになればと思います。

Medical Translator NARITAのおっさんは何もお手伝いできないけど、

●医学翻訳を学習している方が最短距離でプロの医学翻訳者になるための資料として、
●プロの医学翻訳者が翻訳の仕事を通じて豊かな生活が送れるように、上位レベルの訳文の作成を支援し、翻訳スキルをキープするための資料として、

イートモが充実したものになるようにがんばります。

機械翻訳の粗探し

抗炎症薬の安全性概要の和訳、続きます。

 

みんなの自動翻訳

Mt11111

概ね良い出来です。

このくらいシンプルな英文構造だとMTが力を発揮するようです。

 

Nor were there marked differences between the studies.

the studiesは、その上のセンテンス・・・

Demographic characteristics in the low back pain studies were not markedly different between the aspirin group (100-200 mg BID) and the acetylsalicylic acid or placebo group.

the low back pain studiesを指していると思います。the studiesが何を指しているのかを読み取って、然るべく和訳するには人間による読解が必要になるのでしょう。

 

治験関係の文書でstudyを研究と和訳することはまれなので、カスタマイズすれば改善するのかな?

 

Google翻訳

Mt11111transgate


みんなの自動翻訳と同程度の出来でした。

冠詞については、やはり人間による読解と然るべき訳出が必要なのでしょう。

 

ただ、

Demographic characteristics

の訳が

「人口統計学的特徴」となっていたり、「人口学的特徴」となっていたり。これはどういうことなのだろう。

2018年11月 8日 (木)

機械翻訳の粗探し

素材は相変わらず抗炎症薬の安全性概要。

一番簡単なやつ。

 

みんなの自動翻訳

Mt11083_2

 

Postmarketing safety information

市販後の安全性情報

 

と訳しておきながら、

 

Postmarketing Data

ポストマーケティング・データ

 

となっている。

IT系じゃないんだから、「ポストマーケティング・データ」とカタカナにするのはどうかと。

でも、まあまあだね。

 

Google翻訳

Mt11083transgate

 

「郵便物販売後のデータ」

 

Google翻訳もやってもうた。

ま、これだけおかしいと誤訳であることがはっきりわかってPEしやすい。

機械翻訳の粗探し

昼飯を食い終わったので、腹ごなしにMTの粗探し。

 

みんなの自動翻訳

Mt11082

 
the results of eight studies

8件の研究結果

 

結果が8件あるように読めてしまう。

8件あるのは試験なんだよ。

英文にそう書いてあるだろ。

ヘタな小細工をしないで、素直に解釈すればいいんだよ。

 

それと

patients with

の情報が消えている。

英文にそう書いてあるのになぜ省略するんだ。

だから、ルールベース翻訳のほうがましだ、ってMedical Translator NARITAなんかに言われるんだよ。

 

Google翻訳

Mt11082transgate

みんなの自動翻訳と同じエラー。

 

どっちもどっち。

機械翻訳の粗探し

またまた機械翻訳の粗探しコーナー。

医薬系翻訳者を目指して勉強している方々はあまり興味ないかもしれませんが、製薬会社からの「速く翻訳を納品しろ攻撃」と翻訳者からの「納期を伸ばせないか要求」の間に挟まれてきた翻訳会社にとっては、大きなチャンス到来です。

機械翻訳が本当に革命的なものなのか、それとも翻訳作業をちょっぴり軽減するだけのツール程度のものなのか。

フリーランス翻訳者が導入して時間的にペイするものなのか。

しばらく検討してみます。

機械翻訳の粗探しコーナーはもうしばらく続きますので、お付き合いください。

 

みんなの自動翻訳

Mt11081

その結果,現在進行中の研究のプロトコールの改訂や計画中の試験と同様に,現在進行中の試験のプロトコールを見直すことにより,aspirinに関連する心血管リスクは従来のNSAIDsと同様であり,腰痛,肩関節周囲炎,頚部腕症候群および腱鞘炎/腱鞘炎に対するアスピリンの開発を継続することが確認された。

 

めちゃくちゃだな(笑)

何がニューラル(N)だ。

PE作業では、

 

その結果,aspirinに関連する心血管リスクは従来のNSAIDsと同様であることを確認し,現在進行中の研究のプロトコールの改訂や計画中の試験の治験実施計画書を見直すことなど、被験者に対する追加的な安全対策を講じた後、腰痛,肩関節周囲炎,頚部腕症候群および腱鞘炎/腱鞘炎に対するアスピリンの開発を継続した

 

この程度までおおまかに修正した上で、さらに細部を確認するという作業が必要になります。

それだけで10分ほどかかっているでしょうか。

細部を確認すればいい状態でPEに訳文を提供してくれないと、MTは使い物にならない。

このセンテンスについては最初から人手翻訳したほうがいいという結論です。

 

Google翻訳

Mt11081transgate

後半ががたがたになっています。

このMT出力の訳文にもかなりの時間がかかりそう。

 

引き続き継続されていることが確認された当時の計画の計画や、計画中の研究計画の改訂など、被験者の安全を確保するための措置。

 

やはり、これだけ長いセンテンスになるとMTでは手に負えないのかな。

2018年11月 7日 (水)

機械翻訳の粗探し

まだ機械翻訳の味方のMedical Translator NARITAです。

 

みんなの自動翻訳

Mt11072


the U.S.とFood and Drug Administration (FDA)が分割されてしまいました。

ま、これはしかたがないね。

the U.S. Food and Drug Administration (FDA)で一つの意味を構成するように登録すればこのエラーは避けられるのかな?

package insert revisionsの和訳はかなりペケだね。

イートモちゃんを組み込めば一発で解決するのにな。

Iitomochan

 

Google翻訳

Mt11072transgate

分割されているし、

package insert revisions

の和訳がペケ。

 

次、、、

みんなの自動翻訳

Mt11073

どうして、

 

in the study

試験中

になるんだよ!

 

ま、他は比較的よくできているけどね。

 

Google翻訳

Mt11073transgate


やはり、なめらかさはGoogle翻訳が上だ。

産業翻訳だから、なめらかさはあまり重要ではないけど、

大切な原文情報の読み取りもGoogle翻訳のほうが上。

 

何が違うのかな。

より以前の記事一覧

フォト

医学翻訳の友

サイト内検索
ココログ最強検索 by 暴想