機械翻訳(MT)

2022年11月29日 (火)

MT業界は盛り上がっているようだが

ポストエディットすれば何とかなると思っている人がいるかもしれないけど、「和文原稿のpre-edit事例」に示したように、医薬に関してはそれは無理・不可能だと思うよ。

医薬の和文原稿をpre-editできる実力があってMTを効果的に利用できるのだよ。

元々、メディカル英訳者はpre-editと同じことをしてきたのよ。

つまり、MT業界は盛り上がっているようだが、プロフェッショナルなメディカル英訳者にしかMTは扱えないということだな。

おっさんはリタイヤしたからどーでもいいけどさ。 

Img_3531

2022年9月 3日 (土)

機械翻訳割

和文原稿のpre-edit事例5

の英訳のワード数がほぼ200ワード

20分かかったとして、60分間で600ワード

現役時代に200ワードを3000円でやっていたから、9000円/時間

今の翻訳レート事情はわからないけど、「機械翻訳割」のようなものがあるのだろうか?

20%値引きとして、7200円/時間

 

難解な和文だと60分間に400ワードということもある。

6000円/時間とぐっと下がる。

20%値引きだと、4800円/時間

 

平易と難解が均等にあるとして、6000円/時間

時給6000円ならまあまあでしょう。

値引きがあったとしても、機械翻訳はスピードを上げてくれる。

20220820-170726_20220903150101

2022年8月31日 (水)

post-editって本当は難しいんだ

何度も紹介しているけど、メディカル英訳のプロセスね。

20220120163140_20220831040001

 

機械翻訳を使う場合も同様のプロセスを経ることになります。

第2段階は「読み替え」と言っているけど、機械翻訳でのpre-editのことです。

人間翻訳者は英訳に入る前に脳内pre-editしているとも言えます。

 

クライアントと翻訳初心者は、最初から機械翻訳に丸投げして、最後にpost-editすればいいと思っているかもしれません。

機械翻訳は大変進歩していますが、この前のブログ記事に示すように、依然として機械が解読できない部分は相当あります。

post-editが必要な部分を納品可能レベルに修正するには絶対にpre-editが必要なのです。

pre-editスキルを身に着けるには、何度も書いているけど、大変な努力が必要です。

 

巷ではpost-edit講座が大流行で、医学翻訳初心者にも簡単にできて、簡単に稼げる印象があります。機械翻訳のおかげで翻訳スピードが上がって、当面はクライアントに喜ばれるでしょうけど、安易なpost-editのために医学翻訳業界はさらに信用を落とすことになります。昔から信用なかったけど、もっと落ち込む。

pre-editスキルを身に着けた上位の翻訳者を擁している翻訳会社は浮上する。

イートモ等を通じてpre-editスキルを身に着けた人は貴重な人材になるでしょう。

 

2021年7月24日 (土)

DeepL 英訳も中級翻訳者レベル

以下の和文原稿をDeepLに英訳させてみました。

 

(3)用量反応探索試験

<外国人における成績>

海外第Ⅰ相臨床試験(STARTRK-1試験)3)

  • 用量漸増コホート

目 的:本剤を経口投与した場合の初回サイクルのDLT、MTD、RP2Dを特定する。

対 象:局所進行性又は転移性の癌を有する患者76例 (NTRK1/2/3、ROS1又はALK遺伝子変異を有することが望ましいが、適格性の必須条件ではなかった)

試験デザイン:多施設共同非盲検第I相試験

実施国:米国、スペイン、韓国(3カ国)

試験方法:100mg/m2/日、1日1回投与から開始し、1サイクル目(28日間)をDLT評価期間とし、この間でのDLT発現を確認した。「3+3」デザインで実施し、3例中2例又は6例中2例でDLT発現が確認されるまで用量漸増することとした。用量も必要に応じて変更することとし、1日1回での薬物動態、安全性が確認された場合、次コホートで1日2回へ変更できることとした。投与期間はPDが確認される、患者が同意を撤回する、又は許容できない毒性が発現するまでとし、PDが確認された場合は、治験依頼者と協議の上、当該患者が引き続き臨床ベネフィットを得ることができると治験担当医が判断した場合に限り、治験薬投与を継続することができた。なお、MTDの定義は「サイクル1のDLT発現率が33%未満となる最高用量」とした。

評価項目:主要評価項目;初回サイクルのDLT、MTD、RP2D

試験結果:用量漸増パートの本薬投与開始後28日目までがDLT評価期間とされた。その結果、800mg QD投与群の3/9例にDLT(Grade 3の疲労2例及びGrade 3の注意力障害1例)が認められ、RP2Dは600mg QD投与とされた。

 

結果・・・

赤字は要修正箇所です。

20210724-165118

 

どういうわけか、相変わらず大きな訳抜けがある。

でも、どーせ和文原稿と照合して点検するんだから、ご愛敬です。

修正を要する部分は確かにあるんだけど、一瞬でこのレベルの英訳を出してくれると、クレームの来ないギリギリのレベルに仕上げるのは非常に楽になるね。

人間翻訳者、うかうかしてられんよ。

 

2021年7月23日 (金)

DeepLによる医薬文書の英訳

イートモ実戦応用例

ロズリートレク・インタビューフォーム16

 

第Ib相拡大試験

用量漸増パートでRP2Dが決定された後、一斉に開始する計画とした。第Ib相は、規定されたがん腫及び分子変化を有している患者を追加で登録するようにデザインされた。第Ib相での本剤*1の用量は、パートE以外では小児のRP2Dとし、パートEではRP2Dより1段階低い用量レベルを初期用量とした。

 

評価項目:主要評価項目;第I相用量漸増パートのDLT、有害事象など

副次的評価項目;第Ib相拡大試験における以下の項目(いずれも主治医評価) 奏効率(ORR)、奏効期間(DOR)奏効までの期間(TTR)など

 

試験結果:3例の患者において750mg/m2でDLTを認め(Grade 3の肺水腫、Grade 2の味覚異常、血中クレアチニン増加が各1例)、1例の患者において550mg/m2でDLTが認められた(Grade 2の血中クレアチニン増加1例)。その他のDLTは認められなかった。550mg/m2の用量レベルがMTDと判定された。

 

有効性;薬事申請時に小児患者の有効性を評価するため、2018年5月31日までに本試験へ登録されていた患者26例(小児解析対象集団16例及び拡大パートの10例)のデータを解析した(データカットオフ日:2018年10月31日)。このうち、有効性が評価された5例の結果を以下に示す。

 

安全性;安全性評価対象例16例における臨床検査値異常を含む副作用発現頻度は、100%(16/16例)であった。また、重篤な副作用は、6.3%(1/16例)に認められ、肺水腫の発現が認められた。本剤投与期間中又は投与終了後30日以内の死亡は、12.5%(2/16例)(550mg/m2群 2例)に認められ、いずれの死因も疾患進行であり、本剤との因果関係は認められなかった。投与中止に至った事象として呼吸困難が6.3%(1/16例)に認められたが、本剤との因果関係は認められなかった。20%以上に認められた主な副作用は、血中クレアチニン増加50.0%(8/16例)、悪心及びアスパラギン酸アミノトランスフェラーゼ増加が各43.8%(7/16例)、アラニンアミノトランスフェラーゼ増加37.5%(6/16例)、便秘、味覚異常及び貧血が各31.3%(5/16例)、体重増加及び鼓腸が各25.0%(4/16例)であった(データカットオフ日:2018年5月31日)。 また、有効性が評価された5例における副作用発現頻度は100%(5/5例)であった。主な副作用は白血球数減少100.0%(5/5例)、貧血80.0%(4/5例)、好中球数減少60.0%(3/5例)、体重増加40.0%(2/5例)、傾眠40.0%(2/5例)、食欲亢進40.0%(2/5例)であった(データカットオフ日:2018年10月31日)。

注)本剤の承認された用法及び用量(「NTRK融合遺伝子陽性の進行・再発の固形癌」の小児患者)は、エヌトレクチニブとして1日1回300mg/m2を経口投与である。 (「Ⅴ-1.効能又は効果」「Ⅴ-3.用法及び用量」参照)

 

 

DeepLに英訳させてみました。

  ↓ ↓ ↓

赤字部分が修正を要するところです。

20210723-164144

 

機械翻訳は英訳もかなり進歩しているなーという印象です。

とは言っても、やはり和文原稿と照合して、最初から和文原稿を読解する必要があります。

最初からマンパワーで納品レベルに仕上げるのかかる労力が100%とすると、DeepLにより80%程度に軽減されるという印象です。

なお、和訳でも訳抜けが頻発していますが、今回の英訳トライアルでも大きな訳抜けが生じました。

どーせ和文原稿と照合して修正しなければならないので、多少の訳抜けは許容範囲内でしょう。

納品レベルへの仕上げは翻訳者が行うことになるでしょうから、医学翻訳者の需要はなくならないでしょうけど、機械のアウトプットを最大限に利用して(機械翻訳のアウトプットの悪さにいちいち悩んだり、不平を言ったりしてはダメ)、クレームのこないギリギリのレベルに仕上げるという技能が求められるか?

 

2021年6月21日 (月)

現在のDeepLで十分

先ほどから

https://dailymed.nlm.nih.gov/dailymed/drugInfo.cfm?setid=b172773b-3905-4a1c-ad95-bab4b6126563&audience=consumer

つまり、リツキシマブ添付文書をイートモ化しているのだが、DeepLを利用しています。

最近はDeepLのみです。

 

プロ目線からすると、現在のDeepLは十分に実用レベルです。

もちろん、原文と照合しながら修正する必要はあるけど、入力の手間が大きく省けます。

なにしろ、操作がシンプルなのが良い。

どうせ照合・修正しなくてはならないので、ごちゃごちゃわかりにくい機能がないのが良い。

しかも、無料なのに5000Wordまで使えるのが良い。

 

2021年3月27日 (土)

機械翻訳による英訳の比較

みんなの自動翻訳とDeepLを比較してみました。

 


【みんなの自動翻訳】

Minna5_20210327073001

【DeepL】

Deepl1

【イートモ】

Iitomoexample2

 


【みんなの自動翻訳】

Minna6

【DeepL】

Deepl2

【イートモ】

Iitomoexample 

 

どちらもなかなか出来が良いです。

医学翻訳の学習者と初心者、うかうかしてられません。

機械翻訳の出力を最終的に納品レベルに仕上げる仕事、いわゆるMTPEの仕事が残っていると思うかもしれないけど、本当はこのMTPEこそ上位の翻訳者じゃないとできない仕事ですよ。現状はどのような人がMTPEを担当しているのだろう? しばらく現場から離れているからわかりませんけど。

 

それにしても、みんなの自動翻訳、システム障害でもあるのか、反応がめちゃくちゃ遅い。

 

【追記】

ざっと検索して調べてみたけど、機械翻訳とポストエデットをセットにしたサービスを販売しているケースが多い様子です。

「ポストエデットを格安+迅速にやりますよ」というのが売りのようです。

やはりね。

その辺に医学翻訳の初心者が仕事を見つけられるかもです。

「MTPEこそ上位の翻訳者じゃないとできない仕事だ」なんて本当のことを言ったら、クライアントから仕事がこないか。

 

だいたい、「ポストエデット」とか「ポストエディター」とか、言葉がよくない。

大事な仕事が終わって、その後片付けみたいな軽い感じがします。

「翻訳仕上げ師」とか、もう少し重みのある呼び名にしよう。

 

みんなの自動翻訳を利用して医学翻訳(英訳)の勉強

英訳の場合には一致率が66%程度だと、かなり使える対訳がピックアップされます。

それ以下の一致率40%台の対訳についても、類似のスタイルの和文がピックアップされています。類似のスタイルの和文をまとめて英訳トレーニングできるからいいね。

Minna4_20210327072301

 

でも、イートモを対訳メモリとして利用するまでもなく、MT(機械翻訳)でかなりの精度の英訳ができています。

Minna5_20210327073001

 

もう、本当に、低レベルの医学翻訳者の出番はなくなるよ。

 

それにしても、みんなの自動翻訳、どうしてこんなに反応が遅いのだろう?

 

 

2021年3月21日 (日)

みんなの自動翻訳で英訳

イートモデータをみんなの自動翻訳に対訳メモリとして登録してみました。

試しにやってみただけです。

対訳メモリとして登録するのに結構難渋しました。

 

以下の「イートモセンテンス・日英」が翻訳メモリとして登録したイートモデータです。

一致が88.7%だと、ほぼ英訳完了です。

57.0%でもかなり利用可能な部分が大きくなります。

Minna1_20210321143401

 

和訳のときと違って、60%を超えると利用価値がかなり高い。

Minna_20210321143701

 

「MT」は機械翻訳による訳だけど、出来がかなり良いです。治験実施計画書は定型的な表現が多いので、教師データが充実しているのでしょう。

Minna2_20210321144001

 

機械翻訳に組み込まれている教師データと翻訳メモリの関係が良くわからないんだけど、いずれにしても、機械翻訳の精度は良くなっているので、中途半端な翻訳者や学習ステージでくすぶっている人の出番はなくなるのではないかと思います。

 

2021年3月15日 (月)

みんなの自動翻訳をイートモで調べる

今回はもう少し長めの英文(治験実施計画書の一部)をみんなの自動翻訳に和訳させました。

左に英語原文が表示され、右に機械翻訳された和文が表示されています。

Minna1_20210315202001

 

すぐに気づくと思いますが、赤線部分以外に大きな問題はありません。

ニュアンスをちょっと修正すれば納品レベルです。

 

Googleで調べればわかると思いますが、「code break」のダブルでイートモ検索してみました。

対訳4件がみつかりました。

Minna2

 

赤線部分には「開鍵」という訳語が該当することがわかります。

治験実施計画書で「code break」ときたら、「開鍵」であることは医学翻訳フリーランスの常識であり、調べるまでもありませんが。

「開鍵」の英訳には役立つ対訳だと思います。

 

そんなことよりも、この英文についての機械翻訳は上出来です。

翻訳スクールで勉強中の人はここまで上手に、しかも一瞬で和訳できないと思います。

昔(10年以上前)は、時間に余裕のあるときに初心者に下訳をさせて、上位の翻訳者が修正しつつ納品ということがあったけど、今は医学翻訳の初心者を使うよりも、機械翻訳のほうが役立つんじゃないかな?

厳しい時代だけど、しょうがない。

医学翻訳学習ステージの人はのんびり勉強してられない。早くプロのステージに上がらないと!

 

 

より以前の記事一覧

フォト

イートモ

  • 収録対訳件数
    12月3日現在:61,277対訳(イートモ7.3から276対訳の増量) 医学翻訳の友 イートモ・トップ|なりた医学翻訳事務所

相互リンク

サイト内検索
ココログ最強検索 by 暴想