機械翻訳(MT)

2023年2月16日 (木)

どこがAI翻訳なんだ

https://www.nejm.org/doi/full/10.1056/NEJMoa2204233

の「評価項目」の項をAI翻訳というものに和訳させてみました。

プロの医学翻訳者から見て、修正を要する部分を赤字にしています。

医学翻訳者による大幅な修正が必要です。ポストエディットで軽く修正して納品できるレベルではありません。どこに人工知能が使われているというのだ!

この程度の機械翻訳の登場で「医学翻訳者の仕事がなくなるー」と大騒ぎしているド素人の世間がおかしいぜ。

おっさんはもう引退したけど、業界が悪い方向に行かなければいいが。

比較的よくできていたのが「みんなの自動翻訳」でした(ややGood Job)。

英文原稿

OUTCOMES

The prespecified primary outcome was the first occurrence of progression of kidney disease or death from cardiovascular causes. Progression of kidney disease was defined as end-stage kidney disease (ESKD; the initiation of maintenance dialysis or receipt of a kidney transplant), a sustained decrease in the eGFR to less than 10 ml per minute per 1.73 m2, a sustained decrease from baseline in the eGFR of at least 40%, or death from renal causes. The assessment of a sustained decrease used either the values measured at two consecutive scheduled follow-up visits at least 30 days apart or the values measured at the final follow-up visit or the last scheduled visit before death (or withdrawal of consent or loss to follow-up). Central laboratory measurements of serum creatinine were used to estimate the GFR, with measurements from the local laboratory being used when central results were missing.

The prespecified key secondary outcomes were a composite of hospitalization for heart failure or death from cardiovascular causes, hospitalization for any cause (including the first and any subsequent hospitalizations), and death from any cause. Other secondary outcomes were progression of kidney disease, death from cardiovascular causes, and a composite of ESKD or death from cardiovascular causes. Details regarding the tertiary, safety, and laboratory assessments and planned exploratory assessments are provided in the statistical analysis plan.

Prespecified key subgroup analyses of the primary outcome were stratified according to diabetes status, eGFR, and urinary albumin-to-creatinine ratio at baseline. All events of death, potential hospitalizations for heart failure, myocardial infarction, stroke, liver injury, ketoacidosis, lower-limb amputation, acute kidney injury, and serious genital infections were adjudicated by clinicians who were unaware of trial-group assignments, with the use of prespecified definitions and source documents collected from trial sites. Definitions of the clinical outcomes are provided in the Supplementary Appendix.

DeepL

アウトカム
事前に指定された主要アウトカムは、腎臓病の進行または心血管系の原因による死亡の最初の発生であった。腎臓病の進行は、末期腎不全(ESKD:維持透析開始または腎臓移植)、eGFRが1.73m2あたり毎分10ml未満に持続的に低下、ベースラインからのeGFRの40%以上の持続的低下、または腎臓原因による死と定義した。持続的減少の評価には、少なくとも30日間隔で2回連続して予定されたフォローアップ訪問で測定された値、または最終フォローアップ訪問または死亡(または同意撤回またはフォローアップ不能)前の最後の予定訪問で測定された値のいずれかを使用した。GFRの推定には中央検査の血清クレアチニン測定値が使用され、中央の測定値がない場合は地域の検査からの測定値が使用された。

事前に設定した主要な副次的転帰は、心不全による入院または心血管系の原因による死亡、あらゆる原因による入院(最初の入院とその後の入院を含む)、あらゆる原因による死亡の複合であった。その他の副次的アウトカムは、腎臓病の進行、心血管系疾患による死亡、ESKDまたは心血管系疾患による死亡の複合としました。三次評価、安全性評価、検査評価、および計画された探索的評価に関する詳細は、統計解析計画に記載されています。

主要評価項目に関する事前に指定された主要サブグループ解析では、ベースライン時の糖尿病の状態、eGFR、尿中アルブミン/クレアチニン比によって層別化された。死亡,心不全,心筋梗塞,脳卒中,肝障害,ケトアシドーシス,下肢切断,急性腎障害,重症性器感染症のすべてのイベントは,事前に規定した定義と試験施設から収集した資料に基づいて,試験グループの割り当てを知らない臨床医が判断した.臨床転帰の定義は補足資料に記載されている。

Google翻訳

結果
事前に指定された主要転帰は、腎疾患の進行または心血管系の原因による死亡の最初の発生でした。 腎疾患の進行は、末期腎疾患 (ESKD; 維持透析の開始または腎移植の受領)、1.73 m2 あたり毎分 10 ml 未満への eGFR の持続的な減少ベースラインからの持続的な減少として定義されました。 eGFR が 40% 以上の場合、または腎臓の原因による死亡。 持続的減少の評価には、少なくとも 30 日間隔で 2 回連続して予定されたフォローアップ訪問で測定された値、または最後のフォローアップ訪問または死亡前の最後の予定された訪問で測定された値のいずれかが使用されました (または同意の撤回または喪失 ファローアップ)。 血清クレアチニンの中央検査室測定値を使用して GFR を推定し、中央検査の結果が欠落している場合は地元の検査からの測定値を使用しました。

事前に指定された重要な二次転帰は、心不全による入院または心血管系の原因による死亡、あらゆる原因による入院(最初の入院およびその後の入院を含む)、およびあらゆる原因による死亡の複合でした。 その他の二次転帰は、腎疾患の進行、心血管系の原因による死亡、ESKD または心血管系の原因による死亡の複合でした。 三次評価、安全性評価、実験室評価、および計画された探索的評価に関する詳細は、統計分析計画に記載されています。

プライマリアウトカムの事前に指定された重要なサブグループ分析、ベースラインでの糖尿病の状態、eGFR、および尿中アルブミンとクレアチニンの比率に従って層別化されました。 死亡、心不全、心筋梗塞、脳卒中、肝障害、ケトアシドーシス、下肢切断、急性腎障害、重篤な生殖器感染症による入院の可能性のあるすべての事象は、試験グループの割り当てを知らなかった臨床医によって、 治験実施施設から収集された、事前に指定された定義とソース文書の。 臨床転帰の定義は、補足付録に記載されています。

みらい翻訳

成果
事前に規定された主要評価項目は、腎臓病の進行または心血管原因による死亡の最初の発生であった。腎臓病の進行は、末期腎臓病(ESKD;維持透析の開始または腎移植の実施)、eGFRの持続的な低下が1.73 m 2あたり毎分10 ml未満eGFRのベースラインからの持続的な低下が40%以上、または腎原因による死亡と定義された。持続的な減少の評価には、30日以上の間隔を置いて定期的にフォローアップ受診を2回連続して行ったときに測定された値、または最後のフォローアップ受診時または死亡前の最後の定期受診時 (または同意の撤回またはフォローアップの中止) に測定された値のいずれかが用いられた。中央検査での血清クレアチニンの測定値を用いてGFRを推定し、中央検査結果がない場合は地元の検査での測定値を用いた。

事前に指定された重要な副次的評価項目は、心不全による入院または心血管疾患による死亡、あらゆる原因による入院 (初回およびその後の入院を含む) 、あらゆる原因による死亡の複合であった。その他の副次的評価項目は、腎臓病の進行、心血管系の原因による死亡、ESKDまたは心血管系の原因による死亡の複合であった。三次評価、安全性評価、実験室評価及び計画された探索的評価に関する詳細は、統計解析計画に記載されている。

事前に設定された主要評価項目の主要サブグループ解析、ベースライン時の糖尿病の状態、eGFR、尿中アルブミン/クレアチニン比によって層別化された。死亡、心不全による入院の可能性、心筋梗塞、脳卒中、肝障害、ケトアシドーシス、下肢切断、急性腎障害、重篤な性器感染症のすべての事象について、事前に規定された定義と治験実施施設から収集された原資料を用いて、治験グループの割り当てを知らない臨床医が判定を下した。臨床成績の定義は、補足資料に記載されている。

みんなの自動翻訳

結果
事前に規定された主要評価項目は、腎疾患の進行または心血管系の原因による死亡の最初の発生とした。腎疾患の進行は、末期腎疾患(ESKD;維持透析の開始または腎移植の実施)、eGFRの10 ml/分/1.73 m2未満への持続的な低下、eGFRのベースラインから40%以上の持続的な低下、または腎性の原因による死亡と定義された。持続的な低下の評価には、少なくとも30日間隔で2回連続して予定されたフォローアップ来院時に測定された値、または最終フォローアップ来院時または死亡(または同意の撤回またはフォローアップ不能)前の最後に予定された来院時に測定された値のいずれかを用いた。GFRを推定するために、中央検査での血清クレアチニン測定値を用い、中央検査の結果が得られなかった場合には、地域の検査からの測定値を用いた。

事前に規定された主要な副次評価項目は、心不全による入院または心血管死、あらゆる原因による入院(初回およびその後の入院を含む)、およびあらゆる原因による死亡の複合であった。その他の副次評価項目は、腎疾患の進行、心血管死、およびESKDまたは心血管死の複合であった。三次評価、安全性評価、臨床検査評価および計画された探索的評価に関する詳細は、統計解析計画書に記載されている。

事前に規定された主要評価項目の主要サブグループ解析、ベースライン時の糖尿病の状態、eGFRおよび尿中アルブミン/クレアチニン比に従って層別化された。死亡、心不全による入院の可能性、心筋梗塞、脳卒中、肝損傷、ケトアシドーシス、下部四肢切断、急性腎障害および重篤な性器感染症のすべてのイベントは、事前に規定された定義および治験実施施設から収集された原資料を用いて、試験群の割り付けを知らない臨床医によって判定された。臨床アウトカムの定義は補足付録に記載されている。

 

2023年2月14日 (火)

NEJMの治験報告。

NEJMの治験報告。

全訳しました。

20230205-184835_20230214142701

訳上がり21枚程度、4万数千円。

DeepLを利用したから5時間で出来たけど、ほぼ書き直しでした。

実戦で機械翻訳を使うとまだまだ。

ニューラル翻訳が登場する前とさほど変わっていない気がする(医学分野に関しては)。

医学翻訳者の便利なツールの域を出ない。

 

点検したら、後日、イートモユーザーオンリーで紹介します。

 

2022年12月16日 (金)

ポストエディットってそんなに普及しているの?

おっさんは医学翻訳の仕事を辞めて5年ほどになるから、その間の医学翻訳業界のことは知らないけど、ポストエディットって普及しているのかな?

つまり、MT出力を修正する業務が医学翻訳事業の中心になっているのだろうか。

どの機種のMTを使ったかを明記し、ポストエディット有資格者の署名が入っていればOKみたいな。

「ポストエディット」と言うと軽いチェックのような印象を受けるけど、和文原稿のpre-edit事例に示すように、前処理しないで出力されたMT訳文は軽くチェックすればお客さんがお金を払ってくれる代物じゃないよ。

また、和文原稿のpre-edit事例において下線部以外には何の言及もしていないけど、よりよい訳文にするには修正を要する部分は非常に多い。

まあまあの訳文ならばクライアントが受け入れるという時代に入ったのだろうか。

ま、どーでもいいや。

 

2022年11月29日 (火)

MT業界は盛り上がっているようだが

ポストエディットすれば何とかなると思っている人がいるかもしれないけど、「和文原稿のpre-edit事例」に示したように、医薬に関してはそれは無理・不可能だと思うよ。

医薬の和文原稿をpre-editできる実力があってMTを効果的に利用できるのだよ。

元々、メディカル英訳者はpre-editと同じことをしてきたのよ。

つまり、MT業界は盛り上がっているようだが、プロフェッショナルなメディカル英訳者にしかMTは扱えないということだな。

おっさんはリタイヤしたからどーでもいいけどさ。 

Img_3531

2022年9月 3日 (土)

機械翻訳割

和文原稿のpre-edit事例5

の英訳のワード数がほぼ200ワード

20分かかったとして、60分間で600ワード

現役時代に200ワードを3000円でやっていたから、9000円/時間

今の翻訳レート事情はわからないけど、「機械翻訳割」のようなものがあるのだろうか?

20%値引きとして、7200円/時間

 

難解な和文だと60分間に400ワードということもある。

6000円/時間とぐっと下がる。

20%値引きだと、4800円/時間

 

平易と難解が均等にあるとして、6000円/時間

時給6000円ならまあまあでしょう。

値引きがあったとしても、機械翻訳はスピードを上げてくれる。

20220820-170726_20220903150101

2022年8月31日 (水)

post-editって本当は難しいんだ

何度も紹介しているけど、メディカル英訳のプロセスね。

20220120163140_20220831040001

 

機械翻訳を使う場合も同様のプロセスを経ることになります。

第2段階は「読み替え」と言っているけど、機械翻訳でのpre-editのことです。

人間翻訳者は英訳に入る前に脳内pre-editしているとも言えます。

 

クライアントと翻訳初心者は、最初から機械翻訳に丸投げして、最後にpost-editすればいいと思っているかもしれません。

機械翻訳は大変進歩していますが、この前のブログ記事に示すように、依然として機械が解読できない部分は相当あります。

post-editが必要な部分を納品可能レベルに修正するには絶対にpre-editが必要なのです。

pre-editスキルを身に着けるには、何度も書いているけど、大変な努力が必要です。

 

巷ではpost-edit講座が大流行で、医学翻訳初心者にも簡単にできて、簡単に稼げる印象があります。機械翻訳のおかげで翻訳スピードが上がって、当面はクライアントに喜ばれるでしょうけど、安易なpost-editのために医学翻訳業界はさらに信用を落とすことになります。昔から信用なかったけど、もっと落ち込む。

pre-editスキルを身に着けた上位の翻訳者を擁している翻訳会社は浮上する。

イートモ等を通じてpre-editスキルを身に着けた人は貴重な人材になるでしょう。

 

2021年7月24日 (土)

DeepL 英訳も中級翻訳者レベル

以下の和文原稿をDeepLに英訳させてみました。

 

(3)用量反応探索試験

<外国人における成績>

海外第Ⅰ相臨床試験(STARTRK-1試験)3)

  • 用量漸増コホート

目 的:本剤を経口投与した場合の初回サイクルのDLT、MTD、RP2Dを特定する。

対 象:局所進行性又は転移性の癌を有する患者76例 (NTRK1/2/3、ROS1又はALK遺伝子変異を有することが望ましいが、適格性の必須条件ではなかった)

試験デザイン:多施設共同非盲検第I相試験

実施国:米国、スペイン、韓国(3カ国)

試験方法:100mg/m2/日、1日1回投与から開始し、1サイクル目(28日間)をDLT評価期間とし、この間でのDLT発現を確認した。「3+3」デザインで実施し、3例中2例又は6例中2例でDLT発現が確認されるまで用量漸増することとした。用量も必要に応じて変更することとし、1日1回での薬物動態、安全性が確認された場合、次コホートで1日2回へ変更できることとした。投与期間はPDが確認される、患者が同意を撤回する、又は許容できない毒性が発現するまでとし、PDが確認された場合は、治験依頼者と協議の上、当該患者が引き続き臨床ベネフィットを得ることができると治験担当医が判断した場合に限り、治験薬投与を継続することができた。なお、MTDの定義は「サイクル1のDLT発現率が33%未満となる最高用量」とした。

評価項目:主要評価項目;初回サイクルのDLT、MTD、RP2D

試験結果:用量漸増パートの本薬投与開始後28日目までがDLT評価期間とされた。その結果、800mg QD投与群の3/9例にDLT(Grade 3の疲労2例及びGrade 3の注意力障害1例)が認められ、RP2Dは600mg QD投与とされた。

 

結果・・・

赤字は要修正箇所です。

20210724-165118

 

どういうわけか、相変わらず大きな訳抜けがある。

でも、どーせ和文原稿と照合して点検するんだから、ご愛敬です。

修正を要する部分は確かにあるんだけど、一瞬でこのレベルの英訳を出してくれると、クレームの来ないギリギリのレベルに仕上げるのは非常に楽になるね。

人間翻訳者、うかうかしてられんよ。

 

2021年7月23日 (金)

DeepLによる医薬文書の英訳

イートモ実戦応用例

ロズリートレク・インタビューフォーム16

 

第Ib相拡大試験

用量漸増パートでRP2Dが決定された後、一斉に開始する計画とした。第Ib相は、規定されたがん腫及び分子変化を有している患者を追加で登録するようにデザインされた。第Ib相での本剤*1の用量は、パートE以外では小児のRP2Dとし、パートEではRP2Dより1段階低い用量レベルを初期用量とした。

 

評価項目:主要評価項目;第I相用量漸増パートのDLT、有害事象など

副次的評価項目;第Ib相拡大試験における以下の項目(いずれも主治医評価) 奏効率(ORR)、奏効期間(DOR)奏効までの期間(TTR)など

 

試験結果:3例の患者において750mg/m2でDLTを認め(Grade 3の肺水腫、Grade 2の味覚異常、血中クレアチニン増加が各1例)、1例の患者において550mg/m2でDLTが認められた(Grade 2の血中クレアチニン増加1例)。その他のDLTは認められなかった。550mg/m2の用量レベルがMTDと判定された。

 

有効性;薬事申請時に小児患者の有効性を評価するため、2018年5月31日までに本試験へ登録されていた患者26例(小児解析対象集団16例及び拡大パートの10例)のデータを解析した(データカットオフ日:2018年10月31日)。このうち、有効性が評価された5例の結果を以下に示す。

 

安全性;安全性評価対象例16例における臨床検査値異常を含む副作用発現頻度は、100%(16/16例)であった。また、重篤な副作用は、6.3%(1/16例)に認められ、肺水腫の発現が認められた。本剤投与期間中又は投与終了後30日以内の死亡は、12.5%(2/16例)(550mg/m2群 2例)に認められ、いずれの死因も疾患進行であり、本剤との因果関係は認められなかった。投与中止に至った事象として呼吸困難が6.3%(1/16例)に認められたが、本剤との因果関係は認められなかった。20%以上に認められた主な副作用は、血中クレアチニン増加50.0%(8/16例)、悪心及びアスパラギン酸アミノトランスフェラーゼ増加が各43.8%(7/16例)、アラニンアミノトランスフェラーゼ増加37.5%(6/16例)、便秘、味覚異常及び貧血が各31.3%(5/16例)、体重増加及び鼓腸が各25.0%(4/16例)であった(データカットオフ日:2018年5月31日)。 また、有効性が評価された5例における副作用発現頻度は100%(5/5例)であった。主な副作用は白血球数減少100.0%(5/5例)、貧血80.0%(4/5例)、好中球数減少60.0%(3/5例)、体重増加40.0%(2/5例)、傾眠40.0%(2/5例)、食欲亢進40.0%(2/5例)であった(データカットオフ日:2018年10月31日)。

注)本剤の承認された用法及び用量(「NTRK融合遺伝子陽性の進行・再発の固形癌」の小児患者)は、エヌトレクチニブとして1日1回300mg/m2を経口投与である。 (「Ⅴ-1.効能又は効果」「Ⅴ-3.用法及び用量」参照)

 

 

DeepLに英訳させてみました。

  ↓ ↓ ↓

赤字部分が修正を要するところです。

20210723-164144

 

機械翻訳は英訳もかなり進歩しているなーという印象です。

とは言っても、やはり和文原稿と照合して、最初から和文原稿を読解する必要があります。

最初からマンパワーで納品レベルに仕上げるのかかる労力が100%とすると、DeepLにより80%程度に軽減されるという印象です。

なお、和訳でも訳抜けが頻発していますが、今回の英訳トライアルでも大きな訳抜けが生じました。

どーせ和文原稿と照合して修正しなければならないので、多少の訳抜けは許容範囲内でしょう。

納品レベルへの仕上げは翻訳者が行うことになるでしょうから、医学翻訳者の需要はなくならないでしょうけど、機械のアウトプットを最大限に利用して(機械翻訳のアウトプットの悪さにいちいち悩んだり、不平を言ったりしてはダメ)、クレームのこないギリギリのレベルに仕上げるという技能が求められるか?

 

2021年6月21日 (月)

現在のDeepLで十分

先ほどから

https://dailymed.nlm.nih.gov/dailymed/drugInfo.cfm?setid=b172773b-3905-4a1c-ad95-bab4b6126563&audience=consumer

つまり、リツキシマブ添付文書をイートモ化しているのだが、DeepLを利用しています。

最近はDeepLのみです。

 

プロ目線からすると、現在のDeepLは十分に実用レベルです。

もちろん、原文と照合しながら修正する必要はあるけど、入力の手間が大きく省けます。

なにしろ、操作がシンプルなのが良い。

どうせ照合・修正しなくてはならないので、ごちゃごちゃわかりにくい機能がないのが良い。

しかも、無料なのに5000Wordまで使えるのが良い。

 

2021年3月27日 (土)

機械翻訳による英訳の比較

みんなの自動翻訳とDeepLを比較してみました。

 


【みんなの自動翻訳】

Minna5_20210327073001

【DeepL】

Deepl1

【イートモ】

Iitomoexample2

 


【みんなの自動翻訳】

Minna6

【DeepL】

Deepl2

【イートモ】

Iitomoexample 

 

どちらもなかなか出来が良いです。

医学翻訳の学習者と初心者、うかうかしてられません。

機械翻訳の出力を最終的に納品レベルに仕上げる仕事、いわゆるMTPEの仕事が残っていると思うかもしれないけど、本当はこのMTPEこそ上位の翻訳者じゃないとできない仕事ですよ。現状はどのような人がMTPEを担当しているのだろう? しばらく現場から離れているからわかりませんけど。

 

それにしても、みんなの自動翻訳、システム障害でもあるのか、反応がめちゃくちゃ遅い。

 

【追記】

ざっと検索して調べてみたけど、機械翻訳とポストエデットをセットにしたサービスを販売しているケースが多い様子です。

「ポストエデットを格安+迅速にやりますよ」というのが売りのようです。

やはりね。

その辺に医学翻訳の初心者が仕事を見つけられるかもです。

「MTPEこそ上位の翻訳者じゃないとできない仕事だ」なんて本当のことを言ったら、クライアントから仕事がこないか。

 

だいたい、「ポストエデット」とか「ポストエディター」とか、言葉がよくない。

大事な仕事が終わって、その後片付けみたいな軽い感じがします。

「翻訳仕上げ師」とか、もう少し重みのある呼び名にしよう。

 

より以前の記事一覧

フォト

イートモ

  • 収録対訳件数
    3月26日現在:63,712対訳(イートモ7.3から2711対訳の増量) 医学翻訳の友 イートモ・トップ|なりた医学翻訳事務所

相互リンク

サイト内検索
ココログ最強検索 by 暴想