機械翻訳(MT)

2023年10月 1日 (日)

翻訳の需要

翻訳業界団体のディスカッションで以下の図をみました。

 

20231001-085849

 

人手翻訳では対応できないから、機械翻訳を利用しようということらしい。

イメージ図なのだろうけど、こんなに産業翻訳の需要は増えているの?

医学翻訳の現場から離れて5~6年ほど経つけど、景気の良い話は聞こえてこないぞ。

 

需要が増えているのならば喜ばしいけど、iPS細胞の翻訳なんて外注されているのか?

そんな難しい分野なんて時間がかかるばかりで、儲からんし、余程の高レートでなければやってられんぞ。

ボランティアじゃないんだから、儲からない仕事がいくら増えてもうれしくないね。

 

やはり治験関係の分厚い資料をMTにかけて大量生産するのが一番儲かる。

プロの医学翻訳者は稼いでなんぼ。

脳内にイートモ対訳をインストールしておけば、MT訳のエラーを見つけやすくなる。

また、どうしても訳しにくい部分が出てくるから、そんなときはイートモからヒントをもらって、どうにかごまかして体裁の良い商品に仕上げて納品するんだ。

 

久しぶりに医学翻訳の話を書いたら、くたびれた。

今日はパチンコに行って勝負だ。

 

2023年6月 4日 (日)

こういう話になるとイートモの一般販売はやめたくなる

まさにイートモに当てはまる話。

イートモユーザーにはイートモ対訳の流出には十分に注意してもらうしかない。

AI開発側が1億円でイートモ対訳データを書いとりたいと言ってきても、売る気なし。

 

2023年5月24日 (水)

ChatGPTなどのプロンプトエンジニア専門誌「PROMPTY」

ChatGPTなどのプロンプトエンジニア専門誌『PROMPTY』を運営する株式会社Bocekから、
医学翻訳ブログでの紹介依頼がありましたでの、以下に紹介します。

20230524-151503_20230524152601

 

【プロンプト解説】ChatGPTを用いて英語学習を効率的に行う方法

 

2023年4月25日 (火)

MTメディカル和訳の暴走

MTをメディカル英訳に使うのならば、「和文原稿のpre-edit事例」に示すように、適切にpre-editすればかなり高品質の英訳をアウトプットしてくれます。

メディカル英訳にMTに使わない手はありません。

pre-editのコツを習得するため、イートモ対訳を大量に脳内にインプットしましょう。

 

問題はMTによるメディカル和訳。

日本人が英文原稿をpre-editするのは現実的でないので、どうしてもpost-editすることになります。

訳抜けはご愛敬としても、そもそも訳し方がへたくそ。不味い訳語が一見すると問題ないように含まれているから、医学翻訳のベテランでも不味い訳語を見つけることが難しいだろう。

さらに、教師データが反映されるせいなのか、原因はわからないけど、英文原稿にない情報が一見すると問題ないように含まれいてる。私のようにMTのヘビーユーザーは、こうした「MTの暴走」のような現象によく出くわします。原文が英語だから、「MTの暴走」を見つけるのは難しい。

メディカル英訳でもpre-editしなければ「MTの暴走」は頻繁に起こるわけですが、原文が日本語だからpre-editで暴走を食い止めることができるけど、メディカル和訳では難しい。

 

2023年2月16日 (木)

どこがAI翻訳なんだ

https://www.nejm.org/doi/full/10.1056/NEJMoa2204233

の「評価項目」の項をAI翻訳というものに和訳させてみました。

プロの医学翻訳者から見て、修正を要する部分を赤字にしています。

医学翻訳者による大幅な修正が必要です。ポストエディットで軽く修正して納品できるレベルではありません。どこに人工知能が使われているというのだ!

この程度の機械翻訳の登場で「医学翻訳者の仕事がなくなるー」と大騒ぎしているド素人の世間がおかしいぜ。

おっさんはもう引退したけど、業界が悪い方向に行かなければいいが。

比較的よくできていたのが「みんなの自動翻訳」でした(ややGood Job)。

英文原稿

OUTCOMES

The prespecified primary outcome was the first occurrence of progression of kidney disease or death from cardiovascular causes. Progression of kidney disease was defined as end-stage kidney disease (ESKD; the initiation of maintenance dialysis or receipt of a kidney transplant), a sustained decrease in the eGFR to less than 10 ml per minute per 1.73 m2, a sustained decrease from baseline in the eGFR of at least 40%, or death from renal causes. The assessment of a sustained decrease used either the values measured at two consecutive scheduled follow-up visits at least 30 days apart or the values measured at the final follow-up visit or the last scheduled visit before death (or withdrawal of consent or loss to follow-up). Central laboratory measurements of serum creatinine were used to estimate the GFR, with measurements from the local laboratory being used when central results were missing.

The prespecified key secondary outcomes were a composite of hospitalization for heart failure or death from cardiovascular causes, hospitalization for any cause (including the first and any subsequent hospitalizations), and death from any cause. Other secondary outcomes were progression of kidney disease, death from cardiovascular causes, and a composite of ESKD or death from cardiovascular causes. Details regarding the tertiary, safety, and laboratory assessments and planned exploratory assessments are provided in the statistical analysis plan.

Prespecified key subgroup analyses of the primary outcome were stratified according to diabetes status, eGFR, and urinary albumin-to-creatinine ratio at baseline. All events of death, potential hospitalizations for heart failure, myocardial infarction, stroke, liver injury, ketoacidosis, lower-limb amputation, acute kidney injury, and serious genital infections were adjudicated by clinicians who were unaware of trial-group assignments, with the use of prespecified definitions and source documents collected from trial sites. Definitions of the clinical outcomes are provided in the Supplementary Appendix.

DeepL

アウトカム
事前に指定された主要アウトカムは、腎臓病の進行または心血管系の原因による死亡の最初の発生であった。腎臓病の進行は、末期腎不全(ESKD:維持透析開始または腎臓移植)、eGFRが1.73m2あたり毎分10ml未満に持続的に低下、ベースラインからのeGFRの40%以上の持続的低下、または腎臓原因による死と定義した。持続的減少の評価には、少なくとも30日間隔で2回連続して予定されたフォローアップ訪問で測定された値、または最終フォローアップ訪問または死亡(または同意撤回またはフォローアップ不能)前の最後の予定訪問で測定された値のいずれかを使用した。GFRの推定には中央検査の血清クレアチニン測定値が使用され、中央の測定値がない場合は地域の検査からの測定値が使用された。

事前に設定した主要な副次的転帰は、心不全による入院または心血管系の原因による死亡、あらゆる原因による入院(最初の入院とその後の入院を含む)、あらゆる原因による死亡の複合であった。その他の副次的アウトカムは、腎臓病の進行、心血管系疾患による死亡、ESKDまたは心血管系疾患による死亡の複合としました。三次評価、安全性評価、検査評価、および計画された探索的評価に関する詳細は、統計解析計画に記載されています。

主要評価項目に関する事前に指定された主要サブグループ解析では、ベースライン時の糖尿病の状態、eGFR、尿中アルブミン/クレアチニン比によって層別化された。死亡,心不全,心筋梗塞,脳卒中,肝障害,ケトアシドーシス,下肢切断,急性腎障害,重症性器感染症のすべてのイベントは,事前に規定した定義と試験施設から収集した資料に基づいて,試験グループの割り当てを知らない臨床医が判断した.臨床転帰の定義は補足資料に記載されている。

Google翻訳

結果
事前に指定された主要転帰は、腎疾患の進行または心血管系の原因による死亡の最初の発生でした。 腎疾患の進行は、末期腎疾患 (ESKD; 維持透析の開始または腎移植の受領)、1.73 m2 あたり毎分 10 ml 未満への eGFR の持続的な減少ベースラインからの持続的な減少として定義されました。 eGFR が 40% 以上の場合、または腎臓の原因による死亡。 持続的減少の評価には、少なくとも 30 日間隔で 2 回連続して予定されたフォローアップ訪問で測定された値、または最後のフォローアップ訪問または死亡前の最後の予定された訪問で測定された値のいずれかが使用されました (または同意の撤回または喪失 ファローアップ)。 血清クレアチニンの中央検査室測定値を使用して GFR を推定し、中央検査の結果が欠落している場合は地元の検査からの測定値を使用しました。

事前に指定された重要な二次転帰は、心不全による入院または心血管系の原因による死亡、あらゆる原因による入院(最初の入院およびその後の入院を含む)、およびあらゆる原因による死亡の複合でした。 その他の二次転帰は、腎疾患の進行、心血管系の原因による死亡、ESKD または心血管系の原因による死亡の複合でした。 三次評価、安全性評価、実験室評価、および計画された探索的評価に関する詳細は、統計分析計画に記載されています。

プライマリアウトカムの事前に指定された重要なサブグループ分析、ベースラインでの糖尿病の状態、eGFR、および尿中アルブミンとクレアチニンの比率に従って層別化されました。 死亡、心不全、心筋梗塞、脳卒中、肝障害、ケトアシドーシス、下肢切断、急性腎障害、重篤な生殖器感染症による入院の可能性のあるすべての事象は、試験グループの割り当てを知らなかった臨床医によって、 治験実施施設から収集された、事前に指定された定義とソース文書の。 臨床転帰の定義は、補足付録に記載されています。

みらい翻訳

成果
事前に規定された主要評価項目は、腎臓病の進行または心血管原因による死亡の最初の発生であった。腎臓病の進行は、末期腎臓病(ESKD;維持透析の開始または腎移植の実施)、eGFRの持続的な低下が1.73 m 2あたり毎分10 ml未満eGFRのベースラインからの持続的な低下が40%以上、または腎原因による死亡と定義された。持続的な減少の評価には、30日以上の間隔を置いて定期的にフォローアップ受診を2回連続して行ったときに測定された値、または最後のフォローアップ受診時または死亡前の最後の定期受診時 (または同意の撤回またはフォローアップの中止) に測定された値のいずれかが用いられた。中央検査での血清クレアチニンの測定値を用いてGFRを推定し、中央検査結果がない場合は地元の検査での測定値を用いた。

事前に指定された重要な副次的評価項目は、心不全による入院または心血管疾患による死亡、あらゆる原因による入院 (初回およびその後の入院を含む) 、あらゆる原因による死亡の複合であった。その他の副次的評価項目は、腎臓病の進行、心血管系の原因による死亡、ESKDまたは心血管系の原因による死亡の複合であった。三次評価、安全性評価、実験室評価及び計画された探索的評価に関する詳細は、統計解析計画に記載されている。

事前に設定された主要評価項目の主要サブグループ解析、ベースライン時の糖尿病の状態、eGFR、尿中アルブミン/クレアチニン比によって層別化された。死亡、心不全による入院の可能性、心筋梗塞、脳卒中、肝障害、ケトアシドーシス、下肢切断、急性腎障害、重篤な性器感染症のすべての事象について、事前に規定された定義と治験実施施設から収集された原資料を用いて、治験グループの割り当てを知らない臨床医が判定を下した。臨床成績の定義は、補足資料に記載されている。

みんなの自動翻訳

結果
事前に規定された主要評価項目は、腎疾患の進行または心血管系の原因による死亡の最初の発生とした。腎疾患の進行は、末期腎疾患(ESKD;維持透析の開始または腎移植の実施)、eGFRの10 ml/分/1.73 m2未満への持続的な低下、eGFRのベースラインから40%以上の持続的な低下、または腎性の原因による死亡と定義された。持続的な低下の評価には、少なくとも30日間隔で2回連続して予定されたフォローアップ来院時に測定された値、または最終フォローアップ来院時または死亡(または同意の撤回またはフォローアップ不能)前の最後に予定された来院時に測定された値のいずれかを用いた。GFRを推定するために、中央検査での血清クレアチニン測定値を用い、中央検査の結果が得られなかった場合には、地域の検査からの測定値を用いた。

事前に規定された主要な副次評価項目は、心不全による入院または心血管死、あらゆる原因による入院(初回およびその後の入院を含む)、およびあらゆる原因による死亡の複合であった。その他の副次評価項目は、腎疾患の進行、心血管死、およびESKDまたは心血管死の複合であった。三次評価、安全性評価、臨床検査評価および計画された探索的評価に関する詳細は、統計解析計画書に記載されている。

事前に規定された主要評価項目の主要サブグループ解析、ベースライン時の糖尿病の状態、eGFRおよび尿中アルブミン/クレアチニン比に従って層別化された。死亡、心不全による入院の可能性、心筋梗塞、脳卒中、肝損傷、ケトアシドーシス、下部四肢切断、急性腎障害および重篤な性器感染症のすべてのイベントは、事前に規定された定義および治験実施施設から収集された原資料を用いて、試験群の割り付けを知らない臨床医によって判定された。臨床アウトカムの定義は補足付録に記載されている。

 

2023年2月14日 (火)

NEJMの治験報告。

NEJMの治験報告。

全訳しました。

20230205-184835_20230214142701

訳上がり21枚程度、4万数千円。

DeepLを利用したから5時間で出来たけど、ほぼ書き直しでした。

実戦で機械翻訳を使うとまだまだ。

ニューラル翻訳が登場する前とさほど変わっていない気がする(医学分野に関しては)。

医学翻訳者の便利なツールの域を出ない。

 

点検したら、後日、イートモユーザーオンリーで紹介します。

 

2022年12月16日 (金)

ポストエディットってそんなに普及しているの?

おっさんは医学翻訳の仕事を辞めて5年ほどになるから、その間の医学翻訳業界のことは知らないけど、ポストエディットって普及しているのかな?

つまり、MT出力を修正する業務が医学翻訳事業の中心になっているのだろうか。

どの機種のMTを使ったかを明記し、ポストエディット有資格者の署名が入っていればOKみたいな。

「ポストエディット」と言うと軽いチェックのような印象を受けるけど、和文原稿のpre-edit事例に示すように、前処理しないで出力されたMT訳文は軽くチェックすればお客さんがお金を払ってくれる代物じゃないよ。

また、和文原稿のpre-edit事例において下線部以外には何の言及もしていないけど、よりよい訳文にするには修正を要する部分は非常に多い。

まあまあの訳文ならばクライアントが受け入れるという時代に入ったのだろうか。

ま、どーでもいいや。

 

2022年11月29日 (火)

MT業界は盛り上がっているようだが

ポストエディットすれば何とかなると思っている人がいるかもしれないけど、「和文原稿のpre-edit事例」に示したように、医薬に関してはそれは無理・不可能だと思うよ。

医薬の和文原稿をpre-editできる実力があってMTを効果的に利用できるのだよ。

元々、メディカル英訳者はpre-editと同じことをしてきたのよ。

つまり、MT業界は盛り上がっているようだが、プロフェッショナルなメディカル英訳者にしかMTは扱えないということだな。

おっさんはリタイヤしたからどーでもいいけどさ。 

Img_3531

2022年9月 3日 (土)

機械翻訳割

和文原稿のpre-edit事例5

の英訳のワード数がほぼ200ワード

20分かかったとして、60分間で600ワード

現役時代に200ワードを3000円でやっていたから、9000円/時間

今の翻訳レート事情はわからないけど、「機械翻訳割」のようなものがあるのだろうか?

20%値引きとして、7200円/時間

 

難解な和文だと60分間に400ワードということもある。

6000円/時間とぐっと下がる。

20%値引きだと、4800円/時間

 

平易と難解が均等にあるとして、6000円/時間

時給6000円ならまあまあでしょう。

値引きがあったとしても、機械翻訳はスピードを上げてくれる。

20220820-170726_20220903150101

2022年8月31日 (水)

post-editって本当は難しいんだ

何度も紹介しているけど、メディカル英訳のプロセスね。

20220120163140_20220831040001

 

機械翻訳を使う場合も同様のプロセスを経ることになります。

第2段階は「読み替え」と言っているけど、機械翻訳でのpre-editのことです。

人間翻訳者は英訳に入る前に脳内pre-editしているとも言えます。

 

クライアントと翻訳初心者は、最初から機械翻訳に丸投げして、最後にpost-editすればいいと思っているかもしれません。

機械翻訳は大変進歩していますが、この前のブログ記事に示すように、依然として機械が解読できない部分は相当あります。

post-editが必要な部分を納品可能レベルに修正するには絶対にpre-editが必要なのです。

pre-editスキルを身に着けるには、何度も書いているけど、大変な努力が必要です。

 

巷ではpost-edit講座が大流行で、医学翻訳初心者にも簡単にできて、簡単に稼げる印象があります。機械翻訳のおかげで翻訳スピードが上がって、当面はクライアントに喜ばれるでしょうけど、安易なpost-editのために医学翻訳業界はさらに信用を落とすことになります。昔から信用なかったけど、もっと落ち込む。

pre-editスキルを身に着けた上位の翻訳者を擁している翻訳会社は浮上する。

イートモ等を通じてpre-editスキルを身に着けた人は貴重な人材になるでしょう。

 

より以前の記事一覧

フォト

イートモ

  • 最終点検済み対訳数
    ★12月8日現在:12,558対訳/64,523対訳 医学翻訳の友 イートモ・トップ|なりた医学翻訳事務所

相互リンク

サイト内検索
ココログ最強検索 by 暴想