機械翻訳(MT)

2019年7月15日 (月)

医学翻訳の勉強

日本全国のイートモファンのみなさん、こんにちは。

Medical Translator NARITAです。

 

Medical Translator NARITAはそこらへんの甘々翻訳スクールでへなちょこテキストを勉強するだけでは稼げる医学翻訳者になれないと断言しており、先日、それに代わる1つの勉強のしかたをご紹介しました

大変な努力がいります。医学翻訳で稼げるようになる、生活できるようになるのは甘くないよ。趣味・暇つぶし系の人は好きなようにどうぞ。

 

もう1つ医学翻訳の勉強をご紹介しましょう。

イートモサイトの「特徴」の項に以下のように記載しています。

医薬品の非臨床文書(CMC、毒性、薬理、薬物動態等)、治験実施計画書、治験薬概要書、コモンテクニカルドキュメント(CTD)、治験総括報告書、照会事項並びその回答、審査報告、添付文書など、医薬分野で翻訳依頼される中心的な文書について約42,000件の対訳を収録しています。

めったに仕事依頼されない医薬系翻訳の指導者がよく勧めるNEJMのアブストラクトをやってもしょうがないのです。仕事に直結しないから。

 

ま、上記のうち翻訳しやすい「添付文書」を見てみましょうか。

例えばオプジーボの添付文書

検索すれば簡単に見つかります。

 

Optivo package insert

Google検索すれば、このようにOptivoの英語版添付文書がたくさんみつかります。

これらの英語版添付文書を参照しながら、Google検索、ライフサイエンス辞書、イートモなどを使って実際にオプジーボの添付文書を読解し、訳出するトレーニングです。和訳と英訳の両方のトレーニングになります。あくまでもイートモは参考資料の1つです。万能ではありません。

特にこの英語版添付文書は利用価値が高いようです。

なお、副作用についてはご存じのようにMedDRAに準拠しますから、訳出不要です。機械翻訳化されるのは間違いなしです(すでになっているのかな?)。

 

添付文書のように定型的な文書には特に機械翻訳が導入されやすいと思います。

そこで、評判が良いと言われているみらいトランスレーターの実力のほどを試してみました。

上記のオプジーボ添付文書の一部をかけました。

 

イピリムマブ(遺伝子組換え)又はBRAF阻害剤を含む化学療法歴を有する根治切除不能なIII期/IV期又は再発の悪性黒色腫患者405例(本剤群272例、化学療法(ダカルバジン又はカルボプラチンとパクリタキセルとの併用)群133例)を対象に、化学療法を対照として本剤3mg/kgを2週間間隔で点滴静注したときの有効性及び安全性を検討した。主要評価項目である奏効率(RECISTガイドライン1.1版に基づく中央判定によるCR又はPR)について本剤が投与された最初の120例を解析対象集団として中間解析を行った結果、本剤群で31.7%(95%信頼区間:23.5〜40.8%、2014年3月10日データカットオフ)であった。なお、事前に奏効率の閾値は設定していなかった。もう一つの主要評価項目である全生存期間(中央値[95%信頼区間])について182例のイベント(死亡)数にて中間解析を行った結果、本剤群で15.47[12.39〜NE*3]ヵ月、化学療法群で13.67[11.50〜NE*3]ヵ月であり、本剤は化学療法に対し統計学的に有意な延長を示さなかった(ハザード比0.93[95%信頼区間:0.68〜1.26]、p=0.6299[層別log-rank検定]、2014年11月12日データカットオフ)。

 

「本剤」はオプジーボであることは明白なので、以下のようにプリエデットしました。

 

イピリムマブ(遺伝子組換え)又はBRAF阻害剤を含む化学療法歴を有する根治切除不能なIII期/IV期又は再発の悪性黒色腫患者405例(オプジーボ群272例、化学療法(ダカルバジン又はカルボプラチンとパクリタキセルとの併用)群133例)を対象に、化学療法を対照としてオプジーボ3mg/kgを2週間間隔で点滴静注したときの有効性及び安全性を検討した。主要評価項目である奏効率(RECISTガイドライン1.1版に基づく中央判定によるCR又はPR)についてオプジーボが投与された最初の120例を解析対象集団として中間解析を行った結果、オプジーボ群で31.7%(95%信頼区間:23.5〜40.8%、2014年3月10日データカットオフ)であった。なお、事前に奏効率の閾値は設定していなかった。もう一つの主要評価項目である全生存期間(中央値[95%信頼区間])について182例のイベント(死亡)数にて中間解析を行った結果、オプジーボ群で15.47[12.39〜NE*3]ヵ月、化学療法群で13.67[11.50〜NE*3]ヵ月であり、オプジーボは化学療法に対し統計学的に有意な延長を示さなかった(ハザード比0.93[95%信頼区間:0.68〜1.26]、p=0.6299[層別log-rank検定]、2014年11月12日データカットオフ)。

 

みらいトランスレーターに英訳させた結果は以下のとおり。赤字が修正を必要とする部分です。

 

405 patients (272 in the Opdivo group and 133 in the Chemotherapy (Combination of dacarbazine or carboplatin with paclitaxel) group) with previously unresectable stage III/IV or recurrent malignant melanoma who had received ipilimumab (genetic recombination) or BRAF inhibitor chemotherapy were studied for the efficacy and safety of intravenous infusion of Opdivo 3 mg/kg at 2 week intervals as a control of chemotherapy. The primary endpoint, response rate (Central CR or PR according to RECIST guideline 1.1), was 31.7% (95% confidence interval, 23.5 ~ 40.8%; data cutoff March 10, 2014) in the opdivo group in an interim analysis of the first 120 patients treated with the drug in the analysis set. The threshold for response rate was not established in advance. An interim analysis of the other primary endpoint, overall survival (Median [95% confidence interval]), with the number of events (death) in 182 patients showed that Opdivo was 15.47 [12.39 to NE * 3] months versus 13.67 (Hazard ratio 0.93 [95% confidence interval: 0.68 ~ 1.26], p = 0.6299 [stratified log-rank test]; November 12, 2014 data cut-off) months in the chemotherapy arm, and Opdivo did not show a statistically significant prolongation of chemotherapy [11.5 to NE * 3].

 

読み取りが全然ダメ。これほど読み取りができないとは意外でした。

これだけ読み取りが悪いと、専門用語や数字は利用できて多少の時短にはなるが、機械翻訳にかけるメリットはあまりないな。

医薬系の文書の中でも最も読解しやすい文書なのに、他の読解が困難な医薬系文書だったらどうなる?

まだまだ人間翻訳者の出番はありそうです。

正確に言うと、機械翻訳のエラーを瞬時に特定し、機械翻訳による訳文をできるだけ利用し、最短で納品可能な商品に仕上げられることができる翻訳者だけが必要とされる、ってこと。

 

2019年7月14日 (日)

『教師データ』

みなさん、こんにちは。

Medical Translator NARITAです。

 

『教師データ』

㈱翻訳センターのフィスコレポートに出ています。

 

 Kyoshi

 

フィスコがテキトーに作った造語かと思ったら、機械学習関係の専門用語のようです。

teaching data

失礼しました~w

 

お手本の翻訳ってこと?

過去の翻訳のビッグデータ(「過去の翻訳資産」とやら)を使おうとしているんだろうけど、ゴミが大量に含まれているかもしれないから、最低でも一度はたな卸ししたほうがいいんと思うよ。

Gomi

 

2019年7月13日 (土)

ロゼッタさん、機械翻訳事業にものすごく前のめり

決算説明資料にはほぼ機械翻訳事業のことしか書いてないよ。w

 

さらには、

そして戦後、あたかも「英語を話せるようになるのが日本人の当然の義務」のように語られた
奇妙な時代も、まもなく終わろうとしています。
「日本を言語的ハンディキャップの呪縛から解放する」という
弊社のミッションはもうゴールが見えました。

その次は何をするか?
ロゼッタのミッション第2章を決定しました。
「人類を単純作業の苦役的労働から解放する」
です。
生活するために人生の大半の時間を犠牲にして単純作業の辛い労働を嫌々行うという、将来から見れば
「バカげた非人間的な時代」を終わらせるのです。

 

おおー、いいぞ。いけいけー。

 

翻訳業界の最先端はここまで来ているのに、一方で、週1回とか月1回とか、1年も2年も翻訳スクールで講師の授業聞いて、数行を訳して添削してもらうという何十年も昔からのスタイルで翻訳のプロになろうとしている人もいる。

何十年も昔ならともかく、検索エンジンはあるし、医薬や英語・翻訳の資料もたくさん入手できる時代に翻訳スクールに行く意味が分からん。

もう永遠に追いつけないんじゃね?

 

何度も書いていることですが、医学翻訳で稼ごうと思ったら、医学翻訳のプロの壁を一気に突破して、既存の医学翻訳者を一気に追い抜いて、機械翻訳を使う側にならないと。

医学翻訳の仕事を辞めた者が無責任に言っているだけです。

 

2019年7月 4日 (木)

新しい機械翻訳サイト 発見

新しい機械翻訳サイトを発見しました。

クロスランゲージさんのCoss-Transer

面白いのは、翻訳(従来型の機械翻訳?)とニューラル機械翻訳の両方を見比べることができることです。

 

早速、試してみました。

以下の原文を和訳させてみました。

いつものように、赤字は修正を要する部分です。

 

原文
Therefore, it will be stated in the important precautions section of the draft package insert that “since a sudden onset of sleep without warning, sleep attacks, orthostatic hypotension, somnolence, dizziness, loss of consciousness, and syncope etc. may occur, patients should be cautioned against engaging in potentially hazardous activities requiring alertness, such as driving a car, operating machinery, or working in high places, during treatment with Drug A.”

 

翻訳(おそらく従来の機械翻訳)
したがって、草案パッケージ内の印刷物の重要な予防措置セクションで、「警告のない睡眠の突然の発症から、攻撃、起立性低血圧、眠気、めまい、意識喪失は眠る、そして、失神その他が起こるかもしれない、患者は機敏さを必要としている潜在的に危険な活動に従事することに対して警告されなければなりません。そして、例えば車を運転するか、機械を動かすか、薬Aでの治療の間、高い地位の人々の間で働きます」と述べられます。

 

ニューラル機械翻訳(β版)
このため、パッケージ草案の重要な予防策の章では、「警告なしに急に睡眠を開始してしまうと、睡眠不足、傾眠、めまい、意識喪失などが生じる。患者は、薬物治療中に、運転、稼働機械、高場所で働くなど、潜在的に危険な活動を行うことには注意を払う必要がある。「」

 

ついでに同じ原文をみらいトランスレーターに和訳させてみました。

このため,添付文書案の重要な注意事項の項に「A剤の投与中は、不意の突発的睡眠、睡眠発作、起立性低血圧、傾眠、めまい、意識消失、失神等があらわれることがあるので、自動車の運転、機械の操作、高所作業等危険を伴う作業に従事させないよう注意すること。」と記載することとした。 

 

性能の違いが半端ないです。

 

ニューラル機械翻訳は素晴らしい出来だけど、訳抜けがあるとちょっと厳しい。

ロゼッタさんのT4オーオー、売れているようだけど、みらいトランスレーターよりも性能がいいのだろうか。

使ったことないけど。

ロゼッタが開発したAI翻訳『T-4OO』は、製薬会社 80 社以上で導入いただいております。 

だったら、製薬・医学関係はT-4OOで決まりと言うことかな。

 

さぁー、ニューラル機械翻訳の間の戦い、どこが制するのか。

将来は、少なくとも医薬品の研究開発や承認申請の分野の翻訳では、人間翻訳者が最初から訳文を作り上げるということはなくなるんじゃね?

機械翻訳の出力を最終的にチェックして納品できる状態に仕上げる人と機械翻訳の性能を維持管理する人しかいらなくなるということかな?

 

 

2019年7月 1日 (月)

AI 時代の医薬翻訳者に求められるスキルとは?

日本全国のイートモファンのみなさん、こんにちは。

Medical Translator NARITAです。

 

2019年も後半に入りました。

Medical Translator NARITAのおっさんは後半戦も体調に注意しながら適度にがんばります。

 

さて、アイエム翻訳サービスさん、今が旬の話題のセミナーを開催するようです。

AI 時代の医薬翻訳者に求められるスキルとは?

 

興味のある方はどうぞ。

 

私はどうしようかな?

ペンディング。

Medical Translator NARITAはそう名乗っているくせに、医学翻訳の仕事はやめました。だったら何者なんだ、ということになりますが、イートモの制作・販売がメインの事業の1つであり、イートモの制作には医薬系の和訳と英訳の両方の作業が必要なので、やはりMedical Translator NARITAと名乗っていいのだろうと思います。

とにかく、医学翻訳の仕事を受注してMTで翻訳やPEをするわけではないので、このようなセミナーを聞いてもしゃーない。翻訳祭も近いし、やめておこう。機械翻訳なんてものは実際に自分で使ってみればわかりますよ。

梅田の開発がどうなっているかはちょっと気になるけど。

 

2019年6月24日 (月)

パラグラフ単位で機械翻訳の性能テスト

イートモファンのみなさん、こんにちは。

Medical Translator NARITAです。

 

昨日ご紹介したエンタカポンの審査報告のような文書

なかなか良質なので、パラグラフ単位で機械翻訳の性能テストを行ってみました。

 

【原文】

General pharmacology
The applicant has adequately investigated general safety pharmacology. Entacapone seems to be devoid of any marked central effect, at least in single dose experiments, which is in agreement with its low penetration into the CNS. Entacapone did not change body temperature in rats, after single (400 and 800 mg/kg) or repeated administration (200 mg/kg bid for 7 days) in contrast to tolcapone and dinitrophenol suggesting that under in vivo conditions entacapone does not uncouple oxidative phosphorylation. No adverse effects of clinical relevance were observed with respect to the cardiovascular, respiratory, renal or gastrointestinal systems. Following intravenous administration (0.003-3 mg/kg) to anaesthetised normotensive rats, no effect on blood pressure, heart rate or ECG was observed. Even high doses of entacapone (300 mg/kg per os) had no effects on ECG in dogs when measured 1 and 24 hours after last dose in a 51-week chronic toxicity study.

 

◆みらい翻訳様
一般薬理
申請者は一般安全性薬理について十分な調査を行っている。エンタカポンは、少なくとも単回投与実験では、中枢神経系への浸透性が低いことと一致して、顕著な中枢作用を示さないようである。トルカポンおよびジニトロフェノールとは対照的に、エンタカポンはラットに単回(400および800mg/kg)または反復投与(200mg/kg,1日2回,7日間)しても体温を変化させなかったことから、in vivo条件下では、エンタカポンは酸化的リン酸化を解除しないことが示唆される。心血管系、呼吸器系、腎系、消化管系には、臨床的に意義のある有害作用は認められなかった。麻酔した正常血圧ラットへの静脈内投与(0.003-3mg/kg)後、血圧、心拍数、ECGへの影響は観察されなかった。51週間慢性毒性試験で最終投与後1時間および24時間に測定したところ、イヌではエンタカポンの高用量(300mg/kg/os)でもECGに影響を及ぼさなかった。

 

◆Google翻訳様
一般薬理学
申請者は、一般的な安全性薬理学適切に調査しました。 エンタカポンは、少なくとも単回投与実験では、中枢神経系への浸透性が低いことと一致する、いかなる顕著な中心的効果もないようです。 エンタカポンは、トルカポンおよびジニトロフェノールとは対照的に、単回投与(400および800 mg / kg)または反復投与(200 mg / kg、7日間)後、ラットの体温を変化させなかった。これは、エンタカポンは酸化的リン酸化を脱共役しないことを示唆する 。 心血管系、呼吸器系、腎臓系または胃腸系に関して臨床的関連性の有害作用は観察されなかった。 麻酔正常血圧ラットへの静脈内投与(0.003〜3mg / kg)の後、血圧、心拍数またはECGへの影響は観察されなかった。 51週間の慢性毒性試験における最終投与の1および24時間後に測定した場合、高用量のエンタカポン(300 mg / kg /経口)でさえイヌのECGに影響を及ぼさなかった。

 

【結果】

みらい翻訳の性能がかなり高いです。この文書を対訳データとして組み入れたのではないかと思うほど出来が良好です。しかも、200mg/kgのように和文ではスペースを除外するという丁寧さ。低レベルのプロ医学翻訳者よりも優れているのではと思うほどです。低レベルの医学翻訳者が淘汰されるのは近いと感じました。でも、訳出に若干長く時間がかかりました。

一方、Google翻訳については、専門的な用語や表現の記述に機械翻訳らしさがあるし、訳抜けもあります。単位の表示のしかたなども雑です。

今回の性能テストはNICT系のみらい翻訳様の圧勝です。

ロゼッタ様のMTの性能を試してみたいところです。

 

2019年6月22日 (土)

久々にMTを検証した

日本全国のイートモファンのみなさん、こんにちは。

Medical Translator NARITAです。

 

しばらくMTの性能を調べていませんでしたので、どの程度良くなったか試してみます。

 

原文

Among 300 subjects who were treated with 20 mg of Drug A at Week 4 of the open-label phase and continued to receive Drug A thereafter, 130 subjects were maintained on 20 mg of Drug A and 170 subjects had their dose increased to 40 mg. 

非盲検期の4週目に薬剤A 20mgが投与され、その後も薬剤Aの投与を受け続けた被験者300例のうち、130例は薬剤A 20mgで維持療法とし、170例では投与量が40mgに増量となった

 

◆みらいトランスレーター様

和訳非盲検第4週に20mgのA剤を投与し、その後もA剤の投与を継続した300例のうち、130例には20mgのA剤を投与し、170例には40mgに増量した。

【英訳】Of 300 subjects who received 20 mg of DRUG A at 4 weeks of the open phase and continued to receive DRUG A thereafter, 40 received maintenance therapy with 20 mg of DRUG A, and the dose was increased to 130 mg in 170 subjects

 

英訳で致命的なミスが出たけど、和訳は素晴らしい。自然だし。「第~週」は「~週目」に変えたほうがいい。「投与~週目」とはよく言うが、「投与第~週」はあまり見かけない。

 

◆Google翻訳様

【和訳】非盲検相の4週目に20mgの薬物Aで治療され、その後薬物Aを受け続けた300の被験者のうち、130の被験者が20mgの薬物Aで維持され、170の被験者が40mgに増量された。

【英訳】Of the 300 subjects who received 20 mg of drug A on the 4th week of the open-labeling phase and continued to receive drug A thereafter, 130 patients underwent maintenance therapy with 20 mg of drug A, and 170 doses were 40 mg Increased to

 

和訳は若干の不自然さがあるけど、解釈には大きな問題なし。英訳は最後がめちゃくちゃになっているけど、これだけめちゃくちゃだとPEでエラーを見つけやすい。むしろ、「患者」と特定していないのにpatientsがどうして出現するのかが問題。

 

今回はNICT系の代表としてみらいトランスレーターを試しました。

上記の例に限って言えば、NICT系の方がGoogle翻訳よりも良質なアウトプットでした。

組み込まれている対訳コーパスの質がみらいトランスレーターのほうが高いのかなという印象を持ちました。

まだまだ改善の余地はありますけどね。

イートモ対訳コーパスを組み込めばかなり改善されるでしょう。w

ま、冗談は置いといて、これだけMTの質が良くなると実際の翻訳仕事で使わないわけにはいかないと思います。

 

【現時点の結論】こんな単純明快な文章もエラーなく翻訳できないようでは、MTに翻訳仕事を任せられません。MTが一人前のプロの医学翻訳者になるまで、MTよりも優秀な人間翻訳者がMTに付き添って教え込む必要があります。そんな人間翻訳者がいればいいけど。

 

医薬分野にMTが導入される流れは変わらないでしょう。

医学翻訳フリーランサーのみなさんはMT+CATツールに淘汰されないで、MT+CATツールを利用する側に入るように実力をつけてください。

 

伸びている翻訳事業者とコミュニケーションをとっておくことも大事です。 

 

2019年6月14日 (金)

ロゼッタが開発したAI翻訳『T-4OO』は、製薬会社 80 社以上で導入いただいております。

ロゼッタさん、T-4オーオーを武器にがつがつ攻めています。

一方、翻訳センターさんはちょっとMTに慎重すぎなんじゃないかと。

Rozeta2

T-4オーオーが製薬会社80社以上に導入ってあるけど、製薬協の加盟会社は72社しかないんだけど

MTは翻訳者のための道具というよりも、翻訳会社が取引先を獲得するための営業の切り札という意味のほうが大きいんじゃね?

とりあえずMTを武器に入り込んで、あとはその場その場で何とかする。

性能を見極めるとか、ルール整備なんて言っている間にロゼッタさんに全部取られちゃうんじゃね。

株価に反映されている。

時価評価、6倍近くの差になっていますよ。

 

プロの医学翻訳を目指す人も一定レベルになったら、基礎を固めるとか知識を充実させるとかなんとか言っていないで、翻訳会社にがつがつアプローチしたほうがいいと思うけど。

そういうものは仕事を始めてからが本番です。

5年も10年も石橋をたたいていたら、そのうち還暦になっちゃうよ。w

 

 

2019年6月11日 (火)

AIはライバルでなく道具=翻訳センターの二宮俊一郎社長

AIはライバルでなく道具=翻訳センターの二宮俊一郎社長

 

Honyakuctr

 

新社長さん、49歳か。若いね。

翻訳業界、特に医薬系のためにがんばっていただきたいです。

MTに対して冷静ですな。

ロゼッタさんのようにMTに前のめりになっていない気がします。

 

医学翻訳業界、激動の時代。

どうなるのか楽しみじゃわい。

 

 

ロゼッタと武田薬品工業、AI翻訳の共同開発を開始

ロゼッタと武田薬品工業、AI翻訳の共同開発を開始
~ 製薬業界におけるグローバル事業展開を促進 ~

 

Rozeta

 

ロゼッタが開発したAI翻訳『T-4OO』は、製薬会社 80 社以上で導入いただいております。 

 

既に出来上がっているのに、

武田薬品と今から何を共同開発するというの?

武田薬品専用のMTを開発するってこと?

第一三共との共同開発はどうなっているの?

 

よくわからないけど、

ロゼッタ、がんばれ。

政府系MTに負けるな!

 

より以前の記事一覧

フォト

イートモ

  • 7月15日現在の収録対訳件数
    42,928件(イートモ6.3から186件の増量) 医学翻訳の友 イートモ・トップ|なりた医学翻訳事務所
サイト内検索
ココログ最強検索 by 暴想