機械翻訳(MT)

2019年9月14日 (土)

イートモ対訳サンプルの見え方を修正しました

イートモファンのみなさん、こんにちは。

Medical Translator NARITAです。

 

イートモ対訳のサンプルをときどき提示しているのですが、右端が欠けていて見えにくくなっていたようです。

いくつかを修正しました。

イートモで実際に検索したときの見え方については、利用サンプルをご覧ください。

 

ところで、何度も書いていますが、医薬系の翻訳ビジネスでも機械翻訳と翻訳支援ツールが欠かせない時代が来ています。

そこで大切になるのが対訳コーパス。

先日も書きましたが、イートモが対訳コーパスの役割も果たすように改良しているところです

 

イートモの特長の1つに、

・対訳はセンテンスベースで主観を除いて作成していますので、非常にわかりやすいです。

と記載しています。

 

抽象的な表現ですが、要は英文と和文の間で相互利用できるような対訳資料になるように編集しています。

英文と和文の間で相互利用できるようになっていて初めて対訳資料としての価値が生まれると考えています。

「英文→和文」あるいは「和文→英文」の一方通行の対訳資料では機械翻訳+翻訳支援ツールの時代になんとも使いにくい。

若干不自然なところがあるかもしれませんが、機械翻訳+翻訳支援ツールの時代に利用しやすいように、イートモは英文と和文が可能な限り対応するように作成しています

実際の医学翻訳仕事では、文書のタイプや前後の文脈に応じて適当に改変して利用してくださいね。

 

製薬会社や翻訳会社にはイートモを販売していません

フリーランス医学翻訳者の期間が長かったMedical Translator NARITAとしては、同じフリーランス医学翻訳者の皆さんさんにはイートモで武装してもらい、豊かな生活をおくってもらいたいと思うからです。

翻訳会社なんてのはいつ消えてもおかしくないです。

今取り引きのある翻訳会社がいつ消えてなくなってもいいように、医学翻訳フリーランサーのみなさん、医学翻訳業界全体を仕事場とできる地力をイートモでつけましょう

 

 

2019年9月12日 (木)

イートモ対訳はセンテンスベースで主観を除いて作成しています。

日本全国のイートモファンのみなさん、こんにちは。

Medical Translator NARITAです。

 

イートモユーザーのasaさんのブログ

イートモを活用くださり、ありがとうございます。

 

さて、キイトルーダという有名な抗癌薬の対訳資料を紹介してくださっています。

今はこのような資料が公開されて、簡単に手に入るから、医学翻訳の仕事への参入が楽になっています。

 

ほんの一部だけですが、出来具合を見てみました。

 

英語原文 和訳

1.2 Non-Small Cell Lung Cancer

KEYTRUDA is indicated for the treatment of patients with metastatic non-small cell lung cancer (NSCLC) whose tumors express PD-L1 as determined by an FDA-approved test with disease progression on or after platinum-containing chemotherapy. Patients with EGFR or ALK genomic tumor aberrations should have disease progression on FDA-approved therapy for these aberrations prior to receiving KEYTRUDA [see Clinical Studies (14.2)].

This indication is approved under accelerated approval based on tumor response rate and durability of response. An improvement in survival or disease-related symptoms has not yet been established. Continued approval for this indication may be contingent upon verification and description of clinical benefit in the confirmatory trials.

1.2 非小細胞肺癌

KEYTRUDAは、白金製剤を含む化学療法後に疾患が進行した、FDAが承認した診断薬により腫瘍細胞がPD-L1陽性と判定された転移性の非小細胞肺癌の治療を適応とする。EGFR遺伝子変異又はALK遺伝子変異を有する患者については、KEYTRUDAの投与前にこれらの変異に対するFDAが承認した治療後に疾患が進行した患者とする[臨床試験(14.2)参照]。

本適応は、抗腫瘍効果及び効果の持続性に基づき、迅速承認を取得した。生存期間及び疾患に関連する症状の改善は確立されていない。本適応の継続的な承認は、検証試験での臨床効果の確認及び記述を条件とする可能性がある。

 

良い和訳だとか、悪い和訳だとか言うつもりはありません。

 

ただ、近い将来、機械翻訳と翻訳支援ツールを駆使して医学翻訳の仕事をしていくことになるでしょうから(あるいは既になっている?)、英文と和文が可能な限り対応していることが求められると思います。

英語原文を和訳して、和訳されたものを英訳すると、おのずと英語原文に近いものが出来上がる状態。

そうでないと、機械翻訳と翻訳支援ツールの時代で活躍する対訳資料にはならないのではないか。

イートモの特長の1つに、

・対訳はセンテンスベースで主観を除いて作成していますので、非常にわかりやすいです。

と記載しています。

 

抽象的な表現ですが、要は英文と和文の間で相互利用できるような対訳資料になるように作成しているということです。

また、そうなるように見直し(修正と差し替え)を行っています。


英訳に利用されることを想定しながら、対訳化するのが半端なく大変な作業なのです。

 

NICTさん、以前に当面の目標としては1億文の翻訳データの集積を目指しています。」と言っています。

医学翻訳分野で言えば、製薬会社などの利用企業や低レベルの翻訳者にはインパクトのあるメッセージかもしれません。

 

今はICHガイドラインなど対訳になっている文書はものすごく多いです。

翻訳会社や製薬会社には大量の「過去の翻訳資産」が眠っているし。

特許関係でもパテントは対訳になっているようです。

ミ○ク○もいっしょに機械的に対訳にするんだったら、1億文だろうが、翻訳データを増やすのは簡単だろうよ。

でも、問題は中身です。

何億文あろうが、ちゃんと中身を検証しないと、ゴミがゴミを生んで大変なことになるとMedical Translator NARITAは心配になるわけです。

余計なお世話でした。

 

 

2019年8月24日 (土)

「くりんご」ですと

医学翻訳フリーランサーのみなさん、こんにちは。

Medical Translator NARITAです。

 

「くりんご」って知っていました?

 

ロゼッタさんのT-4OOを採用したものAI 自動翻訳「Qlingo」らしいっす。

T-4OO と Qlingoの違いが何なのか、Medical Translator NARITAのおっさんにはよくわかりません。

Medical Translator NARITAが以前にお試しで使ったメムソース等との違いもよくわかりません。

「くりんご」とメムソースの性能の差は「くりんご」を実際に使ってみないとわかりません。

 

精度は別の機械翻訳エンジンよりもbetterとアピールしています。

 

▼ 原文

This agreement (“Agreement”) is dated May __, 2017 (“Effective Date”), and is between ABC International, a California nonprofit public benefit corporation (“ABC”), and XYZ Corp., a Japanese corporation (“Client”).

▼ 訳文

【某社製品】

この契約(「契約」)は、2017年5月5日(「発効日」)であり、カリフォルニアの非営利公益法人であるABC Internationalと日本の会社であるXYZ Corp.(「クライアント」)の間のものです。 )

【T-4OO】

本契約(「本契約」)は、2017年5月 日(「発効日」)付けで、カリフォルニア州の非営利公益法人ABC International(「ABC」)と日本の法人であるXYZ Corp.(「クライアント」)との間で締結された。

【Qlingo】

本契約(「本契約」)は、2017年5月(「発効日」)に締結され、カリフォルニア州の非営利公益法人ABCインターナショナル(「ABC」)と日本法人XYZ Corp.(「クライアント」)との間で締結される。

 

ポストエデットを入れるとすれば、上の例を見る限り、納品するのにかかる時間と労力に大きな差はないでしょう。

 

2019年8月23日 (金)

Cross-Transer

Cross-Transer、面白い。

医学翻訳ブログで以前にちょこっと検証したようです。

忘れていました。

 

■原文

Drug A was administered as either a single dose or as two divided doses given 12 hours apart, with a 7-day washout period between treatments.

これを和訳させてみます。

 

■翻訳(たぶん従来型)

処置の間の7ウオッシュアウト期間Aどちらとしてでも一回の服用施された2つ分かれた服用として12時間間隔で与えられました

 

■ニューラル機械翻訳(β版)

薬物Aは単回投与または12時間間隔で2回に分けて投与され、7日間の洗浄期間がある。

 

他にもいくつかの機械翻訳に和訳させてみました。

結果は以下のとおり。

 

原文 Drug A was administered as either a single dose or as two divided doses given 12 hours apart, with a 7-day washout period between treatments.
Cross-Transer 従来型機械翻訳 処置の間の7ウオッシュアウト期間Aどちらとしてでも一回の服用施された2つ分かれた服用として12時間間隔で与えられました
Cross-Transer ニューラル機械翻訳 薬物Aは単回投与または12時間間隔で2回に分けて投与され、7日間の洗浄期間がある。
みらい翻訳 薬剤Aを単回投与または12時間間隔で二回に分けて投与し、投与間に7日間の休薬期間を設けた。
みんなの自動翻訳 薬剤Aは、1回の用量または12時間間隔で2回の分割用量として投与されたが、7日間の洗浄期間は7日間であった。
Google翻訳 薬物Aは、単回投与または12時間間隔で2回に分けて投与し、治療の間に7日間のウォッシュアウト期間を設けました。
Weblio 翻訳 処置の間の7日のウオッシュアウト期間で、薬Aはどちらとしてでも一回の服用を施されたか、2つの分かれた服用として12時間間隔で与えられました。
   

 

みらい翻訳が抜きんでています。

かなりのものです。

ロゼッタさんのT-4OOも同等のレベルのものを出せるのかな?

 

Google翻訳もなかなかです。

原文が明瞭だと機械も翻訳しやすいのでしょう。

 

それらに比べて、みんなの自動翻訳、出来が悪い。

あいかわらずすっとぼけた翻訳しているな。

民間企業が優れた翻訳エンジンを出しているだから、何も国の研究機関がやらなくてもいいんじゃねーの?

 

【医学翻訳ソフト】MED-Transer V16 パーソナル for Windows(送料無料)

日本全国のイートモファンのみなさん、こんにちは。

Medical Translator NARITAです。

 

だいぶ前からヤフオクに出ています。

 

Medtrans

 

定価の半分以下まで下がっているようです。

 

クロスランゲージさん、「医学分野に特化してチューニングした翻訳エンジン」とあるけど、自社開発したものなのでしょうか?

ステッドマンをはじめいろいろな辞書が入っているようですが、単語ベースのものが何万語入っていてもねーー。

やはり肝は翻訳メモリを充実させることのようです。

「過去の翻訳資産」というやつ。w

 

でも、「過去の翻訳資産」たる翻訳メモリを作るにしても利用するにしても地力がないとどうにもならないんですよ。

 

【お願い】

イートモをオークションに出さないように!ww

イートモの対訳を翻訳メモリとして翻訳支援ツール等に入れている方がいるかもしれません。ルールを守って個人的に利用するのはオッケーですが、イートモはほぼ半年ごとにアップデートしているので、推奨できません

 

Dsc_0073

 

よろしくね。

 

2019年8月22日 (木)

ロゼッタ-MT事業の新規受注は堅調に拡大

通期で営業利益9.1億円と予想ということは、

翻訳センターを追い抜く可能性もある?

 

医薬系ではロゼッタさんのMTをどこが買っているんだろう?

 

翻訳センターの第1四半期の営業利益は0.88億円だから、単純計算で通期で約4.0億円。

通期予想は10.3億円で据え置いているけど、もしかして逆転もあるのかな。

 

Roz822

 

でも、いちよしは当たらなくて、昔、痛い目にあったからなー。

 

2019年8月15日 (木)

「既存のイートモ対訳の見直し」と「新規イートモ対訳の作成・収録」

日本全国のイートモファンのみなさん、こんにちは。

Medical Translator NARITAです。

 

西日本には台風が来ているようです。

Medical Translator NARITAも先週、大分では台風8号でえらい大変な目にあいました。

かろうじて大分空港に入って、ぐったりしているところ。

 

Img_1380_20190815093101

 

さて、先日から3回目のイートモ対訳全体見直しに入っています。

新規対訳の作成・収録と同時進行です。

全体見直しが8、新規作成が2の比になっているので、5:5の比にしようと思っているのですが、不良対訳が気になって、見直しが優先してしまいます。

 

機械翻訳事業者は「過去の翻訳資産」を利用して機械翻訳で儲けようとしているのでしょうけど、

医学翻訳ブログで何度も書いているように、

翻訳会社で品質管理をやっている人ならわかるでしょうが、

「過去の翻訳資産」にはゴミがたくさん含まれていますよ。

http://i-honyaku.cocolog-nifty.com/blog/2019/07/post-0b66b4.html

http://i-honyaku.cocolog-nifty.com/blog/2018/11/post-c931.html

http://i-honyaku.cocolog-nifty.com/blog/2018/11/post-cbbc-1.html

http://i-honyaku.cocolog-nifty.com/blog/2017/06/post-89d2.html

 

特にインターネットが普及する前の翻訳成果物なんてゴミだらけ。

ゴミがゴミを生んで収拾付かなくなるぞ。

大きなお世話ですけど。

 

イートモは独自路線でまいります。

 

2019年7月15日 (月)

医学翻訳の勉強

日本全国のイートモファンのみなさん、こんにちは。

Medical Translator NARITAです。

 

Medical Translator NARITAはそこらへんの甘々翻訳スクールでへなちょこテキストを勉強するだけでは稼げる医学翻訳者になれないと断言しており、先日、それに代わる1つの勉強のしかたをご紹介しました

大変な努力がいります。医学翻訳で稼げるようになる、生活できるようになるのは甘くないよ。趣味・暇つぶし系の人は好きなようにどうぞ。

 

もう1つ医学翻訳の勉強をご紹介しましょう。

イートモサイトの「特徴」の項に以下のように記載しています。

医薬品の非臨床文書(CMC、毒性、薬理、薬物動態等)、治験実施計画書、治験薬概要書、コモンテクニカルドキュメント(CTD)、治験総括報告書、照会事項並びその回答、審査報告、添付文書など、医薬分野で翻訳依頼される中心的な文書について約42,000件の対訳を収録しています。

めったに仕事依頼されない医薬系翻訳の指導者がよく勧めるNEJMのアブストラクトをやってもしょうがないのです。仕事に直結しないから。

 

ま、上記のうち翻訳しやすい「添付文書」を見てみましょうか。

例えばオプジーボの添付文書

検索すれば簡単に見つかります。

 

Optivo package insert

Google検索すれば、このようにOptivoの英語版添付文書がたくさんみつかります。

これらの英語版添付文書を参照しながら、Google検索、ライフサイエンス辞書、イートモなどを使って実際にオプジーボの添付文書を読解し、訳出するトレーニングです。和訳と英訳の両方のトレーニングになります。あくまでもイートモは参考資料の1つです。万能ではありません。

特にこの英語版添付文書は利用価値が高いようです。

なお、副作用についてはご存じのようにMedDRAに準拠しますから、訳出不要です。機械翻訳化されるのは間違いなしです(すでになっているのかな?)。

 

添付文書のように定型的な文書には特に機械翻訳が導入されやすいと思います。

そこで、評判が良いと言われているみらいトランスレーターの実力のほどを試してみました。

上記のオプジーボ添付文書の一部をかけました。

 

イピリムマブ(遺伝子組換え)又はBRAF阻害剤を含む化学療法歴を有する根治切除不能なIII期/IV期又は再発の悪性黒色腫患者405例(本剤群272例、化学療法(ダカルバジン又はカルボプラチンとパクリタキセルとの併用)群133例)を対象に、化学療法を対照として本剤3mg/kgを2週間間隔で点滴静注したときの有効性及び安全性を検討した。主要評価項目である奏効率(RECISTガイドライン1.1版に基づく中央判定によるCR又はPR)について本剤が投与された最初の120例を解析対象集団として中間解析を行った結果、本剤群で31.7%(95%信頼区間:23.5〜40.8%、2014年3月10日データカットオフ)であった。なお、事前に奏効率の閾値は設定していなかった。もう一つの主要評価項目である全生存期間(中央値[95%信頼区間])について182例のイベント(死亡)数にて中間解析を行った結果、本剤群で15.47[12.39〜NE*3]ヵ月、化学療法群で13.67[11.50〜NE*3]ヵ月であり、本剤は化学療法に対し統計学的に有意な延長を示さなかった(ハザード比0.93[95%信頼区間:0.68〜1.26]、p=0.6299[層別log-rank検定]、2014年11月12日データカットオフ)。

 

「本剤」はオプジーボであることは明白なので、以下のようにプリエデットしました。

 

イピリムマブ(遺伝子組換え)又はBRAF阻害剤を含む化学療法歴を有する根治切除不能なIII期/IV期又は再発の悪性黒色腫患者405例(オプジーボ群272例、化学療法(ダカルバジン又はカルボプラチンとパクリタキセルとの併用)群133例)を対象に、化学療法を対照としてオプジーボ3mg/kgを2週間間隔で点滴静注したときの有効性及び安全性を検討した。主要評価項目である奏効率(RECISTガイドライン1.1版に基づく中央判定によるCR又はPR)についてオプジーボが投与された最初の120例を解析対象集団として中間解析を行った結果、オプジーボ群で31.7%(95%信頼区間:23.5〜40.8%、2014年3月10日データカットオフ)であった。なお、事前に奏効率の閾値は設定していなかった。もう一つの主要評価項目である全生存期間(中央値[95%信頼区間])について182例のイベント(死亡)数にて中間解析を行った結果、オプジーボ群で15.47[12.39〜NE*3]ヵ月、化学療法群で13.67[11.50〜NE*3]ヵ月であり、オプジーボは化学療法に対し統計学的に有意な延長を示さなかった(ハザード比0.93[95%信頼区間:0.68〜1.26]、p=0.6299[層別log-rank検定]、2014年11月12日データカットオフ)。

 

みらいトランスレーターに英訳させた結果は以下のとおり。赤字が修正を必要とする部分です。

 

405 patients (272 in the Opdivo group and 133 in the Chemotherapy (Combination of dacarbazine or carboplatin with paclitaxel) group) with previously unresectable stage III/IV or recurrent malignant melanoma who had received ipilimumab (genetic recombination) or BRAF inhibitor chemotherapy were studied for the efficacy and safety of intravenous infusion of Opdivo 3 mg/kg at 2 week intervals as a control of chemotherapy. The primary endpoint, response rate (Central CR or PR according to RECIST guideline 1.1), was 31.7% (95% confidence interval, 23.5 ~ 40.8%; data cutoff March 10, 2014) in the opdivo group in an interim analysis of the first 120 patients treated with the drug in the analysis set. The threshold for response rate was not established in advance. An interim analysis of the other primary endpoint, overall survival (Median [95% confidence interval]), with the number of events (death) in 182 patients showed that Opdivo was 15.47 [12.39 to NE * 3] months versus 13.67 (Hazard ratio 0.93 [95% confidence interval: 0.68 ~ 1.26], p = 0.6299 [stratified log-rank test]; November 12, 2014 data cut-off) months in the chemotherapy arm, and Opdivo did not show a statistically significant prolongation of chemotherapy [11.5 to NE * 3].

 

読み取りが全然ダメ。これほど読み取りができないとは意外でした。

これだけ読み取りが悪いと、専門用語や数字は利用できて多少の時短にはなるが、機械翻訳にかけるメリットはあまりないな。

医薬系の文書の中でも最も読解しやすい文書なのに、他の読解が困難な医薬系文書だったらどうなる?

まだまだ人間翻訳者の出番はありそうです。

正確に言うと、機械翻訳のエラーを瞬時に特定し、機械翻訳による訳文をできるだけ利用し、最短で納品可能な商品に仕上げられることができる翻訳者だけが必要とされる、ってこと。

 

2019年7月14日 (日)

『教師データ』

みなさん、こんにちは。

Medical Translator NARITAです。

 

『教師データ』

㈱翻訳センターのフィスコレポートに出ています。

 

 Kyoshi

 

フィスコがテキトーに作った造語かと思ったら、機械学習関係の専門用語のようです。

teaching data

失礼しました~w

 

お手本の翻訳ってこと?

過去の翻訳のビッグデータ(「過去の翻訳資産」とやら)を使おうとしているんだろうけど、ゴミが大量に含まれているかもしれないから、最低でも一度はたな卸ししたほうがいいんと思うよ。

Gomi

 

2019年7月13日 (土)

ロゼッタさん、機械翻訳事業にものすごく前のめり

決算説明資料にはほぼ機械翻訳事業のことしか書いてないよ。w

 

さらには、

そして戦後、あたかも「英語を話せるようになるのが日本人の当然の義務」のように語られた
奇妙な時代も、まもなく終わろうとしています。
「日本を言語的ハンディキャップの呪縛から解放する」という
弊社のミッションはもうゴールが見えました。

その次は何をするか?
ロゼッタのミッション第2章を決定しました。
「人類を単純作業の苦役的労働から解放する」
です。
生活するために人生の大半の時間を犠牲にして単純作業の辛い労働を嫌々行うという、将来から見れば
「バカげた非人間的な時代」を終わらせるのです。

 

おおー、いいぞ。いけいけー。

 

翻訳業界の最先端はここまで来ているのに、一方で、週1回とか月1回とか、1年も2年も翻訳スクールで講師の授業聞いて、数行を訳して添削してもらうという何十年も昔からのスタイルで翻訳のプロになろうとしている人もいる。

何十年も昔ならともかく、検索エンジンはあるし、医薬や英語・翻訳の資料もたくさん入手できる時代に翻訳スクールに行く意味が分からん。

もう永遠に追いつけないんじゃね?

 

何度も書いていることですが、医学翻訳で稼ごうと思ったら、医学翻訳のプロの壁を一気に突破して、既存の医学翻訳者を一気に追い抜いて、機械翻訳を使う側にならないと。

医学翻訳の仕事を辞めた者が無責任に言っているだけです。

 

より以前の記事一覧

フォト

イートモ

  • 9月1日現在の収録対訳件数
    43,485件(イートモ6.3から743件の増量) 医学翻訳の友 イートモ・トップ|なりた医学翻訳事務所
サイト内検索
ココログ最強検索 by 暴想