機械翻訳(MT)

2018年6月17日 (日)

"If a patient"ではじまるセンテンス

治験実施計画書でよくみかける以下のようなセンテンス

If a patient appears to be lost to follow-up, the investigator must continue to contact the patient over the remaining duration of the study, at regular intervals, by phone and in writing.

特に"If a patient appears to be lost to follow-up,"の和訳がちょっと難しい。

Google翻訳様にかけると、

患者がフォローアップに迷っているように見える場合、研究者は研究の残りの期間にわたって、定期的に、電話で、書面で患者と連絡を取り続ける必要があります。

みらい翻訳様のお試し翻訳にかけると、

患者がフォローアップに迷うようであれば、治験責任医師は、定期的に、定期的に、電話および書面で患者との間に継続的に連絡をとる必要がある。

MTとしては「患者が」の出だしにならざるを得ないのかもしれません。

でも、「患者が」で書き始めると日本語としてぎこちなくなります。

そこで、イートモでは思い切って、以下のような対訳にしています。

追跡調査不能と思われる患者がいる場合には、治験責任医師は残りの試験期間にわたって電話及び書面によって定期的に当患者と連絡を取り続けなければならない

このように、

「~の患者がいる(いた)場合には」

あるいは

「~の患者については」

としてみてはどうでしょう?

前後の文脈に考慮して、可能ならば、和訳の際に利用してみてください。

逆に、「~の患者がいる(いた)場合には」を英訳する際には、"If a patient"で英文を書き始めることができるということです。

追跡調査不能と思われる患者がいる場合には、治験責任医師は残りの試験期間にわたって電話及び書面によって定期的に当患者と連絡を取り続けなければならない

これをGoogle翻訳様で英訳すると、

In the case of patients suspected to be unable to follow-up, the investigator must keep in touch with the patient on a regular basis by telephone and written over the rest of the trial period

まずいですね。

みらい翻訳様のお試し翻訳では、

If there is a patient who appears to be unable to follow up, the investigator must keep contact with this patient on a regular basis by telephone and in writing over the remaining period

なかなかGoodだけど、「残りの試験期間」の「試験」の意味がどうして英文に反映されないのか。訳抜けの問題が解決されないと、原文照合によるPEが必須ということになる。

2018年5月 5日 (土)

MTが本格的に実用化?

翻訳業界で本格的に実用化されている様子。

ロゼッタさん

https://www.jukkou.com/t4oo/

https://www.traai.com/landing/gloze?utm_source=gloze

翻訳センターさん

https://www.honyakuctr.com/compath/

十印さん

https://to-in.com/MT

川村インターナショナルさん

https://www.k-intl.co.jp/552389

主だった翻訳会社は機械翻訳(MT)サービスを始めているようです。

さらには、ローズ三浦さんがブログで紹介してくださったように、医薬翻訳専門のアスカコーポレーションさんもMTを始めた様子。

http://www.asca-co.com/cat31/20180502.html

Asca_2

工程3のMTよりも劣る人間翻訳者は必要なくなるということだ。

http://i-honyaku.cocolog-nifty.com/blog/2018/04/post-e218.html

工程5で必要とされるスキルを速く手に入れないと生き残れないということだ。

医薬系翻訳で稼げるプロを目指す人は、のんびりと英語の勉強を楽しいんでいる場合じゃないと思います。すでに医薬系翻訳のプロとして活躍している人に追い付くには、勉強じゃなくて、正しい方向性の実戦訓練が必要です。それでしかプロの壁は超えられない。

http://i-honyaku.cocolog-nifty.com/blog/2018/04/22000-c442.html

http://i-honyaku.cocolog-nifty.com/blog/2018/04/jtf-d6c7.html

http://i-honyaku.cocolog-nifty.com/blog/2018/03/fed.html

http://i-honyaku.cocolog-nifty.com/blog/2018/02/post-622f.html

http://i-honyaku.cocolog-nifty.com/blog/2018/02/post-b650.html

いくつか調べてみたけど、やはり最終的には人間によるチェックが必要になるようです。

http://i-honyaku.cocolog-nifty.com/blog/2017/06/mt-f606.html

http://i-honyaku.cocolog-nifty.com/blog/2017/06/mt-e2dc.html

http://i-honyaku.cocolog-nifty.com/blog/2017/06/post-86ed.html

MTを動かすのに必要な医薬系翻訳者になればいいのだ。

MTスキル+高レベル医学翻訳スキルの人材は翻訳会社の業績を大きく左右する存在になる予感。

翻訳会社としては最大の経費である人件費を削減して、つまりMT導入で翻訳者を減らして儲けたいところだろうが、そういかんぞ!

2018年4月23日 (月)

アイちゃん やるね~

ロゼッタさんが運営している機械翻訳 「アイちゃん」

https://www.traai.com/landing/main

サイトに掲載されている和訳サンプルを見ると、かなり良い出来具合いです。

和訳サンプルを見る限り、機械翻訳は和訳の面で賢くなっていると言えると思います。

文書全体を通じてこのレベルの和訳をされたら、MTよりもレベルが低い和訳要員は必要なくなります。

この和訳サンプルよりも良い和訳をきわめて短時間に作成できない人は、医薬系和訳の道はあきらめたほうがいいです。

和訳の勉強のしかたを抜本的に変えるか、

医薬系英訳に進むか、

MTオペレーターになるか・・・。

医薬系和訳なんて翻訳スクールに何十万もかけてあらためて勉強する必要なんてナイナイ。自力で調査を重ねていくしかないのだ。だいたい、医薬系和訳は単価が安すぎて食っていけないよ。
http://i-honyaku.cocolog-nifty.com/blog/2018/04/post-d802.html

 でも、いくらMTが高性能になっても、医薬品の承認申請資料などは人間によるチェックが必要ですから、MTに初めに和訳させて、人間翻訳者がポストエデット(PE)して納品というのが近い未来の医薬系和訳の仕事になるのかもしれません。和訳サンプルを見る限り、医薬系和訳ではMT+PEにより、かなり労力と時間が節約されるような気がします。

ロゼッタさん、力、上げたね。

ロゼッタさんとしては「アイちゃん」から有料サービスに誘導したいところなんでしょう。

「アイちゃん」って何だろうとおもったら、AIから来た「アイ」のようです。

他にも、

業界初、人工知能を活用した医薬業界向け自動翻訳システム、アストラゼネカと情報通信研究機構(NICT)で共同開発を実施

https://www.astrazeneca.co.jp/content/az-jp/media/press-releases1/2018/2018041701.html

なんていうニュースもあります。

税金が投入されているんだから、ちゃんとやってくれよ!

2018年3月14日 (水)

おかしいと思ったよ

ポジショントークらしいです。

自分たちの仕事と給料を確保したいためといったところかな。

http://transformation-technologies.livedoor.biz/archives/65843365.html

おかしいと思ったんだよね。

どう考えても無理がある。

少なくとも医薬系の翻訳に適用するに無理がある。

1日アクセス数100~150人らしいw

https://mt-auto-minhon-mlt.ucri.jgn-x.jp/

Googleに一気に抜かれて、焦って、自分たちもがんばっていますアピールと言ったところでしょうか。

セミナー会場に電車で行って、帰りも満員電車でかえったら(目黒駅からタクシーにしたけど)、風邪ひいちゃったよ。

えらい目にあっています。

サラリーマンに対する免疫がなくなったのかなw。

冗談言っている場合じゃなくて、熱がもっと上がって、意識もうろうとしてきたので、インフルエンザを疑って、またまた病院を受診してきました。

結果は、幸か不幸か、インフルエンザ陰性。

結局、抗生物質と解熱薬が追加処方されて、自宅療養中。

加齢に伴い体調や体力の衰えを感じます。

Medical Translator NARITAは亥年生まれのせいか、猪突猛進なんです。

これまでは行けるところまで走る、倒れるまでやる、倒れてもやる、のスタイルでした。

若いころはそれでよかったけど、注意しないといけないと痛感しています。

2018年3月10日 (土)

機械翻訳(MT)の話になると、いつも疑問に思うこと

機械翻訳(MT)の話になると、いつも疑問に思うこと。

MTには対訳コーパスが必要だということはわかります。

情報通信研究機構(NICT)も翻訳バンクというものを作って、民間企業や政府機関に対訳の無償提供を求めている様子です。

奈良の大仏に匹敵する国家的プロジェクトなので、協力してほしいとのことですw。

http://h-bank.nict.go.jp/index.html

先日のJTF翻訳セミナーでは、

当面は、翻訳データの品質よりも量を増やすことに力を入れたい。対訳コーパスを高品質に維持することは訳文の品質のためにも大切なので、ある程度の量が確保できたら、翻訳データのセレクションに取り組みたい。

とかなんとか、そんな意味のようなことを言っていた。

http://h-bank.nict.go.jp/about.html

「当面の目標としては1億文の翻訳データの集積を目指しています。」

そんな膨大な量の翻訳データをだれが品質チェックするのだろう?

NMT自体に品質チェックする機能があるの?

情報通信研究機構(NICT)の内部で品質チェックをやるの?

それとも外部の翻訳会社にでも依頼するのだろうか?

外部の翻訳会社に依頼する場合、翻訳データの無償提供と同様、品質チェックも無償で依頼するのだろうか?

別に自動で品質チェックするシステムでも作るのだろうか?

んー、わからない。

ゆきちゃん、わかる?

Pet8

イートモ対訳データの場合ですけど、以下のフローチャートに示すように、現在は④の工程を強化しています。

いつも書いているように、イートモ対訳の見直し作業ということです。

イートモが特に医薬系の英訳でパワーを発揮するようにと考えています。また、まったく白紙ですが、将来的にMTの対訳コーパスに利用される可能性がないわけではありませんので、そのためにも④の工程は大事だろうと。

①から③までの工程、つまり対訳を作成するのは大変な作業ではありません。8割レベルの対訳でいいなら大量に作れます。大変なのは④の工程です。Medical Translator NARITA自身が痛感していますから。

Iitomoflowchart

情報通信研究機構(NICT)が、後々、品質をチェックする予定だよ~なんて言っているけど、大変さをわかっているのかな?

2018年3月 8日 (木)

JTF翻訳セミナー 行ってきた

ニューラル翻訳(NMT)の実体とその周囲の実態に迫る ~NMTとの良い関係の確立を~(通算第199回)

難しいことはわからないけど、

中長期的には、

産業翻訳にはMTが導入され、

翻訳者のメインの仕事はPE(Post Edit)、

という方向に進むという雰囲気でした。

MTから出力されたものをPEするというが翻訳者の仕事ということになるのでしょうか。

手書きからパソコン入力に移行したときのような劇的な変化にはないような気がしますが、どうなんでしょう。

いずれにしても、対訳コーパス(翻訳バンク)の品質に大きく左右されることは間違いないようです。

メディカル分野でも某製薬企業や某政府機関が対訳コーパスに協力する方向にあるようですが、あのガラクタのような翻訳データがMTに組み込まれたら、PEは相当苦労しそうだなw。

Garakuta

やはり、Medical Translator NARITAが以前にも書いたように、対訳コーパスの品質管理がカギになる。

http://i-honyaku.cocolog-nifty.com/blog/2017/10/post-e596.html

今後の動きを見て、イートモはGoogle側に協力するか、NICT側に協力するか、それともどちらにも協力しないかを決めたいと思います。

MT出力物をPEするという流れになったとき、医学翻訳者の育成・養成はどのようになるんだろう? Medical Translator NARITAはそちらのほうが気になります。

2018年3月 2日 (金)

日本経済新聞 朝刊

AI通訳、技術開放で磨く
総務省、五輪にらみ企業に データ蓄積・精度向上

2018/3/2付

情報元

日本経済新聞 朝刊

 総務省は人工知能(AI)による同時通訳システムを活用した企業の製品開発を後押しする。同省所管の情報通信研究機構(NICT)が持つ同時通訳の基幹技術の民間開放(総合2面きょうのことば)を進め、初期投資を抑えて実用化に乗り出しやすくする。製品化した各企業から蓄積データを集め、グーグルなど米IT(情報技術)大手企業も開発を急ぐAI通訳技術を官民で育てる狙いがある。

 同時通訳システムの普及を促すことで、2020年の東京五輪・パラリンピックに向けて訪日外国人との「言葉の壁」をなくす。

 NICTの翻訳技術は観光に重点を置いているのが特徴だ。17年6月から深層学習(ディープラーニング)を活用して改善し、防災や買い物などの特定分野では9割前後の精度を誇る。グーグル翻訳よりも自然な表現になることも多い。

 すでに実用化したアプリ「ボイストラ」では31言語の文字の翻訳に対応し、英語や中国語など16言語では音声の出入力の両方ができる。同時通訳は、話しているスピーチの文の切れ目などを自動で判断し、1つの文を話し終えてから数単語後には通訳を始める技術を開発済みだ。画像認識を使って表情から適切な文字データに変える技術開発も進めている。

 総務省はこうした技術を使った製品開発を企業に促す。試作する製品端末との間で、通訳する音声データをやり取りする「AIサーバー」を国が用意。同サーバーにはNICTの通訳技術を搭載して企業が自由に使えるようにし、試作段階ではライセンス料も不要にする方針。今後、制度の詳細を詰めて18年度にも実施する。

 今は試作のために企業はサーバー構築やライセンス料などの初期投資に数百万円かかるケースがある。総務省はこれらの費用やライセンス契約の手間がなくなれば、開発のハードルが下がるとみる。

 富士通が医療現場向けのクリップ型の通訳端末を18年度中に実用化をめざすなど、徐々に出始めた製品開発の動きを加速させる。

 NICTの基幹技術を開放することで、製品化のアイデアを持つ様々な企業が事業を展開できるようになる。端末の形を名札型にするかイヤホン型にするかといった製品設計や、対応言語、1度に利用できる人数などで、企業が活用分野や場面などに合わせた様々な製品を開発することを想定する。

 居酒屋などの席に備え付けるタッチパネル式の注文端末に同時通訳の技術を組み込むなど、既存端末と組み合わせる製品開発も普及のカギだ。

 基幹技術を民間に広く開放するのは翻訳の精度向上にもつながるとの判断がある。翻訳の精度を高めるには、深層学習を活用するのに加え、様々な翻訳データを学習することが不可欠。企業から使用した専門用語の翻訳データなどを随時提供してもらい、より幅広い用途に対応するとともに、翻訳できる言語も増やせるようになる。

 深層学習を使った多言語翻訳の開発は、米グーグルや米マイクロソフトなど海外企業も力を入れている。こうした企業では育成・蓄積した技術は外部と共有しないのが一般的だが、データの蓄積で出遅れる日本は官民がオープンな形で開発を進めて追撃を狙う。

 NICTは技術向上の研究や実用化をめぐって、富士通や日立製作所をはじめ日本の約180の企業や研究機関と連携。昨年9月からは実際の翻訳事例を企業などから提供してもらう「翻訳バンク」も始めた。

2018年1月23日 (火)

JTF MT関係の翻訳セミナーにザワザワ

ニューラル翻訳(NMT)の実体とその周囲の実態に迫る ~NMTとの良い関係の確立を~

https://www.jtf.jp/east_seminar/index_e.do?fn=search#seminar_124

懇親会とともに申し込みました。

出席される方はよろしくお願いします。

MTにイートモ対訳データが積極的に関与する考えはありませんが、MTの進歩にはついていこうと思います。

20年数年ほど前になるでしょうか、翻訳ソフトが登場したわけで、翻訳者の仕事がなくなるのでは大騒ぎになりましたが、騒いだのは開発業者や翻訳関係のメディアだけで、翻訳会社や翻訳者は冷静でした。

Medical Translator NARITAも富士通のアトラスという翻訳ソフトを購入して、試してみました。10万円位したのかな。すでに医学翻訳の専業だったので、その程度の出費は惜しくない。

http://www.fujitsu.com/jp/products/software/applications/applications/atlas/

メカは素晴らしいけど、普及するには質的に無理と確信しました。鍛えれば使えるかなと思ったけど、自分で訳したほうが速いというわけで、うやむや。

一方、今回のMTブームには翻訳会社も翻訳者もザワザワしています。

本物かな?

翻訳セミナーに向けて調査します。

Medical Translator NARITAは、医学翻訳に関してですが、人間による翻訳にも、別の人間によるチェックが必要と考えています。

ですから、医学翻訳に関しては、MTでどれだけ効率化されても、複数の人が読む文書ならば、最終的には人間によるチェックが必要という考えです。

2018年1月12日 (金)

AIが医学翻訳に導入されると儲かるの?

【イートモの制作・販売責任者からのごあいさつ】 に

フリーランス医学翻訳者の皆様。イートモで武装し、ワンランク上の収入を得て、豊かな生活をおくりましょう!

と、リンクをはったのですが、今後の医学翻訳業界はどのような仕事のしかたになるのか、翻訳仕事をリタイヤしたMedical Translator NARITAには見通せないところがあります。よって、無責任に情報を流すことはできないので、上のリンクをはずすことにしました。

これまではパソコンの高性能化やインターネットの普及で、よほどあこぎな翻訳会社でないかぎり、医薬系の英訳専門ならばサラリーマンの収入を超え(2倍、3倍)、それを維持することはできました。これは事実です。

今後のことですが、やはり、AIがもし医学翻訳に部分的または全面的に導入された場合、医学翻訳フリーランスにはどのような作業や役割が求められるのがわからないところがあります。翻訳センターなどいくつかの大手翻訳会社の動向を見ると、AIが産業翻訳に利用されるのは確かなのでしょう。もしAI時代になったら、医学翻訳フリーランスは今までよりも、楽して儲かるのか、辛いけど儲かるのか、辛くて儲からないのか、わかりません。辛くて儲からないなら、だれもやる人はいなくなるな。どのような状況にも対応できるように、翻訳スキルを高めて、必要な知識を仕入れていくしかないです。できれば楽して儲かる、最低でも辛いけど儲かるような業界になるように、リーディングカンパニー翻訳センターの東社長さんに期待しましょう。

Kansai

クラウド翻訳サービスなんてものもいくつか出てきました。昔は1社しかなかったけど、最近増えているね。IT技術の進歩はすごいです。まぁ、今はゴミみたいな仕事しかないので、小遣い稼ぎにもなりゃしない。そんなところの翻訳をしている人は、ゴミ捨て場をあさって金目の鉄くずや食料を探しているようにしか見えない。もし医学翻訳ビジネスのメインの文書がクラウド翻訳サービスに出るようになったら、医学翻訳業界は激変することになるな。もしそういう時代が来たら、「ゴミ捨て場」なんて言ってごめんな。でも、製薬会社の研究開発費に占める翻訳費は微々なるものだから、製薬会社が手間をかけて、リスクをおかしてまで微々たる経費を削減しようとすることはないとは思いますけどね。

改めてクラウド翻訳のサイトを見てみたけど、やはりゴミ捨て場。

群衆(crowd)でもあり、雲(cloud)でもあり。まさにスモーキーマウンテン。

Smokie

余計なお世話だけど、ちゃんと準備すれば、ちゃんとした場所で仕事して、ちゃんと生活できますよ。

2017年12月12日 (火)

翻訳AIの進化でこれ以上の英語学習は不要?

情報通信研究機構(NICT) 隅田英一郎氏

http://business.nikkeibp.co.jp/atcl/report/16/113000186/120800004/?n_cid=nbpnbo_mlpum

翻訳祭の翻訳プラザにブースを出展されていたので、ブースのほうで詳しい話を聞きたかったのですが、混雑していて十分な説明が受けられませんでした。

今から思えば、中学と高校で参考書を読めば済むような内容のない英語の授業に週に5時間も6時間に使ったことがものすごくもったいないよ。そんな英語授業に時間を使うんだったら、日本の歴史やITなどを勉強したり、スポーツをしたほうがいいんじゃね? 若い頃の貴重な時間を返してくれ。私は昔から言っているけど、受験科目から英語がなくなればどれだけいいか!

AIの発達で今後は内容のない英語の授業がなくなるといいね。痛快です。

Nict

サラリーマン英語教師は困るだろうけど。

フォト
サイト内検索
ココログ最強検索 by 暴想