2017年12月12日 (火)

翻訳AIの進化でこれ以上の英語学習は不要?

情報通信研究機構(NICT) 隅田英一郎氏

http://business.nikkeibp.co.jp/atcl/report/16/113000186/120800004/?n_cid=nbpnbo_mlpum

翻訳祭の翻訳プラザにブースを出展されていたので、ブースのほうで詳しい話を聞きたかったのですが、混雑していて十分な説明が受けられませんでした。

今から思えば、中学と高校で参考書を読めば済むような内容のない英語の授業に週に5時間も6時間に使ったことがものすごくもったいないよ。そんな英語授業に時間を使うんだったら、日本の歴史やITなどを勉強したり、スポーツをしたほうがいいんじゃね? 若い頃の貴重な時間を返してくれ。私は昔から言っているけど、受験科目から英語がなくなればどれだけいいか!

AIの発達で今後は内容のない英語の授業がなくなるといいね。痛快です。

Nict

サラリーマン英語教師は困るだろうけど。

2017年10月13日 (金)

ロゼッタさん 聞いてないよ~

翻訳業界のもう1つの希望の星 ロゼッタさん

決算厳しいようです。

https://www.rozetta.jp/download/2017101303.pdf

MT単体による夢のマシーンを開発しているものとばかり思っていたのに、いつの間にかMTは翻訳のサポートツールに降格しちゃったんですね。

聞いてないよ~

やはりお客さんに買ってもらえる翻訳商品を作るには人手が必要ということです。

だったら、労力は今のトラドスとかCSTと呼ばれるものとあまり変わんないんじゃね?

Loz3

プロの翻訳者はだいたい予想がついていたけど、AIだのニューラルだの夢のマシーンを信じて株を買っていた投資家は悲惨(^^;

2017年10月 6日 (金)

完全“自動翻訳”時代がやって来る! 商業化レース加速と関連株

10月5日(木)19時30分配信 株探ニュース

株式関係のニュースですが、MTをめぐる動向を知るため、個人的にあとで調査したいと思います。

―相次ぐ「自動翻訳機」発表で高まる関心、関連企業の取り組みは―

 2020年の東京五輪開催や、訪日外国人の増加を受けて注目が高まる自動翻訳だが、ニューラル機械翻訳(NMT:Neural Machine Translation)技術の実用化で自動翻訳の精度が飛躍的に向上したことで、商業化に向けた動きが加速している。9月には中国インターネット検索最大手の百度(バイドゥ)が自動翻訳機を開発したと発表したことで、この動きはさらに加速するとみられ、いま注目のテーマといえるだろう。

●百度が自動翻訳機を発表

 百度が開発した自動翻訳機は、縦152×横62×厚さ9~19ミリメートル、重さ156グラムのコンパクトなサイズのモバイルルーターに自動翻訳機能を搭載したもの。中央に大小2つの丸いボタンがあり、大きなボタンを押しながらしゃべることで自動的に翻訳される。また、小さいボタンで言語の切り替えをするが、将来的には言語も自動で認識する予定という。対象言語は中国語、日本語、英語などで、百度ではまず、中国人の海外旅行客の利用を見込んでいる。

 百度に限らず、ここにて自動翻訳の進化に向けた動きが活発化している。米マイクロソフトでは今年4月、インターネットを介して音声をほぼリアルタイムで自動翻訳するサービス「マイクロソフト・トランスレーター」を日本語対応にした。英語や中国語など9言語の翻訳に対応していたが、日本語は10言語目。これまで日本語ならではの表現で翻訳が難しいとされていた敬語などにも対応している。

 また、米グーグルも10月4日にスマートイヤフォン「Pixel Buds」(日本での発売は未定)を発表した。翻訳機能を搭載し、日本語を含む40言語に対応。相手の言語を自動翻訳してイヤフォンから再生したり、逆にこちらがしゃべった内容を相手の言語に翻訳してスマートフォンから再生したりすることができるようにしている。

以上のものは旅行用に便利そう。観光客に重宝されるね。もう英会話は勉強しなくてもいいんじゃね。

 国内でも、総務省が管轄する情報通信研究機構(NICT)が中心となって同時翻訳を可能とする自動翻訳システムを開発中だ。9月からは精度を高めるため、さまざまな言語の翻訳文例を蓄積する「翻訳バンク」(やはり対訳データの管理が大事になるね)の運用も開始している。

●神経回路を模した翻訳アルゴリズム

 自動翻訳の進化の動きが活発している背景には、人工知能(AI)技術の進展がある。

 自動翻訳は長く、「ルール型」と呼ばれるものを採用していた。これは研究者が作った文法などの規則に沿ってコンピューターが翻訳するというもので、パーツごとに翻訳したものを組み合わせたものだった。これに対して現在普及している「統計翻訳」では、対訳データを大量に集めて統計処理することで、翻訳規則や辞書を自動的に作成し翻訳している。つまり、「統計翻訳」では、ビッグデータを活用し、学習する対訳データが多ければ多いほど翻訳の精度が向上することになる。

 これをさらに進化させたのが、脳の神経回路を模したニューラルネットワークを活用した翻訳アルゴリズムを用いたニューラル機械翻訳だ。最新の機械学習技術(ディープニューラルネットワーク)を活用することで、文単位で文脈を把握して、より適切で自然な訳語を見つけられるようにした。

●11月からみらい翻訳が企業向けサービスを開始

 既に、米グーグルでは昨年後半からニューラル機械翻訳を導入しており、従来に比べて翻訳エラーを大幅に減らすことができたという。米マイクロソフトもほぼ同じ時期に「トランスレーター」でニューラル機械翻訳を採用している。

 一方、国内ではNICTが進めている自動同時通訳プロジェクトで導入され始め、既に一般公開されている多言語音声翻訳アプリ「VoiceTra(ボイストラ)」の高精度化に成功した。

 また、NTTドコモ <9437> やパナソニック <6752> 、フュートレック <2468> [東証2]などが出資するみらい翻訳この会社のウェブサイトにMTがわかりやすく説明されています。イートモのような対訳コーパスの必要性も指摘されています。)(東京都渋谷区)は、NICTと共同でNMTエンジンを開発し、11月から企業向け翻訳アプリケーションサービスを開始する。

みらい翻訳は情報通信研究機構(NICT)と共同で開発しているようです。NICTは対訳データの蓄積を重視しているようですし、みらい翻訳も「人手翻訳で修正された正解文を機械翻訳に学習させることにより恒常的な精度向上を図る」と言っています。MTのメカニカルな部分は完成に近いんだろうけど、MTが成功するかどうかは、結局、内蔵データの管理と更新にかかっているということでしょう(たぶん)。

Mirai_2

 ロゼッタ <6182> [東証M]では、22年に機械翻訳の完成形「T-4PO」(このまえブログに書きました)の投入を計画しているが、そのために現在、ニューラル機械翻訳に関する投資を加速させている。

●翻訳センター、AMIにも注目

 このほかの自動翻訳の動きでは、翻訳センター <2483> [JQ]が、オンライン翻訳ツール「ヤラクゼン」を提供している八楽(東京都渋谷区)と提携し、9月から企業内の翻訳・対応業務をサポートするクラウド型の自動翻訳システム「compath」(このまえブログに書きました)の提供を開始した。また、アドバンスト・メディア <3773> [東証M]は昨年、音声認識を活用した多言語翻訳サービス「AmiVoice TransGuide(アミボイス トランスガイド)」を開発し、現在拡販を図っている。

 さらに、執筆や翻訳、組版といった多岐にわたる業務を一元化した総合管理システムを手掛けているクレステック <7812> [JQ]や、ログバー(東京都渋谷区)が開発したウエアラブル翻訳デバイス「ili(イリー)」のレンタルを行うビジョン <9416> にも注目。NICTと組んで拡声器で話すと外国語訳の音声が出る「メガホンヤク」を開発したパナソニックや、病院で医師と外国人患者がタブレット端末をはさんで会話できるシステムを試作した富士通 <6702> なども関連銘柄といえよう。

2017年10月 5日 (木)

ロゼッタ 株価急落

翻訳業界のもう1つの希望の星

(株)ロゼッタの株価が急落しています。

業績予想を大幅下方修正らしいです。

Loz2

機械翻訳(MT)の技術の進歩が速すぎて、太刀打ちできないということなのか。競争相手が強すぎる。ロゼッタの経営陣はまさかグーグルなどが参入して、こんなにMTが進歩するなんて思わなかったのかもしれません。MT開発の人件費もものすごくかかるだろうし、できればやめちゃいたいというのが本音かもね(推測だけど)。私はMTの仕組みをよく知りませんが、MTが実務翻訳業界で実用化されるにはMTの内蔵データを良い状態に管理することが大切だと思うので、その方面に進出するのもアリかと。でも、大変な労力を使うし、地味だし、あまり儲からないかもしれないね。私も金儲けという観点からすれば、イートモ事業よりも翻訳仕事とか投資事業をやっているほうがはるかに良いわけで、実際、イートモ事業は先日も書いたように大赤字(^^;。でも、必要な資料でもあるにもかかわらず、誰もやっていないし、やろうとしないので、このおっさんがやっています。今後も続けますよ♪

ロゼッタ株価はMTで保たれてきた株価だから、MTから撤退して単なる翻訳会社になるわけにもいかないだろうし、厳しいところだね。

13日に決算発表があるようです。今後の動きを注視していきます。

2017年10月 2日 (月)

みなさん MTに必死やな

このまえもブログに書きましたが、

http://i-honyaku.cocolog-nifty.com/blog/2017/06/mt-f606.html

みなさん、なんとかして翻訳を自動化したいようです。

翻訳センターさんも

https://www.honyakuctr.com/compath/

ロゼッタさんも

http://www.jukkou.com/t4oo/feature/

必死のようです。

「クラウド 機械翻訳」で検索すると、他にもいろいろ模索している事業所さんがいるのがわかります。

デファクトスタンダードを狙ってる?

1つでも超優秀なMTが出来れば翻訳業界を統一しちゃうからね。

ロゼッタさんの将来見通し。

Loz_3

今のうちの翻訳でがっつり稼ぐか、MTのオペレーターになるかという感じですか。

学生じゃあるまいし英検やTOEICを受けたり、翻訳講座でこつこつ勉強してから翻訳のお仕事ができればいいな~、なんて呑気なことを言っている場合じゃないね。

機械音痴のおっさんはまったくついていけません。

イートモの対訳データがMTに役立つようなら、提供を検討したいと思います。

イートモの対訳データはExcelで作られているので、翻訳支援ツール(CAT)に導入するのは容易だと思います(多分)。将来的には、CATやMTのベースとなる資料として利用される方向で考えています。

2017年6月 8日 (木)

MTブーム

マシントランスレーション(MT)

最低でも原文にあるすべての情報が訳文に含まれるようにならないと、実用レベルとは言えません。原文と照合してポストエディットするようでは人間による翻訳と労力や時間はたいして変わらないから。むしろ原文とMT訳文の2つを見なくてはいけないので、かえってわずらわしい。改訂版の翻訳と同じように、2つ、3つとたくさんの資料を見なくてはならないので労力が半端ではありません。ポストエディットの単価を高くしないと、手抜きする翻訳者が出てきますよ。ボランティアじゃないんだから、単価が安ければ時間をかけてられません。

MTはせいぜい「個人的な文書や製薬会社のごく内輪の社内文書」の翻訳に使われる程度でしょう。こうした文書は元々外注される文書ではないので、製薬会社にMTが導入されても翻訳会社や翻訳者は痛くもかゆくもない。

もし翻訳会社がMTを導入するとすれば、一番問題なのは、MTの内蔵データの管理と更新をどうするか、でしょう。ベースとなる内蔵データが信頼できるものなのかどうかが不安です。MTを導入するとすれば、まずは資金力のある大手の翻訳会社が導入することになるでしょうが、ベースとなる内蔵データを管理・更新できる人材がいるのか? 不良訳文の大量生産にならなければいいけどね。

大手翻訳会社がMT翻訳した訳文は、やがて製薬会社を通じて零細の翻訳会社や個人翻訳者にも参考資料として、あるいは準拠すべき資料として提供されるでしょう。翻訳業界は優秀な人材が大手の会社に限っているわけではなく、零細の翻訳会社や個人翻訳者にも優れた翻訳技能を持った人材がたくさんいます。

そうした優れた翻訳者からMT訳文の不具合が指摘された場合、MT訳文の不具合にだれが対応するのでしょう? クライアントである製薬会社に言えばMTを扱っている会社に連絡が行くの? それともMT訳文の不具合はそのまま放置? 見て見ぬふり?(笑) MT訳文を無視して新規に訳出するの? 新規に訳出したデータはどう取り扱うの? MTの内蔵データを修正しなくていいの?

誰か業界全体にわたって統括する人や組織がないと、MTシステムがぐちゃぐちゃになるような気がします。

このまえのブログにも書いたけど、MTは運用面で課題が山積みです。

今回のMTブームも期待だけでぽしゃらなければいいね。

Mt_2

このグラフの縦軸は何なの? イメージ?

将来はどうなるかはわからないけど、MTが導入されるにしても、今よりも翻訳者の収入が増えるような方向でやってもらいたいです。

マシントランスレーション MT

JTF主催 「機械翻訳技術を取り巻く最近の動向について」

セミナーに出席しました。

専門的すぎて理解できません。ちんぷんかんぷん。

おおざっぱな印象ですが、MTの技術が進歩しても、個人的または内輪で使う文書でなければ、人間によるポストエディットが必要なようです。

下図のAdequacyのスケールで、

原文にある「5すべての情報」が訳文に含まれる

と評価される訳文でなければ先日のブログに記載したように、「MT訳文を原文と照合しながら手直しする」ということになると思います。

原文にある「4ほとんどの情報」が訳文に含まれる

ではダメです。結局、原文と照合して見直さなくてはならない。MTを使うメリットは特に医薬系の翻訳で小さいです。

原文と照合してのポストエディットでは「最初から人間が翻訳した場合と労力や時間があまり変わらないのではないか」と思います。MTよりも、ポストエディットを効率化させるツールのほうが、作業時間当たりの収入が上がるから、翻訳会社や翻訳者にとってはメリットになるんじゃないの? MTだろうが支援ツールだろうが、どのように儲けに結び付けるかが課題です。

「個人的または内輪で使う文書」はMTで処理されるが、それ以外はこれまでと同様、翻訳業界に依頼されると予想していますが、どうでしょう。

Mt

2017年6月 4日 (日)

機械翻訳技術を取り巻く最近の動向について

●日時:2017年6月7日(水)

●会場:アルカディア市ヶ谷(私学会館)
    東京都千代田区九段北4-2-25 TEL:03-3261-9921
    http://www.arcadia-jp.org/access.htm
●時間:16:35~17:45(70分) 基調講演(4階 鳳凰の間)
【テーマ】機械翻訳技術を取り巻く最近の動向について
【講師】中岩 浩巳(ナカイワ ヒロミ)氏
JTF監事、名古屋大学、アジア太平洋機械翻訳協会 会長

キャンセル待ちが出るほどだそうです。

それほどマシーントランスレーション(MT)に対する関心がみなさん高いということでしょう。私も概要を知りたいと思って聞いてみます。

医薬系に限れば、MTは製薬会社や研究所などではすでに内輪の資料作成用として導入可能なのでしょう。MTで出来上がった訳文は自分たちで使うだけですから。

問題なのは、翻訳会社や翻訳者がどのように利用するか、利用できるかです。

MTで訳文を作成して、訳文だけを見て手直しするだけでお金になるのか。

MT訳文を原文と照合しながら手直しすることが求められるのか。

MT訳文だけを見て手直しする場合には翻訳料金の値引きを求められるのか。

MT訳文だけを見て手直して誤訳が放置された場合には責任の所在はどうなるのか。

MT訳文を原文と照合しながら手直しするとなると、最初から人間が翻訳した場合と労力や時間があまり変わらないのではないか。

他にもMTの内蔵データの管理や更新をだれがやるのか、その労力を翻訳料金に上乗せできるのか。

などなどMTの技術面よりも運用面において課題はたくさんありそうな気がします。

各種リンク

サイト内検索
ココログ最強検索 by 暴想

アンケート