『翻訳バンク』の運用開始-自動翻訳システムのさらなる高精度化に向けて、様々な分野の翻訳データを集積-

総務省と国立研究開発法人情報通信研究機構は、自動翻訳システムの様々な分野への対応や高精度化を進めるため、オール・ジャパン体制で翻訳データを集積する『翻訳バンク』の運用を開始します。これにより、社会・経済活動のグローバル化が進む中で我が国の国際競争力の強化に貢献します。

2017年9月8日

『翻訳バンク』の運用開始

-自動翻訳システムのさらなる高精度化に向けて、様々な分野の翻訳データを集積-

【ポイント】

■ オール・ジャパンで様々な分野の翻訳データを集積する『翻訳バンク』の運用を開始

■ ニューラル機械翻訳での活用等に向けて翻訳データを集積し、多分野対応や高精度化を実現

■ 翻訳データを提供して頂く方にもメリットのある仕組みを導入

 総務省と国立研究開発法人情報通信研究機構(NICT、理事長: 徳田 英幸)は、自動翻訳システムの様々な分野への対応や高精度化を進めるため、オール・ジャパン体制で翻訳データを集積する『翻訳バンク』の運用を開始します。これにより、社会・経済活動のグローバル化が進む中で我が国の国際競争力の強化に貢献します。

1 背景・課題

 総務省とNICTは、世界の「言葉の壁」をなくすことを目指すグローバルコミュニケーション計画を推進しており、その一環としてNICTは音声翻訳(“VoiceTra”と呼ぶ)とテキスト翻訳(“TexTra”と呼ぶ)の研究・開発・社会実装を進めています。これまでNICTにおいては翻訳の高精度化に必要な翻訳データの集積(表1)に取り組むとともに、2017年6月からニューラル機械翻訳技術の導入等を進めておりますが、翻訳技術を活用する分野によっては翻訳データが足りないことが課題となっていました。

2 翻訳バンクの運用開始

 そこで、総務省とNICTは、様々な分野における翻訳データの集積に向けて、NICTが様々な分野の翻訳データを集積して活用する『翻訳バンク』の運用を開始することにしました(図1)。

 『翻訳バンク』の開始にあたり、データを提供して頂く方のメリットを明確化するため、NICTの自動翻訳技術の使用ライセンス料の算定の際に、提供が見込まれる翻訳データを勘案して負担を軽減する仕組みを用意しました。

3 今後の展望

 総務省とNICTは、様々な分野で高精度翻訳を実現することで「言葉の壁」をなくし、日本を『世界で最も多言語コミュニケーションが容易な国』にすることによって、日本の経済・社会の活性化に貢献します。

<補足説明>

● 自動翻訳技術の性能向上のためには、NICTが研究開発において取り組んでいる翻訳アルゴリズムの改良に加え、翻訳データの質と量の確保が重要となっています。翻訳バンクでは翻訳データを集積して自動翻訳技術に活用することで、自動翻訳技術で対応できる分野を広げるとともに、さらなる高精度化を実現します。

● NICTの自動翻訳技術の使用ライセンス料の算定の際に、提供が見込まれる翻訳データを勘案して負担を軽減する仕組みを導入することで、翻訳バンクにおける好循環モデルを構築し、皆で自動翻訳技術を育てながら、高性能な自動翻訳技術を活用していくサイクルを確立します。

● 翻訳バンクの当面の目標として、100万文×100社=1億文の翻訳データの集積を目指します。

● 翻訳バンクWebサイト http://www2.nict.go.jp/ais/h-bank.html

本プレスリリースは発表元が入力した原稿をそのまま掲載しております。また、プレスリリースへのお問い合わせは発表元に直接お願いいたします。

プレスリリース添付画像

表1 収集する翻訳データのサンプル例

図1 『翻訳バンク』のコンセプト

このプレスリリースには、報道機関向けの情報があります。

プレス会員登録を行うと、広報担当者の連絡先や、イベント・記者会見の情報など、報道機関だけに公開する情報が閲覧できるようになります。

プレスリリース受信に関するご案内

このプレスリリースを配信した企業・団体

  • 名称 国立研究開発法人情報通信研究機構 広報部
  • 所在地 東京都
  • 業種 その他情報・通信業
  • URL https://www.nict.go.jp/
  • ※購読している企業の確認や削除はWebプッシュ通知設定画面で行なってください
  • SNSでも最新のプレスリリース情報をいち早く配信中