金融分野向けの高精度AI翻訳システムを開発
金融庁による翻訳文書の大量収集と、NICTによる深層学習の連携で高精度化
2022年3月11日
ポイント
■ 金融分野の文書を日本語と英語の間で双方向に高精度に翻訳できるAI翻訳システムを開発
■ 金融庁などから文書を大量収集したことで金融専業翻訳者レベルに達した訳文の割合が2割から5割に向上
■ 専門性が高い金融分野での翻訳効率の改善により、日本の国際金融センター機能の強化への貢献に期待
国立研究開発法人情報通信研究機構(NICT(エヌアイシーティー)、理事長: 徳田 英幸)と金融庁は協力して、金融分野の文書を日本語と英語の間で双方向に高精度に翻訳できるAI翻訳システムの開発に成功しました。金融庁は、同庁及び金融関係の業界団体の所有する翻訳文書を大量に収集してNICTに提供し、NICTは翻訳文書をAI用の学習データに変換し、更に精製したデータを深層学習に用いて高精度のAI翻訳システムを開発しました。NICTでは、本システムについて、2022年3月1日から、民間事業者に技術移転を開始しています。本システムを用いることで、金融専業翻訳者レベルに達した訳文の割合が従来の2割から5割に向上するなど高精度な翻訳が可能となり、金融分野の文書の翻訳作業を大幅に効率化できることから、日本の国際金融センター機能の強化への貢献が期待されます。
背景
NICTは、AI翻訳を多分野で高精度化するために、その基盤となる翻訳文書を収集する翻訳バンク*の活動を進め有効性を実証してきましたが、個別組織単位の収集を越えて一気に大規模に収集する方式を模索していました。金融庁は、国際金融センターの実現に向けた取組の一環として、金融分野に特化した高精度なAI翻訳によって英語での情報の受発信を容易にし、金融行政を更に高度化することを目指していました。
今回の成果
NICTと金融庁が連携し、金融分野において、官民協力により業界団体単位でまとまったデータを確保しました。これにより、提供データを効率よく活用し、日本語と英語の間のAI翻訳の精度が向上しました。
具体的には、金融庁の率先垂範の下、金融関係の複数の業界団体から大量の翻訳文書を収集し、NICTはこの翻訳文書をAI用の学習データに変換し、更に精製したデータを深層学習に用いて高精度のAI翻訳システムを開発しました。
同じ原文に対する従来の汎用翻訳システムによる訳文と上記の金融分野向けの高精度AI翻訳システムによる訳文の品質の比較を行ったところ、最高品質である金融専業翻訳者レベルに達した割合は、前者で約2割でしたが、後者では約5割と大きく増加し、NGレベルの割合は半減するなど、圧倒的な高精度化を実現しました(図1参照)。
NICTでは、この金融分野に特化した高精度AI翻訳システムについて、2022年3月1日に民間事業者に技術移転を開始しました。本システムは実用性が高いことから、直ちに普及し、広く利用され、金融分野での英語での情報の受発信が増進されると期待されます。
図 1 従来の汎用翻訳システムと金融分野向け高精度AI翻訳システムの比較
今後の展望
NICTは、今回の金融分野での成功事例を模範として、今後の更なる分野拡大を目指していきます。
また、金融関連の翻訳文書収集に関する金融庁との連携も継続し、次々と登場する新語・新概念への対応を始め性能改善のエコ・システム化を実現していきます。
《訳文の改善例》
日本語原文 | 汎用翻訳の訳文<理解可> | 金融分野向け翻訳の訳文<専門級> |
保険契約に解約価額がある場合、契約を解約する保険契約者に損失を負担させることを可能にするための解約時の契約価額の削減 | where insurance contracts have a surrender value, reducing the value of contracts upon surrender to enable losses to be imposed on policyholders that surrender their contracts. | A reduction in the value of policies at surrender to enable policyholders who surrender policies to bear losses if they have a surrender value ; |
なりすましに対抗するため、各参加者に固有の生体認証番号(BIN)が作成されている。 | A unique Biometric Identification Number (BIN) is created for each participant to counter identity fraud. | To counter identity theft, a unique Biometric Identification Number (BIN) is created for each participant. |
本研究は、NICTが「自動翻訳エンジンの金融専用モデル構築に関する委託研究」を金融庁から受託したものです。
本プレスリリースは発表元が入力した原稿をそのまま掲載しております。また、プレスリリースへのお問い合わせは発表元に直接お願いいたします。
このプレスリリースには、報道機関向けの情報があります。
プレス会員登録を行うと、広報担当者の連絡先や、イベント・記者会見の情報など、報道機関だけに公開する情報が閲覧できるようになります。
このプレスリリースを配信した企業・団体
- 名称 国立研究開発法人情報通信研究機構 広報部
- 所在地 東京都
- 業種 その他情報・通信業
- URL https://www.nict.go.jp/
過去に配信したプレスリリース
外部磁場を必要としない新型超伝導磁束量子ビットを世界で初めて実現
10/15 14:00
映像の中の画像由来、音楽由来の感情に関連する脳部位を特定
10/3 14:00
世界初、量子コンピュータを利用した屋外多数同時接続実験に成功
7/25 14:00
基準光配信と光コムを用い、光源一つで大容量コヒーレント光通信に成功
7/24 14:00
5G携帯電話基地局からの電波強度を明らかに
7/5 14:00
スマホ上でも高速動作可能な21言語の高品質ニューラル音声合成技術を開発
6/25 14:00
迷うことにも意味がある
6/13 14:00
国際無線通信規格Wi-SUNが採用された「IoTルート」用無線標準規格が発効
6/12 14:00
セキュリティ情報融合基盤 “CURE” のカスタム通知機能を開発
6/11 14:00
女性を対象とした令和7年度採用パーマネント研究職等の公募を開始
5/13 14:00
量子コンピュータのコンパイラ高速化技術を開発
5/9 14:00