信頼できる人工知能(AI)開発に向けて

AIセーフティにおけるデータ品質の国際標準規格ISO/IEC 5259シリーズの発行に貢献

産総研

ポイント

・ 包括的で偏りがなく、安全なAI開発のための、機械学習に特有なデータセット品質の土台となる規格

・ AIやデータ駆動型システムにおけるデータの収集、処理、利用など、データライフサイクル全体のデータ品質向上に不可欠な標準

・ AIの安全性強化のためのリスク管理と法規遵守を支援

 

 

人工知能(AI)やデータ駆動型システムの信頼性向上のため、データ品質の管理と評価に関する国際規格ISO/IEC 5259シリーズ(以下「本規格」という)が第1部から第5部まで発行されました。国立研究開発法人 産業技術総合研究所(以下「産総研」という)は、AIを用いた製品やシステム、サービス開発に関する国際標準化を主導的に推進し、本規格の発行に大きく貢献しました。

 

データはAIシステムの開発・運用に必要不可欠な「燃料」であり、その品質はAIシステムの性能や安全性に直接影響するため、極めて重要です。しかしながら、従来のデータ品質管理に関する国際標準は、バイアスの排除、データの多様性やバランスなどの確保といった要件を測定・評価できない問題がありました。本規格は、これらの課題を踏まえ、AIデータライフサイクルフレームワーク全体を通じて適切な管理を行い、さまざまな分析や機械学習のための包括的な指針を提供するものです。

 

これにより、安心・安全なAIシステムの社会的な活用促進、日本のAI産業の国際的な社会実装及び競争力強化に加え、異なる国や企業間でのデータ流通における信頼性向上が期待されます。

 

下線部は【用語解説】参照

 

社会課題の解決

イノベーションを妨げることなく、産業界が信頼性の高いAIシステムを継続的に開発し、その性能と安全性を保証するためには、実用的な品質評価・管理の仕組みを国際的に整備することが求められます。機械学習を活用したデータ駆動型のAIシステムにおける品質評価や品質保証には、学習データの欠落や偏り、モデルの不確実性、さらには利害関係者の異なる要件など、多くの技術的な課題が存在します。特に学習データの品質は、AIシステム全体の性能と安全性に大きく影響します。学習データの品質が不十分であれば、モデルの推論結果にバイアスや不公平性が生じ、システム全体の信頼性を損ない、社会的な受容性にも影響を与える可能性があります。特に、医療や金融、自動運転、公共インフラなどの分野では、データ品質の欠陥が重大な経済的損害や倫理的問題を引き起こす可能性も十分あります。

 

しかし、これまで産業で適応されてきたデータ品質管理のため国際規格であるISO 8000シリーズISO/IEC 25000シリーズは、データ個々の品質要件に着目しており、非構造化データ(テキスト、画像、音声など)や特徴量などの機械学習向けのデータ形式、データセットの分布・バイアス・バランスなどのAI特有の品質指標、持続的な管理・改善などは考慮されていません。そのため、これまでの規格ではAIにおけるデータ品質を適正に評価できない状況でした。また、データの自由な流通を促進するDFFTの概念を実現するためには、データ品質の基準とその測定の整備が重要です。

 

本規格では、データ分析と機械学習のためのデータ品質の概念や、基準、管理、プロセス、ガバナンスなどの新たな体系を提供します。そのため、AIモデルの開発やAI品質評価プロセスにおけるデータ品質を定量的かつ包括的に評価できるようになり、AIの不透明性を解消し、ビジネス活用の促進が期待できます。

 

規格発行までの道のり

産総研は、2017年に合同技術委員会(JTC 1)の傘下にAIに関する分科委員会(ISO/IEC JTC 1/SC 42)が設立された当初から、国内専門委員会と協力しながら主導的に規格化を推進してきました。本規格は、SC 42内でデータに関する標準の策定や検討を行う作業グループ(WG 2)で日本が提案し、韓国、中国、ドイツのそれぞれのプロジェクトリーダと連携して開発された規格です。特に、産総研は、本規格の第2部(データ品質指標)のドラフト作成を含む規格開発を主導するとともに、2024年1月には暫定コンビーナーとして各パートの発行に大きく貢献しました。

 

今後の予定・波及効果

本規格では、技術報告書である第6部(データ品質の可視化)が最終確認段階にあり、今後第6部の発行によりデータ品質管理のための分かりやすい解析手法を提供します。また、本規格は欧州 CEN/CENELEC JTC 21(欧州標準化委員会/欧州電気標準化委員会 合同技術委員会21)から高い評価を受けており、欧州AI法(AI Actの整合規格)として採用が予定されています。これに伴い、世界的にも大きな注目を集めています。さらに、本規格は生成AIにおけるデータ品質評価の基盤を提供し、今後、安全で信頼性の高いAIシステムの開発と運用を支援するために拡張される予定です。

 

規格の概要

ISO/IEC 5259-1:2024 人工知能―分析と機械学習(ML)のデータ品質―第1部:概要、用語及び例

解析及び機械学習に関するデータ品質シリーズ(5部構成)の第1部である。第2部:データ品質指標、第3部:データ品質管理要件及びガイドライン、第4部:データ品質プロセスフレームワーク、並びに、第5部:データ品質ガバナンスフレームワークの概要、用語及び例を記述する。

 

ISO/IEC 5259-2:2024 人工知能―分析と機械学習(ML)のデータ品質―第2部:データ品質測定

データ分析及び機械学習におけるデータ品質モデル、データ品質指標、及びデータ品質報告に関するガイダンスを提供する。ISO 8000シリーズ、ISO/IEC 25012及びISO/IEC 25024を基礎とし、データ品質を測定する20項目の指標を記述する。本規格は、組織がデータ品質の目標を達成することを支援し、あらゆる組織に適用可能である。

 

ISO/IEC 5259-3:2024 人工知能―分析と機械学習(ML)のデータ品質―第3部:データ品質マネジメントの要求事項とガイドライン

分析及び機械学習の領域で使用されるデータの品質を確立、実装、維持、及び、継続して改善するための要件及びガイドラインを規定する。第1部で定義されたデータライフサイクルに基づき、データの取得から廃棄するまでの8つのステージと、それらを横断的に適用する3つのプロセスから構成されるデータ品質管理ライフサイクルを記述している。具体的なデータセットの品質基準について5259-2を参照し、サプライチェーンを考慮したデータサプライヤーの管理要件、データ処理ツールの管理、リスク管理、品質管理組織の役割と責任、および成果物が含まれている。

 

ISO/IEC 5259-4:2024 人工知能―分析と機械学習(ML)のデータ品質―第4部:データ品質プロセスフレームワーク

機械学習におけるトレーニング及び評価のためのデータ品質確保の手法を規定する。機械学習システムにおいてその品質を最も左右するデータラベリングのプロセスにおいて、データを準備して、評価し、利用するプロセスに焦点をあて、要件を整理し記述する。教師あり学習、教師なし学習、半教師付き学習、及び、強化学習をカバーする。

 

ISO/IEC 5259-5:2025 人工知能―分析と機械学習(ML)のデータ品質―第5部:データ品質ガバナンスフレームワーク

データ品質に係る組織のガバナンスのフレームワークを規定する。組織の上位層が、オペレーション層、マネジメント層へ指針を出し、監督することにより組織のデータ品質に関する説明責任を果たすことに資するよう意図している。

 

メンバー

金 京淑(産総研 人工知能研究センター 副研究センター長)

杉村 領一(産総研 情報・人間工学領域 チーフ連携オフィサー)

 

用語解説

ISO 8000Data quality:データ品質)シリーズ

産業データの企業やシステム間におけるデータ交換の品質保証を目的とし、データの収集、処理、管理、共有 に関して、正確性、完全性、一貫性、再利用性などを確保するための指針を提供する。

 

ISO/IEC 25000System and software engineering – Systems and software Quality Requirements and EvaluationSQuaRE: システム及びソフトウェア工学―システム及びソフトウェア品質要求事項及び評価(SQuaRE))シリーズ

ISO/IEC 25000~25002。ソフトウェア製品の品質特性や測定基準を定義し、品質要求の策定、評価、管理を支援することを目的とした国際標準である。信頼性や性能、セキュリティなどの観点からソフトウェアとデータの品質を評価する体系を提供する。

 

DFFTData Free Flow with Trust)信頼性のあるデータ流通

プライバシー、セキュリティ、知的財産権に関する信頼を確保しつつ、ビジネスや社会課題の解決に役立つデータの国境を越えた利活用を促進し、デジタル経済に関する国際的なルール形成への貢献を目指すIT総合戦略の一つである。

 

ISO/IEC JTC 1/SC 42(国際標準化機構/国際電気標準会議/合同専門委員会1/人工知能専門委員会)

2017年に設立されたISO(国際標準化機構)とIEC(国際電気標準会議)の合同技術委員会(JTC 1)に属する人工知能(AI)に特化した分科委員会(SC 42)。AI関する国際標準を策定し、AI技術の信頼性、安全性、透明性の確保を目指す。

 

ISO/IEC 25012 : 2008 Software engineering -- Software product Quality Requirements and Evaluation SQuaRE-- Data quality model

ソフトウェア工学―ソフトウェア製品品質要求事項及び評価(SQuaRE)―データ品質モデル

データ品質の評価基準を定めた国際標準であり、データの適切な管理と利用を支援するためのフレームワークを提供する。本規格のデータ品質モデルの基盤になる。

 

ISO/IEC 250242015 Systems and software engineering -- Systems and software Quality Requirements and EvaluationSQuaRE-- Measurement of data quality

システム及びソフトウェア工学―システム及びソフトウェア品質要求事項及び評価(SQuaRE)―データ品質の測定

データ品質の測定指標と評価方法を定めた国際標準であり、データの正確性、完全性、一貫性、適時性などのデータ品質特性を定量的に評価する測定するための指標を提供する。

 

 

プレスリリースURL

https://www.aist.go.jp/aist_j/press_release/pr2025/pr20250327/pr20250327.html

本プレスリリースは発表元が入力した原稿をそのまま掲載しております。また、プレスリリースへのお問い合わせは発表元に直接お願いいたします。

プレスリリース添付画像

  • エリア
    東京都
  • キーワード
    研究開発、人工知能、AI、国際標準規格、ISO、データ品質
このプレスリリースには、報道機関向けの情報があります。

プレス会員登録を行うと、広報担当者の連絡先や、イベント・記者会見の情報など、報道機関だけに公開する情報が閲覧できるようになります。

プレスリリース受信に関するご案内

このプレスリリースを配信した企業・団体

  • 名称 国立研究開発法人産業技術総合研究所
  • 所在地 茨城県
  • 業種 政府・官公庁
  • URL https://www.aist.go.jp/
  • ※購読している企業の確認や削除はWebプッシュ通知設定画面で行なってください
  • SNSでも最新のプレスリリース情報をいち早く配信中