説明可能なAI
説明可能なAI[1](せつめいかのうなエーアイ、英語: explainable artificial intelligence、略称XAI)またはAIを説明するための技術[2]は、人工知能 (AI) が導き出した答えに対して、人間が納得できる根拠を示すための技術である[3]。特定の技術やツールを指し示す言葉ではなく、「AIを理解する」という目的のために研究・提案されている技術の総称である[4]。XAIという用語は2017年4月から始まったアメリカ合衆国DARPA主導による研究プロジェクト(XAIプロジェクト)を契機として広く浸透した[1]。 背景2010年代初頭の第三次AIブーム到来によりAIの利活用領域は多方面に広がり、自動運転車や病気診断など、影響の大きな、高い信頼性が求められる分野での利用も視野に入れられるようになってきた[5]。一般的なソフトウェアと異なり、機械学習により条件やルールなどを学習させて処理結果を出力するAIでは、人の意思決定に関わる柔軟な対応が求められる複雑な業務に利用ができる反面、柔軟な処理を行うからこそ、その処理結果の根拠を明確に提示できないという課題を持っていた[6]。こうした背景からAI分野において公平性、説明責任、透明性といった倫理性が求められるようになった[6]。ホワイトハウスは2016年10月、米国人工知能研究開発戦略計画を発表し、これを受けてDARPAは翌4月にAI倫理・ガバナンスに関する研究Explainable Learnersプロジェクト(説明可能モデルと説明インタフェース)およびPsychological Model of Explanationプロジェクト(説明の心理学)に着手した[7][8]。DARPAは、人類のパートナーとしてAIを理解し、信頼し、効果的に管理するために、AIが導き出す答えとその過程について説明可能であることが必要不可欠であるとした上で、それぞれの機械学習システムは動作の仕組みやその特徴(長所と短所)を人間が理解するための機能を備えているべきとして、2021年までにXAIの研究を比較検証フェーズまで完了させることを目標としている[9]。 3つの原則2019年に開催された第14回20か国・地域首脳会合で「人間中心のAI社会原則」が承認され、この中でも公平性、説明責任、透明性についての原則が明記された[6]。こうした要求に答えるため、AIによって行われた処理の根拠や透明性を求める声が高まっている[1]。
近年のAIにおいて求められる3つの原則に共通して求められる機能が「AIが学習によってどういう処理を獲得したか」「どういう根拠に基づいて出力を決定したか」といった論理を説明できることであり、AIの内部処理が複雑になればなるほど困難な要求事項である[1][13][14]。XAIはこうした処理の複雑さと説明可能性のトレードオフを解消するために提唱される新たな技術である[14]。 説明手法XAIでは説明範囲の違いやその目的によってAIの説明を2つに分類しており、個々の入力データに対する出力という、個別具体的な予測結果に対する説明を局所説明、指定したAIモデルの全般的な振る舞い(特徴)に対する説明を大局説明と定義している[15]。局所説明としては、特徴量を使った説明(例として、画像データを用いて画像検索を行う際の予測を決定づける画像領域を可視化するなど)、判断ルールによる説明、AIの学習に用いたデータを使った説明などがある[16]。2023年、AIモデリングの専門家が改めてAIモデルの透明性を測定する方法を発表した[17]。 ビジネスへの転用米国連邦取引委員会(FTC)が今後説明が不可能なAIについて調査を行う可能性を示唆し、警告を発したことや、EUにおいて2023年に人工知能法が成立する可能性があることなどを背景に、XAIはシリコンバレーにおいて急激に注目を集める分野となっており、スタートアップ企業やクラウド企業による開発競争が激化している[18]。 日本においてはNTTデータが判定理由が求められる審査業務への適用などを検討している[19]。日立製作所では、企業のDX支援業務にXAI技術を取り入れ、AIの予測結果や判定結果に対する根拠をスピーディーに提供できるシステム作りをNTT東日本と共創していきたいというプレスリリースを2021年9月に発表している[20]。また、2021年10月にはTBSテレビが選挙の開票速報番組においてXAI(富士通のWide Learning)を使用した当落速報予測の根拠を提示する取り組みについて発表した[21]。 代表的なXAI技術LIMELIMEは任意の入力データに対するAIモデルの予測結果について、予測に用いられたデータの特徴を算出する局所説明技術である[22]。2016年にワシントン大学のマルコ・トゥーリオ・リベイロ(Marco Tulio Ribeiro)らによって提唱されたもので、XAIを実現するための代表的な技術のひとつである[23][19]。テーブル、画像、テキストに対応したライブラリが提供されているOSSである[22]。 SHAPSHAP (SHapley Additive exPlanations) はゲーム理論に基づいて個々のプレイヤーの寄与を算出する仕組み(シャープレイ値)を用いた局所説明技術である[24]。スコット・ランドバーグ(Scott Lundberg)によって2018年にGitHubに公開されたOSSであり、ツリー系アンサンブルモデル、ディープラーニングモデル、その他の一般的なアルゴリズムにおけるシャープレイ値の算出機能を提供している[25]。 Permutation ImportancePermutation ImportanceはAIモデルごとの特徴量の重要度を計算する大局説明技術である[26]。アーロン・フィッシャー(Aaron Fisher)らによって2018年に提案された技術で、要素をランダムに並べ替えてその誤差を計測することで、その要素がどの程度処理結果に寄与しているかを計測するPermutationという手法を用いている[27][28]。 Partial Dependence PlotPartial Dependence Plotは、入力データの変化がAIモデルを通して出力データにどの程度影響を与えるかを説明するために変化量をグラフ化し提供する技術である[29]。 Tree SurrogateTree Surrogateは表形式データを予測するタイプのAIモデルにたいして適用できる技術で、AIモデルの複雑なI/Oを人間が解釈しやすい別の代理モデル(決定木代理モデル)に当てはめてロジックを説明する技術である[30]。 CAMCAMはClass Activation Mappingの略で、畳み込みニューラルネットワークを用いた画像識別の判断理由を説明するための技術[31]。ネットワークアーキテクチャの制限を克服したGrand-CAMも存在しており、Grand-CAMはGAPを使用しない分類モデルにも適用できる[32]。 Integrated GradientsIntegrated Gradientsはデータの入力値と出力値の勾配を用いて影響度を算出し、説明するための技術である[33]。PyTorchのCaptumライブラリにはIntegrated Gradientsが実装されており、インタフェースなどが整備されている[33]。 Attention回帰型ニューラルネットワークなどの言語系モデルや畳み込みニューラルネットワークなどの画像モデルにおいて特徴量の重要度を算出する技術である[34]。 XAIの類型用語XAIはAIを何らかの観点から理解し説明していくということを目的とした技術であり、論文や文献による異なる言い回し、手法の違いなどによる多数の類型用語が存在しており、代表的な表現としてUnderstandabillity(わかりやすさ)、Intelligibillity(明瞭度)、Predictabillity(予測可能性)、Trustworthiness(信用性)、Reliabillity(確実性)、Transparent AI(透明性のあるAI)、Interpretable AI(解釈可能なAI)、Explainable AI(説明可能なAI)、Accountable AI(説明責任のあるAI)、Fair AI(公正なAI)、Explainable Machine Learning(説明可能な機械学習)などが挙げられる[35][36]。 関連項目脚注
参考文献
|
Portal di Ensiklopedia Dunia