今、保険業界は大きな転換期を迎えています。AIエージェントは実証実験のフェーズを終えて本格的な「実運用」へと移行し、単なる業務アシスタントから「自律的な意思決定者」へと進化を遂げつつあります。しかし現在、その進化が「具体的に何を意味するのか」を説明するための共通言語が業界内に存在していません。
このように明確な共通定義がない状態では、保険会社は現実的な導入計画を立てることができず、AIベンダーも自社の実力を証明して他社と差別化することが困難になります。また、規制当局にとっても、AIの能力に応じた適切な監督体制を築くことができません。その結果、市場には似たような製品が溢れてしまい、 現場の担当者から見ると、その製品が単なるチャットボットなのか、それとも完全に自律して動く支払査定システムなのか、その違いの判別すら難しいくなってしまう課題が生じてしまいます。
そこでShift Technologyは、保険業界におけるAIエージェントの自律性(自動化レベル)を評価する標準フレームワーク「ARISE」を提案します。
「ARISE」という名称は、AIの自律性を表す5つの進化レベルの頭文字を繋げた略語であると同時に、これからの保険のあり方を「構築・整理する思想」そのものでもあります。その5つのレベルとは、Answers(回答)、Recommends(提案)、Initiates(始動・準備)、Solves(解決)、Exceeds(超越)であり、AIエージェントが能力を高め、信頼を獲得していく中で、すべての保険会社が歩むことになる進化のプロセスを描いています。
世界3億5000万人以上の保険加入者を支える保険会社で、10年以上にわたりAIを実運用環境に実装してきた当社の知見に基づき、また、自動運転車業界に確固たる基準をもたらした「SAE International J3016」規格をモデルに開発されたARISEは、「特定のベンダーに依存しない『業界共通の客観的な評価基準』を提供します。 これにより製品のキャッチコピーに惑わされることなく、『実際の業務で本当に使えるかどうか』という現実的な基準でAIの実力を見極め、適切な導入とガバナンスを推進できるようになります。
本ホワイトペーパーでは、ARISEフレームワークの全容を、各レベルの正確な定義と具体例を交えて解説します。また、自動車保険、火災・損害保険、労災保険、旅行保険の各領域における、Shift Technologyの現在の実運用実績および製品ロードマップを各レベルにマッピングしてご紹介します。
その上で、AIエージェントを業界全体で責任を持って導入していくためには、こうした「自律性の標準基準」を確立することが絶対条件であると提唱します。
ARISEは自社で独占するものではなく、保険業界の健全なAI活用を支える『共通インフラ』として公開するものです。 保険会社、ベンダー、規制当局、アナリストが一体となり、この基準を現場で検証・発展させていくための『オープンな共通基盤』として、広く活用されることを提唱します。
2014年、SAE International(自動車技術会)は「SAE J3016」と呼ばれる自動車の自動運転システムに関する定義と分類を発表しました。この規格は、自動運転の度合いを「レベル0(自動化なし)」から「レベル5(完全自動運転)」までの6段階に定義したもので、またたく間に自動車メーカー、規制当局、保険会社、そして消費者の間で世界的な標準となりました。
この規格がこれほど成功を収めた理由は、次の3つの特性にあります。
自動車だけでなく、航空業界でも同じような道を歩んできました。米連邦航空局(FAA)や欧州航空安全庁(EASA)は、手動操縦からオートパイロット、さらには高度な機体保護システムに至るまで、コックピットシステムの管理に構造化された自動化レベルを長年使用しています。また、産業用ロボットの分野でも、「ISO 8373」規格がロボットの自律レベルを定義しており、これが世界中の工場における調達仕様、安全評価、そして損害保険の引受の基準となっています。
これらの業界に共通しているのは、「技術の急激な進化に、業界全体の共通認識が追いつかなくなったタイミングで、公式な『標準基準』を作ることで混乱を解消してきた」という点です。今、保険業界のAI活用は、まさにこの転換点に立っています。
マッキンゼー・アンド・カンパニーによる2023年の試算では、グローバルな保険業界においてAIを活用したユースケースは年間1.1兆ドルの価値を創出する可能性があるとされています。しかし、実際の導入状況にはバラつきがあり、その成果を正しく測定することもできていません。その大きな原因の一つが、「言葉の定義の曖昧さ」にあります。
例えば、保険会社がRFP(提案依頼書)で「AI支払査定エージェント」を募集したとします。このときベンダーから集まる提案は、簡易的なチャットボットから、人間の手を一切介さない完全自動の支払完結(STP)エンジンまで、千差万別です。業界共通の「ものさし」がない状態では、これらを意味のある形で比較・評価することは不可能です。
業界の意識調査も、この課題を裏付けています。デロイトが2024年に保険業界の経営層を対象に実施した調査によると、79%が「AIは経営戦略上の最優先事項である」と回答した一方で、「AIエージェントの自律性を評価するフレームワークや、人間の監視要件を明確に定めている」と答えた企業は30%未満にとどまりました。「理想」と「統制された実運用」の間には、依然として大きな溝があり、標準的な基準の確立こそが、この課題を直接解決する鍵となります。
言葉の定義が曖昧なままであることは、実務や財務の面で以下のような深刻なリスクをもたらします。
コストの最適化不足: 保険会社は、実際には使いこなせない高度なAI機能を過剰な価格で購入させられることになります。
規制対応の混乱: AIシステムに対する規制当局の検査において、審査官によって評価基準がバラバラになり、不整合な指摘を受けるリスクが生じます。
レピュテーションリスク: 経営陣が「想定していたレベル」を超えてAIエージェントが自律的に動いてしまい、予期せぬ判断ミスやコンプライアンス違反を引き起こすリスクは極めて深刻です。
共通の標準基準を導入することは、これらの目に見えないリスクを、経営陣がコントロール可能で測定可能な「健全な経営判断」へと変えるための必須条件なのです。
L1において、AIエージェントは自然言語での質問に対し、構造化データ・非構造化データ(保険約款、請求記録、規制データベース、過去の対応履歴など)を掛け合わせて情報を要約し、回答します。AIはアクションの提案までは行わず、あくまで「情報の提供」にとどまります。これは、自動運転でいう「ドライバーの運転を単一の機能で支援するが、意思決定の代替はしないレベル1」に相当します。
L2になると、AIは単なる質問への回答を超えて、状況を能動的に分析し、重要度や緊急度の高い「次に取るべき最適なアクション」を提案するようになります。請求内容、書類、写真、サードパーティデータなどの複数のデータストリームを統合し、地域の規制ルールを適用した上で、優先順位付きのアクションプランを作成します。ただし、最終的な決定権はすべて人間の担当者にあり、人間が指示を出す必要があります。これは、車両が複数の機能を制御しつつも、監視とオーバーライドの責任は常にドライバーにある自動運転のレベル2(部分的自動化)と重なります。
L3は、単なる「業務アシスタント」から「エージェント型AI」へと移行する極めて重要な境界線です。AIエージェントがワークフロー全体を自ら動かし、実行に必要なすべての要素を裏側で準備しますが、「最終的な承認だけは人間の専門家が行う」という形式を取ります。補償内容の確認、不正のスクリーニング、過失割合の評価、支払備金の計算、書類の検証にいたるまで、AIがすべてのチェックを裏側で完了させます。そして、すでに入力済みの決済確定画面や顧客向けのお詫び・案内文をセットにし、「あとはワンクリックで承認できるパッケージ」として人間に提示します。人間の監視は維持されますが、その負担は最後の承認作業のみに激減します。これは、一定条件下ではシステムがすべての運転操作を行うものの、要請があれば人間が介入しなければならない自動運転のレベル3(条件付き自動化)に似ています。
L4では、AIエージェントが受付、調査、意思決定、そして保険金支払いにいたるまでのワークフロー全体を、一切の人間の手を介さずに完結させます。AIは契約約款、コンプライアンス、保険会社固有のビジネスルールを大規模かつ一貫して適用し、99%以上の極めて高い判断精度を維持します。人間の役割は、「1件ごとの決済承認」から、「ポートフォリオ全体の定期監査」や「AIが判断を保留した例外事案の管理」へとシフトします。これは、特定の環境下(運行設計領域内)であれば、人間が全く関与しなくても車両がすべての運転タスクをこなす自動運転のレベル4(高度自動化)と全く同じ構図です。
L5は、保険AIにおける最先端の領域です。AIエージェントは単に自律的に動くだけでなく、人間のトップ1%の熟練査定員すら上回る成果を叩き出します。それは、既存のルールやプロセスを効率的にこなすからではありません。「現在の業務プロセス自体が抱えるわずかな非効率性」をAI自らが発見し、より優れた結果を出すために、AI自身の判断でインテリジェントにルールを応用・逸脱していくからです。L5のエージェントは、まだ世の中に顕在化していない新しい不正請求のパターンを損失が出る前に見つけ出し、熟練の調査員が見落としていた潜在的な求償機会を掘り起こし、複雑な事案を最も早く解決できるルートへ動的にルーティングします。これは、あらゆる条件下で人間の能力を超える運転を行う、自動運転のレベル5(完全自動化)の概念に対応しています。
「自律性レベル(SLA)」フレームワークは、決して机上の空論ではありません。世界トップクラスの保険会社における、Shiftの豊富な本番実装実績と経験に裏付けられた、極めて実戦的な基準です。次章のロードマップ(表2)では、Shiftが現在提供している製品の能力と今後の開発計画を、保険種目およびユースケースごとに各自律性レベルへマッピングしています。
ここに提示する指標は、将来の「目標」ではなく、すべて現在稼働中のShiftの実運用環境から測定されたリアルな数値です 。
私たちがこのSLAフレームワークを開発した最大の理由は、Shift自身が現場で強い直面した課題にあります。 共通の「共通言語」がない状態では、保険会社の経営陣、調達チーム、そして規制当局に対し、AIができることの『明確な違い』や『真の価値』を正確に伝えることが極めて困難だったからです。ARISEは、製品のキャッチコピーに惑わされることなく、『実際の業務でどれだけ使えるか』という現実を見据えながら、経営の次の一手を具体的に議論するための強力な共通基盤となります。
Shiftの保険金支払自動化プラットフォームは、比較的シンプルな請求種目を対象に、2020年に初めて「L4:Solves(解決)」レベルの完全自動化を達成しました。それ以降、対象領域はより複雑な保険種目へと着実に拡大しています。現在は、エージェント型AI機能の追加により、実質的にほぼすべての保険種目および請求タイプにおいて、ShiftのAIエージェントがL4レベルで稼働できるようになっています。
以下にご紹介する2つの事例は、「同一の人身傷害請求データ」を使用し、AIエージェントがどのように動くかを対比したものです。まず、すでに現場で稼働している「L3:Initiates(始動・準備)」の実例、続いて同じデータを用いて「人間を一切介さない場合」を検証した「L5:Exceeds(超越)」のシミュレーション結果をご紹介します。
現在の実力:「L3」はすでに支払査定の現場で動いている
Shiftの人身傷害担当AIエージェントは、現在「L3:Initiates」レベルで実運用されています。AIがデータ分析や事務処理といった「チェックポイント間の実務」をすべて裏側で引き受ける一方、人間の査定員はワークフロー内の重要な意思決定ポイントにのみ関与し、完全な監視体制と最終決定権を維持しています。
※車両損害分は清算済み。弁護士から届いた書類は、主張文、車両破損レポート、医療記録、医療費請求書など総計112ページに及び、回答期限は「10日間」と指定されていました。
過去の全履歴を解析したAIは、自社の契約者が当時「相手車両がスピード違反をしていた」と主張していた点に着目。これが証明されれば、自社の過失割合を引き下げられる可能性があると判断しました。AIはこの分析結果と「推奨する証拠収集プラン」を担当査定員に提示。査定員がこれを承認すると、AIは自動で警察の事故報告書や現場の交通カメラ映像を収集し、過失割合を100%から75%に引き下げるための強固なエビデンスを揃えました。
並行して、AIはすべての医療記録と診療報酬明細書をレビューし、過去の類似の和解事例や判例と照合して損害額のベンチマーク分析を行いました。その際、AIは書類内の重大な矛盾を検知しました。被害者は「怪我のせいで予定していたゴルフコンペに参加できなかった」と主張していましたが、該当日の医療記録には「身体的な運動制限なし」と記載されていたのです。AIは、適正な賠償額の算出レンジとともに、この「主張と事実の矛盾」を査定員へ報告し、確認のサインを得ました。
査定員による過失割合の見直しと損害分析の確認を終えると、AIは適切な反論・減額提示の金額、その拠り所となるロジック、契約書などの書類一式を網羅した「完全な示談パッケージ」を自動生成し、査定員の画面に提示しました。査定員がこれを確認し「ワンクリックで承認」したため、AIは4月12日、当初の請求額の52%にあたる「8万7,360ドル」での和解案を相手方に送付。4月14日に相手方もこれを合意しました。
市場調査の結果を見ても、多くの保険会社が現時点で「人身傷害(対人賠償)のような法律や高額な金銭が絡む複雑な支払いを、AIに完全自動で任せる(L5運用)準備ができていない」ことは重々承知しています。これは極めて真っ当な経営判断です。対人賠償請求は法的・財務的、そして企業の信頼性の観点から非常に重みがあり、完全自律的な決断を統制するための枠組みは、業界全体でまだ成熟の途上にあるからです。ShiftがARISEフレームワークにおいて「L3(人間が承認)」と「L5(完全自律)」の境界線を極めて厳格に区別しているのは、まさにこのためです。
しかし、私たちは「テクノロジーがどこまで進化しているか」という未来への道標を示すため、全く同じ事案・リアルなデータを使って、人間のチェックポイントをすべて「ゼロ」にしたL5運用のシミュレーションを行いました。
シミュレーション環境において、AIエージェントはどの段階でも人間の査定員の承認を待ちませんでした。 AI自身が過失割合を引き下げるチャンスを自発的に察知し、警察の報告書やカメラ映像などの証拠を自律的に収集・判断。損害額を算定して、最終的な示談パッケージの組み立てから、相手方への「8万7,360ドル」の和解案の提示にいたるまで、人間のタッチポイントを一切挟まず、エンドツーエンドで自律的に実行しました。相手方の合意を得るまでの期間は変わらず8日間ですが、人間の査定員が費やした時間は「1秒もなし(ゼロ)」でした。
本シミュレーションは単なる新製品の告知ではなく、技術が向かうべき『未来の方向性』を提示するものです。複雑な人身傷害の領域においても、L5(超越)を可能にする技術基盤はすでに確立されています。
すべての保険会社の経営陣がこれから問いかけるべきなのは、「人身・賠償の領域にL5が来るかどうか」ではありません。「自社はいつ、その未来を迎える準備を整えるのか」「そこへ安全にたどり着くために、今どのような管理体制への投資が必要なのか」という問いです。ARISEフレームワークは、まさにその経営の問いに対する明確な答えを導き出すために設計されています。
SLAフレームワークは、AIの「調達」と「統制」を支える実戦的なツールとして機能します。今後、AIベンダーを評価・選定される際には、提案されている個々の機能が「どの自律性レベルに該当するか」を明確にマッピングすることを推奨いたします。
人間の最終判断をワンクリックで仰ぐ「L3:Initiates」と、AIが自律的に実行まで行う「L4:Solves」では、求められるコンプライアンスや監査の要件が根本から異なります。また、これらはいずれも、情報検索ツールである「L1:Answers」のチャットボットとは必要とされる技術水準や運用体制が大きく異なります。調達の段階で自律性のレベルを明確にしておくことが、導入後のミスマッチや予期せぬ追加投資を防ぐための有効なアプローチとなります。
また、それぞれの自律性レベルに応じて、適切なガバナンス体制をステップバイステップで構築していくことが重要です。
現在、世界中の規制当局において、金融サービスにおけるAI監視の枠組みの整備が急速に進められています。米国の全米保険監督官協会(NAIC)のガイダンス、欧州の「欧州AI法(EU AI Act)」、英金融行為規制庁(FCA)の動向など、これらはすべて「AIの自律性が高く、意思決定の権限が大きいほど、より厳格な監視を求める」という原則に基づいています。
ARISE(SLA)フレームワークはこの原則を実務に落とし込み、社内で運用するAIエージェントが「当局の定めるどのリスク階層に該当するか」を正確にマッピングするための共通言語をコンプライアンスチームに提供します。
具体的には、保険金支払いの決済、不正請求の認定、補償の可否判断を自律的に行う「L4:Solves」や「L5:Exceeds」のエージェントは、今後の規制環境において「高リスクAIシステム」の検証対象となる可能性が極めて高いと考えられます。客観的な自律性レベルの分類、明文化された監視体制、そして実証データに基づく精度検証をあらかじめ証明できる体制を整えておくことで、共通の基準を持たない場合に比べて、今後の当局による検査や監査へのスムーズかつ安全な対応が可能になります。
Shift Technologyは、大手保険会社をはじめ、MGA(保険代理業者)、TPA(給付管理専門業者)、再保険会社、コンサルティングファーム、そして業界アナリストにいたるまで、保険エコシステムに関わるすべての皆様に、このSLAフレームワークを「共通の物差し」として導入いただくことを広く呼びかけます。
こうした標準基準の普及には、参加者が増えるほど価値が高まる「ネットワーク効果」が働きます。私たちはこのフレームワークをオープンに開示し、テクノロジーの進化に合わせて業界全体でレビューし、ブラッシュアップし、拡張していくことを期待しています。
私たちの目的は、定義の支配権を握って自社だけの優位性を作ることではありません。業界全体に明確な基準をもたらすことで、より迅速に、より安全に、そして説明責任を果たせる形で、保険業界全体のAI活用を次へ進めることです。
保険業界の経営幹部の皆さまが今、向き合うべきテーマは、もはや「AIを導入するかどうか」という段階ではありません。「いかに社会的な説明責任を果たしながら実業務へ大規模に組み込み、確かな統制を効かせながら、確実な経営成果へと結びつけるか」という、実運用における極めて具体的なステップへと移行しています。しかし、AIが「現場の業務をどこまで自律的に担っているのか」を客観的に測る共通の指標がなければ、この先の実践的なビジョンを描くことは困難です。
Shiftが提唱する「自律性レベル(SLA)」フレームワークは、まさにその羅針盤となる、業界共通の新たな「評価基準」を提供するものです。
安全な自動運転技術の発展を支えた評価手法をモデルに、保険実務の本質を見据えて設計されたこのフレームワークは、AIの能力を「ARISE」という5つのフェーズに体系化しました。これらはすべて、曖昧さを排した定義と現場のリアルなユースケースを備えており、グローバルな主要保険会社におけるShiftの確かな実績に裏付けられています。
私たちは、このフレームワークが今後の保険業界において、AIエージェントを語り、評価し、調達し、統制するための「世界標準」になると確信しています。
私たちはこれを、単なる資料としてではなく、保険業界における「信頼されるAI活用」のインフラへの貢献として捧げます。なぜなら保険とは、何よりもまず「信頼」の上に成り立つビジネスだからです。これからの保険の未来を創るAIエージェントは、人間から信頼され、その判断プロセスを説明でき、そして実力が正確に理解されていなければなりません。
Shift Technologyは、市場において、取締役会の議論において、そして今後の保険AIの未来を形作る規制当局のガイドラインのページにおいて、この世界標準を確立するために、皆さまと共に先頭に立って邁進していくことをお約束いたします。
Selected References
SAE International. (2021). J3016C: Taxonomy and Definitions for Terms Related to Driving Automation Systems for On-Road Motor Vehicles. SAE International.
McKinsey & Company. (2023). The State of AI in Insurance: Toward $1 Trillion in Value. McKinsey Global Institute.
Deloitte Insights. (2024). 2024 Insurance AI Adoption Survey. Deloitte Center for Financial Services.
NAIC. (2023). Model Bulletin on the Use of Artificial Intelligence Systems by Insurers. National Association of Insurance Commissioners.
European Parliament. (2024). EU Artificial Intelligence Act (Regulation EU 2024/1689). Official Journal of the European Union.
ISO 8373:2021. Robotics — Vocabulary. International Organization for Standardization.