米国のGAO（連邦議会行政監査局）によるデジタル・フォレンジック技術・アルゴリズムの評価と更なる課題レポートおよびデジタル・フォレンジックに関する研究機関の最新情報

　筆者の手元に、邦議会独立補佐機関GAO（連邦議会行政監査局）(注1)から「デジタル・フォレンジック技術・アルゴリズムは犯罪捜査に利点をもたらすが、一方で、攻撃の痕跡や手法などの技術的解析から、攻撃者の意図をめぐる地政学的背景まで、多様な状況証拠の収集と分析を通じ、匿名性が高いサイバー攻撃の攻撃者や背後の攻撃国を特定（判断）していくプロセスであるフォレンジック・アトリビューション(attribution )の難しさ、さらに偏見や誤用の可能性、結果を伝える難しさなど等さまざまな要因が結果に影響を与える可能性がある」というレポートが届いた。

　米国GAOには、この問題と関連するレポートが２つある。1つ目は

「デジタル・フォレンジック技術:連邦法執行で使用されるアルゴリズム(Forensic Technology:Algorithms Used in Federal Law Enforcement GAO-20-479SP　Published: May 12, 2020. Publicly Released: May 12, 2020)」

　2つ目は、「デジタル・フォレンジック・アルゴリズムの技術で性犯罪者を追い詰めるNov 27,2020」である。今回のブログは後者レポートの概要も併せ引用する。

　筆者は従来からわが国で「フォレンジック」を「法医学」、「法廷証拠学」や「法科学」といった訳語が氾濫していることに懸念している。(注2) その中で、以下の令和4年6月　法務省刑事局作成の検察庁「各種犯罪への対応（時代に即した検察庁における人材育成）」を読んだ。

デジタル・フォレンジック＝電子鑑識　ジタルフォレンジック（DF）とは、押収したデジタル機器内に保存されているデジタルデータを適正な手続により、全く同じ状態で抽出し（保全）、その抽出したデータの中から犯罪立証のための客観的証拠を見つける（解析）ための手法、技術。

法務省刑事局作成の検察庁「各種犯罪への対応（時代に即した検察庁における人材育成）から抜粋

　GAOレポートを簡易かつ正確に読むには、まず“Highlights”と「GAOが明らかとした事項」、および「GAO が本調査を行った背景」を概観することがポイントなるので、今回のブログでは、まず、その内容をまとめるとともに関連する注書きを追加した。

　なお、最後に法務省の犯罪白書等によると性犯罪者の起訴の難しさや有罪化率の低さはわが国でも同様であろう。

１．2024.1.25 GAO　レポートGAO-24-107206

　「デジタル・フォレンジック技術・アルゴリズムは犯罪捜査に利点をもたらすが、一方でさまざまな要因が結果に影響を与える可能性がある(Forensic Technology: Algorithms Offer Benefits for Criminal Investigations, but a Range of Factors Can Affect Outcomes)」(全文は16頁)を仮訳する。なお、３つのアルゴリズムの内容については、GAO-21-435SPが詳しく論じているので一部引用し、補筆した。

３つのアルゴリズムにつきGAO レポートから抜粋

(1) 概況報告(Fact Sheet)

　指紋やその他の物的証拠は長い間、法執行官や調査官が犯罪を解決するのに役立ってきた。しかし、デジタル・フォレンジック・アルゴリズムの進歩により専門家はそのような証拠の調査を部分的に自動化できるようになった。

このアルゴリズムは、指紋や掌紋、顔画像、DNA を分析できる。我々は、これらのツールが多くの調査の速度と客観性を向上させることができることを証明した。

　しかし、一方でアナリストや調査員は、偏見や誤用の可能性、結果を伝える難しさなどの課題に直面している。

GAOの以前の研究2021.7.6 発表では、これらのアルゴリズムのテスト方法、成果や実績、使用時期の透明性の向上など、役立つ可能性のある政策オプションが特定された。

(2) GAOが明らかとした事項

　2020年と2021年のGAOの技術評価では、連邦法執行機関が証拠が個人に由来する可能性があるかどうかの評価に主に3種類のデジタル・フォレンジック・アルゴリズム（①確率的ジェノタイピング(Probabilistic genotyping algorithms)、②指紋の潜在印刷物分析(Latent print analysis)、③顔認証(Face recognition)）を使用していることが判明した。

①確率的ジェノタイピング・ アルゴリズム

　確率的ジェノタイピング・アルゴリズム(Probabilistic genotyping algorithms) (注3)は、分析者が従来の分析よりもさまざまな DNA 証拠 (複数の寄与因子を持つ DNA 証拠や部分的に分解された DNA など) を評価し、そのような証拠を対象者から採取した DNA サンプルと比較するのに役立つ。これらのアルゴリズムは、尤度比(ゆうどひ)(注4)と呼ばれる証拠の強さの数値尺度を提供する。これらのアルゴリズムを評価するために、法執行機関などは、DNA サンプルの品質、サンプル中の DNA の量、貢献者の数、民族性や家族関係など、尤度比に対するいくつかの要因の影響をテストする。 GAO は、これらのアルゴリズムの使用に対する 2 つの課題を特定した。たとえば、尤度比は複雑であり、確率的ジェノタイピングに関連する結果を解釈したり伝達したりするための標準はない。

②指紋の潜在印刷物分析

　分析者が一人で作業するよりも迅速かつ一貫して、指紋と掌紋の大規模なデータベースを検索できる。その精度は、画質、特定された画像特徴 (隆線パターンなど) の数、分析者が完成した特徴マークアップの変動など、さまざまな影響要因にわたって評価される。ただし、出力の使用に人間が関与すると、エラーや認知バイアス(cognitive bias：物事の判断が、直感やこれまでの経験にもとづく先入観によって非合理的になる心理現象のことである)が発生する機会が生じる。

③顔認証(注5)アルゴリズム

　分析者が画像からデジタル詳細を抽出し、データベース内の画像と比較するのに役立つ。これらのアルゴリズムは、大規模なデータベースをより高速に検索でき、アナリストよりも正確である。これらのアルゴリズムの精度は、画質、データベースサイズ、人口統計など、さまざまな影響要因にわたって評価される。大規模なデータベースも検索できる。人間のアナリストだけで行うよりも精度が高くなる可能性があるが、連邦法執行機関では一般的に行われているように、アルゴリズムと訓練を受けたアナリストを組み合わせることで最高の精度が得られるとある研究では報告されている。ただし、アルゴリズムの出力を人間が解釈するとエラーやバイアスが生じる可能性があり、一部の法執行機関のユーザーは結果が保証されているよりも確実であると認識する可能性がる。

　 GAO は、これらのアルゴリズムの使用に対するいくつかの課題を特定した。たとえば、人間の関与によりエラーが発生する可能性があり、政府機関は最も正確で、人口統計グループ間のパフォーマンスの差が最小限に抑えられるアルゴリズムをテストして調達するという課題に直面している。

　GAO の 2021 年報告書では、政策立案者がフォレンジック・アルゴリズムの使用に対する主要な課題に対処するために検討できる 3 つの選択肢について説明した。① 政策立案者は、フォレンジック・アルゴリズムの一貫した客観的な使用を改善するためのトレーニングの強化、②捜査におけるフォレンジック・アルゴリズムの適切な使用に関する基準とポリシーの策定、および③アルゴリズム・テストに関連する透明性の向上を支援することができるとした。

(3) GAO が本調査を行った理由

　1世紀以上にわたり、法執行機関は重要人物の特定、未解決事件の解決、行方不明者や搾取された人々の発見に役立つ物的証拠を調査してきた。デジタル・フォレンジック専門家は現在、アルゴリズムを使用して犯罪捜査で収集された証拠の評価を部分的に自動化しており、捜査の速度と客観性が向上する可能性がある。

　GAO は、これまで法執行機関におけるフォレンジック・アルゴリズムの使用に関する技術評価を実施してきた (GAO-21-435SPおよび GAO-20-479SP参照)。今回のGAOレポートでは、確率的ジェノタイピング、指紋の潜在印刷物分析、顔認識という 3 つのアルゴリズム・タイプの利点と課題、およびこれらの課題に対処するために政策立案者が検討できるオプションについて言及した。

２．2020.5.12 GAOレポート(GAO-20-479SP)の概要

「フォレンジック技術:連邦法執行で使用されるアルゴリズム(Forensic Technology:Algorithms Used in Federal Law Enforcement) 」(全文は24頁)を仮訳する。

【概況報告】

　米国の法執行機関は永年、犯罪解決に指紋などの物的証拠を活用してきた。現在、コンピュータ・アルゴリズムは、そのような証拠が特定の人物に関連しているかどうかを評価するのに役立つ。これはフォレンジック帰属(forensic attribution) (注6)として知られるプロセスである。

以下については前記1.の内容と重複するので略す。

３．デジタル・フォレンジック・アルゴリズムの技術で性犯罪者を追い詰める(Using Algorithms to Track Down Sex Criminals) (2020.11.27 公表)

　GAOレポートと関連してデジタル・フォレンジック・アルゴリズムに関する新たなintech.mediaポータルの日本語レポートを読んだ。このレポート(原文は英語はAI翻訳らしき内容で、翻訳文としてはいまいちであるが、リンクは確実である。以下、要旨とリンク先データの抜粋、仮訳を行う。

　なお、筆者は関連サイトを調べる中で“プロメガクラブ”の興味深い下記サイトDifferex Systemを見出した。まだ具体内容は読んでいないが、改めて研究したい。

(1)証拠収集上の課題

　性的暴力事件の起訴を実行するには、法執行機関と法制度に多くの課題がある。性的暴行事件の起訴にいたる裁判化件数は、他のどの犯罪よりもはるかに少なく、最近の統計(注7)では、1,000人中5人が刑務所に収容されるにとどまっている。弁護士は、性的暴行事件の起訴が困難であることを認めており、有罪判決の数が少ない理由の1つは、被疑者を暴行と結びつける物理的証拠がないことがあげられる。

　いわゆる「レイプキット(rape kit)」は、正しくは「性的暴行証拠キット」または「SAEK(Sexual Assault Evidence Kit)」と命名され、事件の捜査に役立つ。性的暴行の後、医療スタッフは性的暴行フォレンジック検査(Sexual Assault Medical Forensic Examination)を行い、この検査キットは被災者の衣服、所持品、身体に残された毛髪や精液などの身体的証拠を収集し保管するために使用される。これらのサンプルは、DNA検査を通して、犯罪者のDNAプロファイルの全国データベースであるODIS (注8)にアップロードして照合する。

　しかし、SAEKで採取した検体を検査するには時間がかかり、1キットあたり平均約1000ドルの費用がかかる。また、検査ができるのはデジタル・ォレンジックの専門家のみであり、DNAが採取できる可能性が最も高いと考えられる検体を絞り込むことで時間短縮をはかろうとするが、性的暴行事件の捜査に間に合うようにキットを処理して検査するのに膨大な時間がかかる。多くの都市では、キットは単に保管されているだけですが30日以上経過したキットは廃棄されることもあり、これはニューヨーク市で起きたことで、2012年以降、840個のキットが廃棄された。

　しかし、現在では、高度な機械学習(Machine Learning)によって、キットの検査やDNAサンプルのタイプをより迅速かつ正確に行うことが可能になり、収集された証拠を直ちに暴行事件の起訴に利用できるようになった。

(2)機械学習による検査の高速化と正確性の向上

　スタンフォード大学人間中心人工知能研究所(Stanford University Human-Centered ArtificiaIIntelligence)(HAI)の報告書によると、同大学のローレンス・M・ワイン(Lawrence M. Wein)教授は、SAEKのどの生体試料がDNAを提供する可能性が高く、その結果がヒトの検査官の推奨よりも正確であるかを予測できる機械学習アルゴリズムを開発した。

　ワイン教授の最初の研究は、サンフランシスコ警察(SFPD)データベースに基づいていた。同研究所は、SAEKのすべての要素を検査し、DNAを含む可能性が最も高いと考えられるすべてのサンプルに関する情報を収集し、保管するものであった。サンフランシスコ警察(SFPD)のデータベースには、2年間(2017~2019年)にわたって検査された868キットのデータが含まれており、Weinのチームは、SAEKのどの要素がCODIS(Combined DNA Index System)データベース(注9)にロードする価値のあるDNAサンプルを含む可能性が最も高いかを予測するのに十分な精度の機械学習モデルを開発することができた。

(3) 機械学習の仕組み

　機械学習は、人工知能(AI)の多くの応用例の1つである。人工知能とは、コンピュータやその他のシステムに経験や過去の情報から学習する能力を与え、状況を評価し、人間の行動から独立した判断を下す能力を与える仕組みである。機械学習の日常的なアプリケーションには、検索エンジンや、ユーザーの過去の行動に基づいて提案を行うプラットフォームなどがある。

　大量のデータへのアクセスは機械学習にとって不可欠であり、クラウドベースのストレージプラットフォームはこれまで以上に多くのデータを利用可能にする。機械が操作できるデータが多ければ多いほど、機械のパフォーマンスはより正確になる。これにより、大規模なデータセットに対して人間が同じことをするのに要する時間の数分の一で複雑な操作を行うことが可能になり、間違った結果や不完全な結果をもたらす「ヒューマンエラー」を減らすことができる。

　このように、高度な機械学習プロセスとSFPDが提供する大規模なデータセットの組み合わせによって、Wein教授の初期研究が可能になり、性的暴行事件の捜査と起訴の方法を良い方向に変えられる可能性があることを示した。

【参考】

わが国の犯罪白書や令和３年５月性犯罪に関する刑事法検討会「性犯罪に関する刑事法検討会」取りまとめ報告書を読んでの感想

わが国ではintech.mediaポータルの日本語レポートのような問題指摘は見当たらなかった。

１．犯罪白書

令和4年白書犯罪統計から性犯罪を抜粋

２．令和３年５月性犯罪に関する刑事法検討会「性犯罪に関する刑事法検討会」取りまとめ報告書

デジタル・フォレンジックについての問題指摘は見当たらなかった。

**********************************************:

(注1)わが国でのGAOの訳語も多岐にわたる。しかし、筆者は2008年にブログで取り上げ訳語にこだわった。

2008.11.29 「連邦議会独立補佐機関GAO（連邦議会行政監査局）による行政Watchdogの役割と機能」(Last Updated: Febuary 25,2022)の(注2)参照。

(注2) 原文は「フォレンジック」のみである。しかし、わが国で訳語につき、一律に「法医学」という訳語については大いなる疑問を抱いていた。特に企業情報システム部門にとってのフォレンジック対応はどう訳するのか。

その中で、立命館大学情報理工学部上原哲太郎氏の発表資料を改めて読んだ。そこで筆者が選んだ訳語は「デジタル・フォレンジック」である。以下、一部抜粋する。

辞書的には「科学的な知見を法的解決のために役立てること：特に証拠の分析に使うこと」の意である。

Forensic Medicine 法医学
Forensic Chemistry 法化学
Forensic Science 鑑識学
デジタルなデータを法的に生かすためにComputer Forensics　Digital Forensicsという語が産まれた
ここではデジタル・フォレンジックで総称

＊インシデント・レスポンス

コンピュータやネットワーク等の資源及び環境の不正使用、サービス妨害行為、データの破壊、意図しない情報の開示等、並びにそれらへ至るための行為（事象）等への対応等を言う。

＊ デジタル・フォレンジックとは、「インシデント・レスポンスや法的紛争・訴訟に際し、電磁的記録の証拠保全及び調査・分析を行うとともに、電磁的記録の改ざん・毀損等についての分析・情報収集等を行う一連の科学的調査手法・技術を言う」と定義されている。

＊企業情報システム部門にとっての「フォレンジック対応」

民事訴訟対応のため（特に欧米で）
企業コンプライアンスのため
IT内部統制の健全性を確保する道具として
内部不正調査の道具として
システム管理のため
インシデンスレスポンスの武器として

(注3) 「確率的ジェノタイピング(Probabilistic genotyping algorithms)」は、DNAプロファイリングにおける統計的手法と数学的アルゴリズムの使用をいう。サンプルが非常に少ない場合や、複数の個人のDNAの混合物が含まれている場合など、困難な状況では、手動による方法の代わり使用できる。

(注4) 尤度比((ゆうどひ:likelihood ratio)とは、感度と特異度の比を表すもので，感度÷（1－特異度）で計算する。感度または特異度が高いほど，大きな値をとる。これは正確には陽性尤度比と呼ばれるもので，10より大きくなると有効な検査と判断できる．これとは反対に，陰性尤度比というものもある。陰性尤度比は(1－感度)÷特異度で計算され，感度または特異度が高いほど，小さな値をとる。0.1よりも小さくなると有効な検査と判断できる。(尤度比 likelihood ratio - 一般社団法人日本理学療法学会連合解説から抜粋)

(注5) 「顔認識」は顔の特徴や表情を読み取る技術で、「顔認証」は前もって取得した画像のデータと照合して本人かどうかを見分ける技術である。

(注6) アトリビューション(attribution )とは、攻撃の痕跡や手法などの技術的解析から、攻撃者の意図をめぐる地政学的背景まで、多様な状況証拠の収集と分析を通じ、匿名性が高いサイバー攻撃の攻撃者や背後の攻撃国を特定（判断）していくプロセスである。日本では「特定」や「帰属」とも訳され、「誰がやったのか（who did it）」の問題と呼ばれてきた。(防衛研究所「国家のサイバー攻撃とパブリック・アトリビューション」から抜粋)

米国連邦緊急事態管理庁(FEMA)の“(attribution”の)解釈を引用、以下、仮訳する。

　デジタル・フォレンジックと発生源の帰属者の特定(attribution)の能力は、デジタル・フォレンジックを実施し、テロ行為 (テロの手段と手法を含む) をその発生源に帰属させることとして説明されており、これには、最初の行為やその後の行為を防止するための取り組み、および/または対抗策を迅速に開発するための取り組みによるデジタル・フォレンジック分析と攻撃者の帰属および攻撃の準備が含まれる。

　デジタル・フォレンジックは、行為に関連する証拠の収集と検査である。発生源の帰属には、科学に基づいた技術フォレンジック検査の結果、あらゆる情報源からの諜報情報、およびその他の法執行/捜査情報の融合が含まれる。これらは、米国政府指導部に責任主体を通知し、初期またはその後のテロ行為の防止を支援するために共同で実施される。

(注7) 連邦司法省の最新の全国犯罪被害調査(2018年10月)は性的暴行の被害者のうち警察に犯罪を報告したのはわずか23％だった。

　FBI の統一犯罪報告データベース(Uniform Crime Reporting Program：UCR)によると、通報した者のうち、逮捕に至った通報はわずか約 20% である。性的暴行と強姦に関する全国データを分析している非営利団体「強姦・虐待・近親相姦全国ネットワーク」によると、裁判につながる逮捕はわずか約半数だという。

　有罪判決率に関する最も信頼できるデータは、1990 年から 2009 年までの有罪判決を分析した司法省の調査によるものである。その調査では、レイプ裁判は約 35% の確率で有罪判決に終わると結論付けられている。

　これらを総合すると、有罪判決に至る暴行はわずか約 0.8% であることを意味する。

(注8) ODIS (Offender Data Information System) は、法執行データの取得、保守、品質を向上させるための Web ベースのコンピュータ化された記録管理ソフトウェア・アプリケーションであり、集中型または分散型ネットワーク環境の任意の組み合わせで実行できる。これは Microsoft の DNA (分散型ネットワーク間アーキテクチャ) プログラミング・モデルを使用して設計されており、ストレージ用のデータベース、ビジネスロジックを処理するコンパイル済みアプリケーションコンポーネント、およびユーザーに表示されるプレゼンテーション層の 3 層を使用して構築されている。(Wikipediaから抜粋、仮訳)

(注9) Combined DNA Index System (CODIS) は、連邦捜査局によって作成および維持されている米国の国家 DNA データベースである。 CODIS は 3 つのレベルの情報で構成される。 DNA プロファイルが作成される Local DNA Index System (LDIS)、州内の研究所が情報を共有できるようにする State DNA Index System (SDIS)、および各州が DNA 情報を比較できるようにする National DNA Index System相互 (NDIS)がある。

*****************************************************************************