高速フィンガープリント技術
我々は、ブラウザーフィンガープリント技術を、インターネットサービスでの不正行為検知など社会貢献に資する目的で開発し、科学的探究の一環として研究しております。
〜背景〜
これまで、我々研究チームは、2012年ごろからブラウザフィンガープリント技術(以降、フィンガープリント技術と表記)の研究をしていました。
2020年1月には、学会での発表にあわせて、我々の研究成果をまとめたブログ記事(ブラウザフィンガープリント、その凄さ〜Torブラウザアクセスの識別可能性まで〜)も公開しました。
そのブログ記事の中では、フィンガープリント技術を以下のように定義していました。
ブラウザフィンガープリント技術(以下、FP技術)とは、文字通り、ブラウザの指紋を使ってブラウザをサーバ側で識別する技術です。ここでの「識別」とは、同一ブラウザからのアクセスを同一ブラウザからのアクセスと判定し、違うブラウザからのアクセスは違うと判断することを言っています(図1)。
この手法は、大変高精度で識別できるものの、「2つのアクセスが同一のブラウザからか否か」という限定的な識別しかできない制約がありました。
よって、後述するデバイス推定やID推定を実現する際には、この識別技術を応用して、デバイス推定やID推定を実現していました。
それ故に、リアルタイム性が求められるケースへの応用では、「推定処理時間」が実用化のネックとなっておりました。
今回、我々研究チームは、「推定処理時間」の課題を解決すべくパワーアップされた技術、いわば、「高速フィンガープリント技術」を開発したのでご紹介致します。
〜新しいフィンガープリント推論モデル〜
今回、我々研究チームが新たに開発したフィンガープリント技術は、人工知能技術でいう「多値分類」を用いて、ID推定やデバイス推定などを直接行う仕組み(以降、新手法と呼びます)です。
ここでは、理解のため、「デバイス推定」をユースケースとして新手法を説明します(図1参照)。
新手法では、予め採取したフィンガープリントを用いて多値分類の推論モデルを作成します。学習に使うフィンガープリントには、デバイス等の教師ラベルがあるものを想定します。
推論モデルは、「学習済みのデバイス(図1ではN個)からのアクセス」の際に採取されたフィンガープリントについて、学習済みのデバイスのいずれか(図1ではDev_1〜Dev_N)であるかを推定します。「未知のデバイスからのアクセス」の際には、推論モデルは「その他」と推定します。
すなわち、新手法において、推論モデルは、N+1分類を実現します。
〜新手法のパフォーマンス〜
新手法のパフォーマンスについて、その精度と処理時間を実験して確認してみました。
実験対象は、以下となります。
- 学習済みデバイス500件※(約10万件からサンプリング)
- 推定対象アクセス:1万件
- アクセス内訳:学習済みデバイスからのアクセス 2,450 件、その他デバイス からアクセス7,550 件
※今回は、少し小さい規模の実験の結果のみをこちらでは公開していますが、推定対象デバイスが数万件のケースの実験も行なっています。
実験の結果は、以下の通りです。
新手法の精度
多値分類の推定なので、Precision、Recall、F値については、マクロ平均と加重平均で示します。
ここで、マクロ平均とは、デバイス推定ごとに各評価指標を計算した後、平均した値です。加重平均とは、デバイス推定ごとに各評価指標を計算した後、デバイス推定ごとの件数を重みとして積を取り、平均した値です。
この結果は、過去の我々の手法の精度と比較して遜色ないどころか、精度は向上しています。別の実験ではもう少し良い結果も出ています。
新手法の処理速度
さて、今回のメインの課題であった推定処理時間の結果は如何に。
下記の実行環境で試した実測値です:
実行環境:Xeonプロセッサ E5–2603 v4、128GB
今回の実験では、一件あたりの推定処理時間は0.0074秒となりました。
同じ対象で同じ趣旨の実験を既存方式で行った場合、新手法は、既存方式の72倍以上の処理速度でした。
推定対象数のスケールアップも可能で、既にいくつか実験しました。
〜まとめ〜
今回、我々の持つフィンガープリント技術を応用する際の「推定処理時間」の課題を解決すべくパワーアップされた新手法、
「高速フィンガープリント技術」
の実験結果をご報告を致しました。
これまで、「推定処理時間」の課題が立ち塞がり頓挫していたプロジェクトも、新手法により新展開を迎えることができそうです。
新手法、まだ検証を繰り返す必要はありますが、「フィンガープリント技術は、不正対策向けのアトリビューションとしては使えないよねぇ」というご批評へも反論できそうな兆しが出てきました。
我が国でもデジタル化の波を迎え、一層ネット不正や悪用が増加することが予見されます。また、匿名化が進むサイバー空間における不正行為に対抗するため、アトリビューション技術への要請も高まることでしょう。
我々は、これまでの蓄積を生かし、健全なネット社会の発展に貢献すべく技術開発を続けていく所存です。
今後ともご支援ご指導のほど、何卒よろしくお願い致します。
この研究については、2022年1月18日(火)~ 1月21日(金)開催の、2022年 暗号と情報セキュリティシンポジウム(SCIS2022)にて発表します。
宣伝
- 明治大学理工学部情報セキュリティ研究室ではメンバーを募集しています
- 企業様からの委託研究・協業のお話をお待ちしております
>> saito(a)saitolab.org までお気軽にご連絡ください <<
2022/01/08 賀正