顔認識はどのように機能するのでしょうか?

ほとんどの人は、Instagram フィルターや Face ID での顔認識の使用に慣れています。しかし、この比較的新しいテクノロジーは少し不気味に感じるかもしれません。顔は指紋のようなもので、顔認識の背後にあるテクノロジーは複雑です。

他の新しいテクノロジーと同様に、顔認識にも欠点があります。軍、警察、

広告主

、

ディープフェイク作成者が

顔認識ソフトウェアを利用する邪悪な新しい方法を見つけるにつれて、これらの欠点がより明らかになってきています。

現在、顔認識がどのように機能するかを人々が理解することがこれまで以上に重要になっています。顔認識の限界と、顔認識が将来どのように発展するかを知ることも重要です。

顔認識は驚くほど簡単

顔認識のさまざまな媒体に入る前に、顔認識のプロセスがどのように機能するかを理解することが重要です。ここでは、顔認識ソフトウェアの 3 つのアプリケーションと、それらがどのように顔を認識または識別するのかについて簡単に説明します。

基本的な顔認識

: アニ文字や Instagram フィルターの場合、携帯電話のカメラは顔の特徴、具体的には目、鼻、口を「探します」。次に、アルゴリズムを使用して顔をロックオンし、その顔がどの方向を見ているか、口が開いているかなどを判断します。これは顔の識別ではなく、単にソフトウェアが顔を探しているだけであることに言及する価値があります。
Face ID および同様のプログラム

: 携帯電話に Face ID (または同様のプログラム) を設定すると、顔の写真が撮影され、顔の特徴間の距離が測定されます。その後、携帯電話のロックを解除するたびに、携帯電話はカメラを通して「調べ」、ユーザーの身元を測定して確認します。
見知らぬ人の識別

: 組織がセキュリティ、広告、または警察の目的で顔を識別したい場合、アルゴリズムを使用してその顔を広範な顔データベースと比較します。このプロセスは Apple の Face ID とほぼ同じですが、規模が大きくなります。理論的には、あらゆるデータベース (ID カード、Facebook プロフィール) を使用できますが、事前に識別された鮮明な写真のデータベースが理想的です。

さて、本題に入りましょう。 Instagram のフィルターに使用される「基本的な顔認識」は非常にシンプルで無害なプロセスであるため、ここでは顔の識別と、顔を識別するために使用できるさまざまなテクノロジーに完全に焦点を当てます。

ほとんどの顔認識は 2D 画像に依存しています

ご想像のとおり、ほとんどの顔認識ソフトウェアは完全に 2D 画像に依存しています。しかし、これは 2D 顔イメージングが非常に正確であるために行われるのではなく、利便性のために行われます。圧倒的多数のカメラは奥行きのない写真を撮影しており、顔認識データベースに使用できる公開写真 (Facebook のプロフィール写真など) はすべて 2D です。

2D 顔イメージングがそれほど正確ではないのはなぜですか?そうですね、顔の平面画像には奥行きなどの識別機能が欠けているからです。平面画像を使用すると、コンピューターは瞳孔間距離や口の幅などの変数を測定できます。しかし、鼻の長さや額の高さは判断できません。

さらに、2D 顔イメージングは可視光スペクトルに依存しています。これは、2D 顔イメージングは暗闇では機能せず、ファンキーな照明条件や影のある照明条件では信頼性が低くなる可能性があることを意味します。

明らかに、これらの欠点のいくつかを回避する方法は、3D 顔イメージングを使用することです。しかし、どうしてそんなことが可能なのでしょうか？顔を 3D で見るには特別な機器が必要ですか?

IR カメラがあなたのアイデンティティに深みを加える

一部の顔認識アプリケーションは 2D 画像のみに依存していますが、顔認識が 3D 画像にも依存していることも珍しくありません。実際、顔認識の経験にはおそらく 3D が含まれています。

これは、ソナーに似たライダーと呼ばれる技術によって実現されます。基本的に、

iPhone などの

顔スキャンデバイスは、無害な IR マトリックスを顔に向けて発射します。このマトリックス (レーザーの壁) は顔に反射し、携帯電話の IR カメラ (または

ToF カメラ

) によって捕捉されます。

3D マジックはどこで起こりますか?携帯電話の IR カメラは、IR 光の各ビットが顔に反射して携帯電話に戻るまでにかかる時間を測定します。当然のことながら、鼻で反射する光は耳で反射する光よりも到達距離が短く、IR カメラはこの情報を使用して顔の独自の深度マップを作成します。 3D イメージングを基本的な 2D イメージングと併用すると、顔認識ソフトウェアの精度が大幅に向上します。

LIDAR イメージングは奇妙な概念であり、理解するのが難しい場合があります。役立つ場合は、携帯電話 (または顔認識デバイス) の IR メッシュが
であると想像してみてください。ピンボードのおもちゃのように、あなたの顔は IR メッシュにくぼみを残します。つまり、鼻が目などよりも著しく深い場所です。

サーマルイメージングにより夜間でも顔認識を実現

2D 顔認識の欠点の 1 つは、可視光のスペクトルに依存していることです。平たく言えば、基本的な顔認識は暗闇では機能しません。しかし、これは赤外線カメラを使用することで回避できます (トムクランシーのように)。

「ちょっと待って、熱画像は赤外線に依存しているんじゃないの?」と思われるかもしれません。はい、そうです。しかし、熱画像カメラは赤外線光を大量に送信しません。単に物体から放射される赤外線を検出するだけです。暖かい物体は大量の IR 光を放射しますが、冷たい物体は無視できる量の IR 光を放射します。高価な熱画像カメラは、表面全体の微妙な温度差も検出できるため、顔認識に最適なテクノロジーです。

赤外線画像で顔を識別する

方法はいくつか

あります。これらのテクニックはすべて信じられないほど複雑ですが、基本的な類似点がいくつかあるため、リストを使用して物事を単純化することに努めます。

複数の写真が必要

: 赤外線カメラは対象者の顔の写真を複数枚撮影します。各写真は、IR 光の異なるスペクトル (長波、短波、中波) に焦点を当てています。通常、長波スペクトルは顔の最も詳細な部分を提供します。
血管マップは便利です

: これらの IR 画像は、人の顔の血管の形成を抽出するためにも使用できます。不気味ですが、血管マップは固有の顔の指紋のように使用できます。また、顔の器官間の距離を見つけたり (一般的な赤外線画像で粗悪な画像が得られる場合)、打撲傷や傷跡を特定するためにも使用できます。
被写体を特定できる

: 複数の IR 画像を使用して合成画像 (またはデータセット) が作成されます。この合成画像を顔データベースと比較して、被写体を識別できます。

もちろん、サーマル顔認識は通常軍で使用されており、コールズで見つかるものでも、次の携帯電話に付属するものでもありません。さらに、サーマルイメージングは日中（または一般的に明るい環境では）うまく機能しないため、軍事以外では多くの潜在的な用途がありません。

顔認識の限界

私たちは顔認識の欠点について多くの時間を費やしてきました。 IR や熱画像からわかるように、これらの制限のいくつかは克服することが可能です。しかし、まだ解明されていない問題がいくつかあります。

障害物

: ご想像のとおり、サングラスやその他のアクセサリによって顔認識ソフトウェアが動作しなくなる可能性があります。
ポーズ

: 顔認識は、中立的な正面を向いた画像で最も効果的に機能します。頭を傾けたり回転させたりすると、IR ベースの認識ソフトウェアであっても顔認識が困難になることがあります。さらに、笑顔、頬を膨らませたポーズ、その他のポーズによって、コンピューターによる顔の測定方法が変わる可能性があります。
光

: あらゆる形式の顔認識は、可視スペクトルであれ赤外線であれ、光に依存します。その結果、奇妙な照明条件により顔識別の精度が低下する可能性があります。科学者たちは現在

ソナーベースの顔認識技術

を開発しているため、この状況は変わる可能性があります。
データベース

: 優れたデータベースがなければ、顔認識は機能しません。これと同じように、これまで正しく識別されなかった顔を識別することは不可能です。
データ処理

: データベースのサイズと形式によっては、コンピューターが顔を正しく識別するのに時間がかかる場合があります。警察の取り締まりなどの状況によっては、データ処理の制限により、日常的なアプリケーションでの顔識別の使用が制限されます (これはおそらく良いことです)。

現時点で、これらの制限を回避する最善の方法は、顔認識と組み合わせて他の形式の識別を使用することです。顔を識別できない場合、携帯電話はパスワードまたは指紋の入力を要求します。

中国政府は

ID カードと追跡技術を使用して、顔認識ネットワークに存在する誤差の範囲を狭めています。

将来、科学者たちはこれらの問題を回避する方法を必ず見つけるでしょう。彼らは、ソナー技術とライダーを併用して、あらゆる環境で 3D 顔マップを作成し、信じられないほど短時間で顔データを処理する (そして見知らぬ人を識別する) 方法を見つけるかもしれません。いずれにせよ、このテクノロジーには悪用される可能性が大いにあるため、常に追い続ける価値があります。

出典:

リエカ大学

、

電子フロンティア財団