web-dev-qa-db-ja.com

画像のぼかしは、画像内の情報を難読化する安全でない方法ですか?

画像のぼかしは、画像内の情報を難読化する安全でない方法ですか?

つまり、アルゴリズムと設定を知っている場合、または試行錯誤によって、画像のぼかしを解除することは可能ですか?

たとえば、次の画像は、59.0ピクセルの半径でPhotoshop CS6ガウスぼかしフィルターでぼかしたGoogleロゴタイプです。

Google logotype with Gaussian Blur

肉眼では、ぼやけた内容を把握するのが難しい場合があります。しかし、ぼかしを「リバースエンジニアリング」して元の画像、または少なくとも認識可能なものを明らかにすることはできますか?

69
Winterflags

アルゴリズムと設定がわかっている場合、または試行錯誤によって、画像のぼかしを解除することはできますか?

ここでは、画像に適用されたフィルターを使用してぼかされた画像のみを考慮しており、不十分なキャプチャ(モーション/光学ぼかし)の結果ではないことを想定しています。

確実にブレ除去が可能であり、多くの画像処理ツールでサポートが見られます。ただし、ぼかしは意図的に画像内の情報量を減らします。そのため、元の画像を本当に戻すには、「力ずく」が必要になる可能性があります。画像。

異なるタイプのぼかしには異なる損失がありますが、それらのすべてを元に戻すことは可能です(ただし、費用はかかります)。ぼかしのコストと起こり得る結果の数は、ぼかしフィルターが取るパスの数と、ぼかし中に考慮される近傍の数によって異なります。ぼやけが解消されると、多くのツールやサービスは、それがどのような種類の画像であるかを知ることに基づいて、結果の多くを自動的に削除できるはずです。

たとえば、 このブログ投稿 は、エントロピーの低いコンテンツ(たとえば、本の小切手)をぼかすことが、人間の顔のようなものをぼかすよりもはるかに安全でない理由について説明しています。

要するに、「ぼやけている」場合に提供したのと同じ画像になる画像を実際に戻すことが可能です。ただし、ブレ除去された画像が唯一の有効なブレ除去されたバージョンであることを保証することはできません(一致するエッジ、意味的に意味のあるオブジェクトなどのドメインの知識と画像分析が必要になります)。

肉眼では、ぼやけた内容を把握するのが難しい場合があります。しかし、ぼかしを「リバースエンジニアリング」して元の画像、または少なくとも認識可能なものを明らかにすることはできますか?

ぼかしが画像の「シグネチャ」を根本的に変換しない可能性があります。たとえば、 ヒストグラム は類似しており、マッチングが可能です。あなたの場合、人間の目は実際にこれがcouldがGoogleのロゴ(使い慣れた色)であることがわかりますが、ヒストグラムはかなり異なります。 Google自体 画像を識別できません そして、ヒストグラムとカラークラスターを調べることができます このオンラインツールを使用 -画像はかなり異なります。

機密性の高いコンテンツをブラックアウトすることを選択した場合はおそらく安全でしょう(投稿 こちら を参照)

私はこれらのことが不可能であることを望みます(たとえば、モーションブラーがナンバープレートを隠すために、スピードトラップの近くでできるだけ速く移動することを試みていましたが、もう機能しません)。ぼかしを解除するツールはかなり一般的です(例: Blurity )。ただし、コンピューターで生成された小さな画像(情報が少ない)では写真では機能しません(私が復元したもののサンプルを参照)。

Failed deblurring

その他の参照に関しては、 最初の章画像のブレ除去:マトリックス、スペクトル、およびPer Christian Hansen、James G. Nagy、およびDianne P. O'Learyによるフィルタリング 本当に良い紹介です。残念ながら、元の画像を正確に復元できるという希望はありませんが、ノイズやその他の要因により、元の画像を正確に復元することはできません!どのようにして密接な一致を得ることができます。

この調査 は、フォレンジック画像再構成で使用されるさまざまな手法を比較します(20年近く経過しているため、ファンダメンタルズに焦点を当てています)。

最後に、 Schneierのブログへのリンク では、これについて詳細に説明しています。

66
Jedi

はい、ぼかしは画像内のデータを検閲する安全な方法ではありません。

software があり、ガウスぼかしのようなアルゴリズムによるぼかしを簡単に反転して、かなり読みやすい結果を得ることができます。多くの場合、オブジェクトの識別/テキストの読み取りに十分です。

16
Lie Ryan

これは、画像自体(情報の量)と使用されるぼかし(タイプ+量)の2つに依存します。

あなたが言及したガウスぼかしは、コントラスト(情報)を、コントラストの周りの拡散円に最も集中しているか、または最も集中していないところから再分布させます。中心に近づくほど、円の端(別名ぼかし半径)に近づくにつれて次第に少なくなります。

デジタル画像の代わりに、ガタガタしたテーブルの上にある市松模様のサンドアート画像を検討してください。テーブルの上で拳を叩くと、ガウスぼかしを模倣します。これにより、四角形が丸くなり、接続された重なり合う円が残ります。その乱雑なテーブルを見ると、シェイクアップ前のチェッカーボードであると結論付けることができます。

一方、テーブルの側面を叩いた場合は、モーションブラーをシミュレートします。砂粒の衝撃/慣性の距離がチェッカーボードの正方形の幅を超える場合、テーブルは砂で均一に覆われ、プレシェイクのデザインがチェッカーボード、ストライプ、またはすでに均一な分布。

ガウスぼかししかなく、テキストをぼかしたい場合は、行の高さを2倍にぼかしてから、画像の姿勢を変える必要があります。ぼかしは大きなディテールを細かいディテールに広げ、ポスチャライズは細かいディテールを破棄します。細かい部分を破棄してぼやけた画像をぼかし、色深度を減らしたり、レベルを計算したり、過度に圧縮したりするような、より劇的なものを使用することもできます。

要するに、ディテールが広がるandその後、細かいディテールが破棄される場合、単にreliablyに十分な情報が残っていないため、画像を復元できません。

11
dandavis

私の経験では、GIMPのガウスぼかしでは情報を完全に難読化するには不十分であることがわかっています。実際、デコンボリューションを使用して ガウスぼかし の後にほとんどの画像データを復元することが可能です。

4
bwDraco

ぼかしを完全に反転できるケースが1つあります。たとえば、スクリーンショットなど、コンピューターで生成されたテキストをぼかしている場合です。

たとえば、上記のテキストがぼやけていて、ぼかしが複数の文字にまたがっていたとしても、すべての文字の組み合わせを試し、ぼやけたときにぼやけた画像とまったく同じピクセル値を生成するソフトウェアを見つけることができます。その場合、実際の情報は1文字あたり8ビット程度であり、8x5ボックス内の文字のグラフィックに含まれる8x5x24ビットではないため、機能します。

(別の投稿では、クレジットカード番号について言及しています。16桁の数字の写真には、実際の情報が54ビット未満です。)

2
gnasher729

意図的に領域をぼかすと、情報が失われます。復元できる情報は、失われた情報の量によって異なります。この量は、ぼかしアルゴリズムとそのパラメーターによって異なります。ただし、1つの画像に十分な情報が含まれていない場合でも、特定の領域がぼやけている同様の画像がある場合、特定の画像内で失われた情報を回復する可能性がありますが、わずかに異なる方法(異なるパラメーターまたはアルゴリズム、わずかに異なる領域など)ぼやけた、画像の異なるスケーリング...)。

したがって、すべてのケースですべての重要な情報を再構築できるとは言えません。しかし、ぼかしによってすべての情報が確実に隠されるとは言えません。情報の再構築が可能かどうかは、ぼかしアルゴリズム、パラメーター、そしてもちろん重要な情報の考慮事項によって異なります。

この領域には多くの調査があり、 画像のブレ除去 を検索すると簡単に見つけることができます。

2
Steffen Ullrich

「ぼかし」という用語は、「スミアリング」や「スマッジング」と呼ばれるものを含め、多くの種類の視覚効果を説明するために使用されます。数学的にぼかされた画像が正確に保存されていれば、元の画像を完全に復元することができます。ただし、ぼかしの効果の1つは、特定の種類のノイズまたはサンプリングアーティファクトに対してデータをより敏感にすることです。そのため、十分なぼかしを適用すると、ぼかしを元に戻すとノイズが増幅されるポイントまで画像が不明瞭になる可能性があります。コンテンツを不明瞭にしておくのに十分です。

ただし、ぼかしよりも優れたアプローチは、データを「にじませ」または「にじませ」ることです。これらの用語はあまり明確に定義されていませんが、基本的な本質は、元の画像の一部が他の部分よりも最終画像に大きく寄与し、多くの場合、一部の部分がまったく寄与しないことです。このような影響の多くは、非常にハードなエッジを残して気を散らす可能性がありますが、そのような気晴らしは、ぼかしの後に数学的なぼかしを適用することによって減らすことができます。

最後の注意として、数学的な平均化を伴う「ピクセル化」アプローチは、にじみやにじみと同様に情報を破壊しますが、必ずしも思っているほど安全ではありません。各数字が約2x2の行列で表されるように小切手で画数をピクセル化すると、そのような数は正常に「読み取る」ことができませんが、カメラの配置とピクセル化の設定を再現できる人なら理解できるかもしれません。明るい四角形と暗い四角形の観測パターンを生成するために必要な数値は何ですか。このような問題は、実際のアカウントにマップされないことが保証されている標準の「テスト」アカウント番号でアカウント番号をデジタル的に置き換え、それをデジタル的に不明瞭にすることで回避できます(ビューでアカウント番号が「 1234567890は注意をそらすかもしれませんが、高度な再構成が必要になるほどピクセル化されている場合、そのような努力を怠った人は事実の口座番号に注意をそらされるべきではありません)。

2
supercat