クライアントは、ポルノについて作業機械をスクリーニングすることを望んでいます。出来ますか？

Question

長い間クライアントから、ポルノの仕事用マシンのスクリーニングを依頼してきました。機密性の高い資料が見つかった場合、彼らは責任について心配しています。彼らの主な懸念事項（明らかな理由による）は、ビデオ、オーディオ、および画像ファイルです。可能であれば、テキストベースのドキュメントをスキャンして不適切なコンテンツがないかどうかも確認します。彼らは、明らかに違法である（詳細を記載する必要はありません）から始まり、明らかに不快なものへと下がっていて、一部の人にとって不快であるかもしれないものも含む、仕事以外のコンテンツの階層を持っています-ランジェリー広告、ジョークカードお尻の割れ目、ハウィーマンデルに関連するもの。

私の質問は：

これは倫理的ですか？すべての従業員が彼らの作業機械が会社に属し、調査の対象であることに法的に同意するからだと思います。上映は、稼働している個人用の機械では行われません。
実現可能ですか？たくさんの画像処理/インデックス作成を行ってきましたが、これはまったく新しい複雑な世界のようです。
ポルノを発見するための成功したテクニックへの言及はありますか？
何かが発見されたときに結果をアーカイブすることは適切ですか？

Binary Worrier · Accepted Answer

90％ Headology 、10％ソフトウェアでこれを行うことができます。

まず、従業員のコンピュータを静かにスキャンし、各従業員のファイルとサイズのデータベースを構築します。

次に、すべてのPCで疑わしいコンテンツがスキャンされるというメモを漏らします。つまり、上司はポルノなどを識別できる Shazam のようなプログラムを持っています。

その後、数日後、ファイルとサイズをコンピューターで再度スキャンします。削除されたファイルを見てください、それらは映画または画像ファイルですか？次に、それらを監視する必要がある従業員です。

これらの従業員のPCを定期的にスキャンして画像と動画を探し、問題のあるコンテンツがないか手動で確認します。

Martin Beckett · Answer

これは明らかなニューラルネットワークタスクです。まず、社内の専門家が選択した画像の大規模なトレーニングセットが必要です。

より効果的な解決策は、次の週/月/何でも、みんなのマシンのポルノをチェックすることを発表し、ディスクを動かすだけの簡単なアプリを書くことです。その時までに機械が掃除されていることを保証します。

pS-いくつかの「深刻な」ポイント-あなたは実際にはしないでください何かを見つけたいと思っています。

ブラウザーのキャッシュにいくつかの画像が見つかった場合、おそらくそれらは不良リンクまたは危険なポップアップにヒットします-whitehouse.comで発砲された先生を覚えていますか？あなたがこれのために彼らを解雇/懲戒すると、労働者/労働組合からの反発があるでしょう。労働者が質問を調べたり、オンラインで価格を確認したりする前に、クリックごとに法務部門に提出して承認を得なければならない場合、会社はどのように機能しますか？

マシン上でポルノのスタックを見つけたら、その従業員によってそこに置かれたことをどのように証明しますか？あなたは法廷で立ち上がるようなセキュリティと監査システムを持っていますか？あなたは、システム管理者がそれらをそこに置くことができず、それをユーザーのファイルのように見せることができないOSを使用していますか（あるいは知っていますか）？

さらに、私の経験では、ポルノの隠し場所の最も一般的な場所はCxOと上級副社長のラップトップです。

事前にファイルが消えるように調整することをお勧めします。

Manoj R · Answer

この制御のアプローチは、従業員とIT担当者の両方にとって確かに苦痛です。従業員のマシンの内部に何かが入ると、それを検出する確実な方法はありません。そもそもそれが機械に入るのを止める必要があります。
このための最もよく知られている方法は、アクセスできるサイト/ドメインを制御することです。そのようなリストはネット上のどこかで利用可能でなければなりません。これ以外にも、従業員がダウンロードした画像や動画の数、およびそれがどこから来たかを追跡することもできます。
外付けハードドライブなど、Web以外の素材が使用される可能性があります。 1か月に1回、システムのランダムスキャンが行われ、ビデオや画像の一部をランダムに選択して、手動で確認できます。それがどのようにできるかわかりません。ただし、画像とビデオのチェックの自動化は確かに範囲外であり、間違いです。
実際、私は従業員が個人的なことをするのを制限するという考えにはあまり詳しくありません。これについては、従業員を信頼する必要があります。従業員はオフィスで忙しいので、このために時間を費やすことがありません。より心配なのは、従業員が自分の仕事を正しく行わないことですか？または、クラックまたはハッキングされたソフトウェアをインストールしましたか？

Stephen C · Answer

市場には、さまざまな形式の「コンテンツフィルタリング」を実行する多くの製品があります。（いくつかの明白な用語でのグーグル検索は、いくつかの明白な候補を投げ出します。）これらの製品の1つを使用することは、多くのスキャン/フィルタリングソフトウェアをゼロから構築するよりもおそらく良い考えです。もう1つのオプションは、境界線だけを見ることです。例えば外部の電子メールとWebトラフィックを監視する。この種のことをする製品が再びあります。

企業がコンピュータをスキャンして「悪いこと」を検出することが倫理的であることは間違いありませんが、これは問題がないことを意味するものではありません。

創刊：

「不快なコンテンツ」とは何か、何でないかを判断することは主観的です。
「私たちに言わせてください」「裸の体の描写」を含む画像、ビデオを検出するためのソフトウェアは（AFAIK）信頼性が低く、偽陽性と偽陰性になる可能性があります。

つまり...これは、顧客の組織の誰かが「ヒット」を確認する必要があることを意味します。それはお金がかかります。

第二の問題：無実の説明があるかもしれません。ファイルは誤ってダウンロードされた可能性があります。または、それは復讐者の同僚によって植えられた可能性があります。無実の説明がある場合、顧客の組織は彼らが何をするか/言うか注意する必要があります。（これは実際にはyourの問題ではありませんが、逆流の一部を警戒する可能性があります。）

第3の問題：会社が問題のある素材を監視する権利を持っているにもかかわらず、多くの従業員はこれを不快に思うでしょう。そして、彼らが遠すぎると、これは従業員の士気に影響を与えます。一部の従業員は「歩きます」。他の人たちは抗議行動を起こすかもしれません...例えば。多くの誤検知を作成しようとします。（繰り返しますが、実際にはyourの問題ではありませんが...）

4番目の問題：不快な素材を暗号化したり、ポータブルメディアやリムーバブルメディアに置いたりして、不快な素材を隠すことができます。メタデータを偽造して、誰かが責任があるように見せることができます。

mouviciel · Answer

フランスの法的側面について：

上司はコンピュータとインターネット接続を所有しています。彼は自分の好きなことを何でもできます。

しかし、従業員のプライバシーは侵害できません。コンピュータ上のディレクトリにPERSONALというラベルが付いている場合、上司はそのディレクトリをスキャンできません。

これを回避する唯一の方法は、従業員が違法な素材を保管している証拠の要素を取得し、裁判所にコンピュータのスキャンを要求することです（フランスではポルノは違法ではないことに注意してください）。

Ryan · Answer

従業員が自分の作業機械が会社に属し、検索の対象であることに同意した場合、はい、これは合法です。証拠として、ほとんどの場合、ファイルのアーカイブが必要になります。

実際に資料を探す方法は。あなたは出来る：

何よりもまず、ファイル名をスキャンして特定の単語セット（ポルノ、レズビアンなど）を探します。
テキスト文書をスキャンして同じ単語のセットを探す
画像の場合、画像の平均色を見つけることができ、その色が「肉」色と呼ばれる範囲内にある場合は、画像にフラグを設定します（これらのフラグが設定された画像を誰かが再確認する必要がある可能性が最も高いでしょう））。浜辺の家族の写真となる画像を誰かに報告したくありません。

コンピュータに入るときにファイルをスキャンする場合（たとえば、プログラムをすべての作業マシンにロードし、フラグが付けられたケースを中央データベースに記録するなど）、それがあまり目立たないと思います（露骨な不信感以外は）雇用主は明らかに従業員のために持っています）。

ビデオファイルについては、100％よくわかりません。おそらく、イメージスキャンと同様のアプローチ（ランダムフレームを選択し、特定のレベルの「肌」の色をスキャンする）。

オーディオファイルをスキャンすると、音声認識に入るように見えます。これは、まったく別のワームです。ただし、ファイル名のスキャンは簡単で、ドキュメント、画像、ビデオと同じように実行できます。

Rick Berge · Answer

@ライアンが言ったように、画像分析は色分析に焦点を当てることができます。

実現可能性？私の妹は政府の地域で働いており、毎年何らかの形で監査を受けており、かつてはポルノの監査を受けていました。彼女（地球物理学者）はいくつかの偽陽性（ピンク色の岩）を持っていました。

Nishant · Answer

従来の分類方法を使用したポルノの検出に関する最近の重要な研究があります。例は here と here があります。

kojiro · Answer

これは倫理的ですか？

従業員の実装と合理的な期待に依存します。たとえば、ソフトウェアがネットワークに接続されているマシンをスキャンする場合、追加の要件があり、不正なマシンの接続をインフラストラクチャが防止する必要があります。それは明白なはずですが、私が見たネットワークでは見過ごされがちです）。

実現可能ですか？私はたくさんの画像処理/索引付けを行いましたが、これはまったく新しい複雑な世界のようです。

すべての従業員を薬物検査することは可能ですか？たぶんそうかもしれませんが、私はその価値を疑問視します。ランダム化します。従業員に、自分のマシンがいつでも不適切なコンテンツがないかスキャンされる可能性があることを知らせます。

ポルノを発見するための成功したテクニックへの言及はありますか？

これには触れません。ユーモアのセンスを抑えられないと思います。ただし、テキストを検索するときは The Scunthorpe Problem に注意してください。

何かが発見されたときに結果をアーカイブすることは適切ですか？

これが一番気になるので、弁護士に聞いてみます。違法なコンテンツを見つけた場合、技術的にそれを開示することが法的に義務付けられる可能性があると思います。これは悪いことです。特に、ユーザーが自分の本当の過失にさらされなかった場合はなおさらです。あなた（rクライアント）は、これを処理する方法についての真の法的助言が必要になります。人事と弁護士を関与させます。

Anonymous Type · Answer

あなたがネットワークのドメイン管理者であると仮定します。

各ユーザーのデスクトップマシンにC $。
ポルノファイルを個人のプライベート共有にコピーします。
元の場所から削除します。
ポップコーンを作る。
すべての「証拠」の完全な詳細分析。

nikie · Answer

純粋に技術的な観点から：これはオブジェクトカテゴリの認識の問題のように聞こえます。私はそのようなことをしたことがありませんが、私が読んだことから、最新のカテゴリー認識システムは次のように機能します。

最初に、多数の関心点を検索します（たとえば、Harris Corner Detectorを使用して、スケール空間でのLoG/DoGフィルターの極値点。ランダムな点の選択を提案する著者もいます）。
次に、特徴変換を各ポイントに適用します（SIFT、SURF、GLOHなどの多く）。
見つかったすべての機能を組み合わせてヒストグラム（機能のバッグ）
標準の機械学習アルゴリズム（サポートベクターマシンなど）を使用して、多数のトレーニング画像を使用したオブジェクトカテゴリの違いを学習します。

JeffO · Answer

みんなのコンピュータのオペレーティングシステムはおそらくディスクイメージからインストールされたのでしょう。

ディスクイメージから始めて、おそらくスキャンする必要がないファイルのリストを取得します。
各PC上の他のすべてのファイルのリストを取得します。
10-20台のランダムなマシンから実際のファイルをプルし、テストベッドとして使用する
冒とく的で疑わしい単語（ギャル、水差し、「かろうじて合法」、ジョークなど）辞書のアイテムを検索する
ビデオを見る-誰かがビデオを持っているべきですか？
写真を見る
疑わしいビデオまたは画像ファイルは、他のマシンの検索に使用できます

誰かが仕事用コンピュータに何かを置く前に、1人か2人の従業員が捕まるのにかかるでしょう。

このサービスにわいせつな金額を請求します。私はザッポスが彼らの従業員にこれを行うことは決してないでしょう。

crosenblum · Answer

わからない、中程度の答えが必要です。これはそれほど侵襲的ではありませんが、実際の問題である責任を解決します。

仕事に関連するものではない、仕事用PCで見つかった違法なものに対する会社の責任を解放する権利放棄書に署名してもらいます。

mplungjan · Answer

<ol> <li>uRLが成人と見なされることをユーザーに伝える- <a href="http://www.bluecoat.com/products/overview">bluecoat proxy</a> はそれを行います。</li> <li>Googleが画像検索で行うことのライセンス <a href="http://code.google.com/apis/safebrowsing/">http://code.google.com/apis/safebrowsing/</a> http://www.google.com/search?q=google+image+recognition+ api</li> <li>コンピュータをスキャンして、事前に同意したリストにない項目を探します。</li> </ol>

JYelton · Answer

人の趣味の良い写真、水着の写真、ヌードの写真、ポルノの描写の違いを判断するための画像とコンテンツの分析...私が知る限り、ソフトウェアだけで行うほど高度なものはありません。

@ammoQがコメントで示唆しているように、幸運なことに、クラウドソーシングがここで役立つはずです。ただし、4chanまたは他のフォーラムのメンバーが膨大な数の非ポルノ画像（ボタン用の一般的なWebグラフィックなど）を高く評価するとは思わないフレーム、広告等掲載しています。

私の推奨は、 Amazon Mechanical Turk などの既存のクラウドソーシングソリューションを検討することです。（ただし、利用規約ではポルノコンテンツの関与を明示的に禁止している場合があります。そのため、別の解決策を見つけるか、独自の解決策を講じる必要があるかもしれません。）

クラウドソーシングを実現可能にするには、ソフトウェアで以下の一部またはすべてを実行できるように準備する必要があります。

コンテンツと元のコンピューターをリンクする情報を保存する
インベントリ全体の正確な重複を特定して削除します（ただし、Origin情報は保持されます）
画像をある次元、おそらく320x200にダウンサンプリングします。これは、不必要な詳細を保持したり、ストレージスペース/帯域幅を無駄にしたりせずに画像のコンテンツを識別するのに十分です。
一定の間隔でビデオコンテンツの静止画像を作成し、同じダウンサンプリングルールを適用する

最後に、元の画像とビデオコンテンツを表す縮小画像のデータベースが、会社の行動規範に従ってユーザー（またはリソースがある場合は指定されたチーム）によってチェックされます。プログラムまたはインターフェイスには、一度に1つの画像、またはサムネイルの画面が表示される場合があります。正確な情報を取得するのに最適と思われるものであれば何でもかまいません。

画像の送信元のコンピュータの身元は完全に秘密であり、データを評価する人には知られていない必要があります。さらに、ランダム化する必要があり、バイアスを取り除くために、各画像をおそらく複数回チェックします。

同じ手法をテキストに使用することもできますが、まずコンテンツをキーワードランキングでスコア付けして、クラウドソースのレビューからテキストの大部分を削除できます。もちろん、長いドキュメントの分類は、画像の分類よりも時間がかかります。

a2j · Answer

私はコメントしたかったのですが、担当者は1人しかいないので、コメントできません。

Gravatarの場合、インターネットキャッシュの場所にあるクリーンなサイトのリストからフィルターで除外する関数を追加できます。 I.E. Gravatarや、誤検知を避けたい他のサイト。デスクトップの壁紙などを除外することもできます。彼らがデスクトップ上でポルノを表示しているなら、あなたは人々があなたの監査の外で気づくであろうと思うでしょう。

jwenting · Answer

そのようなことは確実に機能しません。ブロックリストを使用して、ドメインを名前で、またはリストに含まれるようにブロックすることができます（一般的な方法）。ただし、これらのリストは完全ではなく、基準に基づいて名前をブロックすると、多くの誤検知が発生する可能性があります。

サイトのテキストに表示される単語をブロックできますが、これも誤検出につながる可能性があります（「いたずらなビット」を検出するためにネットワークを通過するデータのすべてのビットを解析する必要があるため、非常に遅くなります）。

スキントーンの特定のパーセンテージ以上を示す画像（およびおそらくそれらを含むサイト）をブロックできます。しかし、それでも多くの誤検知が発生します。傷や皮膚の状態を示す手足や胴体の画像で医学百科事典をブロックしている大学医学部は、そのよく知られた例です。そしてもちろん、特定のスキントーンのみをブロックするので、人種差別主義者になるでしょう。コーカサス人の肌に合った色をブロックすると、たとえば常に黒人俳優を使ったポルノがあります。

従業員を信頼し、その信頼が破られたときのためのポリシーを用意するのが最善です。