web-dev-qa-db-ja.com

テキスト内のテキストを非表示にするステガノグラフィー

(オプションで暗号化された)テキストメッセージを別の無害なテキストメッセージ内に隠すことができるステガノグラフィーアルゴリズムはありますか?

私が想定しているシナリオは、綿密な調査を行ったとしても、真ん中の人にとってはまったく無害に見える電子メールの会話を続けたいというものです。しかし、どの実際には、表示されるテキスト内に隠された真のメッセージが含まれています。

この手法がメディアファイル内のテキストを非表示にするために使用されていることは承知していますが、すべてのメッセージとその応答にメディアファイルが添付されていると、煩雑であり、中間者にとって疑わしいと思われます。 。

現在、隠す価値のあるものはなく、違法なことはしていませんが、プライバシーを重視しており、暗号に非常に興味があります。

例は次のとおりです。

送信者の見かけのメッセージ:こんにちは、ボブ。週末はどうでしたか?鉱山だった... more text ... ciao

送信者の実際のメッセージ:私が要求したパスワードは見つかりましたか?

受信者の見かけのメッセージ:かなり良い。 ...続きを読む...チャオ

受信者の実際のメッセージ:はい、それは「パスワード」でした

16
mulllhausen

はい、まったく無害に見えるメッセージ内にメッセージを隠すアルゴリズムが存在します。例として spammimic を考えます。それはあなたのメッセージを典型的な外見のスパムメッセージの中に隠す可能性を与えます。

「テキスト内のテキストを隠すステガノグラフィー」をグーグル検索すると、これに関するより多くの研究と例が得られます。

18
Chris Dale

私の個人的な(おそらく偏ったかもしれませんが)意見では、スパムミミックはあまり「自然」ではありません。私の控えめな試みは、電子メールまたは同様のテキスト文書の行に単語の数を使用することです。 1つのステゴビットを送信するために、通常は回線の終端の頑丈さをあまり気にしないHTMLソースファイル。 A Pythonコードをフォーマットするのに役立つコードは、EMAILSTEGANOという名前で利用できます。残念ながら、ビットレートは非常に低くなっています。一方、非常に短いステゴメッセージで十分な場合もあります(たとえば、適切に作成されたコードブックを使用して、高度に圧縮された形式で送信される情報を表現することができます。手書きのテキストの場合、対応する場合は、多少なりとも不満足な行端の頑丈さの問題が完全になくなることもあります。書面で注意が払われます。

[補遺、編集済み]別のスキーマWORDLISTTEXTSTEGANOGRAPHY(広範なWordリストを採用)があり、ソフトウェアのガイダンスに従ってユーザーがカバーテキストを作成する必要がありますが、ビットレートが高くなっています。上記の両方のスキームは、私のホームページmok-kong-shen.deからアクセスできる最新バージョンにあります。

3
Mok-Kong Shen

私はあなたのために素晴らしい例を持っています!最近、テキストドキュメント内のテキストメッセージを非表示にするためにステガノグラフィの1つのアプリケーションが使用されるのを見ました。

Aryan Brotherhood と、刑務所内での全国的なコミュニケーション方法に関するYouTubeのナショナルジオグラフィックビデオがあります。ギャングはカリフォルニアの最大のセキュリティ刑務所内に作成され、他のスーパーマックス刑務所から管理されました。彼らは刑務所で最も暴力的なギャングであり、人口の1%の1/10しか構成していないが、刑務所内で行われる殺人の20%以上を担当している。

彼らが採用したステガノグラフィック技術は、400年前にサーフランシスベーコンによって開発されたバイリテラル暗号であり、FBIの専門家、NSAおよびその他の組織を含む、複数の管轄区域を持つ連邦組織によって破られました。当然、このテクノロジーは壊れているため使用できませんが、その背後にあるロジックの一部はまだしっかりしています。

私がここで何を言っているのか理解できない場合は、本当にビデオを見る必要があります。述べたように、テキストは一緒にメッシュ化されています。このテクノロジーでは、1つの「アルファベット」はプレーンブロック文字で記述され、もう1つの「アルファベット」は筆記体で記述されます。プレーンブロック文字はAsになり、筆記体文字はBsになります。次に、文字は5つのグループに分けられ、キーを使用して解読する必要があります。

これはインターネットに投稿された場​​合、簡単に壊れるように聞こえますが、非常に近いフォントがいくつかあり、すべてのドキュメントが注がれない限り、これを有能なテクノロジーにすることができます。また、ドキュメントには数十のフォントが含まれる場合があります。フォントの変更を非表示にする1つの方法は、異なるフォントをPDFドキュメントまたは画像に配置することです。異なるフォントを抽出するには、一般的ではない特別なテクノロジーが必要になります。ほとんどのOCRソフトウェア。

2
T I

Matthew Kwanは、プレーンな古いテキストファイル(.txt)のスペースとタブにあるテキストを非表示にする方法を開発しました。これは雪と呼ばれ、次の場所から入手できます。 http://www.darkside.com.au/snow/ これはWindows中心のポータブルユーティリティであり、外部に依存する必要がないため、何もインストールする必要がありません。オプションで、隠しテキストを暗号化(ICEアルゴリズム)して、隠しテキストをさらに難読化できます。私はLinuxでWineを実行しようとしませんでした。(理論的には)動作するはずです。

2
PsyclePhreak

ここでスキームを開発しました:

http://mjethani.github.io/typo

これがどのように機能するかについて簡単に説明します:

https://crypto.stackexchange.com/a/24863/1522

簡単に言えば、秘密のメッセージの4ビットごとがstegotextのタイプミスとしてエンコードされます。タイプミスの値は、SHA-256ハッシュの最初のバイトの最下位4ビットです。たとえば、タイプミス「確認」(情報)の値は0xE(0b1110)です。受信者はタイプミスを識別し、ハッシュ化して情報を抽出します。

1
Manish

私の以前の回答で述べた種類のステガノグラフィーの方法は、一般に構文的方法と呼ばれています。 Rhinedahlによるもう1つの構文方法について説明します。これは次のように説明できます。

Stegoメッセージを、各文字が5ビットとしてコード化された文字列とする。たとえば、次のようなルールに従って、5ビットのセットごとにカバーテキストの文を記述しようとします。

1番目のビット= 2を法とする文の名詞句の数.

2番目のビット= 2を法とする形容詞の数.

3番目のビット= 2を法とする副詞の数.

4番目のビット= 2を法とする句の数.

5番目のビット=主動詞は他動詞(= 1)または自動詞(= 0)でしたか?

これは明らかに、私の控えめなスキームEMAILSTEGANOよりもはるかに高いステゴビットレートを持っています。この方法は、実際には手作業ではそれほど難しくありません。ただし、完全に自動化することはできません。 IMHOは、AIテクニック(NLP)を使用して所定の文から必要な文法情報を決定し、ステゴエンコーディングの実際の問題に対処するためのユーザーとの適切な対話を提供するソフトウェアです。

1
Mok-Kong Shen