暗号解析や言語識別に用いるテキストの一致指数(IC)を計算します。英字の出現頻度統計に対応。
一致指数を計算するには、2文字以上のテキストを入力してください。
一致指数(Index of Coincidence, IC)は、テキスト内の文字の分布の均一性を測る統計量です。暗号分析において特に有用で、テキストが暗号化されているか、またどのような暗号方式が使われているかを判断するのに役立ちます。
IC値が0.0667に近い場合、テキストは自然言語(例:英語)である可能性が高く、0.0385に近い場合は、ランダムなテキストまたは高度に暗号化されたテキストである可能性を示します。正規化ICは、結果に26(英字の数)を乗じることで、より直感的に解釈できるようにしたものです。
暗号化されたテキストが自然言語の特徴を保持しているかを判定する際、一致指数(IC:Index of Coincidence)は重要な指標となります。本ツールは英字の出現頻度を統計し、ランダムに選んだ2つの文字が一致する確率を計算します。0.0385(ランダムなテキスト)から0.067(英語)の間のIC値を出力し、暗号解析のための定量的な根拠を提供します。
IC値0.05は何を意味しますか?
テキストのランダム性が英語(0.067)と完全なランダム(0.0385)の中間であることを示しており、弱い暗号化処理が施されている可能性があります。
なぜ最低100文字が必要なのですか?
短いテキストでは統計的な変動が大きくなるためです。IC値の代表性を確保するには100文字以上が必要であり、より正確な結果を得るには300文字以上を推奨します。
分析結果は文字の分布特徴のみを反映しており、意味論的な内容は含みません。10万文字を超えるテキストは、分割して処理することをお勧めします。すべての計算はブラウザ上でローカルに行われるため、データがアップロードされるリスクはありません。
一般的な英語テキストのIC値は約0.067、フランス語は0.078、ドイツ語は0.076です。ヴィジュネル暗号(Vigenère cipher)を解析する場合、暗号文を分割してIC値を計算することができます。特定の分割長において各セグメントのIC値が英語の基準値に近くなった場合、その長さが鍵の長さ(キー長)である可能性が高いと推測できます。