テキストから中国大陸フォーマットの身分証番号を迅速に特定・抽出し、新旧フォーマットに対応して抽出数をカウントします。
テキストを入力して抽出を開始
文字や数字が混在する雑然としたテキストから、すべての身分証番号を迅速に見つけ出す必要がある場合、手作業での検索は非効率でミスが起こりやすくなります。身分証番号抽出ツールは、組み込みの正規表現エンジンを使用して入力テキストを自動的にスキャンし、中国大陸の18桁(新版)および15桁(旧版)の公民身分証番号のフォーマット規則に一致するすべての文字列を正確にマッチングして抽出します。身分証番号は、住所コード、生年月日コード、順序コード、およびチェックディジット(18桁の場合)で構成される個人の識別番号です。本ツールの中核は「フォーマットマッチング抽出」の実行であり、出力結果はプレーンテキストのリストとして、認識された各身分証番号が独立した行に表示されます。
Q:このツールは身分証番号の真偽を検証できますか?
A:できません。フォーマットのマッチング抽出のみを行い、チェックディジットの正確性や情報の真偽は検証しません。
Q:「張三:110101199003074512、李四:420106198512126633」というテキストから何を抽出できますか?
A:2つの18桁の身分証番号「110101199003074512」と「420106198512126633」を抽出できます。
本ツールはフォーマットのマッチング抽出にのみ使用され、結果データの真実性や有効性について責任を負いません。個人のプライバシーに関わる機密データの処理や違法な目的には使用しないでください。入力テキストが長すぎる場合、処理に数秒かかることがありますので、しばらくお待ちください。結果には、重複して出現する番号を含め、すべての一致項目が含まれます。
非構造化テキスト(カスタマーサポートの履歴やアンケートの自由記述など)からエクスポートされたデータを処理する際、このツールはデータクレンジングの効率を大幅に向上させます。マッチング規則は公開されている身分証のエンコーディング規則に基づいていますが、マスク処理された(例:一部が*記号で置き換えられている)番号や、フォーマットが著しく崩れている番号は認識できないことにご注意ください。典型的な入出力の例として、「ユーザーAの身分証は110101199003074512、ユーザーBは420106198512126633」と入力すると、出力として2行の独立した番号が得られます。データコンプライアンスの要件が厳しいシナリオでは、抽出後に手作業で再確認するか、公式の検証サービスと連携することをお勧めします。