如果這個工具幫到了你,可以請作者喝杯咖啡 ☕
從文字中快速定位並提取符合中國大陸格式的身份證號碼,支援新舊版格式並統計數量。
輸入文字開始提取
當您面對混雜著文字、數字的雜亂文字,需要快速找出其中所有身份證號碼時,手動查詢既低效又易出錯。身份證號碼提取器透過內建的正規表示式引擎,自動掃描輸入文字,精準匹配並提取所有符合中國大陸18位(新版)和15位(舊版)公民身份證號碼格式規則的字串。身份證號碼是由地址碼、出生日期碼、順序碼和校驗碼(18位)組成的個人身份標識。本工具的核心是執行“格式匹配提取”,其輸出結果為純文字列表,每個識別到的身份證號碼獨立成行。
問:這個工具能校驗身份證號碼的真實性嗎?
不能。它只做格式匹配提取,不驗證校驗位正確性或資訊真實性。
問:從“張三:110101199003074512,李四:420106198512126633”這段文字裡能提取出什麼?
能提取出兩個18位身份證號碼:110101199003074512 和 420106198512126633。
本工具僅用於格式匹配提取,不對結果資料的真實有效性負責。請勿用於處理涉及個人隱私的敏感資料或非法用途。輸入文字過長時,處理可能需要數秒時間,請耐心等待。結果中會包含所有匹配項,包括重複出現的號碼。
在處理從非結構化文字(如客服記錄、調查問卷開放題)匯出的資料時,此工具能有效提升資料清洗效率。其匹配規則基於公開的身份證編碼規則,但請注意,它無法識別經過掩碼(如用*號部分替換)或格式嚴重錯亂的號碼。一個典型輸入輸出示例是:輸入“使用者A身份證是110101199003074512,使用者B的是420106198512126633”,輸出將得到兩行獨立的號碼。對於資料合規要求高的場景,提取後建議人工複覈或對接權威驗證服務。