如果這個工具幫到了你,可以請作者喝杯咖啡 ☕
快速識別文字編碼型別,解決亂碼問題
請輸入文字以檢視字元編碼結果
當您開啟文字檔案或網頁時遇到亂碼,往往是因為系統使用了錯誤的編碼格式解碼。本工具透過分析文字位元組模式,準確識別UTF-8、GBK等常見編碼型別。字元編碼(Character Encoding)是將字元對映為計算機可儲存數字的規則體系,不同編碼對同一位元組序列的解釋可能完全不同。
為什麼檢測結果有多個可能的編碼?
這是因為不同編碼對某些位元組序列的解釋存在重疊。工具會顯示所有可能編碼並按置信度排序。
如何解決"錕斤拷"亂碼?
這是典型的GBK被誤讀為UTF-8的情況,應使用本工具確認實際編碼後重新以正確編碼開啟檔案。
短文字(少於50字元)檢測準確率可能較低。二進制檔案無法檢測編碼。混合編碼文字只能識別主要編碼型別。
開發中推薦始終使用UTF-8編碼。典型示例:"你好"在GBK中佔2位元組(0xC4E3 0xBAC3),在UTF-8中佔6位元組(0xE4BDA0 0xE5A5BD)。透過位元組長度差異可初步判斷編碼型別。