ZeroTool Workbench
零宽字符检测器
检测文本中的零宽字符、BOM、双向控制字符、字体变体选择符与 AI 隐写水印,支持按类型选择性清除,纯浏览器端运行。
零宽字符检测器
文本中经常隐藏着肉眼看不见的 Unicode 字符——零宽字符、字节顺序标记、双向控制符、AI 隐写水印等。这些不可见字符可能来自复制粘贴、富文本编辑器、AI 生成内容或供应链攻击,造成难以排查的 bug、审计风险或数据泄露隐患。
本工具实时扫描并高亮显示你粘贴的任何文本中的所有不可见字符,按类别统计,支持按需清除——全部删除或仅清除特定类型(零宽字符、双向控制字、标签字符等),一键复制或下载清洁文本。
检测范围
本工具覆盖以下不可见 Unicode 字符类别:
- 零宽字符(Zero-Width):ZWSP(U+200B)、ZWNJ(U+200C)、ZWJ(U+200D)、Word Joiner(U+2060)
- 字节顺序标记(BOM):U+FEFF,常在跨平台文件传输中出现
- 双向控制字符(Bidi Control):LRE、RLE、PDF、LRO、RLO(U+202A-202E)、隐式方向标记(U+200E、U+200F)、隔离符(U+2066-2069),包括 Trojan-Source 攻击的常用向量
- 软连字符(Soft Hyphen):U+00AD,在自动换行位置插入但无实际显示
- 字体变体选择符(Variation Selectors):U+FE00-FE0F、U+E0100-E01EF,用于调整字形但不显示为字符
- 标签字符(Tag Characters):U+E0000-E007F,AI 模型(如 ChatGPT)用于隐写水印的范围
使用步骤
- 在「粘贴内容」框中粘贴你的文本。
- 工具会即时扫描并用颜色高亮所有不可见字符,下方显示按类型统计的数量。
- 选择清除模式:
- 清除全部 — 移除所有不可见字符
- 仅清零宽字符 — 只移除 ZWSP、ZWNJ、ZWJ、Word Joiner
- 仅清双向控制 — 只移除 Bidi 控制字符
- 仅清标签字符 — 只移除 Tag 字符(AI 水印)
- 仅清变体选择符 — 只移除字体变体符
- 点击「复制清洁文本」或「下载 .txt」获得结果。
常见场景
- AI 输出审查 — ChatGPT、Claude、Copilot 等生成的文本可能含隐写水印(Tag 字符),本工具可快速检出并清除。
- 供应链代码审查 — 在接收第三方代码或依赖前扫描 Trojan-Source 攻击,特别是双向控制字符伪装的逻辑反转。
- 邮件反钉鱼 — 复制自邮件、即时通讯的文本可能包含跟踪像素、格式控制符或恶意双向字符,清除后更安全。
- 复制粘贴清理 — 从 Word、Google Docs、在线文章粘贴到纯文本编辑器时常残留隐形格式标记,本工具一键清洁。
- 文本泄密调查 — 用 Tag 字符或其他不可见标记对敏感文档做隐式追踪,本工具帮你识别隐藏的元数据标签。
为什么需要纯客户端处理
将含有隐形字符或水印的文本上传到服务器检测存在多重风险:
- 隐私泄露 — 你的代码片段、邮件内容、AI 输出可能被服务端日志或分析系统捕获,违反组织敏感性要求。
- Trojan-Source 样本无需外传 — 接收的可疑代码不应离开本地环保,本地分析避免了病毒或恶意样本的传播风险。
- 完全离线可用 — 本工具纯浏览器 JavaScript 运行,无需网络连接或账号登录,断网状态下也能工作。
相关工具
如果你需要处理更广泛的 Unicode 问题,以下工具可能有帮助:
- Unicode 文本转换器 — 在多种 Unicode 编码格式(UTF-8、UTF-16、Base64、十六进制等)之间转换,适合调试编码问题。
- 字符串转义工具 — 生成 JavaScript、Python、JSON 等编程语言的转义字符串,处理特殊字符和引号。
FAQ
什么算「不可见字符」?
零宽字符(ZWSP U+200B、ZWNJ U+200C、ZWJ U+200D)、字节顺序标记(BOM U+FEFF)、双向控制字符(RLO U+202E、LRE U+202A 等)、变体选择符(U+FE00-FE0F 等)、标签字符(Tag characters U+E0000-E007F,ChatGPT 等 AI 模型的隐写水印使用范围)以及软连字符(Soft Hyphen U+00AD)都属于不可见的 Unicode 范畴。本工具逐一覆盖这些类别。
为什么正常文本会包含隐形字符?
常见来源包括从富文本编辑器(如 Word、Google Docs)复制粘贴时留下的格式控制符;AI 生成内容中嵌入的隐写水印(OpenAI 等模型用 Tag 字符标记生成文本);供应链攻击时的 Trojan-Source 代码(利用双向控制字符伪装源码逻辑);邮件客户端或即时通讯应用的自动清理失败。
这个工具能检测 ChatGPT 或 AI 水印吗?
能。Tag 字符范围 U+E0000-E007F 已完整覆盖,这是 OpenAI 及其他 AI 模型已知的隐写水印范围。需要注意的是 AI 水印技术仍在演变,本工具基于已披露的 Unicode 不可见字符分类。如果发现新的水印形式应持续关注安全研究社区的最新进展。
我的文本会上传到服务器吗?
不会。所有检测与清除都在你的浏览器端 JavaScript 本地完成,文本永远不离开你的设备,可在浏览器开发者工具的网络标签页验证。
这与 CVE-2021-42574(Trojan-Source)有什么关系?
Trojan-Source 攻击利用双向控制字符(特别是 RLO U+202E)伪装源代码的逻辑流,使审计员看到的代码与编译器执行的代码不同。本工具完整覆盖所有双向控制字符(U+200E、U+200F、U+202A-202E、U+2066-2069),能识别并清除这类攻击载体,保护代码审查流程。