简单说,Privacy Filter 是一个浏览器端 PII 识别与脱敏工具,用来在文本或截图分享前识别姓名、邮箱、电话、地址、账号、URL、日期和密钥等敏感信息。
把含有客户姓名、报错参数或连接凭证的文本直接粘进 ChatGPT、Claude,或者贴到论坛和工单系统里,已经是很多开发者、运营和客服人员的日常操作。问题在于,这些内容一旦发送出去,就会离开原来的控制范围。
Privacy Filter(隐私过滤器)就是为了缓解这种“投喂焦虑”而生的。它不是让你把敏感文本再上传到另一个云端服务去处理,而是把识别和脱敏过程放在当前设备上完成。你可以把它当作发给 AI 或公开分享前的“第一道数据清洗站”,扫除敏感字段后再发出去。
本地隐私脱敏工具:它和普通查找替换的区别在哪?
如果你只要隐藏一两个具体的手机号,用记事本的 Ctrl+F 查找替换确实够了。但面对几百行杂乱无章的报错日志,手动删减不仅折磨人,还极易遗漏。
Privacy Filter 不是简单的规则和正则匹配,它底层调用的是 OpenAI 开源的 openai/privacy-filter 模型,并通过 Transformers.js 在浏览器本地完成推理。它能结合上下文,智能侦测出 8 类个人隐私信息(PII):
- 姓名、电话、邮箱、物理地址
- 账号/卡号、日期、URL 链接
- 开发者最容易手滑泄露的 API Key 和 Token(密钥凭证)
识别出来后,它会一键生成类似 [EMAIL]、[KEY] 这样的占位符,既保留了日志的上下文逻辑,又藏住了关键数据。顺带一提,它甚至内置了 Tesseract.js,你丢一张聊天截图进去,它也能在本地完成 OCR 识别并给敏感词打上马赛克。
Privacy Filter 的识别过程主要发生在你的设备上。第一次打开时,浏览器需要从 Hugging Face 下载约 50MB 的模型文件,加载完成后会缓存在本地。后面再处理文本时,就不需要把内容发到服务器上跑一遍。浏览器支持 WebGPU 时速度会更快,不支持也能退回 WebAssembly,只是处理时间可能长一点。
适合哪些场景:AI 提示词、日志和截图脱敏
Privacy Filter 几乎没有上手门槛,打开网页、等待模型加载完成后,就可以直接粘贴文本或上传截图处理。它更适合那些经常需要把真实业务内容发给外部系统的人。
- 开发者和运维:在 GitHub Issue、论坛求助或团队协作前,先清理 Bug 报告、服务器日志里的 Token、URL、账号和连接参数。
- 重度 AI 用户:把会议纪要、客户反馈、合同摘要或内部文档发给 ChatGPT、Claude 之前,先做一次本地脱敏检查。
- 客服、运营和行政人员:处理聊天记录、用户反馈、订单截图或表格内容时,先遮盖姓名、电话、邮箱和地址等字段。
如果团队希望把这类流程固定下来,也可以参考项目源码部署成内部使用的轻量脱敏辅助页面。它支持部署到 Cloudflare Pages、Vercel 等静态平台,但实际使用前仍要确认模型文件加载、浏览器兼容性和团队操作规范。
使用前要知道:它不能替代企业级 DLP
Privacy Filter 适合作为分享文本前的辅助检查工具,但不要把它理解成“万能合规保险”。它依赖模型识别敏感字段,面对极其口语化的人名、非标准格式的自建密钥、复杂的多语言混排,仍然可能出现漏报或误报。
生产环境主密码、客户原始数据、合同全文、财务信息这类内容,即使用 Privacy Filter 处理过,也建议再人工检查一遍。它更适合日常共享前的轻量脱敏,不能替代企业级 DLP、权限管理和合规审核。
Privacy Filter 的定位不复杂:它不是完整的数据安全方案,而是一个发出去之前的本地检查步骤。对经常使用 AI 工具、公开求助或跨团队共享资料的人来说,它能把敏感信息检查这一步做得更省事,也更容易形成习惯。