首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >腾讯玄武实验室 HaS Anonymizer:本地化数据隐私脱敏技术评估概要

腾讯玄武实验室 HaS Anonymizer:本地化数据隐私脱敏技术评估概要

原创
作者头像
gawain2048
发布2026-03-24 17:40:02
发布2026-03-24 17:40:02
110
举报

一、 产品定位与核心亮点

HaS Anonymizer(简称 HaS)是由腾讯玄武实验室研发的完全本地化运行的隐私保护工具。其核心技术属性在于通过非云端的本地计算,对非结构化数据(文档、图片)中的敏感信息进行精准扫描与掩盖处理。

其商业差异化卖点在于构建了大模型应用的安全合规桥梁。在企业接入 Claude、GPT 等大模型进行数据分析时,HaS 能够在数据出域前完成物理隔离级别的本地脱敏,从根本上消除隐私泄露风险,满足企业严苛的数据安全合规要求

二、 产品应用场景

HaS 主要服务于需要处理含个人敏感信息(PII)及商业机密数据,且有外部大模型调用或内部跨部门数据流转需求的企业与开发者。

  • 智能文本分析与大模型交互场景:业务人员在将含有用户隐私(如身份证号)的合同、业务文档输入给大模型前,面临合规审查痛点。通过发送自然语言指令,工具可自动抽取并脱敏敏感词段,确保输入大模型的语料纯净。
  • 财务票据与身份凭证归档场景:财务或审核人员在处理发票、身份证件图片时,需对关键字段(如金额、日期、证件号码)进行脱密展示。工具可自动识别图片中的特定区域并进行打码模糊处理。

三、 应用框架和功能介绍

1. 功能框架

产品基于自然语言指令驱动,具备四大核心执行模块与一项可逆操作模块:

  • 隐私扫描:自动识别文档或内容中的敏感隐私信息。
  • 文档脱敏:针对主流文本格式中的敏感信息进行处理。
  • 图片脱敏:针对图片文件中的敏感信息(身份证、银行卡、票据等)进行掩盖。
  • 隐私还原:基于生成的 mapping 文件,将脱敏后的数据进行无损逆向还原。
  • 批量处理:支持通过指令对多个文件进行并发脱敏。
2. 硬核指标(量化数据与兼容性)
  • 支持文档数据格式Word、PDF、Excel
  • 支持图片数据格式PNG、JPG、BMP 等常见格式。
  • 敏感信息识别类型身份证号、手机号、银行卡号、邮箱、地址、票据等。
  • 部署与运行环境
    • 桌面端:内置于 WorkBuddy(小龙虾) 客户端,开箱即用。
    • 服务端部署:适配 Lighthouse / OpenClaw,支持通过 SkillHub 命令行(CLI)一键安装。
    • 市场分发:支持通过 ClawHub(官方市场) 调用安装。
3. 产品优势能力
  • 数据绝对隔离完全本地运行,所有数据绝对不上传到云端,斩断网络层面的泄露途径。
  • 多模态文件支持:无缝兼容图文双轨的常见办公文件格式。
  • 前沿 AI 兼容性:在保障合规的前提下,不影响 Claude、GPT 等大模型对脱敏后上下文的理解与生成。
  • 极简交互门槛:操作逻辑极简,支持诸如“帮我脱敏这张图片中的身份证”等自然语言直接调用。
  • 数据可恢复性:提供 mapping 文件机制,兼顾了数据的安全掩蔽与业务对真实数据的溯源需求。
4. 荣誉背书

产品底层技术基于腾讯玄武实验室深厚的技术积累,其脱敏效果经过专业测试,具备高可靠性

四、 典型应用案例

(注:原文档未披露外部企业客户名称,以下案例严格基于原文“使用方式”章节提取的标准化业务处理场景)

案例一:非结构化文本隐私合规处理
  1. 背景:业务人员需要分析包含隐私数据的文本文档,面临手动排查敏感信息效率低、易遗漏的技术瓶颈。
  2. 解决方案:使用 HaS 的文本隐私保护模块。用户直接输入自然语言指令(如:“扫描这段文字,告诉我有哪些隐私信息”或“帮我脱敏这段文本中的身份证号”)。
  3. 成效:系统自动分析文本内容并列出发现的隐私数据,精准针对身份证号码等字段进行脱敏处理,输出合规文本。
案例二:财务票据与证件图像脱敏处理
  1. 背景:在处理报销或身份认证业务时,图片文件(如身份证、发票)中暴露了关键的视觉隐私信息。
  2. 解决方案:调用 HaS 的图片隐私保护模块。输入指令(如:“扫描这张发票,帮我把敏感信息打码”或“帮我脱敏这张图片中的身份证”)。
  3. 成效:系统自动识别并遮挡图片中的身份证信息,或精准识别发票中的核心指标(金额、日期等)并进行模糊处理

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、 产品定位与核心亮点
  • 二、 产品应用场景
  • 三、 应用框架和功能介绍
    • 1. 功能框架
    • 2. 硬核指标(量化数据与兼容性)
    • 3. 产品优势能力
    • 4. 荣誉背书
  • 四、 典型应用案例
    • 案例一:非结构化文本隐私合规处理
    • 案例二:财务票据与证件图像脱敏处理
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档