铭鸿体育资讯网

Easy同学正在独立开发OpenAI 这次不是发大模型,而是发了一个专门做隐私识

Easy同学正在独立开发

OpenAI 这次不是发大模型,而是发了一个专门做隐私识别和脱敏的小模型,叫 Privacy Filter。它不是拿来聊天写作的,而是用来在文本里自动找出个人信息,比如姓名、邮箱、电话、地址、账号、日期、密码和 API key,然后把这些内容标出来或者遮掉。

官方给出的信息是,它大概有 15 亿总参数,5000 万活跃参数,模型体量不算大。它支持 128,000 token 的长上下文,可以处理比较长的文本。

官方还明确说了它可以本地运行,既支持 GPU,也能跑 CPU。网页和笔记本都能用,适合放在自己的环境里做处理,只是具体要多强的电脑,官方没有给出硬性的最低配置。

对普通用户来说,这个模型最直接的用处,就是发文件、发聊天记录、发邮件之前,可以先把里面的隐私信息处理掉。对程序员来说,它也能用在日志清洗、代码仓库里的 secret 扫描、训练数据脱敏这些场景里。

如果放到日常里看,像整理聊天记录、转发合同、保存笔记、导出邮件这些事,都可能用得上。它做的事情很简单,就是帮你先把不该公开的信息挑出来。