AI 精选动态
智能评分 67
Introducing OpenAI Privacy Filter
AI 推荐理由
值得重点看模型架构与标签体系设计,尤其是本地部署、单次前向推理和长上下文脱敏在生产流程中的落地方式。核心解读
OpenAI 发布了 Privacy Filter,一个开源权重的文本 PII 检测与脱敏模型,支持在本地运行,面向训练、索引、日志和审核等隐私工作流。该模型是双向 token-classification 架构,支持最长 128,000 tokens 上下文,总参数量 1.5B、活跃参数 50M,可一次前向推理完成标签判定并用约束 Viterbi 解码成连续 span。OpenAI 表示,该版本在修正评测中的标注问题后,在 PII-Masking-300k 基准上达到 SOTA;模型可识别 8 类内容,包括 private_person、private_address、private_email、private_phone、private_url、private_date、account_number 和 secret。