OpenAI開源Privacy Filter,可在本地自動檢測並遮蔽文本中的隱私信息

robot
摘要生成中

ME News 消息,4 月 23 日(UTC+8),據 動察 Beating 監測,OpenAI 以 Apache 2.0 許可證開源 Privacy Filter,一個本地部署的文本去敏模型。用戶將文本傳入模型,它會自動識別其中的人名、郵箱、電話、地址、帳號、URL、日期和密鑰共 8 類個人身份信息(PII),並標記或遮蔽。整個過程在本地完成,數據不需要發往雲端。 模型總參數 1.5B,但採用稀疏混合專家架構,實際每次推理只激活 50M 參數,因此可以在筆記本電腦甚至瀏覽器中運行。上下文窗口 128K token,單次前向傳播即可標註全部隱私信息。用戶可通過預設操作點調整精確率與召回率的權衡,也可用自有數據微調以適配特定場景。模型以英文為主,多語言能力有限。 (來源:BlockBeats)

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 留言
  • 轉發
  • 分享
留言
請輸入留言內容
請輸入留言內容
暫無留言