机器遗忘edit

研究如何从已训练模型中删除、降低或纠正数据影响。

机器遗忘 研究模型训练完成后，如何删除、降低或纠正特定训练数据对模型的影响。在本 wiki 中，它既是隐私问题，也是数据中心系统问题：一个遗忘算法需要说明删除了什么、与重新训练的结果有多接近，以及节省了多少计算和延迟成本。¹

引言edit

本专题覆盖训练后的数据操作，包括认证删除、树模型中的精确删除，以及用于公平性和鲁棒性修正的连续加权。共同问题是：当数据记录发生变化时，能否在不从头重新训练的情况下修正已部署模型。

在本 wiki 中的作用edit

本页组织乔鑫宝关于训练后数据操作的论文脉络。该脉络包括认证删除、软加权修正和随机森林更新。它与数据中心 ML 紧密相关，因为核心对象不是新的模型结构，而是能够改变模型行为的数据操作；它也连接可信 AI，因为删除请求、公平性修正和鲁棒性干预都属于对已训练系统的治理。

论文edit

论文	会议/状态
无 Hessian 在线认证遗忘	ICLR 2025，2025年4月24日至28日，新加坡。
DynFrs：随机森林机器遗忘高效框架	ICLR 2025，2025年4月24日至28日，新加坡。
超越二元擦除：用于公平性与鲁棒性的软加权遗忘	AAAI 2026，2026年1月20日至27日，新加坡。

与乔鑫宝工作的关系edit

乔鑫宝的机器遗忘论文覆盖互补设置。无 Hessian 在线认证遗忘面向可微模型，在避免显式 Hessian 求逆的同时给出认证式近似；超越二元擦除将删除从二元保留/移除推广为连续权重，用于公平性和鲁棒性修正；DynFrs 则研究随机森林中的精确、低延迟更新机制。三者共同构成从数学认证到实用模型维护的研究线。

参见edit

Footnotesedit

机器遗忘领域的常见起点包括 Bourtoule 等人在 IEEE S&P 2021 的 “Machine Unlearning”，该文提出用分片、隔离、切片和聚合训练作为删除数据的一种实用途径。 ↩