研究edit

乔鑫宝学术 wiki 的研究概览。

本页总结乔鑫宝学术 wiki 中的主要研究方向。它不是静态兴趣列表，而是由多个相互链接的专题页编译出的研究图谱。当前重心是数据中心 ML和双向的 AI 与网络问题。

研究主线edit

乔鑫宝主要围绕 AI 模型中数据的全生命周期管理开展研究，关注数据从生成、使用到删除过程中的理论方法与实际问题。相关工作致力于提升 AI 模型在异质、计算和通信受限环境下的可靠性、可解释性与可控性。

在数据生成方面，研究合成数据及其质量、隐私与泛化影响；
在数据使用方面，关注分布式/联邦学习、AI for Networks 与 Networks for AI 等场景下的数据建模、协同优化与系统设计；
在数据删除方面，研究机器遗忘与数据影响评估，探索如何在保护隐私和满足删除需求的同时维持模型性能。

AI 与网络edit

AI 与网络覆盖 AI 与网络通信系统的交叉：AI for Networks、Networks for AI、去中心化学习、数据剪枝和协作评估。在当前 CUHK 博士阶段，这条主线与数据中心 ML相结合，并包括Wasserstein barycenter 的分布式计算等工具，即在不默认汇总原始数据的前提下，把多方局部分布组合成共享的分布参考。

机器遗忘edit

机器遗忘研究删除请求后的认证数据删除和低成本更新机制。相关页面包括无 Hessian 在线认证遗忘、超越二元擦除、DynFrs、影响函数和认证数据删除。

合成数据edit

合成数据研究递归合成数据训练、数据选择、样本选择偏差、模型坍缩，以及低资源数据孤岛中的协作缓解。中心论文是样本选择偏差何以促成模型坍缩，其核心表述是：当真实数据覆盖稀缺或碎片化时，模型坍缩风险尤其高。

数据中心 ML 与可信 AIedit

数据中心 ML 覆盖数据选择、估值、过滤和评估。可信 AI 连接机器遗忘、公平性、鲁棒性、隐私、安全、可解释性和可靠性。

几何与分布式学习edit

Wasserstein 几何、分布式 Wasserstein barycenter 与分布式学习为协作评估、最优传输代理、去中心化数据访问，以及网络化 AI 系统中的分布参考提供工具。