English

研究edit

乔鑫宝学术 wiki 的研究概览。

本页总结乔鑫宝学术 wiki 中的主要研究方向。它不是静态兴趣列表,而是由多个相互链接的专题页编译出的研究图谱。当前重心是数据中心 ML和双向的 AI 与网络问题。

研究主线edit

乔鑫宝主要围绕 AI 模型中数据的全生命周期管理开展研究,关注数据从生成、使用到删除过程中的理论方法与实际问题。相关工作致力于提升 AI 模型在异质、计算和通信受限环境下的可靠性、可解释性与可控性。

  1. 在数据生成方面,研究合成数据及其质量、隐私与泛化影响;
  2. 在数据使用方面,关注分布式/联邦学习、AI for Networks 与 Networks for AI 等场景下的数据建模、协同优化与系统设计;
  3. 在数据删除方面,研究机器遗忘与数据影响评估,探索如何在保护隐私和满足删除需求的同时维持模型性能。

AI 与网络edit

AI 与网络 覆盖 AI 与网络通信系统的交叉:AI for Networks、Networks for AI、去中心化学习、数据剪枝和协作评估。在当前 CUHK 博士阶段,这条主线与数据中心 ML相结合,并包括Wasserstein barycenter 的分布式计算等工具,即在不默认汇总原始数据的前提下,把多方局部分布组合成共享的分布参考。

机器遗忘edit

机器遗忘 研究删除请求后的认证数据删除和低成本更新机制。相关页面包括 无 Hessian 在线认证遗忘超越二元擦除DynFrs影响函数认证数据删除

合成数据edit

合成数据 研究递归合成数据训练、数据选择样本选择偏差模型坍缩,以及低资源 数据孤岛 中的协作缓解。中心论文是 样本选择偏差何以促成模型坍缩,其核心表述是:当真实数据覆盖稀缺或碎片化时,模型坍缩风险尤其高。

数据中心 ML 与可信 AIedit

数据中心 ML 覆盖数据选择、估值、过滤和评估。可信 AI 连接机器遗忘、公平性、鲁棒性、隐私、安全、可解释性和可靠性。

几何与分布式学习edit

Wasserstein 几何分布式 Wasserstein barycenter分布式学习 为协作评估、最优传输代理、去中心化数据访问,以及网络化 AI 系统中的分布参考提供工具。