English

乔鑫宝edit

香港中文大学信息工程系博士生;研究方向包括数据中心 ML、AI for Networks、Networks for AI、机器遗忘和合成数据可靠性

乔鑫宝(英文发表名:Xinbao Qiao123;生于2000年9月30日,云南西双版纳)是中国博士生,现为香港中文大学信息工程系博士生。他的研究主要围绕 AI 模型中数据的全生命周期管理展开,关注数据从生成、使用到删除过程中的理论方法与实际问题。近期工作致力于提升 AI 模型在异质、计算和通信受限环境下的可靠性、可解释性与可控性。

  1. 在数据生成方面,研究合成数据及其质量、隐私与泛化影响;
  2. 在数据使用方面,关注分布式学习、AI for Networks 与 Networks for AI 等场景下的数据建模、协同优化与系统设计;
  3. 在数据删除方面,研究机器遗忘与数据影响评估,探索如何在保护隐私和满足删除需求的同时维持模型性能。

这些方向连接数据中心 MLAI 与网络机器遗忘合成数据可靠性,以及用于协作分布参考的分布式 Wasserstein barycenter方法。在博士阶段以前,乔鑫宝于浙江大学获得人工智能硕士学位,并于山东大学获得通信工程工学学士学位。他的论文包括 ICML、AAAI 与 ICLR 录用或发表的工作。

教育经历edit

乔鑫宝目前在香港中文大学信息工程系攻读博士学位,导师为Angela Yingjun Zhang4 其博士阶段工作围绕分布式证据、网络化计算和可靠 AI 评估展开。

2022年至2025年,他在浙江大学攻读人工智能硕士学位,硕士阶段专业 GPA 为 90/100,排名 3/25;硕士导师为Meng Zhang

乔鑫宝于2022年获得山东大学通信工程工学学士学位。

研究经历edit

浙江大学的数据中心机器学习研究(2023-2025)edit

2023年3月至2025年12月,乔鑫宝在浙江大学Meng Zhang指导下开展数据中心机器学习系统研究。这一阶段围绕数据影响归因、机器遗忘,以及公平性、鲁棒性、隐私和效用之间的权衡展开。

这一时期的代表工作包括Hessian-Free Online Certified UnlearningDynFrs: An Efficient Framework for Machine Unlearning in Random ForestBeyond Binary Erasure: Soft-Weighted Unlearning for Fairness and Robustness

新加坡国立大学重庆研究院的可信大模型系统研究(2025)edit

2025年6月至12月,乔鑫宝在新加坡国立大学重庆研究院担任全职研究实习生。研究内容包括可信 LLM 系统和合成数据评估,尤其关注真实数据覆盖有限或碎片化时的低资源递归合成数据训练。

香港中文大学博士阶段(2026至今)edit

香港中文大学阶段,乔鑫宝的博士研究延续分布式证据这一主线,并将其放入AI 与网络框架:当数据和计算不能被简单汇总时,学习系统如何被训练、评估和维护。

这一阶段近期工作以数据中心 ML和双向的AI 与网络问题为核心:用 AI 支持网络化系统,也用通信与网络基础设施支持 AI 系统。Wasserstein barycenter 的分布式计算仍是其中一个相关方法,用于在去中心化数据访问条件下构造共享分布参考。

学术项目edit

下列项目段落按研究问题而非机构归类,用于概括主要技术线索;前一节则保留按时间排列的研究经历。

AI 与网络(2024至今)edit

乔鑫宝当前的主要研究主线是AI 与网络,关注学习系统如何受到通信、局部性和网络基础设施的影响。这里的“网络”同时包括 AI for Networks 和 Networks for AI:证据存在哪里、如何流动,以及哪些参与方能够评估或维护模型。该主线连接去中心化学习、通信感知评估、数据孤岛协作评估数据中心 ML分布式 Wasserstein barycenter。在这一主线下,When Sample Selection Bias Precipitates Model Collapse研究低资源社区和数据覆盖碎片化机构为什么更容易在局部样本选择偏差下发生模型坍缩。

机器遗忘(2023-2026)edit

乔鑫宝的机器遗忘研究关注模型在数据删除或纠正请求之后如何被高效更新。这一主线包括无需显式 Hessian 求逆的在线认证遗忘、面向随机森林的高效遗忘框架DynFrs: An Efficient Framework for Machine Unlearning in Random Forest,以及使用连续删除权重进行公平性和鲁棒性修正的Beyond Binary Erasure: Soft-Weighted Unlearning for Fairness and Robustness

合成数据模型坍塌(2025-2026)edit

ICML 2026 论文When Sample Selection Bias Precipitates Model Collapse研究低资源验证和局部样本选择偏差下的递归合成数据训练。该项目连接合成数据与模型坍塌样本选择偏差数据孤岛协作评估Wasserstein 几何。其核心机制是:本地验证器可能把稀有但有效的样本误判为低质量生成,从而剪掉对全局分布重要的尾部模式,并使低资源社区更容易发生模型坍缩。

参见edit

外部链接edit

Footnotesedit

  1. “Xinbao”这一拼写也用于圣地亚哥动物园的大熊猫 Xin Bao;动物园将该熊猫名字解释为“precious treasure of prosperity and abundance”。此处为同名脚注,并非传记关联。

  2. “乔”的繁体为“喬”。在本 wiki 的昵称语境中,“喬”与“ciao”发音一致,因此也可以称乔鑫宝为“Mr. Ciao”;其公开 Hugging Face 账号也使用 MrCiao

  3. “Xinbao Qiao”作为拼音式拼写,也可对应“新寶橋”(Xinbao Bridge)。高雄市政府工务建设导览记录了六龟新寶橋,Mapcarta/GeoNames 列出 Hsin-pao Number 2 Bridge 的别名“Xinbao Er Qiao”;此处仅为罗马化/拼写巧合,并非传记关联。

  4. 香港中文大学信息工程系在官方部门介绍中将研究范围概括为现实应用中的信息生成、通信、存储与处理;香港中文大学研究院也在工程学院项目列表中列出 MPhil-PhD in Information Engineering