Auto-FL-Research: 用智能体搜索联邦学习算法

联邦学习（Federated Learning, FL）研究近年来持续升温，但一个长期存在的痛点始终挥之不去：算法选择。优化器变体、服务器聚合规则、本地训练调度、正则化手段、模型架构……这些参数组合起来，数不胜数。研究人员往往靠经验和直觉逐个尝试，费时费力，且很难公平比较——因为一个改动可能连带影响训练路径或评估指标。

最近一篇 arXiv 论文提出了一个有意思的解决方案：Auto-FL-Research (AFR)。它本质上是一个受约束的编码智能体工作流，专门用于 FL 算法搜索。AFR 的智能体可以自主提议并实现候选训练算法，包括服务器聚合规则、客户端更新策略、本地目标函数以及模型变体。与此同时，任务配置文件固定了算法修改面、计算预算、通信协议和最终模型评估标准。每轮搜索都会记录候选分数、运行时间、编辑过的文件、生成的工件以及失败状态。

AFR 的核心设计：约束下的搜索

AFR 的理念很有趣——不是让智能体天马行空地乱改，而是通过任务配置划定边界。这有点像给科学家一个“实验安全框”：你可以自由探索，但不能超出预算和协议。这种设计很务实，因为 FL 场景中通信和计算成本往往是硬约束。系统会记录每一次尝试的结果，无论成功还是失败。失败信息尤其宝贵：它告诉后来的智能体哪些路走不通。

研究中，AFR 在五个医疗领域跨筒仓 FL 任务上进行了评估。医疗数据天然分散且对隐私敏感，是 FL 的典型应用场景。据论文报告，AFR 能够有效找到比人工基线更优的算法组合，且搜索效率显著提升。虽然没有公布具体提速倍数，但这种自动化思路本身已经很有价值。

对 FL 研究意味着什么

FL 领域的一个尴尬现实是：很多论文的算法对比并不公平。作者自己选的超参、优化器、聚合规则，很难判断是算法本身好还是配置合适。AFR 这类工具如果能标准化，就能让对比更有说服力。它不是一个“自动炼丹”工具，而是提供一个可复现、可审计的搜索框架。每个搜索都记录完整轨迹，同行可以复盘失败案例，这比只看最终指标强。

当然，AFR 目前还停留在学术实验阶段。它的搜索空间受限于任务配置，对于全新类型的算法（比如颠覆性聚合规则）可能难以发现。另外，智能体依赖的编码能力也有限：如果算法实现需要复杂的工程技巧，AFR 可能无能为力。