Accurate, private, secure, federated U-statistics with higher degree
作者: Quentin Sinh, Jan Ramon
分类: cs.CR, cs.LG
发布日期: 2026-03-02
💡 一句话要点
提出一种基于多方计算的联邦U-统计协议,提升隐私保护下的计算精度。
🎯 匹配领域: 支柱一:机器人控制 (Robot Control)
关键词: 联邦学习 U-统计量 多方计算 差分隐私 隐私保护 安全计算 Kendall's τ
📋 核心要点
- 现有联邦U-统计计算方法在隐私保护和计算精度上存在不足,尤其是在高阶U-统计量计算中。
- 论文提出一种基于多方计算(MPC)的协议,在中心差分隐私下安全计算高阶U-统计量。
- 实验结果表明,该方法在计算精度上显著优于现有方法,例如Kendall's τ系数的均方误差降低了四个数量级。
📝 摘要(中文)
本文研究了在联邦学习环境中计算具有k (≥2)阶核函数f的U-统计量的问题,即对所有k元组实例上的函数f求平均。2阶U-统计量包括Kendall's τ系数、接收者操作曲线下面积和Gini平均差等有用的统计量。现有方法仅在较低效用的本地差分隐私模型下提供解决方案,并且/或者在域离散化的大小方面扩展性较差。在这项工作中,我们提出了一种协议,该协议利用多方计算(MPC)在中心差分隐私下安全地计算k (≥2)阶U-统计量。与先前的解决方案相比,我们的方法大大提高了准确性。我们提供了对其准确性、通信和计算属性的详细理论分析。我们通过实验评估了其性能,获得了良好的结果,例如,对于Kendall's τ系数,我们的方法将均方误差降低了高达四个数量级。
🔬 方法详解
问题定义:论文旨在解决联邦学习场景下,高阶U-统计量(k≥2)的精确计算问题。现有方法主要面临两个痛点:一是依赖于低效用的本地差分隐私模型,导致精度损失较大;二是当数据域离散化程度较高时,计算复杂度显著增加,扩展性差。
核心思路:论文的核心思路是利用多方计算(MPC)技术,在中心差分隐私的框架下,安全地计算U-统计量。通过MPC,各个参与方可以在不泄露自身数据的前提下,共同完成计算任务,从而提高隐私保护程度和计算精度。
技术框架:该协议主要包含以下几个阶段:1) 各参与方对本地数据进行预处理和编码;2) 使用MPC协议,在多个参与方之间安全地计算U-统计量;3) 添加中心差分隐私噪声,以保护最终结果的隐私性;4) 将结果返回给请求方。整体架构利用MPC的安全性和中心差分隐私的隐私保证,实现了高精度和强隐私保护的U-统计量计算。
关键创新:最重要的技术创新点在于将MPC与中心差分隐私相结合,用于联邦U-统计量的计算。与现有方法相比,该方法能够在保证隐私性的同时,显著提高计算精度,尤其是在高阶U-统计量和高维度数据域的情况下。
关键设计:论文详细分析了协议的准确性、通信复杂度和计算复杂度,并针对不同的U-统计量,设计了特定的MPC协议。关键设计包括选择合适的MPC协议(例如,基于秘密共享或同态加密的协议),以及优化通信和计算过程,以提高效率。此外,论文还考虑了差分隐私噪声的添加方式,以在隐私保护和精度之间取得平衡。
📊 实验亮点
实验结果表明,该方法在计算Kendall's τ系数时,与现有基线方法相比,均方误差降低了高达四个数量级。这表明该方法在高精度计算方面具有显著优势,尤其是在需要高阶U-统计量的复杂分析任务中。
🎯 应用场景
该研究成果可广泛应用于需要联邦学习和隐私保护的统计分析场景,例如金融风控、医疗健康、社会科学研究等。通过安全地计算各种U-统计量,可以进行更准确的风险评估、疾病诊断和政策制定,同时保护用户数据的隐私。
📄 摘要(原文)
We study the problem of computing a U-statistic with a kernel function f of degree k $\ge$ 2, i.e., the average of some function f over all k-tuples of instances, in a federated learning setting. Ustatistics of degree 2 include several useful statistics such as Kendall's $τ$ coefficient, the Area under the Receiver-Operator Curve and the Gini mean difference. Existing methods provide solutions only under the lower-utility local differential privacy model and/or scale poorly in the size of the domain discretization. In this work, we propose a protocol that securely computes U-statistics of degree k $\ge$ 2 under central differential privacy by leveraging Multi Party Computation (MPC). Our method substantially improves accuracy when compared to prior solutions. We provide a detailed theoretical analysis of its accuracy, communication and computational properties. We evaluate its performance empirically, obtaining favorable results, e.g., for Kendall's $τ$ coefficient, our approach reduces the Mean Squared Error by up to four orders of magnitude over existing baselines.