Accurate, private, secure, federated U-statistics with higher degree

作者: Quentin Sinh, Jan Ramon

分类: cs.CR, cs.LG

发布日期: 2026-03-02

💡 一句话要点

提出一种基于多方计算的联邦U-统计协议，提升隐私保护下的计算精度。

🎯 匹配领域: 支柱一：机器人控制 (Robot Control)

关键词: 联邦学习 U-统计量 多方计算 差分隐私 隐私保护 安全计算 Kendall's τ

📋 核心要点

现有联邦U-统计计算方法在隐私保护和计算精度上存在不足，尤其是在高阶U-统计量计算中。
论文提出一种基于多方计算（MPC）的协议，在中心差分隐私下安全计算高阶U-统计量。
实验结果表明，该方法在计算精度上显著优于现有方法，例如Kendall's τ系数的均方误差降低了四个数量级。

📝 摘要（中文）

本文研究了在联邦学习环境中计算具有k (≥2)阶核函数f的U-统计量的问题，即对所有k元组实例上的函数f求平均。2阶U-统计量包括Kendall's τ系数、接收者操作曲线下面积和Gini平均差等有用的统计量。现有方法仅在较低效用的本地差分隐私模型下提供解决方案，并且/或者在域离散化的大小方面扩展性较差。在这项工作中，我们提出了一种协议，该协议利用多方计算（MPC）在中心差分隐私下安全地计算k (≥2)阶U-统计量。与先前的解决方案相比，我们的方法大大提高了准确性。我们提供了对其准确性、通信和计算属性的详细理论分析。我们通过实验评估了其性能，获得了良好的结果，例如，对于Kendall's τ系数，我们的方法将均方误差降低了高达四个数量级。

🔬 方法详解

问题定义：论文旨在解决联邦学习场景下，高阶U-统计量（k≥2）的精确计算问题。现有方法主要面临两个痛点：一是依赖于低效用的本地差分隐私模型，导致精度损失较大；二是当数据域离散化程度较高时，计算复杂度显著增加，扩展性差。

核心思路：论文的核心思路是利用多方计算（MPC）技术，在中心差分隐私的框架下，安全地计算U-统计量。通过MPC，各个参与方可以在不泄露自身数据的前提下，共同完成计算任务，从而提高隐私保护程度和计算精度。

技术框架：该协议主要包含以下几个阶段：1) 各参与方对本地数据进行预处理和编码；2) 使用MPC协议，在多个参与方之间安全地计算U-统计量；3) 添加中心差分隐私噪声，以保护最终结果的隐私性；4) 将结果返回给请求方。整体架构利用MPC的安全性和中心差分隐私的隐私保证，实现了高精度和强隐私保护的U-统计量计算。

关键创新：最重要的技术创新点在于将MPC与中心差分隐私相结合，用于联邦U-统计量的计算。与现有方法相比，该方法能够在保证隐私性的同时，显著提高计算精度，尤其是在高阶U-统计量和高维度数据域的情况下。

关键设计：论文详细分析了协议的准确性、通信复杂度和计算复杂度，并针对不同的U-统计量，设计了特定的MPC协议。关键设计包括选择合适的MPC协议（例如，基于秘密共享或同态加密的协议），以及优化通信和计算过程，以提高效率。此外，论文还考虑了差分隐私噪声的添加方式，以在隐私保护和精度之间取得平衡。

📊 实验亮点

实验结果表明，该方法在计算Kendall's τ系数时，与现有基线方法相比，均方误差降低了高达四个数量级。这表明该方法在高精度计算方面具有显著优势，尤其是在需要高阶U-统计量的复杂分析任务中。

🎯 应用场景

该研究成果可广泛应用于需要联邦学习和隐私保护的统计分析场景，例如金融风控、医疗健康、社会科学研究等。通过安全地计算各种U-统计量，可以进行更准确的风险评估、疾病诊断和政策制定，同时保护用户数据的隐私。

📄 摘要（原文）

We study the problem of computing a U-statistic with a kernel function f of degree k $\ge$ 2, i.e., the average of some function f over all k-tuples of instances, in a federated learning setting. Ustatistics of degree 2 include several useful statistics such as Kendall's $τ$ coefficient, the Area under the Receiver-Operator Curve and the Gini mean difference. Existing methods provide solutions only under the lower-utility local differential privacy model and/or scale poorly in the size of the domain discretization. In this work, we propose a protocol that securely computes U-statistics of degree k $\ge$ 2 under central differential privacy by leveraging Multi Party Computation (MPC). Our method substantially improves accuracy when compared to prior solutions. We provide a detailed theoretical analysis of its accuracy, communication and computational properties. We evaluate its performance empirically, obtaining favorable results, e.g., for Kendall's $τ$ coefficient, our approach reduces the Mean Squared Error by up to four orders of magnitude over existing baselines.

Accurate, private, secure, federated U-statistics with higher degree

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理