梦码城-CSDN博客

原创 Center Smoothing Certified Robustness for Networks with Structured Outputs

在概率论中，霍夫丁不等式给出了随机变量的和与其期望值偏差的概率上限，该不等式被Wassily Hoeffding于1963年提出并证明。在无放回抽样时，若想要更好的概率边界，可查看Serfling在1974年发表的论文。在无放回抽样时，若想要更好的概率边界，可查看Serfling在1974年发表的论文。掷硬币，假设正面朝上概率为 p ，反面朝上概率为 1-p ，投掷 n 次，则正面朝上次数的期望值为 np。（CDF）是概率分布函数（PDF）的积分。其中， H(n) 是 n 次投掷中，正面朝上的次数。

2023-11-14 16:49:28 163

原创专题解读｜Graph Fairness代表性工作介绍

图在现实世界中无处不在，例如知识图谱，社交网络和生物网络。近年来，图神经网络( graph neural networks，GNNs ) 在图结构数据建模方面表现出了强大的能力。一般地，GNNs采用消息传递机制，通过迭代地聚合邻居节点的表示来更新节点的表示。得到的表示同时保留了节点属性和局部图结构信息，便于各种下游任务，如节点分类和链接预测。尽管GNNs表现优异，但最近的研究表明，GNNs倾向于从训练数据中继承偏见.

2023-11-14 16:45:04 266

原创解决Windows系统本地代理服务开启情况下创建Conda环境报错

Collecting package metadata (current_repodata.json): failedProxyError: Conda cannot proceed due to an error in your proxy configuration.Check for typos and other configuration errors in any '.netrc' file in your home directory,any environment variables

2023-04-21 13:12:29 451 1

原创机器学习中的公平性

机器学习公平性主要研究如何通过解决或缓解“不公平”来增加模型的公平性，以及如何确保模型的输出结果能够让不同的群体、个人都有平等的机会获得利益。然而，受文化和环境的影响，人们对公平性的理解存在一定的主观性。到目前为止，公平性尚未有统一的定义及度量指标。

2023-03-30 20:10:07 2099

原创 Certifying Some Distributional Fairness with Subpopulation Decomposition

先前工作存在的缺陷先前的工作主要是正则化训练、解纠缠、对偶、低阶矩阵分解、分布对齐等方法，来提高ML的公平性。已有部分在ML上做可验证公平性表征的工作，但是存在的问题：在随机给定的一个数据分布上训练一个端到端的模型，这个模型在预测结果上缺乏可验证的公平性。现有公平性上的文献所关注的ML模型，是在一个（非）平衡数据分布上训练模型，在可测量的目标域中通过现有的公平性评估方法来评估模型的性能，所以公平性评估只取决于评估方法的选择，并未考虑方法的验证性。可验证公平性。

2023-03-30 20:04:37 300

原创 HIN应用调研总结

通过GitHub和Stack overflow之间的跨平台用户识别来增强社交编码安全**背景与问题：**GitHub与Stack Overflow等平台逐渐流行，潜在的安全问题也在上升，主要归因于风险与有害代码能很好地嵌入传播。文献利用异质图表示学习识别用户，检测跨平台投毒攻击者。**贡献：**自动跨平台【Github与Stack Overflow】用户识别，利用用户的属性与社交编码属性等进行用户标识，检测投毒攻击者。**方法与模型：**构造跨平台用户代码交互图，基于attributed heterogen

2022-12-04 10:51:39 518

原创《CRFL:Certifiably Robust Federated Learning against Backdoor Attacks》

在联邦学习的场景中，很容易在本地客户端添加像后门这种的对抗扰动，从而影响全局模型的训练。针对这些对抗攻击，现有方法包括：设计一种鲁棒性聚合函数、开发经验丰富的联邦学习协议、利用噪声扰动、在训练期间增加额外的评估。但是这些方法都缺乏在一定条件下针对后门攻击的鲁棒性验证。**CRFL的具体过程：**在训练阶段，每个客户端可以上传参数到服务端做聚合与更新，其中服务端主要负责：（1）聚合从客户端收集的模型信息；（2）裁剪聚合模型的范式；（3）对被裁剪模型增加随机噪声；（4）给每一个客户端返回新的模型参数。

2022-11-14 09:59:32 1159

原创矩阵与对角阵相乘的一般特点

矩阵与对角阵相乘的一般特点

2022-11-14 09:22:58 5976 2

原创 Pytorch中的梯度知识总结

你真的了解Pytorch中梯度的计算原理吗？这篇文章主要涉及Pytorch中梯度计算的知识，包括什么是叶子向量，梯度反向传播原理，参数优化过程的详细解释。

2022-11-02 09:54:39 3502

原创数据挖掘进阶

3.7自定义评估函数 train = pd . read_csv("./练习数据/ch03_practice_4.csv") train_x = train . drop([ "target" ] , axis = 1) train_y = train [ "target" ] test_x = pd . read_csv("./练习数据/ch03_practice_4_test.csv") test_x = test_x . drop([ "target" ] , axis = 1)

2022-09-07 21:19:37 617

原创《Shortening passengers’ travel time A dynamic metro train scheduling approach using deep reinforcem》

城市地铁已成为现代城市最重要的公共交通工具，每天有数百万人乘坐地铁。由于出行效率关系到城市的工作效率，因此缩短地铁乘客的出行时间是一项迫切的需求，可以带来巨大的经济效益。在本文中，我们研究了一种细粒度、安全和节能的策略，通过动态调度列车停留时间来提高地铁系统的效率。然而，由于以下三个方面的原因，制定这样的策略是非常具有挑战性的：1）优化乘客平均旅行时间的目标是复杂的，因为它需要适当平衡乘客在站台的等待时间和列车上的旅行时间，并考虑对整个地铁系统的长期影响；2）很难捕捉地铁车站进站乘客的动态时空相关性；3）

2022-07-28 11:59:09 201

原创数据压缩STC稀疏三元压缩算法复现

数据压缩STC稀疏三元压缩算法复现

2022-07-28 11:03:47 750 4

原创联邦学习FedAvg算法复现任务

联邦学习FedAvg算法复现任务

2022-07-28 11:01:25 2365 1

原创 FedAvg算法+LSTM模型+ Shakespeare数据集——字符预测任务

FedAvg算法+LSTM模型+ Shakespeare数据集——字符预测任务

2022-07-28 10:58:09 3552 7

原创《Robust and Communication-Efficient Federated Learning From Non-i.i.d. Data》论文阅读

联合学习允许多方在其组合数据上联合训练深度学习模型，而无需任何参与者将其本地数据透露给中央服务器。然而，这种形式的隐私保护协作学习是以培训期间的大量通信开销为代价的。为了解决这个问题，分布式训练文献中提出了几种压缩方法，可以将所需的通信量减少多达三个数量级。然而，这些现有方法在联合学习环境中的效用有限，因为它们要么只压缩从客户端到服务器的上游通信（不压缩下游通信），要么只在理想条件下运行良好，例如客户端数据的i.i.d.分布，这通常在联合学习中找不到。...

2022-07-28 10:27:14 1475

原创 Anaconda 环境迁移

在anaconda的enve下创建新的环境目录env_name，讲导出的压缩环境包上传至新的anaconda的enve下的新的环境目录env_name下，并解压。工具导出当前环境为离线环境，-o参数设置导出环境的文件名。

2022-07-19 15:48:35 2421

原创 Communication-Efficient Learning of Deep Networks from Decentralized Data

现代移动设备可以访问大量适合学习模型的数据，这反过来又可以极大地改善设备上的用户体验。例如，语言模型可以改进语音识别和文本输入，图像模型可以自动选择好的照片。然而，这些丰富的数据通常对隐私敏感，数量大，或者两者兼而有之，这可能会妨碍使用传统方法登录到数据中心并在那里进行培训。我们提倡另一种方法，将训练数据分布在移动设备上，并通过聚合本地计算的更新来学习共享模型，我们将这种分散的方法称为联合学习。我们提出了一种基于迭代模型平均的深度网络联合学习的实用方法，并结合五种不同的模型结构和四个数据集进行了广泛的实证评

2022-06-14 00:03:21 3788

原创基于cifar10数据集的FedAvg联邦学习任务

根据论文《Communication-Efficient Learning of Deep Networks from Decentralized Data》实现FedAvg联邦学习算法。联邦学习入门推荐

2022-06-02 17:58:16 2259 1

原创基于LSTM与Shakespeare数据集的字符预测任务

基于LSTM与Shakespeare数据集的字符预测任务

2022-06-02 17:47:37 607

原创 GammaGL论文复现-以ChebNet为例

本文目录1. 创建需要用到的文件2. 编写训练文件2.1 导入对应的包与环境配置2.2 运行参数设置2.3 编写损失函数类2.4 编写验证函数2.3 编写训练main主函数3. 编写模型文件4. 编写卷积层文件4.1 编写网络初始化方法4.2 编写标准化拉普拉斯矩阵方法4.2 编写forword前向传播方法5. 训练结果附录：ChebConv1. 创建需要用到的文件exmaples文件夹下面创建模型训练文件夹——chebnetgcn，用于测试训练，文件夹里面创建对应的chebnetgcn_trainn

2022-05-18 14:24:54 1001

原创 ChebNet论文复现（数据准备部分）

本文目录1. Data Prepation1.1 加载数据集1.2 构造图1.2.1 构造大小为m的网格1.2.2 计算成对距离1.2.3 构造图的邻接稀疏权重矩阵1.2.4 构造网格图1.3 计算粗话图1.3.1 重边匹配HEM1.3.2 构造二叉树1.3.3 构造聚类树1.3.4 构造图拉普拉斯矩阵1.3.5 使用重边匹配构造K个粗化图1.4 计算每个粗话图的最大特征值1.5 根据二叉树节点索引重新索引数据集的节点索引，构造数据集二叉树1. Data Prepation1.1 加载数据集# lo

2022-05-10 18:19:06 757

原创 Understanding Convolutions on Graphs

1. 介绍传统的神经网络被用于对固定大小和/或规则结构的输入（例如句子、图像和视频）进行操作。这使得他们无法优雅地处理图结构数据。图神经网络 (GNN) 是一系列神经网络，可以自然地对图结构数据进行操作。与孤立地考虑单个实体的模型相比，通过从底层图中提取和利用特征，GNN 可以对这些交互中的实体做出更明智的预测。本文将说明图计算的挑战，描述图神经网络的起源和设计，并探索最近最流行的 GNN 变体。特别是，我们将看到许多这些变体由相似的构建块组成。2. 图计算面临的挑战2.1 缺乏一致的结构预测给

2022-05-05 17:11:26 1122

原创 Graph Convolutional Networks

1. 摘要我们介绍了一种在图结构数据上可扩展的半监督学习方法，该方法是基于一种高效的有向图卷积神经网络变体。我们通过谱图卷积局部一阶近似来激励我们的卷积架构的选择。我们的模型在图边的数量上线性缩放，并且学习隐藏层对局部图结构和节点特征进行编码的表示。在大量的基于引用网络与知识图谱数据集上的实验中我们证明我们的方法表现比起相关方法具有很大的优势。2. 相关符号表示KaTeX parse error: Undefined control sequence: \cal at position 4: {{

2022-04-30 20:23:12 711

原创概率论与数理统计基础

本文目录1. 古典概率2. 条件概率3. 贝叶斯公式4. 概率的估计方法5. 随机变量6. 离散分布6.1 两点分布6.2 二项分布6.3 泊松分布7. 连续分布7.1 均匀分布7.2 指数分布7.3 正太分布8. 数字特征1. 古典概率在概率的定量计算上，频率学派依赖的基础是古典概率模型。在古典概率模型中，试验的结果只包含有限个基本事件，且每个基本事件发生的可能性相同。假设所有基本事件的数目为 n，待观察的随机事件 A 中包含的基本事件数目为 k，则古典概率模型下事件概率的计算公式为:P(A)=kn

2022-04-29 16:41:28 468

原创线性代数基础

本文目录1. 线性代数的意义2. 基本概念3. Pytorch中的运算3.1 标量3.2 向量3.3 长度、维度和形状3.4 矩阵3.5 张量3.6 降维3.7 点积3.8 矩阵-矩阵乘法3.9 范数1. 线性代数的意义线性代数提供了⼀种看待世界的抽象视角：万事万物都可以被抽象成某些特征的组合，并在由预置规则定义的框架之下以静态和动态的方式加以观察。是现代数学和以现代数学作为主要分析方法的众多学科的基础。从量子力学到图像处理都离不开向量和矩阵的使用。线性代数是用虚拟数字世界表示真实物理世界的工具。

2022-04-29 15:52:38 1364

李宏毅机器学习全套资料

lib.zip包含mybatis-3.4.6+mysql-connector-java-8.0.24

在线求一个人工智能的学习路线，个人打算将来从事自然语言处理方面的学习。路过的大佬指引一下小白吧[fa