自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(214)
  • 资源 (2)
  • 问答 (1)
  • 收藏
  • 关注

原创 Center Smoothing Certified Robustness for Networks with Structured Outputs

在概率论中,霍夫丁不等式给出了随机变量的和与其期望值偏差的概率上限,该不等式被Wassily Hoeffding于1963年提出并证明。在无放回抽样时,若想要更好的概率边界,可查看Serfling在1974年发表的论文。在无放回抽样时,若想要更好的概率边界,可查看Serfling在1974年发表的论文。掷硬币,假设正面朝上概率为 p ,反面朝上概率为 1-p ,投掷 n 次,则正面朝上次数的期望值为 np。(CDF)是概率分布函数(PDF)的积分。其中, H(n) 是 n 次投掷中,正面朝上的次数。

2023-11-14 16:49:28 163

原创 专题解读|Graph Fairness代表性工作介绍

图在现实世界中无处不在,例如知识图谱,社交网络和生物网络。近年来,图神经网络( graph neural networks,GNNs ) 在图结构数据建模方面表现出了强大的能力。一般地,GNNs采用消息传递机制,通过迭代地聚合邻居节点的表示来更新节点的表示。得到的表示同时保留了节点属性和局部图结构信息,便于各种下游任务,如节点分类和链接预测。尽管GNNs表现优异,但最近的研究表明,GNNs倾向于从训练数据中继承偏见.

2023-11-14 16:45:04 266

原创 解决Windows系统本地代理服务开启情况下创建Conda环境报错

Collecting package metadata (current_repodata.json): failedProxyError: Conda cannot proceed due to an error in your proxy configuration.Check for typos and other configuration errors in any '.netrc' file in your home directory,any environment variables

2023-04-21 13:12:29 451 1

原创 机器学习中的公平性

机器学习公平性主要研究如何通过解决或缓解“不公平”来增加模型的公平性,以及如何确保模型的输出结果能够让不同的群体、个人都有平等的机会获得利益。然而,受文化和环境的影响,人们对公平性的理解存在一定的主观性。到目前为止,公平性尚未有统一的定义及度量指标。

2023-03-30 20:10:07 2099

原创 Certifying Some Distributional Fairness with Subpopulation Decomposition

先前工作存在的缺陷先前的工作主要是正则化训练、解纠缠、对偶、低阶矩阵分解、分布对齐等方法,来提高ML的公平性。已有部分在ML上做可验证公平性表征的工作,但是存在的问题:在随机给定的一个数据分布上训练一个端到端的模型,这个模型在预测结果上缺乏可验证的公平性。现有公平性上的文献所关注的ML模型,是在一个(非)平衡数据分布上训练模型,在可测量的目标域中通过现有的公平性评估方法来评估模型的性能,所以公平性评估只取决于评估方法的选择,并未考虑方法的验证性。可验证公平性。

2023-03-30 20:04:37 300

原创 HIN应用调研总结

通过GitHub和Stack overflow之间的跨平台用户识别来增强社交编码安全**背景与问题:**GitHub与Stack Overflow等平台逐渐流行,潜在的安全问题也在上升,主要归因于风险与有害代码能很好地嵌入传播。文献利用异质图表示学习识别用户,检测跨平台投毒攻击者。**贡献:**自动跨平台【Github与Stack Overflow】用户识别,利用用户的属性与社交编码属性等进行用户标识,检测投毒攻击者。**方法与模型:**构造跨平台用户代码交互图,基于attributed heterogen

2022-12-04 10:51:39 518

原创 《CRFL:Certifiably Robust Federated Learning against Backdoor Attacks》

在联邦学习的场景中,很容易在本地客户端添加像后门这种的对抗扰动,从而影响全局模型的训练。针对这些对抗攻击,现有方法包括:设计一种鲁棒性聚合函数、开发经验丰富的联邦学习协议、利用噪声扰动、在训练期间增加额外的评估。但是这些方法都缺乏在一定条件下针对后门攻击的鲁棒性验证。**CRFL的具体过程:**在训练阶段,每个客户端可以上传参数到服务端做聚合与更新,其中服务端主要负责:(1)聚合从客户端收集的模型信息;(2)裁剪聚合模型的范式;(3)对被裁剪模型增加随机噪声;(4)给每一个客户端返回新的模型参数。

2022-11-14 09:59:32 1159

原创 矩阵与对角阵相乘的一般特点

矩阵与对角阵相乘的一般特点

2022-11-14 09:22:58 5976 2

原创 Pytorch中的梯度知识总结

你真的了解Pytorch中梯度的计算原理吗?这篇文章主要涉及Pytorch中梯度计算的知识,包括什么是叶子向量,梯度反向传播原理,参数优化过程的详细解释。

2022-11-02 09:54:39 3502

原创 数据挖掘进阶

3.7自定义评估函数 train = pd . read_csv("./练习数据/ch03_practice_4.csv") train_x = train . drop([ "target" ] , axis = 1) train_y = train [ "target" ] test_x = pd . read_csv("./练习数据/ch03_practice_4_test.csv") test_x = test_x . drop([ "target" ] , axis = 1)

2022-09-07 21:19:37 617

原创 《Shortening passengers’ travel time A dynamic metro train scheduling approach using deep reinforcem》

城市地铁已成为现代城市最重要的公共交通工具,每天有数百万人乘坐地铁。由于出行效率关系到城市的工作效率,因此缩短地铁乘客的出行时间是一项迫切的需求,可以带来巨大的经济效益。在本文中,我们研究了一种细粒度、安全和节能的策略,通过动态调度列车停留时间来提高地铁系统的效率。然而,由于以下三个方面的原因,制定这样的策略是非常具有挑战性的:1)优化乘客平均旅行时间的目标是复杂的,因为它需要适当平衡乘客在站台的等待时间和列车上的旅行时间,并考虑对整个地铁系统的长期影响;2) 很难捕捉地铁车站进站乘客的动态时空相关性;3)

2022-07-28 11:59:09 201

原创 数据压缩STC稀疏三元压缩算法复现

数据压缩STC稀疏三元压缩算法复现

2022-07-28 11:03:47 750 4

原创 联邦学习FedAvg算法复现任务

联邦学习FedAvg算法复现任务

2022-07-28 11:01:25 2365 1

原创 FedAvg算法+LSTM模型+ Shakespeare数据集——字符预测任务

FedAvg算法+LSTM模型+ Shakespeare数据集——字符预测任务

2022-07-28 10:58:09 3552 7

原创 《Robust and Communication-Efficient Federated Learning From Non-i.i.d. Data》论文阅读

联合学习允许多方在其组合数据上联合训练深度学习模型,而无需任何参与者将其本地数据透露给中央服务器。然而,这种形式的隐私保护协作学习是以培训期间的大量通信开销为代价的。为了解决这个问题,分布式训练文献中提出了几种压缩方法,可以将所需的通信量减少多达三个数量级。然而,这些现有方法在联合学习环境中的效用有限,因为它们要么只压缩从客户端到服务器的上游通信(不压缩下游通信),要么只在理想条件下运行良好,例如客户端数据的i.i.d.分布,这通常在联合学习中找不到。...

2022-07-28 10:27:14 1475

原创 Anaconda 环境迁移

在anaconda的enve下创建新的环境目录env_name,讲导出的压缩环境包上传至新的anaconda的enve下的新的环境目录env_name下,并解压。工具导出当前环境为离线环境,-o参数设置导出环境的文件名。

2022-07-19 15:48:35 2421

原创 Communication-Efficient Learning of Deep Networks from Decentralized Data

现代移动设备可以访问大量适合学习模型的数据,这反过来又可以极大地改善设备上的用户体验。例如,语言模型可以改进语音识别和文本输入,图像模型可以自动选择好的照片。然而,这些丰富的数据通常对隐私敏感,数量大,或者两者兼而有之,这可能会妨碍使用传统方法登录到数据中心并在那里进行培训。我们提倡另一种方法,将训练数据分布在移动设备上,并通过聚合本地计算的更新来学习共享模型,我们将这种分散的方法称为联合学习。我们提出了一种基于迭代模型平均的深度网络联合学习的实用方法,并结合五种不同的模型结构和四个数据集进行了广泛的实证评

2022-06-14 00:03:21 3788

原创 基于cifar10数据集的FedAvg联邦学习任务

根据论文《Communication-Efficient Learning of Deep Networks from Decentralized Data》实现FedAvg联邦学习算法。联邦学习入门推荐

2022-06-02 17:58:16 2259 1

原创 基于LSTM与Shakespeare数据集的字符预测任务

基于LSTM与Shakespeare数据集的字符预测任务

2022-06-02 17:47:37 607

原创 GammaGL论文复现-以ChebNet为例

本文目录1. 创建需要用到的文件2. 编写训练文件2.1 导入对应的包与环境配置2.2 运行参数设置2.3 编写损失函数类2.4 编写验证函数2.3 编写训练main主函数3. 编写模型文件4. 编写卷积层文件4.1 编写网络初始化方法4.2 编写标准化拉普拉斯矩阵方法4.2 编写forword前向传播方法5. 训练结果附录:ChebConv1. 创建需要用到的文件exmaples文件夹下面创建模型训练文件夹——chebnetgcn,用于测试训练,文件夹里面创建对应的chebnetgcn_trainn

2022-05-18 14:24:54 1001

原创 ChebNet论文复现(数据准备部分)

本文目录1. Data Prepation1.1 加载数据集1.2 构造图1.2.1 构造大小为m的网格1.2.2 计算成对距离1.2.3 构造图的邻接稀疏权重矩阵1.2.4 构造网格图1.3 计算粗话图1.3.1 重边匹配HEM1.3.2 构造二叉树1.3.3 构造聚类树1.3.4 构造图拉普拉斯矩阵1.3.5 使用重边匹配构造K个粗化图1.4 计算每个粗话图的最大特征值1.5 根据二叉树节点索引重新索引数据集的节点索引,构造数据集二叉树1. Data Prepation1.1 加载数据集# lo

2022-05-10 18:19:06 757

原创 Understanding Convolutions on Graphs

1. 介绍传统的神经网络被用于对固定大小和/或规则结构的输入(例如句子、图像和视频)进行操作。这使得他们无法优雅地处理图结构数据。图神经网络 (GNN) 是一系列神经网络,可以自然地对图结构数据进行操作。与孤立地考虑单个实体的模型相比,通过从底层图中提取和利用特征,GNN 可以对这些交互中的实体做出更明智的预测。本文将说明图计算的挑战,描述图神经网络的起源和设计,并探索最近最流行的 GNN 变体。特别是,我们将看到许多这些变体由相似的构建块组成。2. 图计算面临的挑战2.1 缺乏一致的结构预测给

2022-05-05 17:11:26 1122

原创 Graph Convolutional Networks

1. 摘要我们介绍了一种在图结构数据上可扩展的半监督学习方法,该方法是基于一种高效的有向图卷积神经网络变体。我们通过谱图卷积局部一阶近似来激励我们的卷积架构的选择。我们的模型在图边的数量上线性缩放,并且学习隐藏层对局部图结构和节点特征进行编码的表示。在大量的基于引用网络与知识图谱数据集上的实验中我们证明我们的方法表现比起相关方法具有很大的优势。2. 相关符号表示KaTeX parse error: Undefined control sequence: \cal at position 4: {{

2022-04-30 20:23:12 711

原创 概率论与数理统计基础

本文目录1. 古典概率2. 条件概率3. 贝叶斯公式4. 概率的估计方法5. 随机变量6. 离散分布6.1 两点分布6.2 二项分布6.3 泊松分布7. 连续分布7.1 均匀分布7.2 指数分布7.3 正太分布8. 数字特征1. 古典概率在概率的定量计算上,频率学派依赖的基础是古典概率模型。在古典概率模型中,试验的结果只包含有限个基本事件,且每个基本事件发生的可能性相同。假设所有基本事件的数目为 n,待观察的随机事件 A 中包含的基本事件数目为 k,则古典概率模型下事件概率的计算公式为:P(A)=kn

2022-04-29 16:41:28 468

原创 线性代数基础

本文目录1. 线性代数的意义2. 基本概念3. Pytorch中的运算3.1 标量3.2 向量3.3 长度、维度和形状3.4 矩阵3.5 张量3.6 降维3.7 点积3.8 矩阵-矩阵乘法3.9 范数1. 线性代数的意义线性代数提供了⼀种看待世界的抽象视角:万事万物都可以被抽象成某些特征的组合,并在由预置规则定义的框架之下以静态和动态的方式加以观察。是现代数学和以现代数学作为主要分析方法的众多学科的基础。从量子力学到图像处理都离不开向量和矩阵的使用。线性代数是用虚拟数字世界表示真实物理世界的工具。

2022-04-29 15:52:38 1364

原创 决策树算法

1. 自己创建至少2个向量,每个向量至少1个属性和1个类标号,根据向量生成决策树,并利用该决策树进行预测导入必备包from sklearn import treeimport numpy as npimport pandas as pd构造scikit-learn内置决策树X = [[20,10],[15,17],[23,21],[50,20],[20,34]]Y = [0,1,0,1,1]clf = tree.DecisionTreeClassifier()clf = clf.fit(

2022-04-25 18:41:46 565

原创 计算机操作系统 - 进程管理

计算机操作系统 - 进程管理计算机操作系统 - 进程管理进程与线程1. 进程2. 线程3. 区别进程状态的切换进程调度算法1. 批处理系统2. 交互式系统3. 实时系统进程同步1. 临界区2. 同步与互斥3. 信号量4. 管程经典同步问题1. 哲学家进餐问题2. 读者-写者问题进程通信1. 管道2. FIFO3. 消息队列4. 信号量5. 共享存储6. 套接字进程与线程1. 进程进程是资源分配的基本单位。进

2022-04-22 17:56:31 184

原创 计算机操作系统 - 概述

计算机操作系统 - 概述计算机操作系统 - 概述基本特征1. 并发2. 共享3. 虚拟4. 异步基本功能1. 进程管理2. 内存管理3. 文件管理4. 设备管理系统调用宏内核和微内核1. 宏内核2. 微内核中断分类1. 外中断2. 异常3. 陷入基本特征1. 并发并发是指宏观上在一段时间内能同时运行多个程序,而并行则指同一时刻能运行多个指令。并行需要硬件支持,如多流水线、多核处理器或者分布式计算系统。操作系统通过引入进程和

2022-04-22 17:42:04 115

原创 2022第13届蓝桥杯Java省赛B组个人题解

文章目录A. 星期计算B. 山C. 字符统计D. 最少刷题数E. 求阶乘F. 最大子矩阵G. 数组切分H. 回忆迷宫I. 红绿灯J. 拉箱子个人总结A. 星期计算思路解析:大整数类的应用,计算幂后对其取余。官方给的计算器也能直接计算其值答案:取余结果为1,所以答案为7代码:package lanqiao;import java.math.BigInteger;//答案:6+1=7public class A_星期计算 { public static void main(S

2022-04-11 10:36:08 18405 36

原创 字符串中的算法

本文目录1. KMP算法查询字符串2. KMP_next数组的应用3. 单词翻转4. 后缀数组的应用_最长公共字串5. 回文字符串6. 判断两字符串的字符集是否相等7. 旋转词8. 移除字符串中连续出现的K个09. 最短摘要1. KMP算法查询字符串问题描述:使用KMP算法查询子串的位置代码:package 字符串;/** * @author: DreamCode * @file: KMP.java * @time: 2022年3月18日-下午7:28:08 */public c

2022-04-11 00:32:44 251

原创 逐步生成式递归

本文目录1. 走楼梯2. 机器人走格子3. 非空子集(递归|迭代)4. 非空子集(二进制)5. 全排列(迭代)6. 全排列(递归回溯法)7. 全排列(前缀法)8. 全排列(抽取法)9. 合法括号10. 硬币表示1. 走楼梯问题描述:有个小孩正在上楼梯,楼梯有n阶台阶,小孩一次可以上1阶、2阶、3阶。请实现一个方法,计算小孩有多少种上楼的方式。为了防止溢出,请将结果Mod 1000000007给定一个正整数int n,请返回一个数,代表上楼的方式数。保证n小于等于100000。思路解析:

2022-04-10 16:05:19 422

原创 位运算算法

本文目录位运算的技巧1. 二进制数中1的个数2. 是不是2的整数次方3. 找出唯一成对的数位运算的技巧^为二进制异或运算符:相同为0,相异为11.判断奇偶数:与 1 进行异或操作,为0则为奇数,为1则为偶数2.交换两个整数变量的值:a=ab,b=ab,a=a^b;3.求整数的绝对值:对补码的所有位取反,然后加1,可得到该补码对应的负数的绝对值。4.交换律:a^b = b^a5.结合律:(ab)c = a(bc)6.对于任何数x,都有x^x = 0, x^0 = x, 即同自己求异或为0

2022-04-10 16:04:41 544

原创 贪心 算法

本文目录1. 部分背包问题2. 乘船问题3. 区间调度问题4. 区间覆盖问题5. 区间选点问题6. 小船过河_往返问题7. 硬币支付问题8. 字典序最小问题9. 最优装载问题1. 部分背包问题问题描述有n个物体,第i个物体的重量为wi,价值为vi。在总重量不超过C的情况下让总价值尽量高。每一个物体都可以只取走一部分,价值和重量按比例计算。求最大总价值注意:每个物体可以只拿一部分,因此一定可以让总重量恰好为C。思路解析:贪心选择:总是选择单价较高的物品package 贪心算法;i

2022-04-10 16:03:29 589

原创 常用数论算法

本文目录1. 天平称重问题2. Nim游戏3. 阶梯尼姆博弈问题4. 高僧斗法5. 欧几里得算法6. 扩展欧几里得算法7. 一步之遥8. 青蛙约会9. 模的逆元10. 同余方程组11. 素数_埃氏筛法12. 快速幂运算1. 天平称重问题问题描述:用天平称重时,我们希望用尽可能少的砝码组合称出尽可能多的重量。如果只有5个砝码,重量分别是1,3,9,27,81 则它们可以组合称出1到121之间任意整数重量(砝码允许放在左右两个盘中)。本题目要求编程实现:对用户给定的重量,给出砝码组合方案。例如:用

2022-04-10 16:02:26 311

原创 常用的排序算法

本文目录1. 冒泡排序2. 选择排序3. 插入排序4. 堆排序4. TopK问题5. 排序数组中找指定和的因子6. 判断数组的包含问题7. 数组能排成的最小数8. 需排序的子数组长度1. 冒泡排序算法思路:第一趟,通过两两交换的手段,将最大元素顶到最末端第二趟,将次大元素顶到倒数第二个位置…………………………………………时间复杂度:O(n²)空间复杂度:O(1)原址排序稳定性:有相同元素,排序前和排序后相对位置不会变化,稳定代码:package 排序;/** * @autho

2022-04-10 16:01:04 853

原创 算法中的矩阵

本文目录1. Z形打印二维数组2. 边界为1的最大方阵3. 边界为1的最大方阵_优化4. 将0所在的行列清零5. 顺序打印二维数组1. Z形打印二维数组问题描述:按照Z字型打印二维数组思路解析:逐步模拟即可。按照从左到右于从右到左交替打印。分别考虑以下情况:从左到右打印:当前位于第一行,向右走;当前位于最后一列,向下走从右到左打印:当前位于第一列,向下打印;当前位于最后一行,向右打印package 矩阵;/** * @author: DreamCode * @file: Z形

2022-04-10 15:59:43 152

原创 分治 算法

本文目录1. 超过一半的数2. 超过一半以上的数3. 快速排序4. 乱序数组中查找第k位1. 超过一半的数问题描述:数组中有一个数字出现的次数等于数组长度的一半,找出这个数字。package 分治法;/** * @author: DreamCode * @file: 超过一半以上的数.java * @time: 2022年2月27日-下午4:40:11 */public class 超过一半的数 { public static void main(String[] args)

2022-04-10 15:58:27 313

原创 动态规划算法

本文目录1. 硬币支付问题2. 钢条切割问题3. 数字三角形4. 完全背包问题5. 最大公共子序列6. 最长递增子序列的长度1. 硬币支付问题问题描述有1元,5元,10元,50元,100元,500元的硬币各c1,c5,c10,c50,c100,c500枚.现在要用这些硬币来支付A元,最少需要多少枚硬币?假定本题至少存在一种支付方案.0≤ci≤10^90≤A≤10^9输入:第一行有六个数字,分别代表从小到大6种面值的硬币的个数第二行为A,代表需支付的A元样例:输入3 2 1 3 0

2022-04-10 15:56:10 98

原创 递归与二分法

本文目录1. 递归基础知识2. a的n次幂3. 小白上楼梯4. 旋转数组的最小数字5. 在有序含空字符串的数组中查找6. 最长连续递增子序列1. 递归基础知识1. 找重复1、找到一种划分方法2、找到递推公式或者等价转换都是父问题转化为求解子问题2. 找变化的量变化的量通常要作为参数3.找到出口根据参数变化的趋势,对边界进行控制,适时终止递归4.递归规模5. 2的指数阶的大小关系1000000000(十亿)大概为230,所以如果复杂度达到2n次方,这里的n只能到达30左右,否则容易

2022-04-10 15:54:20 542

原创 深度优先搜索算法(DFS)

本文目录1. DFS算法一般步骤2. 数独3. 部分和4. 水洼数目5. n皇后问题6. 素数环7. 困难的串1. DFS算法一般步骤void dfs(int step){ if(边界成立) { 走到最深处 。。。。。。 return; } for(尝试每一种可能的状态) { if(如果这种状态可行){ //剪枝 把这种可能的状态标记,表示走过 继续下一步dfs(step+1) //状态转移 把这

2022-04-10 15:49:31 663

李宏毅机器学习全套资料

包含教学ppt,作业答案,讲课详细内容

2021-08-31

lib.zip包含mybatis-3.4.6+mysql-connector-java-8.0.24

mysql与mybatis驱动下载

2021-04-30

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除