自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(131)
  • 资源 (14)
  • 问答 (1)
  • 收藏
  • 关注

原创 大模型背后的“英雄”——Transformer

如今大火的大模型背后许多都离不开Transformer,本文将带你深入了解Transformer的架构。

2024-04-18 11:17:24 564

原创 Redis入门指南学习笔记(3):Redis高级特性

本文主要介绍Redis事务、内存驻留策略、排序、消息队列等高级特性。

2023-11-22 14:35:03 360

原创 Redis入门指南学习笔记(2):常用数据类型解析

Redis入门指南》 李子骅编著。

2023-11-02 17:40:36 229

原创 Redis入门指南学习笔记(1):初识Redis

本文主要介绍什么是Redis,如何安装和使用Redis。

2023-10-30 18:26:42 364

原创 ICML 2017: 基于卷积的Seq2Seq解决方案

通常而言,Seq2Seq解决方案一般都采用循环神经网络,但在本文,作者提出了基于卷积神经网络的解决方案**ConvS2S**。基于卷积神经网络的方案有两大优势:计算并行化更高,优化更容易(非线性的数量是固定的)。

2023-09-26 19:28:28 226

原创 预训练GNN:GPT-GNN Generative Pre-Training of Graph Neural Networks

本文提出了一种自监督属性图生成任务来预训练GNN,使得其能捕图的结构和语义属性。作者将图的生成分为两个部分:属性生成和边生成,即给定观测到的边,生成节点属性;给定观测到的边和生成的节点属性,生成剩余的边。通过这种方式使得模型能捕获每个节点属性和结构之间的依赖关系。对于每个节点,GPT-GNN可以同时计算其属性生成和边生成损失。另外,为了使得GPT-GNN可以处理大图,作者采用了子图采样技术,并提出自适应嵌入队列来缓解负采样带来的不准确损失。

2023-08-15 21:20:53 1005

原创 《Learning Combinatorial Optimization Algorithms over Graphs》阅读笔记

本文提出将强化学习和图嵌入的组合以端到端地自动为图上组合优化问题设计贪心启发式算法,以避免设计传统算法所需要的大量专业知识和试错。学得的贪心策略行为类似增量构造解决方案的元算法,动作由解决方案当前状态上的图嵌入网络确定。

2023-08-15 21:17:33 269

原创 《Rethinking the Expressive Power of GNNs via Graph Biconnectivity》阅读笔记

现如今存在许多工作探索GNN的表达能力,然而对于其中大多数方法,仍然缺乏对它们可以系统地和可证明地获取哪些额外表达力的深刻理解。在本文中,作者通过图双连通性(biconnectivity)引入一类新的表达能力度量,并指出现有大部分关于GNN表达能力的工作无法表达此类指标。

2023-08-15 21:12:57 381

原创 《Effects of Graph Convolutions in Multi-layer Networks》阅读笔记

本文研究了在XOR-CSBM数据模型的多层网络的第一层以上时,图卷积能力的基本极限,并为它们在数据中信号的不同状态下的性能提供了理论保证。在合成数据和真实世界数据上的实验表明a.卷积的数量是决定网络性能的一个更重要的因素,而不是网络中的层的数量。b.只要放置相同数量的卷积层,只要不在第一层,任何放置组合能实现相似的性能增强。c.当图相对稀疏的时候,多个图卷积是有利的。

2023-08-15 21:10:09 224

原创 《Allen-Cahn Message Passing for Graph Neural Networks with Particle Phase Transition》阅读笔记

本文从多粒子系统的角度引入排斥力到消息传递框架中,提出了ACMP模型。现有的大多数消息传递神经网络是由与Dirichlet能量相关的吸引力驱动的,相应的图神经网络存在oversmoothing问题,无法进行异配数据集预测。但倘若相互排斥的粒子始终保持排斥,随着时间推进,粒子之间会不断远离。为避免粒子被推到无穷远处,作者引入了Allen-Cahn项。

2023-08-15 21:06:55 95

原创 TrajGAT: A Graph-based Long-term Dependency Modeling Approach for Trajectory Similarity Computation

轨迹相似性计算在许多时空应用中都很重要。传统的相似性度量算法的二次复杂度无法处理大规模数据集,而基于RNN的解决方案在长轨迹上的性能会急剧下降。为此,作者提出了一种新的基于图的方法,即TrajGAT,来显式地建模层次空间结构,提高长轨迹相似度计算的性能。

2023-08-15 21:03:38 162

原创 CS144学习笔记(1):Internet and IP

网络应用可以在世界范围内交换数据,例如你可以通过浏览器读取出版社服务器提供的文章。网络应用的基本模型:两台主机各自在本地运行一个程序,程序通过网络来通信。最常用的通信模型使用,通信的两台主机可以想对方发送数据或读取对方发送过来的数据,双方也都可以主动断开连接。

2023-07-26 09:23:38 596

原创 Web Bench源码剖析

Web Bench是 基于C语言实现的Linux系统下的HTTP压力测试工具,可以模拟大量用户请求网站所需资源,测试服务器在不同并发情况下的负载能力。Web Bench通过`fork()`函数创建多进程的方式来模拟多个客户端,客户端可以发送`HTTP/0.9-HTTP/1.1`请求,请求类型包括`GET`、`HEAD`、`OPTIONS`、`TRACE`等。Web Bench的源码体积非常小,适合C/C++的学习者来阅读。

2023-06-13 09:09:42 257

原创 异配图神经网络——Graph Transformer Networks

作者提出了Graph Transformer Network (GTN)用来在异配图(heterogeneous graph)上学习节点表示。通过Graph Transformer层,模型能将异构图转换为由meta-path定义的多个新图,这些meta-paths具有任意的边类型和长度,通过在学得的meta-path对应的新图上进行卷积能获取更有效的节点表示。在几个异配图数据集上的实验结果也验证了GTN的有效性。

2023-04-15 23:26:48 2304 4

原创 《MixHop Higher-Order Graph Convolutional Architectures via Sparsified Neighborhood Mixing》阅读笔记

之前的GCN及其后续工作在图卷积过程中,仅聚合自己的1-hop邻居的消息。作者指出可以将聚合扩大到不同距离的邻居,并基于该idea提出了MixHop,该模型能在不增加额外内存和计算复杂性的同时,生产更加表达能力的节点表示。实验结果表明作者设计的MixHop是有效的。

2023-04-15 23:21:15 454

原创 STL剖析(二):容器底层数据结构及常见用法

本文主要聚焦于STL容器,下文将逐一对各个容器底层的数据结构以及常见用法进行介绍。

2023-01-04 11:38:25 848

原创 STL剖析(一):体系结构概览

STL全称是Standard Template Library,它属于泛型编程的范畴(泛型编程的代表性作品),泛型编程旨在编写独立于数据类型的代码,也就是说代码中的数据类型只有在编译的时候才会确定,否则为一个占位符。C++的STL中包含了各种常用的数据结构类模板以及操作这些数据结构的泛型算法。

2023-01-01 20:56:12 795 1

原创 Python如何调用C和C++

本文主要讲解如何在Python中调用C/C++程序。

2022-10-28 11:09:28 2645 1

原创 基于图卷积神经网络的微博疫情情感分析

关于微博疫情情感分析,博主之前有过给过一套基于循环神经网络的解决方案——疫情微博内容情感分析。今天我们换一个视角,利用图卷积神经网络(Graph Convolutional Network, GCN)来解决该问题。关于数据集的介绍和预处理部分,本实验基本沿用之前的设置,想要了解的可以去看看博主的那篇博客。唯一不同之处在从训练集中划分出20%作为验证集。话不多说,直接上干货!!!

2022-09-20 21:41:26 2834 9

原创 K-hop消息传递图神经网络的表达能力有多强?

遵从1-hop消息传递范式的GNN的表达能力上限为Weisfeiler-Lehman test(1-WL test),为了获取更具表达能力的GNNs,学者提出了K-hop消息传递范式。本文作者先对K-hop消息传递的表达能力进行了分析,并整合外围子图信息来进一步改善K-hop消息传递的表达能力。

2022-09-08 15:29:07 2003

原创 如何为无属性图设置节点特征?

图神经网络(Graph Neural Networks, GNNs)在众多图相关的问题上都取得了优越的性能,而这成功的背后离不开图节点丰富的特征的支持。但是,事实上并不是所有的图节点都有特征,那么无属性图(no-attributed graphs)图神经网络又该如何处理呢?其输入该如何设计?本文便是对现有各种无属性图进行人工节点特征构造的总结。

2022-08-24 13:59:05 1915

原创 爬虫实战系列(十三):新浪热搜榜微博评论爬取及可视化

关于新浪微博的爬虫实战。

2022-08-15 20:57:15 4169

原创 《Weisfeiler and Leman Go Neural Higher-order Graph Neural Networks》阅读笔记

本文阐明了GNN和WL Test的联系,并基于此提出了kkk-GNNs,该模式是kkk-WL在GNN上的泛化。另外,作者还提出了多粒度的层次kkk-GNN。在分类和回归任务的实验结果表明,kkk-GNNs比1-GNN的表达能力更强。

2022-08-11 22:11:43 991 1

原创 GNN动手实践(三):适用于同配图和异配图的高效图神经网络——H2GCN

H2GCN是NeurIPS 2020上发表的论文《Beyond Homophily in Graph Neural Networks: Current Limitations and Effective Designs》所提出来的一个同时适用于同配图和异配图的GNN模型。该模型官方也开源了相应的源码(Github),但是是Tensorflow实现的,为此,本文基于Pytorch+PyG来对该模型进行复现。......

2022-08-09 10:48:14 2108 3

原创 PyG教程(8):计算更高效的稀疏矩阵形式

在Pytorch Geometric中我们经常使用消息传递范式来自定义GNN模型,但是这种方法存在着一些缺陷:在邻域聚合过程中,物化x_i和x_j可能会占用大量的内存(尤其是在大图上)。然而,并不是所有的GNN都需要表达成这种消息传递的范式形式,一些GNN是可以直接表达为稀疏矩阵乘法形式的。在1.6.0版本之后,PyG官方正式引入对稀疏矩阵乘法GNN更有力的支持(torch-sparse中的SparseTensor),通过稀疏矩阵乘法能够让内存更高效,同时也加快了执行时间。...

2022-07-18 11:32:34 2623 10

原创 C++中的Lambda表达式

使用Lambda表达式的执行效率更高,虽然在其它编程语言如python中确实经常用它,但是C++中却用的很少。为此,我专门去学习了一下C++中的Lambda表达式,于是便有了此文。

2022-07-14 08:39:43 2883 1

原创 《Bag of Tricks for Node Classification with Graph Neural Networks》阅读笔记

论文地址:Bag of Tricks for Node Classification with Graph Neural Networks本文作者总结了前人关于图上半监督节点分类任务的常用Tricks,另外还提出了将节点特征和节点标签组合来进行训练和更鲁棒的损失函数,结果表明作者的设计是有效的,可供参考。...

2022-07-11 11:41:11 373 2

原创 《CGNF: CONDITIONAL GRAPH NEURAL FIELDS》阅读笔记

在大多数GNNs中,并没有考虑节点标签间的依赖性。为此,作者将条件随机场(Conditional Random Fields, CRF)和图卷积网络整合在一起提出了CGNF(Conditional Graph Neural Network),该模型显式地建模了整个节点标签集的联合概率,从而在节点标签预测任务中能够利用邻域标签信息。...

2022-07-01 11:32:25 429

原创 GNN动手实践(二):复现图注意力网络GAT

参考论文:Graph Attention NetworksGAT(图注意力网络)是GNNs中重要的SOTA模型,该模型是从空域角度来进行定义,能够用消息传递范式来进行解释。GAT与GCN最大的不同便是它在图节点邻域聚合的过程中引入了注意力机制来计算邻居对当前正在聚合的节点的重要程度。本文的内容包括:图注意力网络的架构介绍、基于PyG来复现GAT模型。...

2022-06-29 16:39:07 1840 1

原创 PyG教程(7):剖析邻域聚合

上篇文章《PyG教程(6):自定义消息传递网络》主要介绍了消息传递GNN的大致框架。本文主要聚焦于消息传播中的邻域聚合,本文将介绍PyG是如何将节点的邻居的消息聚合到节点本身的。

2022-06-21 11:45:23 1427

原创 PyG教程(6):自定义消息传递网络

在上篇文章中主要介绍了GNN的消息传递机制,在PyG中提供了一个消息传递基类,它实现了消息传递的自动处理,继承该类就可以简单方便的构建自己的消息传播GNN。本文的主要内容包括:类剖析、继承实现GAT。...

2022-06-17 11:42:06 2819

原创 PyG教程(5):剖析GNN中的消息传播机制

众所周知,图神经网络可以从空域或谱域来对其进行研究。其中,空域角度主要借助消息传播机制来构建GNN。本文主要介绍的是消息传递机制,为下篇文章具体介绍PyG中是如何实现消息传播机制做好铺垫。...

2022-06-16 11:35:24 1949 1

原创 Python系列(八):“一网打尽”类

作为一门面向对象(Object)的编程语言,Python的核心当然包含类(class)的设计。本文详细介绍了类的方法面面,具体介绍内容包括如下图所示

2022-06-13 07:00:00 182 1

原创 PyG教程(4):自定义数据集

在PyG中,除了直接使用它自带的benchmark数据集外,用户还可以自定义数据集,其方式与Pytorch类似,需要继承数据集类。PyG中提供了两个数据集抽象类:下面是对其的详细介绍。

2022-06-10 17:23:21 2338

原创 PyG教程(3):邻居采样

在GNN领域,大图是非常常见的,但由于GPU显存的限制,大图是无法放到GPU上进行训练的。为此,可以采用邻居采样,这样一来可以将GNN扩展到大图上。在PyG中,邻居采样的方式有很多种,具体详解`torch_geometric.loader`。本文以GraphSage中的邻居采样为例进行介绍,其在PyG中实现为`NeighborLoader`。...

2022-06-10 11:42:36 4945 3

原创 PyG教程(2):图数据

PyG中是面向图数据的,它同时支持同构图(homogeneous graphs)和异构图(heterogeneous)。同构图指只包含一种类型的节点和边的图(下图左)。而异构图指包含两种及以上类型的节点和边的图(下图右)。在PyG中,同构图被描述为类的实例,而异构图被描述为的实例。本文主要介绍PyG关于同构图的的相关操作。............

2022-06-09 18:36:37 5140 13

原创 PyG教程(1):初识Pytorch Geometric

PyG全称是Pytorch Geometric,它是一个基于Pytorch构建的库,可以帮助用户快速构建和训练自己的图神经网络模型。PyG中实现了很多先进(state of the art)的GNN模块,例如、、、、等等。此外,PyG中还包含了大量的benchmark图数据集、丰富的图数据操作方法、支持多GPU。关于PyG的安装,推荐使用命令的方式:其中和分别表示Pytorch版本和CUDA版本的占位符,即需要根据你的环境中两者的版本来对其进行设置,例如你本地的Pytorch和CUDA版本分别为和,则使用

2022-06-09 10:44:54 4461 2

原创 《GSN A Universal Graph Neural Network Inspired by Spring Network》阅读笔记

本文作者提出了一个有理论支撑的、同时适用于同配图(homophilous graph)和异配图(heterophilous graph)的图神经网络模型Graph Spring Network(GSN)。作者表明,GSN框架从弹簧势能最小化的角度用各种度量可以解释许多现有的GNN模型。几个现实世界中同配和异配数据集上的实验表明了GSN的优越性能。.........

2022-06-06 11:21:28 739

原创 Python系列(七):用栗子带你深入了解生成器的send()方法

一.问题引入在Python中,可以使用生成器来一次返回单个元素,从而可以避免大量占用内存。下面例子中计算房价函数house_price便是一个生成器的栗子,该函数接收两个参数,其中unit_price表示每平方米单价,areas是售卖的房子的面积。def house_price(unit_price ,areas): for area in areas: yield unit_price * areaunit_price = 1areas = [100, 120, 110

2022-05-26 23:42:15 2249

原创 关于爬虫系列博客迁移的声明

由于CSDN各种奇怪的政策,这个系列的博客可能会突然消失,为此我直接将该专栏迁移到了知乎:爬虫实战专栏。以后若是还有爬虫系列的博客,会直接发在知乎,不会在这里发布了,有需求的小伙伴可以去关注收藏一下。...

2022-05-22 10:10:31 145

基于图卷积神经网络的微博疫情情感分析实战

本项目的任务为NLP中的情感分析。项目将文档进行构图,然后采用图卷积来进行文档嵌入学习,最后进行分类。项目包含数据集以及数据集预处理、建图、训练与测评的完整源码,源码注释清晰,还有相应的博客说明,对新人十分友好。

2023-03-21

机器学习-logistic回归实战项目

本项目实现了机器学习中的典型分类算法逻辑斯蒂回归,项目包含数据生成、模型实现与可视化部分,代码注释清晰,且包含说明文档,对新人友好。

2023-02-11

机器学习-线性判别分析实战项目

本项目实现了机器学习中线性判别分析(LDA)算法,并在真实世界数据集上进行了测试。项目包含数据预处理、模型实现和训练测评的全过程,注释清晰。

2023-02-11

机器学习PCA降维实战项目

本项目实现了机器学习中经典的PCA降维,并在真实世界数据集上进行了实践。项目包含了数据集预处理、模型定义与降维可视化等部分,代码注释清晰。

2023-02-11

机器学习-感知机模型实战

本项目是机器学习感知机模型的Python实战,项目包含了数据生成、模型的定义与训练。项目代码注释清晰,并包含说明文档,对新手友好。

2023-02-11

NLP中文文本生成实战

本项目选用中文诗词作为训练集,用Seq2Seq的方式来训练模型,并基于此可以进行诗词的生成。该项目包含数据预处理、模型训练和文本生成的所有代码,并包含一份简单的说明文档,易于上手。

2023-02-11

基于KMeans的中英文文档聚类

本项目采用K-Means算法分别对若干中文文档和英文文档进行聚类,其中K的取值为20,即最终聚簇结果为20个簇,其中文档间的距离采用的是余弦距离,K-Means算法的终止条件为所有簇的中心不再发生偏移。算法会返回中文文档和英文文档最大的三个簇所对应的文档id(id与文档名一一对应)以及每个簇距离类中心最近的5个文档。

2023-01-19

UCI数据集上的机器学习分类算法实战

本项目为KNN、朴素贝叶斯和决策树的机器学习分类实战项目。本项目使用的数据集breast cancer, iris和wine都是来自于UCI。项目包含了数据集的预处理、划分和加载,三种经典机器学习算法的实现、训练与测评。测评采用了十折交叉验证且采用F1 Score作为测评指标。

2023-01-19

NLP:面向中文电子病历的命名实体识别实战项目源码

本项目是在一个开源中文电子病历数据集上的命名实体识别(NER)任务的源码,其中包含了数据预处理、BERT-BiLSTM模型实现以及训练与测评的完整过程。本人有一篇博客是对其的详细说明,源码也注释详细,简单易读。

2022-05-10

基于CNN的中文文本分类

本资源是使用Pytorch实现的基于CNN的中文文本分类源码,其中包括了数据集预处理、数据集统计分析,模型实现和训练全过程的源码。另外,代码中有详细的注释,对新人十分友好,欢迎下载学习。

2022-04-25

NNI自动调参示例项目

本实验程序内容是利用ResNet进行图像分类的任务。在本项目中,实现了调用NNI进行自动调参。资源中包括了原始数据集以及引入NNI的完整实验源码,是一个非常友好的入门级AI程序,开箱即用。在本人的专栏中还有一篇配套博客,详细介绍了这个项目。

2022-03-05

处理连续属性的朴素贝叶斯实现

本资源主要是实现了一个处理连续属性的朴素贝叶斯模型并在UCA上的葡萄酒数据集上进行了测评,另外源码中还包含了与数据集预处理、sklearn中的朴素贝叶斯的对比以及降维可视化等操作且注释详细,是一份完整的机器学习入门源码。

2022-01-10

深度学习交通流量预测新手入门实战项目源码

本资源为深度学习交通流量预测的实战项目,其中包含了用LSTM,GRU以及CNN来进行流量预测的相关源码,整个项目的过程集数据预处理、模型训练与测评,性能展示于一体,代码结构良好,易于阅读,且在CSDN有本人相应的博客说明。

2021-11-03

NLP微博内容情感分类新人入门实战源码

本资源为微博内容进行情感分析实战项目,适用于NLP情感分析的新人,其中包含了对数据分析、预处理以及模型的训练以及测评的全过程,且在博主的博客中有对项目的文字教程,对新人非常友好。

2021-11-03

hadoop-eclipse-plugin-3.2.1.jar

hadoop-eclipse-plugin.jar插件基于Ubuntu18.04和Hadoop-3.2.1编译的,最后可以在eclipse创建Map Reduce文件

2020-11-13

sakteBallGame.zip

本程序利用eclipse实现了滑板反射小游戏,游戏分为三个难度模式,游戏移动操作采用键盘,游戏界面左侧可以显示得分,小球在滑板上反射时允许一定量的随机变化弹射角度,游戏失败后可以选择重新开始

2020-03-20

Java Swing实现一个计算器.docx

本资源使用Java Swing实现了一个计算器, 计算器能进行整数,浮点数,正负数的运算,计算器的实现中还利用了中缀式求值

2019-12-01

赋值语句的解释程序设计.docx

本资源实现赋值语句的解释程序设计,资源中附加了代码和实现思路

2019-09-28

C语言(子集)词法分析器的设计.docx

本资源实现了C语言子集的词法分析器的设计,可以完成C语言子集的词法分析

2019-09-28

基于十字链表存储的稀疏矩阵的转置

实现了从字符文件读入三个正整数m, n, t以及t个三元组(i, j, e)建立稀疏矩阵的十字链表存储结构(m、n分别表示矩阵行数和列数;i, j为非零元素行号和列号)和十字链表的转置并将转置后的三元组到另一字符文件中

2019-04-28

C语言实现带头结点的单向链表的基本操作

使用C语言实现了单向链表的创建,输出,插入元素和删除元素以及单向链表的逆序连接和两个有序线性表的归并

2019-04-04

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除