自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(221)
  • 收藏
  • 关注

原创 【论文笔记】Attention,please!A survey of neural attention models in deep learning

Attention mechanismsSoft attention(global attention):Soft attention会确认输入数据的每个element的权重,这个值决定了需要放多大的注意在当前element上,Soft attention的计算考虑了深度学习模型的输入以及目标。weight的范围是0~1。 Hard attention(local attention):Hard attention考虑的是这个元素被看见or忽略,取值只有0或1,不可微 Self-attention(

2021-04-08 16:41:17 681

原创 【Pytorch】GNN学习填坑记

参考:https://blog.csdn.net/YPP0229/article/details/106328173/pycharm执行代码出现错误No module named 'torch_sparse’解决办法h https://pytorch-geometric.com/whl/,在这里找到自己pytorch对应的版本,下载.whl 直接在下载的路径执行 pip install xxx.whl即可 ...

2020-11-05 13:35:56 1098

转载 【机器学习】 Local Outlier Factor(LOF)算法

转载自:https://blog.csdn.net/Zhang_Chen_/article/details/90612028

2020-07-28 14:40:05 593

原创 【论文笔记】HARP: Hierarchical Representation Learning for Networks

目录AbstractIntroduction问题定义Method源码【code】[paper]https://arxiv.org/pdf/1706.07845v2.pdf[code]https://github.com/GTmac/HARPAbstractOur proposed method achieves this by compressing the input graph prior to embedding it, effectively avoiding

2020-07-14 15:44:04 1269 7

原创 【机器学习】聚类算法、社区发现

目录前言前言最近方向是团案挖掘,关于聚类算法,其实之前不怎么了解,最近得补补了。聚类和社区发现首先要先明白这两者的差别。[参考地址]社团检测通常是指将网络中联系紧密的部分找出来,这些部分就称之为社团,那么也可以认为社团内部联系稠密,而社团之间联系稀疏 [1]。显而易见,其中有一个非常重要的点,稠密是如何定义的。不管现在想到的定义是什么,但都包含顶点,边,度,或许还有路径这些字眼,它们有一个共同的特征–网络的结构。所以,社团检测侧重于找到网络中联系紧密的部分,而经常忽略节点的.

2020-07-14 15:35:06 7230 1

原创 【学习】评价指标理解

目录ROC曲线AUCKS曲线P-R曲线准确率(precision)召回率(recall)F1系列ROC曲线ROC的全称是Receiver Operating Characteristic Curve,中文名字叫“受试者工作特征曲线”,顾名思义,其主要的分析方法就是画这条特征曲线。ROC曲线的横轴是FPR(假阳性率、误诊率)、纵轴是TPR(真阳性率、灵敏度)。这条曲线代表的是在不同的阈值下,FPR和TPR的一个变化曲线,通常,我们希望FPR尽可能的小,而TPR尽可.

2020-07-07 15:14:48 610

原创 【LeetCode】基本数据结构

注意:和大雪菜刷题https://www.bilibili.com/video/BV1T441167eG1. 两数之和思路:利用哈希表存储每个数字的下标。 遍历数组的同时,检查哈希表里target-nums[i]是否存在,存在则返回答案class Solution: def twoSum(self, nums: List[int], target: int) -> List[int]: hashtable = {} for index, n

2020-06-27 23:24:07 394

原创 【论文笔记】node2vec: Scalable Feature Learning for Networks

[论文]https://dl.acm.org/doi/pdf/10.1145/2939672.2939754[code]https://github.com/eliorc/node2vec abstract We define a flexible notion of a node’s network neighborhood and design a biased random walk procedure, which efficiently explores diverse neigh

2020-06-18 15:18:18 564

原创 【论文笔记】LINE: Large-scale Information Network Embedding

[paper] https://dl.acm.org/doi/pdf/10.1145/2736277.2741093[code] C++\PYTHON TF 摘要 In this paper, we propose a novel network embedding method called the “LINE,” which is suitable for arbitrary types of information networks: undirected, directed, and

2020-06-18 15:11:53 972 8

原创 【论文笔记】Learning Structural Node Embeddings via Diffusion Wavelets

[paper]https://arxiv.org/pdf/1710.10321.pdf[code]https://github.com/benedekrozemberczki/GraphWaveMachine abstract In this paper, we develop GraphWave, a method that represents each node’s network neighborhood via a low-dimensional embedding by leve

2020-06-18 15:05:36 1248

原创 【论文笔记】DeepWalk: Online Learning of Social Representations

[paper]http://www.perozzi.net/publications/14_kdd_deepwalk.pdf[code]https://github.com/phanein/deepwalk abstract DeepWalkuses local information obtained from truncated random walks tolearnlatent representations by treating walks as the equivalen...

2020-06-18 15:02:15 350

原创 【LeetCode】滑动窗口、双指针、单调队列和单调栈

167. 两数之和 II - 输入有序数组思路:

2020-06-14 22:55:02 259

原创 【LeetCode】树专题

注意主要和b站大雪菜一起刷题,宝藏up主(https://www.bilibili.com/video/BV19t411w7Ep/?spm_id_from=333.788.videocard.0)98. 验证二叉搜索树思路:这个题只需要判断是否是BST即可 题目条件限制的也很清晰,不会出现节点相等的情况 考虑划分范围的做法,假如当前节点的值为x,则左子树的取值范围为[-∞,x-1],右子树的取值范围为[x+1,∞]# Definition for a binary tree node

2020-06-02 23:31:13 260

原创 【学习】PSI、IV、WOE的计算

PSI PSI(模型分布稳定性):稳定度指标(population stability index ,PSI)可衡量测试样本及模型开发样本评分的的分布差异,为最常见的模型稳定度评估指针。其实PSI表示的就是按分数分档后,针对不同样本,或者不同时间的样本,population分布是否有变化,就是看各个分数区间内人数占总人数的占比是否有显著变化。 其中,bins是分箱数量,Actual是实际占比,Expected是预期占比。 一般来说,PSI小于0.1模型稳定性较高,0.1至0.2之间稳定性.

2020-06-01 17:34:07 2765

原创 【论文笔记】NRL-Heterogeneous Information Network

Abnormal Event Detection via Heterogeneous Information Network Embedding论文地址摘要In this paper, we propose a novel deep heterogeneous network embedding method which incorporates the entity attributes and second-order structures simultaneously to address

2020-05-28 11:57:24 531

原创 【实习日记】每日问题总结(持续更新......)

2020.05.18堡垒机:堡垒机,即在一个特定的网络环境下,为了保障网络和数据不受来自外部和内部用户的入侵和破坏,而运用各种技术手段监控和记录运维人员对网络内的服务器、网络设备、安全设备、数据库等设备的操作行为,以便集中报警、及时处理及审计定责。DQCETLXT系统强 、弱依赖UDF魔数kylinOLAPMPPBG/BU2020.05.19SLASPARKHOPEZEPPELINSCALAKS值2020.05.20HIVE分区表concat_wspar

2020-05-21 18:48:26 775

原创 【实习日记】SQL语句学习

一些最重要的SQL命令SELECT:从数据库中提取数据UPDATE:更新数据库中的数据DELETE:从数据库中删除数据INSERT INTO:向数据库中插入新数据CREATE DATABASE:创建新数据库ALTER DATABASE:修改数据库CREATE TABLE:创建新表ALTER TABLE:变更(改变)数据库表DROP TABLE:删除表CREATE INDEX:创建索引(搜索键)DROP INDEX:删除索引SQL SELECT 语句SELECT column

2020-05-19 14:10:43 308

原创 【LeetCode】链表专题

注意:和b站up主大雪菜一起刷题https://www.bilibili.com/video/BV1jt411J7tC19. 删除链表的倒数第N个节点思路:首先,链表题一般可以直接画图得到思路 要删除倒数第N个节点的话,我们实际需要找到的是倒数第N+1个节点的位置,然后令其的next=next.next 由于可能头结点被删除,则可以添加一个虚节点指向头结点 题目要求只扫描一次...

2020-05-02 00:15:05 221

原创 【LeetCode】动态规划专题(持续更新......)

注意:和b站up主大雪菜一起刷的https://www.bilibili.com/video/BV15441117yb53. 最大子序和思路:状态表示dp[i]:以i结尾的最大子段和 状态转移:dp[i] = max(dp[i-1],0)+nums[i],优化后,因为状态转移只与前一个dp[i-1]有关,可以直接用last代替 初始化:dp[0]=nums[0]clas...

2020-04-28 21:48:57 310

原创 【LeetCode】DFS+回溯

注意:https://www.bilibili.com/video/BV1M4411Q7td参考刷题视频17. 电话号码的字母组合思路:主要是需要枚举所有的字母组合,可以利用循环class Solution: def letterCombinations(self, digits: str) -> List[str]: if not digit...

2020-04-24 16:32:43 275

原创 【LeetCode】二分专题

注意:主要和b站大雪菜一起刷题,宝藏up主(https://www.bilibili.com/video/BV1Vt411M741)模板# 模板1while l<r: mid = (l+r)>>2 if 性质: l = mid + 1 else: r = midretrun l# 模板2while l...

2020-04-22 21:43:50 299

原创 【数据分析】数据预处理

4.1 数据清洗数据清洗主要是删除原始数据集中的无关数据、重复数据、平滑噪声数据、筛选掉与挖掘主题无关的数据,处理缺失值、异常值等4.1.1 缺失值处理删除记录、数据插补、不处理插补方法:均值/中位数/众数插补使用固定值最近邻插补回归方法插值法:拉格朗日插值法、牛顿插值法、hermite插值法、分段插值、样条插值法4.1.2 异常值处理删除含有异常值的记录视为缺...

2020-04-19 21:49:24 266

原创 【数据分析】数据探索

参考书《Python数据分析与挖掘实战》3.1 数据质量分析数据质量分析主要任务是检查原始数据中是否存在脏数据,脏数据主要包括:缺失值,异常值,不一致的值,重复数据以及含有特殊符号(#、*等)的数据3.1.1 缺失值分析产生的原因:有些数据暂时无法获取,或者获取的代价过大被遗漏掉属性值不存在(一个儿童的固定收入、一个未婚者的配偶姓名)带来的影响:数据挖掘建模将...

2020-04-18 19:20:58 306

原创 【LeetCode】字符串专题

目录注意:38. 外观数列49. 字母异位词分组151. 翻转字符串里的单词165. 比较版本号929. 独特的电子邮件地址5. 最长回文子串6. Z 字形变换3. 无重复字符的最长子串208. 实现 Trie (前缀树)273. 整数转换英文表示注意:主要和b站大雪菜一起刷题,宝藏up主(https://www.bilibili.com/...

2020-04-18 18:02:50 269

原创 【机器学习】树类模型总结

前言想对自己所学的东西进行一个总结。决策树算法决策树学习的算法通常是一个递归地选择最优特征,并根据该特征对训练数据进行分割,使得对各个子数据集有一个最好的分类的过程。1. ID3信息增益:表示得知特征X的信息而使得类Y的信息的不确定性减少的程度 使用信息增益准则选择特征 分裂至信息增益很小或者没有特征可选为止 只有树的生成,容易过过拟合2. C4.5信息增益倾向于选...

2020-04-01 14:07:39 758

原创 【剑指offer】刷题记录(持续更新....)

注意题源是在LeetCode平台上《剑指offer》。使用的是Python面试题03. 数组中重复的数字思路:在一个长度为 n 的数组 nums 里的所有数字都在【0~n-1】 的范围内。 请找出数组中任意一个重复的数字。 因为每个数字都在【0~n-1】中,利用哈希table就可以找到第一个重复的数字进行返回class Solution: def findRep...

2020-03-31 11:53:21 239

原创 【Git】 ! [rejected]master -> master (fetch first)

刚开始使用github,有些问题没有注意。记录下自己的错误。提交新文件到远程仓库的时候出现了这个错误,我有点懵。查了查反应过来,我在github上加了个readme,而本地没有添加,导致本地仓库和远程仓库不一样。所以我们需要先同步一下a.--> git pull origin masterb.--> git push origin master...

2019-05-11 17:46:54 121

转载 【Python】TypeError: 'AxesSubplot' object is not subscriptable的解决办法

方法转自:https://blog.csdn.net/qq_36142336/article/details/78776426《Python数据分析与挖掘实战》第三章中代码清单3-1照书写会出现这个问题:TypeError: 'AxesSubplot' object is not subscriptable。原始代码如下:p = data.boxplot()x = p['flier...

2019-05-08 22:58:36 14772 1

原创 1155 Heap Paths (30 分)

In computer science, aheapis a specialized tree-based data structure that satisfies the heap property: if P is a parent node of C, then the key (the value) of P is either greater than or equal to (i...

2019-04-29 11:49:09 127

原创 1154 Vertex Coloring (25 分)

Aproper vertex coloringis a labeling of the graph's vertices with colors such that no two vertices sharing the same edge have the same color. A coloring using at mostkcolors is called a (proper)k...

2019-04-28 11:53:07 175

原创 1153 Decode Registration Card of PAT (25 分)

A registration card number of PAT consists of 4 parts:the 1st letter represents the test level, namely,Tfor the top level,Afor advance andBfor basic; the 2nd - 4th digits are the test site nu...

2019-04-18 17:22:30 103

原创 1152 Google Recruitment (20 分)

In July 2004, Google posted on a giant billboard along Highway 101 in Silicon Valley (shown in the picture below) for recruitment. The content is super-simple, a URL consisting of the first 10-digit p...

2019-04-17 13:06:16 167

原创 1151 LCA in a Binary Tree (30 分)

The lowest common ancestor (LCA) of two nodes U and V in a tree is the deepest node that has both U and V as descendants.Given any two nodes in a binary tree, you are supposed to find their LCA.In...

2019-04-15 16:38:08 124

原创 1150 Travelling Salesman Problem (25 分)

The "travelling salesman problem" asks the following question: "Given a list of cities and the distances between each pair of cities, what is the shortest possible route that visits each city and retu...

2019-04-13 21:35:01 156

原创 1149 Dangerous Goods Packaging (25 分)

When shipping goods with containers, we have to be careful not to pack some incompatible goods into the same container, or we might get ourselves in serious trouble. For example, oxidizing agent (氧化剂)...

2019-03-27 16:59:04 153

原创 1148 Werewolf - Simple Version (20 分)

Werewolf(狼人杀) is a game in which the players are partitioned into two parties: the werewolves and the human beings. Suppose that in a game,player #1 said: "Player #2 is a werewolf."; player #2 said...

2019-03-27 16:37:22 181

原创 【箱型图】如何看箱型图

箱形图(Box-plot)又称为盒须图、盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图。因形状如箱子而得名。在各种领域也经常被使用,常见于品质管理。它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比 较。箱线图的绘制方法是:先找出一组数据的最大值、最小值、中位数和两个四分位数;然后, 连接两个四分位数画出箱子;再将最大值和最小值与箱子相连接,中位数在箱子中间主要包...

2019-03-27 16:05:11 8618

原创 【碎碎念】要一直前进。

二战这一年压力蛮大, 常常胡思乱想,也想就此放弃。但还好,还好我挺过来了,直到拟录取出来之前都没放弃。以后还要继续努力,继续前进。But life is never what you would have envisioned. People change and the world changes....

2019-03-26 15:11:23 94

原创 【Python】Pycharm新建模板加入个人信息

考完试回归!充实充实充实自己!!!!方法如下:1.打开pycharm,选择file-settings2.选择editor-&gt;code style-&gt;file and code templates-&gt;python-&gt;script3.编辑内容(a)shebang行#!/usr/bin/python3(b)预定义的变量要扩展为格式为$ {&lt...

2019-01-04 15:50:04 602

原创 【C++】一些注意点

做个小笔记,pat时注意1.map、set的自动排序如何解决使用 unordered_map,unordered_set,则无序 重载排序,修改排序的函数 bool operator &lt; (const node &amp;a)const{ return cnt!=a.cnt?cnt&gt;a.cnt:num&lt;a.num; }2.lower_bound()和upp...

2018-08-30 18:05:06 177

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除