自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(512)
  • 收藏
  • 关注

原创 GraphSAGE算法 和 代码解析

聚合邻居GraphSAGE研究了聚合邻居操作所需的性质,并且提出了几种新的聚合操作(aggregator),需满足如下条件:(1)聚合操作必须要对聚合节点的数量做到自适应。不管节点的邻居数量怎么变化,进行聚合操作后输出的维度必须是一致的,一般是一个统一长度的向量。(2)聚合操作对聚合节点具有排列不变性。对于我们熟知的2D图像数据与1D序列数据,前者包含着空间顺序,后者则包含着时序顺序,但图数据本身是一种无序的数据结构,对于聚合操作而言,这就要求不管邻居节点的排列顺序如何,输出的结果总是一样的。比如Ag

2020-09-02 11:21:04 2961 1

原创 lstm 分类 情感分析 代码完整解析

文本情感分析(Sentiment Analysis)是自然语言处理(NLP)方法中常见的应用,也是一个有趣的基本任务,尤其是以提炼文本情绪内容为目的的分类。它是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。  本文将介绍情感分析中的情感极性(倾向)分析。所谓情感极性分析,指的是对文本进行褒义、贬义、中性的判断。在大多应用场景下,只分为两类。例如对于“喜爱”和“厌恶”这两个词,就属于不同的情感倾向。  本文将详细介绍如何使用深度学习模型中的LSTM模型来实现文本的情感分析。文本介绍及语料

2020-08-20 19:26:47 8223 4

转载 基于LSTM分类文本情感分析

背景介绍文本情感分析作为NLP的常见任务,具有很高的实际应用价值。本文将采用LSTM模型,训练一个能够识别文本postive, neutral, negative三种情感的分类器。本文的目的是快速熟悉LSTM做情感分析任务,所以本文提到的只是一个baseline,并在最后分析了其优劣。对于真正的文本情感分析,在本文提到的模型之上,还可以做很多工作,以后有空的话,笔者可以再做优化。理论介绍RNN应用场景RNN相对于传统的神经网络,它允许我们对向量序列进行操作:输入序列、输出序列、或大部分的

2020-08-19 17:36:08 4699 3

转载 深度学习中Embedding的理解

在自然语言处理领域,由于计算机并不直接处理文本,需要将其先转化成易于计算的特征向量。这里就需要用到文本特征表示模型,主要有两大类:直接从原始文本生成文本向量(LDA);先从文本中获取字向量,然后在字向量的基础上得到文本向量(词袋模型基于词的one-hot表示,word2vec基于词的分布式表示)。语言模型:通过上下文的词,计算某个词出现的概率的模型。其实就是一个多分类器文本特征表示模型:将原始文本中的词、词组和句子转化为易于计算的特征向量,常用的有词袋模型、LDA模型、概率神经网络模型等。其中实际应

2020-08-19 10:46:56 2058

转载 TF-IDF的原理

转:https://blog.csdn.net/sun_brother/article/details/80360112TF-IDF介绍  TF-IDF是NLP中一种常用的统计方法,用以评估一个字词对于一个文件集或一个语料库中的其中一份文件的重要程度,通常用于提取文本的特征,即关键词。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。公式 ????????????????????=????????∗????????????.TF-IDF(Term Fr

2020-08-09 16:36:15 284

原创 正向传播和 反向传播(大白话笔记)

由于要更新参数,所以求这玩意又等于L对w的偏导这玩意又可以用链乘前面这部分是前向传播可求右边那玩意用反向传播 就是知道预测的和实际的偏差距离来求正向反向的数相乘可以凑到更新w权值需要的数,然后更新权值...

2020-07-31 16:51:58 1489

原创 GCN实战(代码分析)深入浅出图神经网络第五章(GCN和CNN区别)

import itertoolsimport osimport os.path as ospimport pickleimport urllibfrom collections import namedtupleimport numpy as npimport scipy.sparse as spimport torchimport torch.nn as nnimport torch.nn.functional as Fimport torch.nn.init as init..

2020-07-29 01:00:49 2630 7

原创 笔记:关于GCN的学习理解(白话)

GCN就是把时域上的图,用拉普拉斯矩阵,或者别的矩阵进行频域上的表示,再在频域上进行卷积.Q1:为什么要用时域转频域,因为时域不好表示各个点和相邻的点的邻接关系,因为不同的邻接关系需要不同的权值才能进行卷积神经网络,但基于图的谱分解可以表示.Q2:如何在频域上进行卷积?变为频域上的运算就可以更好结合图的特征,运算的话就用频域上的傅里叶函数变换.这样就可以在频域上算好卷积.卷积定理:函数卷积的傅里叶变换是函数傅立叶变换的乘积,即对于函数 f(t)与 h(t)两者的卷积是其函数傅立叶变换...

2020-07-22 09:42:24 772

原创 分布式爬虫项目(开发手册)

1.安装docker 安装最简单版本的 dockersudo apt install docker.iosudo apt-get update2.用了这么一个镜像 docker pull markadams/chromium-xvfb-py2这个镜像包含了python+selenium+chrome 省去了配置selenium+chromedriver的麻烦提醒一下 服务器的安全组记得方形 63793.安装redisapt-get install redis-servervi /etc/r.

2020-06-11 16:31:13 404

转载 KKT条件

https://zhuanlan.zhihu.com/p/38163970

2020-06-11 16:29:48 469

原创 求割点,割边 tarjan 模板

观察DFS搜索树,我们可以发现有两类节点可以成为割点: 对根节点u,若其有两棵或两棵以上的子树,则该根结点u为割点; 对非叶子节点u(非根节点),若其中的某棵子树的节点均没有指向u的祖先节点的回边,说明删除u之后,根结点与该棵子树的节点不再连通;则节点u为割点。 对于根结点,显然很好处理;但是对于非叶子节点,怎么去判断有没有回边是一个值得深思的问题。我们用dfn[u]记录节点u在DFS过程中被遍历到的次序号,low[u]记录节点u或u的子树通过非父子边追溯到最早的祖先节点(即DFS次

2020-05-11 23:52:35 185

原创 欧拉路,求欧拉路 路径

小Ho:这个好像是一笔画问题哎,我们是在求一个方法能够一笔画出所有边吧?小Hi:没错,这就是一笔画问题,不过它更正式的名字叫做欧拉路问题。其定义是给定无孤立结点图G,若存在一条路,经过图中每边一次且仅一次,该条路称为欧拉路。小Ho:既然有名字,那就证明这东西有解咯?小Hi:没错,欧拉路是有判定条件的:一个无向图存在欧拉路当且仅当该图是连通的且有且只有2个点的度数是奇数,此时这两个点只能作为欧拉路径的起点和终点。若图中没有奇数度的点,那么起点和终点一定是同一个点,这样的欧拉路叫做欧拉回路

2020-05-09 16:02:48 483 1

原创 hihocoder 1162 : 骨牌覆盖问题·三(四十三周)

方块问题的 最终形式 利用二进制进行状态转移,然后矩阵快速幂,[x][y] x为i-1列的状态,y为 i列状态, [x][y]能唯一标示所有的状态。时间限制:10000ms单点时限:1000ms内存限制:256MB描述前两周里,我们讲解了2xN,3xN骨牌覆盖的问题,并且引入了两种不同的递推方法。这一次我们再加强一次题目,对于给定的K和N,我们需要去求KxN棋盘的覆盖方案数。提示:KxN骨牌覆盖输入第1行:2个整数N。表示棋盘宽度为k,长度为N。2≤K≤7,1≤N≤100,

2020-05-09 15:20:18 418

原创 prime 模板复习 hihocoder 1097

#1097 : 最小生成树一·Prim算法时间限制:10000ms单点时限:1000ms内存限制:256MB描述最近,小Hi很喜欢玩的一款游戏模拟城市开放出了新Mod,在这个Mod中,玩家可以拥有不止一个城市了!但是,问题也接踵而来——小Hi现在手上拥有N座城市,且已知这N座城市中任意两座城市之间建造道路所需要的费用,小Hi希望知道,最少花费多少就可以使得任意两座城市都可以...

2020-05-07 19:34:32 162

原创 spfa 模板复习 hicocoder 1093

时间限制:10000ms单点时限:1000ms内存限制:256MB描述万圣节的晚上,小Hi和小Ho在吃过晚饭之后,来到了一个巨大的鬼屋!鬼屋中一共有N个地点,分别编号为1..N,这N个地点之间互相有一些道路连通,两个地点之间可能有多条道路连通,但是并不存在一条两端都是同一个地点的道路。不过这个鬼屋虽然很大,但是其中的道路并不算多,所以小Hi还是希望能够知道从入口到出口的最短...

2020-05-07 11:51:59 176

转载 leetcode 5403

5403. 有序矩阵中的第 k 个最小数组和难度困难6给你一个m* n的矩阵mat,以及一个整数k,矩阵中的每一行都以非递减的顺序排列。你可以从每一行中选出 1 个元素形成一个数组。返回所有可能数组中的第 k 个最小数组和。示例 1:输入:mat = [[1,3,11],[2,4,6]], k = 5输出:7解释:从每一行中选出一个元素,前 k 个和...

2020-05-03 18:25:06 316

原创 leetcode 5402(滑动窗口 + map)

5402. 绝对差不超过限制的最长连续子数组难度中等13给你一个整数数组nums,和一个表示限制的整数limit,请你返回最长连续子数组的长度,该子数组中的任意两个元素之间的绝对差必须小于或者等于limit。如果不存在满足条件的子数组,则返回0。解法1:滑动窗口 + map 因为map自动排好了最大最小值,时间复杂度 log#include <b...

2020-05-03 17:29:06 155

原创 codeforces Nastya and Scoreboard(dp)

题意:0~9每个数字由不同数量位置的火柴棍组成,一共n组数字,让你添加k根火柴棍,使n组数字可以构造的最大的数。若不能构成任何数,那么输出 -1dp[i][j] 第i个数时,还剩下j个火柴棍,dp[i][j] = 1代表这个状态是可以构成的。那么初始值 dp[n+1][0] = 1代表 n+1个数时,剩下0个火柴棍的状态是1。从后往前推可以达到的状态,最后从前往后贪心得到结果。#incl...

2020-04-25 10:41:10 199

原创 Replica set 的选举策略之一

首先介绍一下在replica set里分为三种节点类型:1primary 负责client的读写。2secondary作为热备节点,应用Primary的oplog读取的操作日志,和primary保持一致,不提供读写操作! secondary有两种类型: 1)normal secondary 随时和Primay保持同步, 2)delayed second...

2020-04-20 12:33:41 261

原创 codeforces D Xenia and Colorful Gems

给 t给 nr,ng,nb三种宝石数量nr个宝石的价值ng个宝石的价值nb个宝石的价值每种宝石各取一个,使 (xx-yy)^2+ (xx-zz)^2 + (yy-zz)^2 最小展开,有 2(xx + yy + zz) - 2xy - 2xz - 2yz 最小 由不等式可知 xx==yy==zz最小,答案为0则推 当xyz 差值最小的时候 答案最小 所以 分别对三种...

2020-04-16 11:45:43 225

原创 codeforces E2. Three Blocks Palindrome (hard version)

给你一个序列,你要可以在这些序列中进行删除操作,最后这个序列形成abaabaaba回文序列,并且a,ba,ba,b中的数字要一样,问这个的序列最长的长度是多少。分析:收尾两边同时逐一增加某字符,然后和中间相同字符个数,拼接起来,找到最大值#include <bits/stdc++.h>using namespace std;#define fi first#define...

2020-04-15 16:30:50 259

原创 leetcode1406. 石子游戏 III 零和博弈

Alice 和 Bob 用几堆石子在做游戏。几堆石子排成一行,每堆石子都对应一个得分,由数组 stoneValue 给出。Alice 和 Bob 轮流取石子,Alice 总是先开始。在每个玩家的回合中,该玩家可以拿走剩下石子中的的前 1、2 或 3 堆石子 。比赛一直持续到所有石头都被拿走。每个玩家的最终得分为他所拿到的每堆石子的对应得分之和。每个玩家的初始分数都是 0 。比赛的目标是决出...

2020-04-12 18:22:33 263

原创 leetcode 5383. 给 N x 3 网格图涂色的方案数

你有一个 n x 3的网格图 grid,你需要用 红,黄,绿三种颜色之一给每一个格子上色,且确保相邻格子颜色不同(也就是有相同水平边或者垂直边的格子颜色不同)。给你网格图的行数 n。请你返回给grid涂色的方案数。由于答案可能会非常大,请你返回答案对10^9 + 7取余的结果。示例 2:输入:n = 2输出:54示例 3:输入:n = 3输出:246示例...

2020-04-12 17:01:24 666

转载 codeforces 632C Eugene and an array

给定长度为n的序列,定义序列a为“好的”,当且仅当,a的子段中不存在sum值为0。那么根据题意,若sum[a[i]]在i前面存在,那么这样的序列只能最后一次取到sum[a[i]]的下标k以后,数量为i - k。#include <bits/stdc++.h>using namespace std;#define fi first#define se second#d...

2020-04-09 12:41:57 265

原创 codeforces 1332C K-Complete Word

K-Complete Wordtime limit per test2 secondsmemory limit per test512 megabytesinputstandard inputoutputstandard outputWord????sof length????nis called????k-complete if????sis a palindrome...

2020-04-01 14:32:04 384 1

原创 codeforces 1332D 构造

小明有一个动态规划程序是为了解决一个矩阵只能往右走或者往下走相与的最大值 是 dp[i][j] = max(dp[i-1][j] & a[i][j], dp[i][j - 1]&a[i][j]) ,然后说这个程序是错的,有真正的对的答案,给一个k 是 这个错误答案与正答的差值,让构造这个矩阵只要给一条有k的路,但是动态规划程序是不会走这条路的矩阵即可构造3*3 矩阵 ...

2020-04-01 14:04:03 237

原创 codeforces E. Tree (lca 求最小公共祖先)

E. Tree Queriestime limit per test2 secondsmemory limit per test256 megabytesinputstandard inputoutputstandard outputYou are given a rooted tree consisting of????nvertices numbered fr...

2020-03-27 10:48:24 421

原创 codeforces627 div3 D Pair of Topics(树状数组+离散化)

D. Pair of Topicstime limit per test2 secondsmemory limit per test256 megabytesinputstandard inputoutputstandard outputThe next lecture in a high school requires two topics to be dis...

2020-03-12 23:31:36 421

原创 codeforces 627 div3 E. Sleeping Schedule

E. Sleeping Scheduletime limit per test2 secondsmemory limit per test256 megabytesinputstandard inputoutputstandard outputVova had a pretty weird sleeping schedule. There areℎhhour...

2020-03-12 23:21:36 662 4

原创 hdu 5583 Kingdom of Black and White(水题)

In the Kingdom of Black and White (KBW), there are two kinds of frogs: black frog and white frog.NowNNfrogs are standing in a line, some of them are black, the others are white. The total strength ...

2020-02-27 11:15:28 432

原创 红黑树 (插入)总结

1. 红黑树概述 二叉查找树 左节点key < 其根节点key < 右节点key 平衡二叉树 平衡二叉树是对 二叉查找树的一种优化,规定左右两个子树的高度差的绝对值不超过1,这样便提高了查找的效率。 红黑树 红黑树是 “平衡二叉树” 的一种实现算法。 红黑树的特性:每个节点或者是黑色,或者是红色 根节点是黑色 每个叶子结点(NIL,这里的叶子...

2020-02-23 21:45:44 274

原创 scrapy实战之爬取简书

这一节,我们利用scrapy来爬取简书整站的内容。对于一篇文章详情页面,我们发现许多内容是Ajax异步加载的,所以使用传统方式返回的response里并没有我们想要的数据,例如评论数,喜欢数等等。对于动态数据请求,我们使用selenium+chromedriver来完成1.到淘宝镜像https://npm.taobao.org/mirrors/chromedriver选择对应的chromedr...

2020-02-22 09:25:37 934 1

原创 scrapy 随机设置请求头和ip代理池中间件

Request和Response都会首先经过中间件,所以我们在中间件中定义需要添加的header和paramscrapy中最重要的的两个类Response和Requestfrom scrapy import Requestclass Request(object_ref): def __init__(self, url, callback=None, method='GE...

2020-02-22 09:20:43 635

原创 hihocoder 1543 SCI表示法

时间限制:10000ms单点时限:1000ms内存限制:256MB描述每一个正整数N都能表示成若干个连续正整数的和,例如10可以表示成1+2+3+4,15可以表示成4+5+6,8可以表示成8本身。我们称这种表示方法为SCI(Sum of Consecutive Integers)表示法。 小Hi发现一个整数可能有很多种SCI表示,例如15可以表示成1+2+3+4+5,4+...

2020-02-10 22:04:44 170

转载 爬虫学习 scrapy 入门

这篇文章转载于:https://blog.csdn.net/Hampton_Chen/article/details/81147110这里作为简便的记录基础知识:xpath的基本用法 :https://blog.csdn.net/manongpengzai/article/details/77109600Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架。 可以应用在包括...

2020-02-10 21:02:47 252

原创 爬虫学习笔记(3)

网络爬虫之实战1正则表达式 2 淘宝商品比价定向爬虫 3 股票数据定向爬虫4.1正则表达式正则表达式语法由字符和操作符构成常用操作符. 表示任何单个字符[ ] 字符集,对单个字符给出取值范围[abc]表示a、b、c,[a‐z]表示a到z单个字符[^ ] 非字符集,对单个字符给出排除范围[^abc]表示非a或b或c的单个字符* 前一个字符0次或无限次扩展abc* 表示ab、...

2020-02-08 17:28:59 675

原创 爬虫学习笔记(2)

网络爬虫规则之提取1 Beautiful Soup库入门 2 信息组织与提取 3 实例:大学排名爬取Beautiful Soup库,也叫beautifulsoup4 或bs4约定引用方式如下,即主要是用BeautifulSoup类import bs4 fromimport bs4 from BeautifulSoup4种解析器:soup = BeautifulSoup(‘&...

2020-02-08 17:19:07 186

原创 爬虫学习笔记(1)

网络爬虫规则1 Requests库 自动爬取html页面 2robots.txt 网络爬虫排除标准 3 实战项目我用的操作系统ubuntu + pycharm + anaconda在网上搜教程即可安装好,利用conda下载 requests 库,在pycharm 中配置anaconda 作为编译器环境即可#requests库7个主要方法:a、requests.request...

2020-02-08 17:00:26 315

原创 hihocoder 1538

描述小Hi的学校大礼堂的地毯是由很多块N×M大小的基本地毯拼接而成的。例如由2×3的基本地毯ABCABD拼接而成的大礼堂整片地毯如下: ... ABCABCABCABCAB ABDABDABDABDAB. ABCABCABCABCAB .. ABDABDABDABDAB .. ABCABCABCABCAB . ABDABDAB...

2020-01-08 16:48:54 146

原创 CodeForces - 988F Rain and Umbrellas (dp)

题目大意:有三个整数a,n,m,a是终点坐标,给出n个范围(l,r)表示这块区域下雨,m把伞(p,w)在点p有重量为w的伞。小明可以携带任意数量的伞,经过下雨处时必须要撑伞,小明每走一个单位长度消耗的体力与他所携带伞的重量相同,求小明从0~a所需消耗的最少体力,若无解则输出-1。 思路:可以考虑 从 1 到 a一步步转移过去的 o(n)做法,但是写起来比较麻烦,需要保存三种状态...

2018-12-31 17:16:08 229

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除