自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(46)
  • 资源 (1)
  • 收藏
  • 关注

原创 配置本地yum

5. yum repolist all #检查自己新创建的本地yum源是否是enabled状态。gpgkey #若gpgcheck=1时候则需要有这个参数,同之前yum源中的一致。baseurl #指定yum源的url地址,这里写的是刚才挂载点的绝对路径。enabled #是否激活该yum源,1为激活,默认是激活的。name #指定yum源名称,可以随意写。1.1 先创建一个新的目录,作为挂载点。4.将别的yum源ID变成0。2.然后复制本地的yum源。【】#yum源唯一的ID。

2023-11-02 14:25:01 122

原创 异构图注意力网络计算过程

下图是一个异构图注意力网络计算的例子,节点1-6为6条评论数据,评论1、2、3根据评论长度数共同在某一区间内这一实体联系相互依赖,评论3、4、5、6根据评分偏差相同这一实体联系相互依赖。

2023-06-06 20:04:35 140

原创 LSTM和LR

论文中本来打算放这两块来着,后来修改论文不用了。但是我觉得我LSTM的图画的还是可以的。(公式没办法在这里复制,就贴上图片吧)

2023-05-08 11:10:46 155

原创 虚假评论检测可视化系统的实现

虚假评论检测可视化

2023-04-13 17:14:11 1283 1

原创 json转excel[几百兆的数据量]

【代码】json转excel[几百兆的数据量]

2022-09-15 15:57:08 191

原创 使用ELMO提取词向量后,通过highway+linear降维

代码参考链接:https://blog.csdn.net/sinat_34611224/article/details/83147812所需要的语料模型可以从上面的链接获取from allennlp.modules.elmo import Elmo, batch_to_idsimport reimport nltkimport numpy as npfrom torch import nnimport tensorflow as tfimport torch.nn.functional as

2022-05-29 21:56:16 193

原创 新手上手超算平台最易方法

前言(可以忽略不看)知道要在这个平台上跑代码的时候,教程上说的是运行.py文件需要slurm语言提交脚本语言。于是开始百度,结果有的根本就没有讲脚本语言是使用vim编写,使用 vim ee.sh进入编写,至于如何退出,可以参考这个。对了,千万不要在登入节点运行代码。正篇:salloc -N 1 #表示申请一个节点它会返回一个作业号squeue找到作业号对应的行,那行最后一个位置就是节点号ssh c340然后就像你在你自己电脑命令行上运行代码一样就可以了使用conda activ

2022-05-13 10:02:01 694 1

原创 蓝桥杯知识点总结【python】

一、最大公约数辗转相除法,a,b的最大公约数是a除以b的余数r和b之间的最大公约数。def gcd(a,b): return b if (a%b)==0 else gcd(b,a%b)最大公倍数a*b的乘积除以a,b的最大公约数def lcd(a,b): return a*b/gcd(a,b)求素数(即质数)质数是指在大于1的自然数中,除了1和它本身以外不再有其他因数的自然数。求素数,只需要从2循环到n的平方根就可以了import mathn=16for

2022-04-08 23:52:25 1581 1

原创 卡片【python】

思路参考s=''for i in range(1,3500): s+=str(i) if s.count('1')==2021: print(i) exit()

2022-04-07 19:14:46 552

原创 【Python】音节判断

S=input()a=['a','e','i','o','u']z=[]#存储元音字母所在的索引jishu=[]#存储辅音字母所在的索引count=0#记录两个元音字母相邻的情况count2=0#记录两个辅音字母相邻的情况start=0for i in S: if i in a: d=S.index(i,start) start+=1 z.append(d) else: dd=.

2022-04-01 22:03:08 1131

原创 计算文本中包含的单词数并存储到表格中

import reimport nltkimport pandas as pdimport numpy as npimport xlsxwriterdef word_count(text): # text = text.replace('\n', '').split('\t') text=re.sub(r'http[:.]+\S+', '', text) # print(text) text = re.sub(r'[0-9]+', ' ', text) # 去除数

2022-03-29 12:11:41 305

原创 [Python]菲波那切数列最大公约数

def main(data):#菲波那切数列值 f=[0]*data f[0]=1 f[1] = 1 i=2 while i!=data: f[i]=f[i-1]+f[i-2] i+=1 return f[i-1]#最大公约数:辗转相除法def gcd(a,b): return b if(a%b==0) else gcd(b,a%b)# #更相减损术# def gcd(a,b):# if a==b:.

2022-03-29 12:07:11 672

原创 九数分三组Python

思路是参考的另一个博客的,不过他是java代码写的.for i in range(111,334): if str(i).count('0')==1: continue b=i*2 if str(b).count('0')==1: continue c = i * 3 if str(c).count('0')==1: continue c=(str(i) + str(b) + str(c)) c=li.

2022-03-27 19:23:23 1667

原创 在标点符号前面加空格,方便情感词典senticNet的使用

在使用senticNet的时候,输入单个单词disgusting有反应,能判断出是一个消极词,但是在输入一整句话的时候,就没办法检测到disgusting,后来debug的时候方向,遍历句子中的单词的时候是"disgusting."估计就是这个原因使得词典判断句子情感极性不准确。解决方式:line ='This place is disgusting, absolutely horrible, it is my second stay here, there is a strange stain on

2022-03-17 15:11:09 938 1

原创 创建测试集,数据集,验证集时y[mask,:]作用

2022-02-27 21:55:35 131

原创 创建元路径的.mat文件

这样就会创建一个变量名为“feature”的变量(这个变量名是可以更改的)。(此处需要注意的是,1、这个文件类型需要是microsoft office格式,并且COM加载项中的对勾全部取消)同样的操作,创建元路径这样就将两个.mat文件保存到一个文件中了。和HAN代码数据集的格式一样了。遇到的问题解决方法以及参考链接:1、无法激活excel工具表我的COM加载项是在选项->工具中找到的。2、将多个.mat文件保存为一个.mat文件3. 将excel文件保存为.mat文件...

2022-02-27 11:31:42 1860 8

原创 python创建元路径的邻接矩阵

此例构建的是用户-评分-用户的元路径。索引号即对应的用户id。# 构建稀疏矩阵import scipy.sparse as ssfrom itertools import combinations, permutationsimport numpy as npimport pandas as pddef build_matrix(aa,l):#aa代表邻接矩阵索引号,l是最后要构建的邻接矩阵 # aa = [0, 2, 3] A = list(permutations(aa,

2022-02-24 11:33:51 1718 6

原创 立方和(使用Python求解)

求立方和

2022-01-05 15:26:51 2493

原创 使用java构建元路径,生成邻接矩阵

对元路径的理解:(本人做的是文本方向,所以就以评论者-评论数-评论者作为一条元路径啦)元路径就是多个(大于2个)节点通过另一个类型的节点连接起来的路径,在yelp数据集中我想构建 评论—评论数量—评论 这条元路径。那就是找到相同评论数的评论,这些评论构成一个邻接矩阵。然后有不同的评论数,如142个评论数构成一个邻接矩阵,143个评论数构成一个邻接矩阵…这些小的邻接矩阵最后构成一个全节点的大邻接矩阵。最后这个矩阵就是元路径 评论—评论数量—评论 的矩阵了。伪代码:1.在数据集中将自己需要的两列数据摘取出

2021-11-06 21:13:59 468 1

原创 GAT代码

layers.pyimport numpy as npimport torchimport torch.nn as nnimport torch.nn.functional as Fclass GraphAttentionLayer(nn.Module): """ Simple GAT layer, similar to https://arxiv.org/abs/1710.10903 """ #对实例的属性进行初始化 def __init__(self

2021-10-16 20:38:18 855 1

原创 GAT代码理解

GAT核心公式一、在layers.py中计算GraphAttentionLayer,选框内系数α的求法如下:W的求法如下:【1. 其中涉及到的xavier初始化方法是为了使得每一层输出的方差应该尽量相等#初始化w参数nn.init.xavier_uniform_(self.W.data, gain=1.414)】计算Wh计算e需要注意的是此处求得的e值是所有顶点之间的e值,到了后面torch.where的时候才是计算的相邻节点之间的e值。计算Wh2的时候注意a的取值,感觉它是取了各

2021-10-16 20:27:31 3806 10

原创 GCN代码

代码可以在github上fork,本文主要是加了一些注释,并且搭配本人所作笔记【GCN代码笔记】layers.pyimport mathimport torchfrom torch.nn.parameter import Parameterfrom torch.nn.modules.module import Moduleclass GraphConvolution(Module): """ Simple GCN layer, similar to https://arx

2021-10-11 20:33:10 1297 2

原创 GCN代码笔记

代码来源:https://github.com/tkipf/pygcn涉及数据集:cora学习代码方法:以下就是我做的对GCN代码的笔记,整理不易,大佬莫喷,嘻嘻!GCN代码中layers就是图卷积GraphConvolution的代码layers中,forward即神经网络的前向传播,即上面11的内容,GCN的数学公式也是在这里应用init 中包括对权重的处理和对偏置的处理,调用的是Parmeter()forward部分再调用init部分models即整个模型的整体架构,如此论文中用了

2021-10-11 20:21:59 557

原创 HGAN部分代码

main.pyimport torchfrom sklearn.metrics import f1_scorefrom utils import load_data, EarlyStoppingdef score(logits, labels): #在类的方法或属性前加一个“_”单下划线,意味着该方法或属性不应该去调用,它并不属于API。 _, indices = torch.max(logits, dim=1) prediction = indices.long().c

2021-09-30 17:52:48 663 4

原创 HGAN代码加笔记的理解

1.在类的方法或属性前加一个“_”单下划线,意味着该方法或属性不应该去调用,它并不属于API。2.Python中反斜杠也可以用在一行结尾做续行符使用g, features, labels, num_classes, train_idx, val_idx, test_idx, train_mask, val_mask, test_mask = load_data(args[‘dataset’])我看这个也是根据设置的元路径进行图的构建,根据主函数中上面这句话,下载数据集,跳到utils文件下载数据集那

2021-09-30 17:47:50 1139 1

原创 集成学习Boosting与Stacking的区别

Boosting有三种典型的算法是AdaBoost、XGBoost和GBDT(计算残差)Boosting是基于样本的是因为在训练过程中每次训练的数据总量不会变,而是不断调整上一步预测错误数据的权重,然后继续训练,最后将弱的分类器组合成强的分类器(可见AdaBoost算法加以理解);stacking基于模型的是在训练过程中不断调整模型参数,然后得到最终的模型,再使用逻辑回归组合这些最终模型。参考链接:https://www.biaodianfu.com/boosting.html...

2021-08-06 10:28:25 743

原创 第一次论文复现学到的知识

1.如果镜像没有办法安装某一个库时:此处需注意:在anaconda prompt命令行的时候左侧是(pytorch)时执行安装的命令才有效(我的是这样的)https://blog.csdn.net/mmmm0584/article/details/116761405https://www.cnblogs.com/tianlang25/p/12433025.htmlhttps://blog.csdn.net/lanchunhui/article/details/713795552. 第一次使用百度飞

2021-07-12 21:01:37 163

原创 机器学习考点---过拟合与欠拟合、CNN原理......

2 、 与数据相关的内容:数据的标注来源、规范化、增广、噪声处理怎么处理?数据有噪声好不好?测试集、验证集、训练集各自的作用:训练集:参数调优。验证集:超参、模型的选择,模型评估,正则化 。为什么用验证集进行正则化防止过拟合而不是训练集:通过 validation_data 来设置超参数,一旦我们得到了想要的超参数,就用 test_data 做最后的精度评估。这让我们相信test_data的精度能够真正体现网络的泛化能力。测试集:测试模型泛化能力。数据规范化(数据变换策略之一)数据增广(

2021-07-12 20:49:26 1253

原创 分布式数据库冲突等价问题--找冲突操作的小技巧

注意看定义8.2找冲突操作的小套路:先看括号内的x,y,z,找相同的去看;再看下标1,2,3,找不同的。

2021-07-12 20:24:40 535 2

原创 《分布式数据库系统原理第三版》SQAllocation两步优化算法

其中效益即:分配到该站点的子查询的数量,计算出由该分配所节约的通信代价来定义。Q:为什么分配到S3的效益为0?A:如果分配到S1,因为q4在s1,所以q3与q4结合时,不需要跨站点传输,所以产生效益为1,而如果分配到s3,q4在s1,需要站点传输,所以不需要产生效益,也就是0。R1可以在S1,S3,S4上运行,R4只能在S1上运行,所有先选择q4放在S1,然后选择q2或q3,最后选择灵活度最高的q1.算法思路:先考虑分配灵活度,然后是负载,在负载一致的情况下考虑效益。即:先考虑片段最少..

2021-07-12 20:14:52 273

原创 机器学习--解决一个结构化问题前的考虑因素,ML思考流程

数据方面:数据是否可以获得,以下是数据获取的一些来源:数据的标注成本需要从人力,财力等方面去考虑决定选择哪种学习方式有监督的学习需要标注的数据作为先验经验。考虑是否可以选择半监督、无监督的学习方式,或者选择对偶学习。数据预处理数据预处理的任务主要包括数据清理、数据集成、数据归约、数据变换。算法方面:判断这个问题属于哪种问题,分类?结构化预测?回归?数据生成?知识获取?然后决定选择哪种算法作为baseline。如,二分类问题最好选择SVM作为baseline模型

2021-06-28 10:14:39 125

原创 N元语法求解思路

看到这个是不是觉得特别麻烦?还要去数文本中出现的不重复词的个数吗难道。好麻烦呀!本老菜鸟告诉你,不用!就以上面的那个例子为例这些值都是怎么算出来的呢?敲黑板了,注意听啊!走神一会儿吧。没关系,走神周也会的~第一个值代表的是:句子开头是father的概率是多少。那你就去数有几个句子嘛,一数,欸,三个句子。那有几个是father开头的呢?—一个!那1/3这不就出来了嘛?会了吗?再来一个?好!第二个代表的是啥呢?是Father这个词之后是read的概率。那就去句子中找Father..

2021-06-27 20:58:53 79

原创 SpringMVC流程图之情景小剧场

人物介绍:DispatcherServlet:外号DS。男,心里有一个特别喜欢的人–UserHandlerMapping: 是DS的智囊团,外号HP,拥有法宝法宝:处理器对象和处理器拦截器:如吸铁石般的存在,二者组成HandlerExecutionChain之后会发挥出巨大威力。HandlerAdapter: DS的左膀,对DS的命令无条件的服从,能力很强,外号HAcontroller:HA手下的得力干将。ViewResolver: DS的右臂,能力稍弱,但是具有能讨User欢心的关键技术,.

2021-06-26 16:46:29 84 2

原创 web路径格式总结(老杜)

1、路径的缩写形式:(除了配置文件中的,都需要加/项目名) -<a href="/项目名/资源路径"></a> -<form action="/项目名/资源路径"></form>-重定向:response.sendRedirect("项目名/资源路径");-转发:request.getRequestDispatcher("/资源路径).forward(request,response);-欢迎页面(写在web.xml中) <welcome-f

2021-03-22 16:48:31 250

原创 购物车

用户选择一个商品编号,就把对应的商品添加到购物车里 ,最终用户输入q退出时,打印购买的商品列表products=["iphone",6888],["MacPro",14800],["xiaomi",2499],["coffee",31],["book",60],["nike",699]i=0print("------商品列表-----")for product in products: i+=1 print("%d "%i,end="\t") for item in prod

2021-03-14 21:39:59 136

原创 Java判断一行字符中单词数最长的长度

判断一行字符中单词数最长的长度public static void main(String[] args){Scanner sc =new Scanner(System.in);String str=sc.nextLine();String ch[]=str.split(" ");int j=0;int a[]=new int[ch.length];for(int i=0;i<ch.length;i++){ a[j]=String.valueOf(ch[i]).length();

2021-01-15 17:02:12 373

原创 贪心法解决最小顶点覆盖

最小顶点覆盖:假如选了一个点就相当于覆盖了以它为端点的所有边,最小顶点覆盖就是选择最少的点来覆盖所有的边。贪心法思想:贪心法是只顾局部利益,由顶向下,一步一步做出贪心选择。抓住重点看它贪什么。在用贪心法解决最小顶点覆盖问题中,它贪的是覆盖的边最多的顶点。用邻接矩阵存储无向图,矩阵中每行的和即为顶点的出度。出度最多的顶点即为最优量度标准。最小顶点覆盖其一般特性:(1)找覆盖边最多的顶点(2)已选中的顶点和未选中的顶点(3)判断解函数,检查邻接矩阵中元素是否都为0,若不是则继续寻找顶点(4)如果已找

2020-12-10 19:08:37 6157 1

原创 代理模式(主要来自老杜的视频)

本来想依次复制来着但是工作量太大了,就直接截图了。直接上传资料好像过一段事件CSDN自动会收费。这些是我对代理模式的一些理解,主要就是代理中要干啥以及动态代理的那些主要类和方法(在我最后总的那个图中)。涉及到的反射知识还要自己去理解呀,推荐一个讲反射的博客吧代理(Proxy)是一种设计模式,提供了对目标对象另外的访问方式;即通过代理对象访问目标对象。这样做的好处是:1、(功能增强)可以在完成目标对象的调用时,附加一些额外的功能,这些额外的功能叫做功能增强;2、(控制访问)代理类不让客户类访问目标类,

2020-12-10 18:49:27 117 1

原创 Android学习笔记2

用于给当前的活动加载一个布局,一般会传入一个布局文件的id,(项目中添加任何资源都会在R文件中生成一个相应的资源的id

2020-11-30 17:55:48 54

原创 Android学习笔记(小白)

Android Studio布局学习笔记android:textSize指定文字的大小,用sp作为单位match_parent 让当前控件大小和父布局大小一样wrap_content 由控件内容决定当前控件的大小android:gravity 用于指定文字在控件中的对齐方式android:layout_gravity 指定控件在布局中的对齐方式android:orientition是指定排列方式(ps.如果排列方式是horizontal,内部控件就绝对不能将宽度指定为match_parent

2020-11-29 16:14:16 85

多元正态分布的验证以及部分阿帕奇代码

算是一个学习指引吧,方便你找资料,其中也有部分底层代码,以及计算协方差的代码,代码都是经过验算的。涉及多元正态分布验算的部分,可以去寻找一元正态分布验算的代码,从而从曲线图像上观测样本拟合程度

2020-11-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除