misite_J-CSDN博客

原创 CCF推荐期刊/会议历年发表论文数据库：CCF Rec-Paper DB

CCF推荐期刊/会议历年发表的论文数据库，包含数据库构建、数据库检索、数据库更新功能。

2022-03-22 19:37:28 1884

原创 win10下CUDA、cudnn以及pytorch的安装更新

文章目录查看自己电脑支持的cuda信息cuda toolkits与cuda drivernvidia-smi与nvcc -Vdriver API与runtime API下载CUDA和cuDNNpytorch与cuda版本对应cuda与cudnn版本对应安装CUDA和cudnnCUDAcudnn环境变量配置安装完成后的验证CUDA多版本切换下载并安装Pytorchpytorch1.8.2 GPU版安装检查PyTorch GPU版本是否安装成功参考前言：“升级至cuda不需要将老的cuda版本手动卸载”，在安

2021-08-27 23:22:09 4108

原创（Datawhale）Java Task04：面向对象编程基础

文章目录面向对象概述类与对象成员变量成员方法构造方法this关键字static 关键字静态变量静态方法静态代码块类的主方法继承与多态继承继承类型继承关键字implementssuper与thisfinal继承的特性多态多态的转型参考资料# 类与方法面向对象概述面向机器语言计算机处理信息的早期语言是所谓的机器语言，使用机器语言进行程序设计需要面向机器来编写代码，即需要针对不同的机器编写诸如0101 1100这样的指令序列。面向过程语言随着计算机硬件功能的提高，在20世纪60年代出现了面向

2021-07-19 23:18:50 482

原创（Datawhale）Java Task03：Java数组

文章目录数组的概念数组的定义数组的初始化数组下标的有效范围与常见异常数组内存分析二维数组创建二维数组二维数组的赋值多维数组不规则数组数组的基本操作数组遍历填充和替换数组元素参考资料数组的概念数组是一种用于存储数据的方式，使用一组连续的存储空间来存储多个相同数据类型的值，也就是说，数组是同一种类型数据的集合。特点：类型相同，长度固定，数组中的元素从0开始编号。数组的定义数组的创建：元素类型[] 数组名 = new 元素类型[元素个数或数组长度];eg：int[] arr = new int[3

2021-07-17 00:32:26 200 1

原创（Datawhale）Java Task02：初识Java语言基础

文章目录Java程序的基本结构运算符和表达式数学函数与常量结合赋值和运算符自增与自减运算符关系和boolean运算符位运算符括号与运算符级别控制流程条件语句循环语句`while`循环语句`for`循环语句中断控制流程语句多重选择：switch语句参考资料Java程序的基本结构//java程序结构package test; //定义包，必须是小写字母，多个单词用.隔开import java.util.Scanner; //java API 一定在当前库中存在public class Test

2021-07-16 01:29:29 150 1

原创（Datawhale）Java Task01：Java简介与环境配置

Java简介Java是一门面向对象编程语言，不仅吸收了C++语言的各种优点，还摒弃了C++里难以理解的多继承、指针等概念，因此Java语言具有功能强大和简单易用两个特征。Java语言作为静态面向对象编程语言的代表，极好地实现了面向对象理论，允许程序员以优雅的思维方式进行复杂的编程。Java特性1.简单性Java看起来设计得很像C++，但是为了使语言小和容易熟悉，设计者们把C++语言中许多可用的特征去掉了，这些特征是一般程序员很少使用的。例如，Java不支持go to语句，代之以提供break和con

2021-07-13 16:41:43 332

原创（DataWhale）图深度学习Task08：总结

ＧＮＮ背景欧几里得空间的数据满足平移不变性和局部可连通性等特点，适用CNN、RNN等传统深度学习模型。图是一种更广泛的数据，且非欧几里得数据，研究图神经网络极有必要。图数据的特征：节点的不均匀分布排列不变性边的额外属性图神经网络的挑战：图数据的不规则性图结构的多样性图数据的大规模性图研究的跨领域性典型图神经网络GCN：每个节点的卷积操作可以看作一阶邻居节点之间的消息传递；GAT：利用注意力机制来定义图卷积；MPNN：将空域图神经网络统一成消息传递方式；GraphSAGE

2021-07-10 21:43:32 134

原创（DataWhale）图神经网络Task07：按需加载样本到内存的数据集类

文章目录简单数据导入依赖`torch_geometric.data.Data`, `DataLoader`的数据导入依赖`torch_geometric.data.Data`, `Batch`的批次导入自定义数据导入继承`Dataset`基类的自定义数据集类图样本封装成批（BATCHING）小图的属性增值与拼接图的匹配（Pairs of Graphs）二部图（Bipartite Graphs）在新的维度上做拼接超大规模数据集类实践参考背景：当数据集规模超级大，很难在内存中完全存下所有数据，因此要按需将数据

2021-07-10 00:00:28 443

原创（DataWhale）图神经网络Task06：基于图神经网络的图表征学习

文章目录背景Weisfeiler-Lehman Test (WL Test)Weisfeiler-Leman Test 算法实例WL Subtree Kernel：图相似性衡量图同构网络图表征学习方法简介图同构网络基本思路图同构网络的实现`GINConv`--图同构卷积层`BondEncoder`与`AtomEncoder`基于图同构网络的节点嵌入模块（GINNodeEmbedding Module）基于图同构网络的图表征模块（GINGraphRepr Module）参考背景Weisfeiler-Leh

2021-07-03 19:36:12 405 2

原创（DataWhale）图神经网络Task05：超大图上的节点表征学习

文章目录背景Cluster-GCN方法简介基本方法Cluster-GCN改进：随机多簇法扩展：深层GCN的设计与训练Cluster-GCN实践数据集采集与预处理Cluster-GCN的构建、训练与测试参考背景图神经网络的局限性：训练效率与可扩展性。基于SGD的图神经网络的训练方法，随着图神经网络层数增加，计算成本呈指数增长；保存整个图的信息和每一层每个节点的表征到内存（显存）而消耗巨大内存（显存）空间；“邻居爆炸（Neighbor Explosion）”：在信息传递网络中，每一层的都需

2021-07-02 01:49:22 166 1

原创（Datawhale）图神经网络Task04：数据完全存储于内存的数据集类+节点预测与边预测实践

文章目录数据完整存储于内存的数据集类构造PyG规定的使用数据的一般过程`InMemoryDataset`基类继承`InMemoryDataset`的数据集构造实例基于节点表征的节点预测和边预测实践节点预测边预测Cora数据集预处理边预测图神经网络参考数据完整存储于内存的数据集类构造PyG规定的使用数据的一般过程从网络上下载数据原始文件；对数据原始文件做处理，为每一个图样本生成一个**Data对象**；对每一个Data对象执行数据处理，使其转换成新的Data对象；过滤Data对象；保存Data

2021-06-28 00:10:43 471 1

原创（DataWhale）图神经网络Task03：基于图神经网络GCN/GAT的节点表征与分类

文章目录Cora数据集的准备与分析TSNE可视化节点表征分布图节点分类模型实现与对比（MLP vs. GCN vs. GAT）MLP分类模型GCN分类模型GAT分类模型结果比较与分析参考Cora数据集的准备与分析Cora是一个机器学习论文数据集，其中共有7个类别（num_classes：基于案例、遗传算法、神经网络、概率方法、强化学习、规则学习、理论。整个数据集中共有2708篇论文（num_nodes），在词干堵塞和去除词尾后，只剩下1433个独特的单词（num_node_features）,文档频

2021-06-24 01:53:11 1152 2

原创（DataWhale）图神经网络Task02：消息传递图神经网络

文章目录消息传递范式MessagePassingPyG`MessagePassing`基类初识与子类实例MP基类MP子类实例PyG`MessagePassing`自定义函数`message、aggregate、message_and_aggregate、update`覆写示例作业2消息传递范式MessagePassing领域聚合节点更新xi(k)=γ(k)(xi(k−1),□j∈N(i) ϕ(k)(xi(k−1),xj(k−1),ej,i))\mathbf{x}_i^{(k)} = \gamm

2021-06-20 00:56:37 298

原创（DataWhale）图神经网络Task01：基于PyG包的图数据的表示与使用

文章目录PyG`Data`类初识`graph_data`对象的创建：`graph_data`实例初探PyG`Dataset`类初识内置数据集（Cora）的下载作业1PyGData类初识graph_data对象的创建：通过torch_geometric.data.Data构造函数，即graph_data = Data(x=x, edge_index=edge_index, edge_attr=edge_attr, y=y, num_nodes=num_nodes, other_attr=other_a

2021-06-15 22:33:12 482 6

原创 OCR识别扫描版PDF文件（Python版）

文章目录概述扫描版PDF文字识别Tesseract OCR实现pdf文本识别tesseract-ocr安装与测试python实现基于tesseract的pdf文本识别百度 OCR实现pdf文本识别准备python实现基于百度OCR的pdf文本识别参考概述本文识别扫描版PDF文件（不是文字版）基本原理基于OCR识别。若要处理文字版OCR，百度pdfminer或pdfplumder等使用即可。依赖：应用程序tesseract-ocr https://digi.bib.uni-mannheim.de/

2021-01-19 22:55:19 12158 6

原创 ChiMerge算法：卡方检验+ChiMerge+Python

文章目录卡方分布与卡方检验卡方分布卡方χ2\chi^{2}χ2检验Python实现ChiMerge算法算法原理Python实现参考卡方分布与卡方检验卡方分布定义若n个相互独立的随机变量ξ1,ξ2,…,ξn\xi_{1},\xi_{2},\dots,\xi_{n}ξ1,ξ2,…,ξn均服从标准正态分布，则这n个服从标准正态分布的随机变量的平方和Q=∑i=1nξi2Q=\sum_{i=1}^{n}\xi_{i}^{2}Q=∑i=1nξi2 构成一个新的随机变量，其分布规律称为χ2\chi_

2021-01-06 17:04:10 1170 2

原创 PageRank求解（networkx & gephi）

文章目录PageRank求解（networkx & gephi）networkx基本操作Geophi基本操作利用Sigma.js插件把图形导出到HTMLnetworkx的pagerank比较参考PageRank求解（networkx & gephi）networkx基本操作import networkx as nxG = nx.Graph() # 创建空图G.add_node(1, time='5pm') # 添加节点，并赋节点属性G.add_edge(1, 2, weight

2020-12-25 17:46:08 2209 2

原创 (NER经典之作BiLSTM-CRF解读)Bidirectional LSTM-CRF Models for Sequence Tagging

NER经典之作，2015年提出的BiLSTM-CRF序列标注模型解读。文章目录AbstractIntroductionModelsTraining procedureExperimentsDataFeaturesResultsAbstract论文以LSTM为基础，对比LSTM、BiLSTM、CRF、LSTM-CRF和BiLSTM-CRF一系列序列标注模型，实验对比表明BiLSTM-CRF模型在序列标注任务中的极大优势（该模型在后续几年成为NER任务的标杆，几乎知道NER任务的人都有听说过BiLST.

2020-10-27 09:07:22 2278

原创命名实体识别（NER）：BiLSTM-CRF原理介绍+Pytorch_Tutorial代码解析

本文较全面的介绍了命名实体识别（NER），包括NER定义、BiLSTM-CRF模型、Pytorch代码实现，未来将继续完善本文，以求涵盖NER众多方面。文章目录命名实体识别任务（NER）定义BiLSTM-CRF模型模型输入LSTMCRF真实路径得分所有路径得分Pytorch Tutorial NER代码解析#TODO参考命名实体识别任务（NER）定义命名实体识别属于自然语言处理中的序列标注任务，是指从文本中识别出特定命名指向的词，比如人名、地名和组织机构名等。具体而言，输入自然语言序列，给出对应.

2020-10-12 20:59:52 26293 10

原创 350. 两个数组的交集 II(python)

问题描述350. 两个数组的交集 II 给定两个数组，编写一个函数来计算它们的交集。示例 1：输入：nums1 = [1,2,2,1], nums2 = [2,2]输出：[2,2]示例 2:输入：nums1 = [4,9,5], nums2 = [9,4,9,8,4]输出：[4,9]说明：输出结果中每个元素出现的次数，应与元素在两个数组中出现次数的最小值一致。我们可以不考虑输出结果的顺序。问题分析直接的想法是：遍历数组1，查看是否含于数组2，如果是的话，删除数组2中的该元素

2020-07-13 21:02:44 287

原创 Leecode147.地下城游戏(python)

问题描述174. 地下城游戏一些恶魔抓住了公主（P）并将她关在了地下城的右下角。地下城是由 M x N 个房间组成的二维网格。我们英勇的骑士（K）最初被安置在左上角的房间里，他必须穿过地下城并通过对抗恶魔来拯救公主。骑士的初始健康点数为一个正整数。如果他的健康点数在某一时刻降至 0 或以下，他会立即死亡。有些房间由恶魔守卫，因此骑士在进入这些房间时会失去健康点数（若房间里的值为负整数，则表示骑士将损失健康点数）；其他房间要么是空的（房间里的值为 0），要么包含增加骑士健康点数的魔法球（若房间里

2020-07-13 19:13:20 254

原创 Daily Paper 004: Two Forms of Knowledge Representations in the Human Brain

作者通过先天性盲人和普通人对颜色的认知，判断得出人脑存在基于感官体验以及语言和认知推理的两种知识。DOI：https://doi.org/10.1016/j.neuron.2020.04.010导言“玫瑰花是红色的”，你有想过这样关于颜色的知识究竟存储在大脑何处吗？过去有两种观点：一种认为这样的知识来源于感官经验，存储在感觉联想皮层sensory association cortices；另一种则认为这些知识不单来自感官，而是经过加工，在an abstract conceptual level存.

2020-06-23 22:40:27 326

原创 transformers库学习笔记（一）：安装与测试

印象中觉得transformers是一个庞然大物，但实际接触后，却是极其友好，感谢huggingface大神。原文见tmylla.github.io。安装我的版本号：python 3.6.9；pytorch 1.0；CUDA 10.0。pip install transformerspip之前确保安装1.1.0+。测试验证代码与结果python -c "from transformers import pipeline; print(pipeline('sentiment-an.

2020-06-21 11:57:17 5767 7

原创 Python下载网络图片方法汇总与实现：含正则，BeautifuSoup及动态爬虫

本文介绍下载python下载网络图片的方法，包括通过图片url直接下载、通过re/beautifulSoup解析html下载以及对动态网页的处理等。原文见tmylla.github.io通过pic_url单个/批量下载已知图片url，例如http://xyz.com/series-*(1,2…N).jpg，共N张图片，其链接形式较为固定，这样经简单循环，直接通过`f.write(requests.get(url).content)'即可以二进制形式将图片写入。import osimport re.

2020-06-18 23:19:35 697

知识图谱发展报告（2018）思维导图（仅含.xmind文件）

《知识图谱发展报告（2018）》思维导图

空空如也