3 Britesun

尚未进行身份认证

暂无相关简介

等级
TA的排名 7w+

[编程工具篇]史上最简单的 IntelliJ IDEA 教程

史上最简单的IntelliJIDEA教程 前言IntelliJIDEA(简称IDEA),是Java语言开发的集成环境,IDEA在业界被公认为最好的Java开发工具之一,尤其在智能代码助手、代码自动提示、重构、J2EE支持、各类版本工具(Git、SVN、GitHub等)、JUnit、CVS整合、代码分析和创新的GU...

2019-04-16 21:23:55

[论文笔记]Representation Learning on Graphs: Methods and Applications

RepresentationLearningonNetwork网络表示学习笔记 EmbeddingNodesEncoder-decoderViewEncodingMethods1Factorizationbased2RandomWalkbased3DeepLearningbased...

2019-01-26 19:33:44

[Python] TypeError: 'set' object is not callable”解决方案

Pythonsetset()函数创建一个无序不重复元素集,可进行关系测试,删除重复数据,还可以计算交集、差集、并集等。注:set中无index今天读取两个文件合并,并去重。文件格式如下:下面程序在29行报错’set’objectisnotcallable(当前程序中注释掉的行),此错误表示您可能已将变量名称设置为set,如果这样做,则会覆盖内置函数集built-in就会报...

2019-01-23 16:32:47

[论文笔记]Graph Embedding Techniques, Applications, and Performance: A Survey

【论文笔记】GraphEmbeddingTechniques,Applications,andPerformance:ASurvey 这篇论文列举了目前graphembedding算法,将其分为“因式分解”、“随机游走”、“深度学习”三类,在不同的任务上评估其效果,最后提了点发展方向...

2019-01-22 15:35:40

[Kmeans 评价指标]标准化互信息NMI计算步骤及其Python实现

转载链接 标准化互信息NMI计算步骤及其Python实现 Excellenceisacontinuousprocessandnotanaccident.卓越是一个持续的过程而不是一个偶然事件.标准化互信息NMI计算步骤及其Python实现本文介绍其计算步骤和代码实现假设对于17个样本点(v1,v2,...,v17)(v...

2019-01-17 13:24:17

[分类问题的评估指标] Macro-F1和Micro-F1

分类问题的评估指标 在利用K_means聚类、LR、SVM分类,评估Embedding结果的好坏时,遇到如下代码,不理解当中micro_f1,macro_f1的含义,开此篇学习记录。defclassification(x,y,method='XGBoost'):x_train,x_valid...

2019-01-16 20:40:40

[Math]时间复杂度O(1)的离散采样算法—— Alias method/别名采样方法

关于AliasMethod的介绍的比较好的是一个外国Blog:Darts,Dice,andCoins:SamplingfromaDiscreteDistribution,以下的介绍也主要参考这篇Blog里的算法。问题:比如一个随机事件包含四种情况,每种情况发生的概率分别为:12,13,112,11212,13,112,112,问怎么用产生符合...

2019-01-15 20:06:05

基于meta-path的异质网络Embedding-metapath2vec

基于meta-path的异质网络Embedding-metapath2vec 转载自:https://blog.csdn.net/hy_jz/article/details/78877483metapath2vechttps://dl.acm.org/citation.cfm?id=3098036是17年发表的,使用基于meta-path...

2019-01-14 14:33:38

[shell 编程]几个基本知识点

开一贴篇,记录shell编程入门学习最近发现shell脚本真的很好用,可以节约很多跑实验的时间,so决定学习一哈。Shell脚本Shell脚本(shellscript),是一种为shell编写的程序。shell编程Java、PHP语言一样,需要有一个文本编辑器和一个能解释执行的脚本解释器。第一个shell程序Linux下vitest.sh,新建一个文件test.sh,扩...

2019-01-12 14:03:20

Word2Vec原理详解

Word2Vec原理详解 word2vec是Google于2013年开源推出的一个用于获取wordvector的工具包,它简单、高效,因此引起了很多人的关注。由于word2vec的作者TomasMikolov在两篇相关的论文[3,4]中并没有谈及太多算法细节,因而在一定程度上增加了这个工具包的神秘感。一些按捺不住的人于是选择了通过解...

2018-12-24 15:46:56

知识图谱技术综述

一.知识图谱技术综述知识图谱技术是人工智能技术的组成部分,其强大的语义处理和互联组织能力,为智能化信息应用提供了基础。以下内容涵盖了基本定义与架构、代表性知识图谱库、构建技术、开源库和典型应用。引言随着互联网的发展,网络数据内容呈现爆炸式增长的态势。由于互联网内容的大规模、异质多元、组织结构松散的特点,给人们有效获取信息和知识提出了挑战。知识图谱(...

2018-12-20 17:10:38

[Trans 系列之一]TransE算法(Translating Embedding)

TransE算法(TranslatingEmbedding) 一、引言    网络上已经存在了大量知识库(KBs),比如OpenCyc,WordNet,Freebase,Dbpedia等等。这些知识库是为了各种各样的目的建立的,因此很难用到其他系统上面。为了发挥知识库的图(graph)性,也...

2018-12-20 16:28:43

GBDT原理及利用GBDT构造新的特征-Python实现

GBDT原理及利用GBDT构造新的特征-Python实现 背景1GradientBoosting2GradientBoostingDecisionTree3GBDT应用-回归和分类GBDT构建新的特征思想GBDT与LR融合方案源码内容generateGBDTfeaturesgeneratefea...

2018-11-15 20:34:45

Arrays.copyOf() 的使用:

Arrays.copyOf()用法: Arrays的copyOf()方法传回的数组是新的数组对象,改变传回数组中的元素值,不会影响原来的数组。copyOf()的第二个自变量指定要建立的新数组长度,如果新数组的长度超过原数组的长度,则保留数组默认值,例如:代码块:importjava.util.Arrays;public...

2018-10-26 09:47:53

[牛客算法系列] BFPRT算法

BFPRT算法O(n)解决第k小的数我们通常会简单地进行一个快速排序后,得到第k个位置上的数字即可。我们都知道的是快速排序是个不稳定的排序,它的排序过程简单的理解主要是两个概念Partion,pivot(基准数)一趟快速排序的过程如下先从序列中选取一个数作为基准数将比这个数大的数全部放到它的右边,把小于或者等于它的数全部放到它的左边一趟快速排序也叫做Partion...

2018-10-13 16:09:46

LR的公式推导和过拟合问题解决方案

原文链接 Stanford机器学习课程笔记——LR的公式推导和过拟合问题解决方案    1.LogisticRegression  前面说的单变量线性回归模型和多变量线性回归模型,它们都是线性的回归模型。实际上,很多应用情况下,数据的模型不是一个简单的线性表示就可以搞定的...

2018-10-09 15:53:06

[面试笔试整理3]:项目问题准备

面试笔试整理5:项目问题准备 1、课题从目的->意义->难点->如何解决的->用了什么方法为什么要用这些方法->创新点。2、实习经历实习期间主要负责华为HC大会的推荐算法以及数据分析,用过SQLServer,制作过报表。3、自己曾经做过一些比赛,但是结果不是很好,不过还是准备写到简历里

2018-09-26 15:34:21

[面试笔试整理2]:机器学习面试问题准备(进阶)

面试笔试整理4:机器学习面试问题准备(进阶) 一、问题杂烩1、PCA的第二主成分第二个主成分时域第一成分方向正教的差异性次大方向。2、什么时候用组合的学习模型只有当各个模型之间没有相关性的时候组合起来是最好用的。但是一般来说,弱相关的模型组合比较好用。3、多重共线性多重共线性是指当两个特征的相关性很大的时候,会对参数模型...

2018-09-26 15:30:36

[面试笔试整理1]:深度学习机器学习面试问题准备(必会)

此系列三篇文章的原文链接 面试笔试整理1:深度学习机器学习面试问题准备(必会) 1、神经网络基础问题(1)Backpropagation(要能推倒)  后向传播是在求解损失函数L对参数w求导时候用到的方法,目的是通过链式法则对参数进行一层一层的求导。这里重点强调:要将参数进行随机初始化而不是全部置0,否则所有隐层的数值都会与输入相关...

2018-09-26 15:28:44

梯度消失问题与如何选择激活函数

梯度消失问题与如何选择激活函数什么是梯度消失?梯度消失有什么影响?是什么原因?解决方案有哪些?如何选择激活函数?1.什么是梯度消失?梯度消失,常常发生在用基于梯度的方法训练神经网络的过程中。当我们在做反向传播,计算损失函数对权重的梯度时,随着越向后传播,梯度变得越来越小,这就意味着在网络的前面一些层的神经元,会比后面的训练的要慢很多,甚至不会...

2018-09-23 16:32:44

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!