Britesun-CSDN博客

转载 [编程工具篇]史上最简单的 IntelliJ IDEA 教程

史上最简单的 IntelliJ IDEA 教程前言IntelliJ IDEA（简称 IDEA），是 Java 语言开发的集成环境，IDEA 在业界被公认为最好的 Java 开发工具之一，尤其在智能代码助手、代码自动提示、重构、J2EE 支持、各类版本工具（Git、SVN、GitHub 等）、JUnit、CVS 整合、代码分析和创新的 GU...

2019-04-16 21:23:55 400

翻译 [论文笔记]Representation Learning on Graphs: Methods and Applications

Representation Learning on Network 网络表示学习笔记 Embedding NodesEncoder-decoder ViewEncoding Methods1 Factorization based2 Random Walk based3 Deep Learning based...

2019-01-26 19:33:44 3646 1

原创 [Python] TypeError: 'set' object is not callable”解决方案

Python setset() 函数创建一个无序不重复元素集，可进行关系测试，删除重复数据，还可以计算交集、差集、并集等。注：set中无index今天读取两个文件合并，并去重。文件格式如下：下面程序在29行报错’set’ object is not callable（当前程序中注释掉的行），此错误表示您可能已将变量名称设置为set，如果这样做，则会覆盖内置函数集 built-in就会报...

2019-01-23 16:32:47 23447

翻译 [论文笔记]Graph Embedding Techniques, Applications, and Performance: A Survey

【论文笔记】Graph Embedding Techniques, Applications, and Performance: A Survey 这篇论文列举了目前graph embedding算法，将其分为“因式分解”、“随机游走”、“深度学习”三类，在不同的任务上评估其效果，最后提了点发展方向...

2019-01-22 15:35:40 587

转载 [Kmeans 评价指标]标准化互信息NMI计算步骤及其Python实现

转载链接标准化互信息NMI计算步骤及其Python实现 Excellence is a continuous process and not an accident.卓越是一个持续的过程而不是一个偶然事件.标准化互信息NMI计算步骤及其Python实现本文介绍其计算步骤和代码实现假设对于17个样本点(v1,v2,...,v17)(v...

2019-01-17 13:24:17 5326

原创 [分类问题的评估指标] Macro-F1和Micro-F1

分类问题的评估指标在利用K_means 聚类、LR、SVM 分类，评估Embedding 结果的好坏时，遇到如下代码，不理解当中 micro_f1，macro_f1 的含义，开此篇学习记录。 def classification(x, y, method='XGBoost'): x_train, x_valid...

2019-01-16 20:40:40 10874 1

转载 [Math]时间复杂度O(1)的离散采样算法—— Alias method/别名采样方法

关于Alias Method的介绍的比较好的是一个外国Blog：Darts, Dice, and Coins: Sampling from a Discrete Distribution，以下的介绍也主要参考这篇Blog里的算法。问题：比如一个随机事件包含四种情况，每种情况发生的概率分别为： 12,13,112,11212,13,112,112，问怎么用产生符合...

2019-01-15 20:06:05 720

转载基于meta-path的异质网络Embedding-metapath2vec

基于meta-path的异质网络Embedding-metapath2vec 转载自：https://blog.csdn.net/hy_jz/article/details/78877483metapath2vec https://dl.acm.org/citation.cfm?id=3098036是17年发表的，使用基于meta－path...

2019-01-14 14:33:38 2037

原创 [shell 编程]几个基本知识点

开一贴篇，记录shell编程入门学习最近发现shell脚本真的很好用，可以节约很多跑实验的时间，so决定学习一哈。Shell 脚本Shell 脚本（shell script),是一种为shell编写的程序。shell 编程Java 、PHP语言一样，需要有一个文本编辑器和一个能解释执行的脚本解释器。第一个shell程序Linux 下 vi test.sh，新建一个文件test.sh, 扩...

2019-01-12 14:03:20 183

转载 Word2Vec原理详解

Word2Vec原理详解 word2vec 是 Google 于 2013 年开源推出的一个用于获取 word vector 的工具包，它简单、高效，因此引起了很多人的关注。由于 word2vec 的作者 Tomas Mikolov 在两篇相关的论文 [3,4] 中并没有谈及太多算法细节，因而在一定程度上增加了这个工具包的神秘感。一些按捺不住的人于是选择了通过解...

2018-12-24 15:46:56 200

原创知识图谱技术综述

一.知识图谱技术综述知识图谱技术是人工智能技术的组成部分，其强大的语义处理和互联组织能力，为智能化信息应用提供了基础。以下内容涵盖了基本定义与架构、代表性知识图谱库、构建技术、开源库和典型应用。引言随着互联网的发展，网络数据内容呈现爆炸式增长的态势。由于互联网内容的大规模、异质多元、组织结构松散的特点，给人们有效获取信息和知识提出了挑战。知识图谱（...

2018-12-20 17:10:38 7062 1

翻译 [Trans 系列之一]TransE算法（Translating Embedding）

TransE算法（Translating Embedding）一、引言&nbsp; &nbsp; &nbsp; &nbsp;网络上已经存在了大量知识库（KBs），比如OpenCyc，WordNet，Freebase，Dbpedia等等。这些知识库是为了各种各样的目的建立的，因此很难用到其他系统上面。为了发挥知识库的图（graph）性，也...

2018-12-20 16:28:43 1916

原创 GBDT原理及利用GBDT构造新的特征-Python实现

GBDT原理及利用GBDT构造新的特征-Python实现背景1 Gradient Boosting2 Gradient Boosting Decision Tree3 GBDT应用-回归和分类GBDT构建新的特征思想GBDT与LR融合方案源码内容generate GBDT featuresgenerate fea...

2018-11-15 20:34:45 518

原创 Arrays.copyOf() 的使用：

Arrays.copyOf() 用法： Arrays的copyOf()方法传回的数组是新的数组对象，改变传回数组中的元素值，不会影响原来的数组。copyOf()的第二个自变量指定要建立的新数组长度，如果新数组的长度超过原数组的长度，则保留数组默认值，例如：代码块：import java.util.Arrays;public...

2018-10-26 09:47:53 15000 1

原创 [牛客算法系列] BFPRT算法

BFPRT算法O(n)解决第k小的数我们通常会简单地进行一个快速排序后，得到第k个位置上的数字即可。我们都知道的是快速排序是个不稳定的排序，它的排序过程简单的理解主要是两个概念Partion,pivot(基准数)一趟快速排序的过程如下先从序列中选取一个数作为基准数将比这个数大的数全部放到它的右边，把小于或者等于它的数全部放到它的左边一趟快速排序也叫做Partion...

2018-10-13 16:09:46 1711

转载 LR的公式推导和过拟合问题解决方案

原文链接 Stanford机器学习课程笔记——LR的公式推导和过拟合问题解决方案     1. Logistic Regression    前面说的单变量线性回归模型和多变量线性回归模型，它们都是线性的回归模型。实际上，很多应用情况下，数据的模型不是一个简单的线性表示就可以搞定的...

2018-10-09 15:53:06 1434

转载 [面试笔试整理3]：项目问题准备

面试笔试整理5：项目问题准备 1、课题从目的 -&amp;gt; 意义 -&amp;gt; 难点 -&amp;gt; 如何解决的 -&amp;gt; 用了什么方法为什么要用这些方法 -&amp;gt; 创新点。 2、实习经历实习期间主要负责华为HC大会的推荐算法以及数据分析，用过SQL Server，制作过报表。 3、自己曾经做过一些比赛，但是结果不是很好，不过还是准备写到简历里

2018-09-26 15:34:21 269

转载 [面试笔试整理2]：机器学习面试问题准备（进阶）

面试笔试整理4：机器学习面试问题准备（进阶）一、问题杂烩1、PCA的第二主成分第二个主成分时域第一成分方向正教的差异性次大方向。 2、什么时候用组合的学习模型只有当各个模型之间没有相关性的时候组合起来是最好用的。但是一般来说，弱相关的模型组合比较好用。 3、多重共线性多重共线性是指当两个特征的相关性很大的时候，会对参数模型...

2018-09-26 15:30:36 445

转载 [面试笔试整理1]：深度学习机器学习面试问题准备（必会）

此系列三篇文章的原文链接面试笔试整理1：深度学习机器学习面试问题准备（必会） 1、神经网络基础问题（1）Backpropagation（要能推倒）　　后向传播是在求解损失函数L对参数w求导时候用到的方法，目的是通过链式法则对参数进行一层一层的求导。这里重点强调：要将参数进行随机初始化而不是全部置0，否则所有隐层的数值都会与输入相关...

2018-09-26 15:28:44 401

转载梯度消失问题与如何选择激活函数

梯度消失问题与如何选择激活函数什么是梯度消失？梯度消失有什么影响？是什么原因？解决方案有哪些？如何选择激活函数？1. 什么是梯度消失？梯度消失，常常发生在用基于梯度的方法训练神经网络的过程中。当我们在做反向传播，计算损失函数对权重的梯度时，随着越向后传播，梯度变得越来越小，这就意味着在网络的前面一些层的神经元，会比后面的训练的要慢很多，甚至不会...

2018-09-23 16:32:44 327

原创 [LeetCode] Spiral Matrix II 螺旋矩阵之二

题目Given an integer n, generate a square matrix filled with elements from 1 to n2 in spiral order.For example,Given n = 3,You should return the following matrix:[[ 1, 2, 3 ],[ 8, 9, 4 ],[...

2018-09-21 09:48:02 129

原创 Tensorflow在训练模型的时候如何指定GPU进行训练

tensorflow在训练模型的时候如何指定GPU进行训练实验室共用一个深度学习服务器，两块GPU,在用tensorflow训练深度学习模型的时候，假设我们在训练之前没有指定GPU来进行训练，则默认的是选用第0块GPU来训练我们的模型，而且其它几块GPU的也会显示被占用。有些时候，我们更希望可以通过自己指定一块或者几块GPU来训练我们的模型，而不是用这种默认的方法。接下来将简单介绍两种简单的方法...

2018-09-20 15:25:18 14019 5

原创 [LeetCode] Largest Plus Sign 最大的加型符号

题目In a 2D grid from (0, 0) to (N-1, N-1), every cell contains a 1, except those cells in the given list mines which are 0. What is the largest axis-aligned plus sign of 1s contained in the grid? Re...

2018-09-13 14:39:51 183

翻译 [Deep Learning 译文] LeCun、Bengio和Hinton三大牛的联合综述（下）

【翻译】本文为该综述文章中文译文的下半部分，详细介绍了CNN、分布式特征表示、RNN及其不同的应用，并对深度学习技术的未来发展进行展望。接上文：[Deep Learning 译文] LeCun、Bengio和Hinton三大牛的联合综述（上）卷积神经网络卷积神经网络被设计用来处理到多维数组数据的，比如一个有3个包含了像素值2-D图像组合成的一个具有3个颜色通道的...

2018-09-11 16:03:56 2190

翻译 [Deep Learning 译文] LeCun、Bengio和Hinton三大牛的联合综述（上）

英文原文链接：Deep Learning 三大牛人联合综述译文下篇链接：[Deep Learning 译文] LeCun、Bengio和Hinton三大牛的联合综述（下）【翻译】本文为该综述文章中文译文的上半部分，深入浅出地介绍了深度学习的基本原理和核心优势。原文摘要：深度学习可以让那些拥有多个处理层的计算模型来学习具有多层次抽象的数据的表示。这些方法...

2018-09-11 15:56:42 1444

原创 [LeetCode] Unique Binary Search Trees 独一无二的二叉搜索树

题目 Given&amp;nbsp;n, how many structurally unique&amp;nbsp;BST’s&amp;nbsp;(binary search trees) that store values 1…n?For example,Given&amp;nbsp;n&amp;nbsp;= 3, the

2018-09-11 09:44:13 110

转载计算机视觉四大基本任务(分类、定位、检测、分割)

计算机视觉四大基本任务(分类、定位、检测、分割)深度学习目前已成为发展最快、最令人兴奋的机器学习领域之一，许多卓有建树的论文已经发表，而且已有很多高质量的开源深度学习框架可供使用。然而，论文通常非常简明扼要并假设读者已对深度学习有相当的理解，这使得初学者经常卡在一些概念的理解上，读论文似懂非懂，十分吃力。另一方面，即使有了简单易用的深度学习框架，如果对深度学习常见概念和基本思路不了解，面对现实任务...

2018-09-10 18:00:20 17256

转载 [目标检测算法] 从R-CNN、Fast R-CNN、Faster R-CNN、R-FCN 到 FPN

「目标检测算法」从Faster R-CNN 、 R-FCN 到 FPN ...

2018-09-10 15:13:24 602

原创 [LeetCode] Combination Sum IV 组合之和之四

题目Given an integer array with all positive numbers and no duplicates, find the number of possible combinations that add up to a positive integer target.Example: nums = [1, 2, 3] target = 4 The...

2018-09-10 10:53:38 233

转载图像处理之特征提取

图像处理之特征提取知乎上看到一个话题——目前火热的 Deep Learning 会灭绝传统的 SIFT / SURF 特征提取方法吗？由于之前研究过SIFT和HOG这两种传统的特征提取方法，故本篇文章先对SIFT和HOG作一综述，并比较二者优缺点。之后，将SIFT和HOG同神经网络特征...

2018-09-04 16:10:04 20137

原创 [LeetCode] Longest Palindromic Subsequence 最长回文子序列

题目Given a string s, find the longest palindromic subsequence’s length in s. You may assume that the maximum length of s is 1000.Example 1: Input: “bbbab” Output: 4 One possible longest palin...

2018-09-04 14:04:24 100 1

转载从线性分类器到卷积神经网络

从线性分类器到卷积神经网络前言本文大致分成两大部分，第一部分尝试将本文涉及的分类器统一到神经元类模型中，第二部分阐述卷积神经网络（CNN）的发展简述和目前的相关工作。本文涉及的分类器（分类方法）有：线性回归逻辑回归（即神经元模型）神经网络（NN）支持向量机（SVM）卷积神经网络（CN...

2018-09-03 14:54:43 3092

原创 [LeetCode] Target Sum 目标和

题目You are given a list of non-negative integers, a1, a2, …, an, and a target, S. Now you have 2 symbols + and -. For each integer, you should choose one from + and - as its new symbol. Find out ho...

2018-09-02 14:23:26 377

原创 [LeetCode] Predict the Winner 预测赢家

题目Given an array of scores that are non-negative integers. Player 1 picks one of the numbers from either end of the array followed by the player 2 and then player 1 and so on. Each time a player pic...

2018-08-30 11:18:35 293

转载神经网络训练中的Tricks之高效BP（反向传播算法）

神经网络训练中的Tricks之高效BP（反向传播算法）         ...

2018-08-29 16:39:02 623

转载 MIT最新算法，双向传播比BP快25倍深度学习

MIT最新算法，双向传播比BP快25倍深度学习 ...

2018-08-29 15:26:33 686

原创 [LeetCode] Shopping Offers 购物优惠

题目In LeetCode Store, there are some kinds of items to sell. Each item has a price.However, there are some special offers, and a special offer consists of one or more different kinds of items with ...

2018-08-29 14:56:18 528

转载 BP算法与公式推导

BP算法与公式推导 ...

2018-08-27 17:00:15 1474

转载深度学习笔记1(卷积神经网络)

...

2018-08-27 16:58:11 484

转载梯度下降算法分类总结

梯度下降算法分类总结引言  梯度下降法 (Gradient Descent Algorithm，GD) 是为目标函数J(θ)，如代价函数(cost function), 求解全局最小值（Global Minimum）的一种迭代算法。为什么...

2018-08-27 15:41:23 7118 1

空空如也

空空如也