- 博客(38)
- 资源 (1)
- 收藏
- 关注
原创 图算法学习
背景毕业到现在也干了接近三年的帐号安全相关的工作了,个人觉得目前自己对业务安全中的安全工作有了全面的认识。基于此自己也尝试总结了一套业务安全地工作框架,从框架出发审视自身发现自己对于图算法相关的了解还是不够,所以计划集中的学习一下常见的图算法,扩宽自身的眼界目标重点了解社区发现相关算法以及背后的思想,主要是以下几个算法a. LPA算法b. fastUnfolding算法c. fraudar算法-稠密子图检测了解中心性算法a. 度中心性算法(Degree Centrality)b. 紧密中
2021-12-19 17:21:53 212
原创 GloVe: Global Vectors for Word Representation
Abstract本文分析了要想让向量的算术运算对词向量有意义,模型所具备的性质本文提出的模型结合了包含全局信息的因子分解和局部上下文窗口方法本文提出的方法通过只在word-word共现矩阵的的非零元素上训练,从而能够更加高效的利用统计信息Introduction两种主要的学习词向量方法类分别是:基于全局矩阵分解的方法(如:LSA),这些方法在word analogy任...
2018-07-25 21:07:36 525
原创 Distributed Representation of Words and Phrases and their Compositionality
AbstractSkip-gram模型是一个学习高质量的词分布向量表示的方法,这个向量可以捕获许多细微的语法和语义关系。在本文将提出一些策略用来提高训练的词向量的质量和提高训练速度。提出对高频词语进行下采样,加速训练过程和提高词向量质量(特别出现频率低的词)通过负采样替代层次softmax(能够提高高频率词汇的词向量质量)提出一个简单的从文本中发现短语,从而学习出短语向量的方法...
2018-07-24 23:42:42 1037
转载 Efficient Estimation of Word Representation in Vector Space
本文转载自Efficient Estimation of Word Representation in Vector SpaceAbstract本文提出两个新颖的模型,能够在更少的训练时间里对更多的语料库进行训练,同时所得到的词向量在词语的语法相似度任务以及语义相似度任务的度量中取得了state-of-the-art的结果Introduction之前的一些NLP系统,将利用...
2018-07-24 18:30:36 849
转载 配置Hexo使用Mathjax,以及开启访问统计和配置评论
本文转载自:xiholix博客1. 使用Kramed代替 Marked在工程目录下(即hexo init执行的那个目录下)执行以下命令安装Kramednpm uninstall hexo-renderer-marked --savenpm install hexo-renderer-kramed --save然后将/node_modules/hexo-renderer-k...
2018-07-23 20:56:24 954
原创 ubuntu下vscode配置c++的编译及调试环境
1. 安装cmake tools helper输入快捷键ctrl+p, 然后在弹出框中输入命令 ext install cpptools 然后选择cmake tools helper安装2. 项目配置输入快捷键ctrl+shift+D, 点击设置图标,弹出的选择中选C++(GDB/LLDB),会自动创建项目的launch.json文件。然后更改launch.json中的配置,主要...
2018-03-10 21:50:45 5182
原创 Ubuntu16.04安装mongodb
1. 在Ubuntu系统中导入mongodb官网的GPG key,使用命令如下:sudo apt-key adv --keyserver hkp://keyserver.ubuntu.com:80 --recv 0C49F3730359A14518585931BC711F9BA15703C6GPG 是GnuPG的缩写,GnuPG是加密软件PGP的开源替代版本 ref :GPG介绍2. 为mongo
2017-09-29 14:48:32 244
原创 python decorator的理解
1. python的decorator语法有两种等价形式,分别如下:第一种形式@dec2@dec1def func(arg1, arg2, ...): passThis is equivalent to:def func(arg1, arg2, ...): passfunc = dec2(dec1(func))第二种形式:@decomaker(argA, argB, ...
2017-05-20 18:21:15 477
原创 tensorflow中embedding_lookup, tf.gather以及tf.nn.embedding_lookup_sparse的理解
1. tf.nn.embedding_lookup()函数签名如下:embedding_lookup( params, ids, partition_strategy='mod', name=None, validate_indices=True, max_norm=None)参数说明:params参数是一些tensor组成的列表或者单个的tenso
2017-05-04 13:14:43 17850 2
原创 关于tensorflow的reading data的总结
本文主要是对tensorflow的官方教程reading data的总结。 1. 在tensorflow中有三种方法输入数据,分别是: 1. 在python程序中使用的run函数中使用feed_dict提供数据 2. 使用pipeline从文件中读取数据 3. 将数据预先载入到tensorflow的graph中,这种方式只适合数据集小的情况2. feeding方法一个feeding方
2017-03-28 22:33:27 3619
原创 tensorflow官方rnn教程的源码阅读总结
这篇教程的主要源代码在ptb_word_lm.py与reader.py两个文件中。教程对应的源代码的github仓库地址。数据下载地址,该教程需要的数据在该下载的文件解压后的data子目录下。该目录的内容如下图所示: 首先介绍reader.py文件的内容: reader.py文件由_reader_words、_builid_vocab、_file_to_word_id
2017-03-19 10:30:09 1474
原创 通过python操作mysql数据库
1. ubuntu下安装mysql-server在ubuntu16.04下通过命令sudo apt install mysql-server安装mysql服务器。然后为了让python练级数据库 然后通过pip工具安装mysql-connector。即在命令行界面输入:pip install mysql-connector。2. 连接数据库def test_connect(): co
2017-03-11 19:46:18 351
转载 编译安装升级gcc,ubuntu14.10可用
本文转载至:原文链接1. 下载最新版本gccgcc当前最新版本是5.2,下面是我找到的两个下载镜像,下载速度还可以,都可以使用:wget http://gcc.parentingamerica.com/releases/gcc-5.2.0/gcc-5.2.0.tar.bz2// 或wget http://ftp.tsukuba.wide.ad.jp/software/gcc
2017-02-28 07:54:14 663
原创 tensorflow中使用tensorboard可视化结果
1. 将数据与summary绑定在tensorflow中为了能够将数据显示出来,必须先将summary operation与数据关联起来,使得后面能够将这些数据写入 event files。因为tensorboard的可视化就是根据这些eventfiles的内容来可视化的。比较典型的两个summary operation是 scalar_summary()和histogram_summary(
2016-11-19 22:15:00 4320
原创 解决ubuntu16.04下默认快捷导致pycharm的alt+左键选取多行进行操作的功能的失效
1,打开终端,菜单-编辑-配置文件首选项-命令,勾上“以登录Shell方式运行命令”,重启终端。2,在终端输入 gsettings get org.gnome.desktop.wm.preferences mouse-button-modifier #查看“mouse-button-modifier”当前的值,应该是返回''。3,接着输入 gsettings set org.gnome.d
2016-11-19 20:58:42 4174
原创 ubuntu16.04通过修改transmission源码编译安装transmission,使得其能够通过ipv6在六维下载
1. 首先通过官网提供的github地址下载transmission-2.04.tar.xz 然后通过命令 xz -d transmission-2.04.tar.xztar -xvf trans*.tar进行解压2:首先更改metainfo.c中的内容static intis_rfc2396_alnum( char ch ){ re
2016-11-12 14:55:33 2358
原创 ubuntu16.04下cuda8.0以及tensorflow的配置所遇到的坑
昨天把自己的电脑重装了一下,然后在重新搭建tensorflow的GPU版本的过程中遇到了一些坑,所以写下此博文用来纪念自己这个陪ubuntu度过的光棍节。 对于ubuntu系统的安装就不在进行介绍了。 在安装完ubuntu系统后,我们首先需要安装nvidia的驱动。在这个过程中我遇到了一个大坑就是安装了cuda8.0自带的361的驱动。安装了这个驱动后直接导致了我的ubunut系统
2016-11-11 21:37:27 2924 2
原创 numpy.r_
numpy.r_是将一系列的序列合并到一个数组中,调用是要用中括号[],而不是()。 它有两种类型的参数,放在最前面的控制参数,已经后面逗号分开的要合并的序列。 控制参数其他的情况都很好理解,本文主要解释控制参数中包含了3个数的情况,第3个参数的作用。 其中第3个参数是用来控制后面序列的upgrade方式的,由于第二参数控制了最小的维度,后面的序列参数中可能需要一些维度提升才能进行合并。所以第
2016-10-06 09:44:21 7437 2
转载 Windows和Ubuntu双系统,修复UEFI引导的两种办法
编译自:http://linux.about.com/od/LinuxNewbieDesktopGuide/tp/3-Ways-To-Fix-The-UEFI-Bootloader-When-Dual-Booting-Windows-And-Ubuntu.htm作者: Gary Newell原创:LCTT https://linux.cn/article-4667-1.html译者:
2016-09-11 16:12:13 1425
转载 win10下配置theano的CUDA加速
本教程适合最初学习者,高手勿喷。原文地址:http://blog.csdn.net/niuwei22007/article/details/47684673经过一段时间的使用,建议安装python2.7,因为大部分的代码都是基于python2.7开发,如果安装python3.4的话,会有很多的语法问题,就是python3.x和python2.x在语法变量函数名上边进行了大的改动,如果基
2016-09-02 17:21:34 952
原创 pip ssl certificate verify failed
使用命令:pip install --index-url=http://pypi.python.org/simple/ --trusted-host pypi.python.org pythonPackage解决,其中的pythonPackage改为对应得库名,如scrapy
2016-09-02 17:15:41 4145 1
原创 CNN总结
CNN总结本次的博客内容来自对cs231n的Convolutional Neural Networks的总结,原始的博文链接是[github地址- 网络的层次的种类:convelutional layer:一般输入为3D(width*height*depth)的数据,输出一般也是一个三维数据。对于该层有stride、zero-padding、depth0三个超参数。该层次上利用一个指定的width
2016-08-21 22:16:39 389
原创 ubuntu下git的使用
本次的博客内容是对廖雪峰的git教程的集中,为了自己以后对于git命令的查询。git创建仓库 在对应的文件下使用命令git init即可查看仓库中的文件状态 git status比对文件的修改的命令 git diff 将文件加入暂存区命令 git add < filename> 也可使用 git add –a将所有的修改过的文件一次性提交要将修改真正的管理起来需要使用命令comm
2016-08-12 12:32:06 501 2
转载 欢迎使用CSDN-markdown编辑器(CSDN自动提供)
欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl
2016-08-12 10:27:47 335
原创 ubuntu16.04下对theano进行cuda配置
由于cuda7.5还没有支持ubuntu16.04,如果在ubuntu16.04上安装cuda7.5会出现各种问题,处理起来比较麻烦。一个简单的解决方法是安装cuda8.0。cuda8.0下载地址。cuda8.0目前需要先注册然后才能下载。在如下页面中我们选择runfile下载。 然后到该.sh文件所在的目录执行sudo sh cuda_8.0.27_linux.run 安装完毕后,再声明一下环
2016-08-09 11:08:35 794 3
原创 Theano scan
本次的博客内容是根据自己对theano的scan官方教程的总结。点击scan官方教程scan函数在theano中提供循环迭代。 scan的函数签名如下: theano.scan(fn, sequences=None, outputs_info=None, non_sequences=None, n_steps=None, truncate_gradient=-1, go_backward
2016-08-09 09:42:27 601 3
原创 160807
这周没有进行太多的学习,只能将今天刷的一个特别简单的leetcode题目 作为博客了。今天刷的题目是single num III。这个题目的具体描述在[leetcode](https://leetcode.com/problems/single-number-iii/) 题目的大致要求是寻找一个数组中两个不是成对出现的数字。除了这两个数字之外,题目中 其它数字都是保证数组中有成对的这样
2016-08-07 16:09:12 411 4
原创 java通过栈实现树的遍历
实现代码实现的语言解释实现代码package traversalTree;import java.util.*;import java.util.Scanner;class NodeType{ NodeType left, right; int value; public NodeType( int _value){ this.value = _value
2016-07-31 11:39:06 2488 1
原创 欢迎使用CSDN-markdown编辑器
Ensemble Learning目前的Ensemble Learning主要存在着三种类型分别是:bagging, boosting和stackingbagging是通过从训练集中抽样出一些样本来训练各个基分类器。如果基分类器的相关程度较高将会导致Ensemble的效果降低,所以在bagging的时候需要尽量保证随机抽取的训练样本的差距较大。在随机抽样的时候既可以从训练样本中随机的抽取出实例加入
2016-07-24 16:46:40 466 1
转载 Scrapy爬虫:代理IP配置
Scrapy设置代理IP步骤:1、在Scrapy工程下新建"middlewares.py":?12345678910111213import base64 # Start your middleware classc
2016-04-20 14:47:13 5920
转载 hadoop学习之hadoop完全分布式集群安装
Hadoop2.6版本集群环境搭建[日期:2015-01-08]来源:Linux社区 作者:stark_summer[字体:大 中 小]一、环境说明1、机器:一台物理机 和一台虚拟机2、linux版本:[spark@S1PA11 ~]$ cat /etc/issueRed Hat Enterprise Linux Server r
2016-04-06 17:45:08 501
转载 Java 中InputStream与Reader的区别
java.io下面有两个抽象类:InputStream和ReaderInputStream是表示字节输入流的所有类的超类Reader是用于读取字符流的抽象类InputStream提供的是字节流的读取,而非文本读取,这是和Reader类的根本区别。即用Reader读取出来的是char数组或者String ,使用InputStream读取出来的是byte数组。弄清了两个超类的根本区
2016-03-28 22:53:24 248
转载 Json 和 Jsonlib 的使用
什么是 JsonJSON(JvaScript Object Notation)(官网网站:http://www.json.org/)是 一种轻量级的数据交换格式。 易于人阅读和编写。同时也易于机器解析和生成。它基于 JavaScript Programming Language, Standard ECMA-262 3rd Edition - December 1999 的一个子集。
2016-03-24 16:11:09 316
转载 matplotlib画图
5 matplotlib-绘制精美的图表matplotlib 是python最著名的绘图库,它提供了一整套和matlab相似的命令API,十分适合交互式地进行制图。而且也可以方便地将它作为绘图控件,嵌入GUI应用程序中。它的文档相当完备,并且 Gallery页面 中有上百幅缩略图,打开之后都有源程序。因此如果你需要绘制某种类型的图,只需要在这个页面中浏览/复制/粘贴一下,基本上都能
2016-03-23 19:26:58 680
转载 java流
装载自 http://www.runoob.com/java/java-files-io.htmlJava 流(Stream)、文件(File)和IOJava.io包几乎包含了所有操作输入、输出需要的类。所有这些流类代表了输入源和输出目标。Java.io包中的流支持很多种格式,比如:基本类型、对象、本地化字符集等等。一个流可以理解为一个数据的序列。输入流表示
2016-03-19 18:42:46 276
转载 损失函数(Loss Function) -1
损失函数(Loss Function) -1http://www.ics.uci.edu/~dramanan/teaching/ics273a_winter08/lectures/lecture14.pdfLoss Function损失函数可以看做 误差部分(loss term) + 正则化部分(regularization term)1
2016-01-29 18:42:34 701
转载 机器学习中的规则化范数(L0, L1, L2, 核范数)
机器学习中的规则化范数(L0, L1, L2, 核范数)目录:一、L0,L1范数二、L2范数三、核范数 今天我们聊聊机器学习中出现的非常频繁的问题:过拟合与规则化。我们先简单的来理解下常用的L0、L1、L2和核范数规则化。最后聊下规则化项参数的选择问题。这里因为篇幅比较庞大,为了不吓到大家,我将这个五个部分分成两篇博文。知识有限,以下都是我一些浅显的看法
2016-01-28 20:40:52 635
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人