自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(109)
  • 资源 (2)
  • 收藏
  • 关注

原创 《神经网络与深度学习》编程笔记

小白学习神经网络的一些笔记,参考书上的代码实现的。原理在附件的pdf中,注释就不写了。纯手打,调试ok

2017-12-25 15:02:08 1216 1

原创 字符串关联度求解算法改进模型

计算编辑距离和最大公共子串长度,对字符串之间包含情况的编辑距离进行优化,取最优解

2017-11-21 11:38:44 1152

原创 深度学习入门必须理解这25个概念

神经网络基础1)神经元(Neuron)——就像形成我们大脑基本元素的神经元一样,神经元形成神经网络的基本结构。想象一下,当我们得到新信息时我们该怎么做。当我们获取信息时,我们一般会处理它,然后生成一个输出。类似地,在神经网络的情况下,神经元接收输入,处理它并产生输出,而这个输出被发送到其他神经元用于进一步处理,或者作为最终输出进行输出。 2)权重(Weights)——当输入进入神经元时,它会乘以一

2017-05-22 21:11:51 53638 17

原创 CNN中Max Pooling的作用

卷积层本身是个特征抽取,可以指定超参数F来制定设立多少个特征抽取器。 Poolig层对Filter层的特征进行降维操作,形成最终的特征。 一般在Pooling层后连接全连接层神经网络,形成最后的分类结果。Max Pooling的含义是对某个Filter抽取到若干特征值,只取得其中最大的那个Pooling层作为保留值,其他特征值全部抛弃,值最大代表只保留这些特征中最强的,抛弃其他弱的此类特征。好处

2017-05-13 16:44:15 29492

原创 Tensorflow术语表

Tensorflow术语表

2017-04-25 17:04:55 1594

原创 Fiddler+JSoup爬取现代汉语语料库数据

爬虫中常用JSoup处理Html,对于类似百度这样的搜索引擎,则需要配合fiddler使用

2017-03-15 15:30:22 2585

原创 TextureView实现视频播放

TextureView在4.0(API level 14)中引入。它可以将内容流直接投影到View中,可以用于实现Live preview等功能。和SurfaceView不同,它不会在WMS中单独创建窗口,而是作为View hierachy中的一个普通View,因此可以和其它普通View一样进行移动,旋转,缩放,动画等变化。值得注意的是TextureView必须在硬件加速的窗口中。它显示的内容流数据

2016-12-07 12:54:51 7141

原创 c++求若干个集合的笛卡尔积

大家都知道求任意两个集合的笛卡尔积一般是如下方式

2016-10-31 15:04:06 5186 2

原创 两张图简单理解区块链

区块链是一个分布式账簿,核心是去中心化

2016-10-18 19:44:56 3668

原创 c++跨平台技术学习(三)--使用标准API

Posix.1 API定义了大量的函数,在各方面的功能都很丰富,下面对其进行介绍System V接口定义它是一份描述了AT&T UNIX System V操作系统的文档,与POSIX.1保持一致,是它的一个超集。SVID由基础系统和扩展定义,它只定义了C编程接口,没有定义任何用户级别的命令,基础系统更进一步细分几个类别基础OS服务程序 它由以下三个子类组成:第一组:包含了完整基础OS服务程序核

2016-10-12 17:48:04 2560

原创 利用文本挖掘技术来找出《天龙八部》中的“小鲜词”

开始之前,先看一下从人人网中发现的90后用户爱用的词是不是很好玩,哈哈。写这篇文章就是让你简单的自动的从文本中找出新的词,这样就知道现在的年轻人喜欢什么了(对于博主这种上了年纪的人来说,真的是很有用,呜呜)项目结构当然,text.dat和common.dic这两个文件你可以随意替换,注意text.dat中的数据一定要够份量,否则没啥效果原理么,看下Matrix67大牛的文章你就懂了互联网时代的社会语

2016-10-09 17:55:51 3507 1

原创 99%的人都理解错了HTTP中GET与POST的区别

GET和POST是HTTP请求的两种基本方法,要说它们的区别,接触过WEB开发的人都能说出一二。最直观的区别就是GET把参数包含在URL中,POST通过request body传递参数。你可能自己写过无数个GET和POST请求,或者已经看过很多权威网站总结出的他们的区别,你非常清楚知道什么时候该用什么。当你在面试中被问到这个问题,你的内心充满了自信和喜悦。

2016-10-09 16:17:25 2061 3

原创 CSDN博客成长记录

从2015年4月份写博客开始,到2016年10月9日终于成为了csdn博客准专家,排名也进入了前20000名。纪念一下,为分享更多的干货和成为博客专家而努力。2016年10月25日终于转成博客专家,再接再厉2016年11月4日博客浏览量超过10万次2017年4月26日博客排名进入前1万名2017年6月26日博客访问量突破20万次...

2016-10-09 14:58:19 1979 1

原创 程序员必备技术类微信公众号

这篇文章推荐了包括技术、设计和极客相关的热门公众号。

2016-10-09 12:31:21 37275 2

原创 用Python统计新浪微博各种表情使用频率

用新浪微博API积累了微博广场的1.4万条数据,我选择了21个字段输出为TXT文件,想用Python稍微处理一下,统计一下这1.4万条微博里面表情使用情况,统计结构在最后。

2016-10-09 11:43:53 3461 1

原创 c++跨平台技术学习(二)--使用跨平台的Make系统

make主要用在代码移植性上。跨平台管理编译工作有好几种方法,每种的核心都是一个叫make的程序,这是一个跨平台的工具

2016-09-28 16:12:42 2355

原创 c++跨平台技术学习(一)--使用公共的代码

引言能被不同平台共享的代码越多,跨平台的项目就越容易。所有平台上公用的功能应该被标识出来避免它们在平台相关的代码里重复出现。并且它们的编译、测试和部署应该贯穿在整个生命周期中。建议隐藏到一个统一的API抽象之中去。在工厂模式下,可以编写一个希望暴露的功能接口,进而向每一个支持的平台提供这个功能的具体实现。在编译或运行阶段,可以根据平台的不同来具体实现,然后实例化,最后粘合到接口类中。当applica

2016-09-28 15:55:40 3032

转载 软件项目将死的27个征兆

其他技术相比,Git应该拯救了更多开发人员的饭碗。只要你经常使用Git保存自己的工作,你就一直有机会可以将代码退回到之前的状态,因此就可以挽回那些你深夜里迷迷糊糊犯下的错误。尽管这么说,Git的命令行界面可是出了名的难掌握。接下来,就给大家介绍7个小技巧,最大限度发挥Git的作用。通常,大部分时间我们都只会用到add、commit、branch和push/pull这些命令。大部分人熟悉这套

2016-09-28 15:45:01 1585

原创 VS2015中搭建lua环境

所以本篇博文介绍在Windows平台下,使用VS2015搭建lua开发环境的一些侥幸成功经验,源码已经放到github上(https://github.com/pangjiuzala/luaplay),安装过程参考网上教程,安装过程如下一  生成lua5.3.lib1、下载并编译lua源码 首先进入lua官网,下载最新版本的lua源码。 这里我将

2016-09-19 17:56:53 8766 5

原创 word2vect实战

word2vect实战

2016-09-01 15:46:11 1997 1

转载 经典面试题---单链表的基本操作(C语言实现)

以下是常见的单链表操作,包括倒序、排序、查找等函数,基础知识,值得品

2016-06-24 12:05:59 1457

原创 IBM openblockchain学习(五)--consensus源码分析

这段时间小编一直忙着找实习,现在开始接着分析了,不好意思让大家久等了。好了,直接上干货。 consensus是blockchain中实现obc peer端一致性的插件,诸位请看consensus// Consenter用于从网络接收消息// 每一个consensus插件需要实现这个接口type Consenter interface { RecvMsg(msg *pb.Openchai

2016-04-23 19:05:42 2563 2

原创 IBM openblockchain学习(四)--crypto源码分析

crypto是blockchain中加密技术功能的实现,其中包括了椭圆曲线加密和SHA256等加密算法等,接下来将对其核心部分进行解析

2016-04-04 19:12:14 5075 2

原创 IBM openblockchain学习(三)--Ledger源码分析

Ledger是总账簿的意思,也就是blockchain中存储交易记录的部分。其代码包含如下,这块代码量大,可能分析时间会很长,希望读者耐心等待。

2016-04-02 15:44:53 6662 5

原创 IBM openblockchain学习(二)--chaincode源码分析

openblockchain是IBM开源的blockchain项目,具体安装流程之前已经介绍过,具体请看http://blog.csdn.net/pangjiuzala/article/details/50897819。 解压后会发现在obc-peer根目录下出现一个main.go文件 ,其中主要功能是生成obc-peer命令,核心代码集中在openchain中的。接下来,将首先从chainco

2016-03-23 16:25:45 11074 1

原创 IBM openblockchain学习(一)--obc-peer环境搭建

配置开发环境当前开发环境使用varant来运行一个ubuntu镜像,ubuntu中运行着docker容器。 主机->ubuntu->docker。该模型可以使开发者使用它们自己喜欢的编辑器/操作系统,并且为长期开发的团队提供可控制的环境。 先前的准备Git client (能够ping通google) Go(1.6或以上) Vagrant(1.7.4之上) Virtualbox(5.0之上

2016-03-15 16:49:54 6770 11

原创 10G数据不用框架快速去重

试想一下,如果有10G数据,或者更多;怎么才能够快速地去重呢?你会说将数据导入到数据库(mysql等)进行去重,或者用java写个程序进行去重,或者用Hadoop进行处理。如果是大量的数据要写入数据库也不是一件容易的事情,首先你需要开发一个程序将数据写入数据库,然后再用数据库的select distinct或者group by进行去重。如果是一次性的工作,这种方式显得就比较笨拙了。那么有没有更好的办

2016-03-10 11:32:24 3381 2

原创 Spark学习笔记(一)--Spark架构

Spark架构采用了分布式计算中的Master-Slave模型。Master是对应集群中的含有Master进程的节点,Slave是集群中含有Worker进程的节点。Master作为整个集群的控制器,负责整个集群的正常运行;Worker相当于是计算节点,接收主节点命令与进行状态汇报;Executor负责任务的执行;Cluster作为用户的客户端负责提交应用,Driver负责控制一个应用的执行。具体如下

2016-03-10 11:15:39 3789

原创 《machine learning with spark》学习笔记--文本挖掘

We will introduce more advanced text processing techniques available in MLlib to work with large-scale text datasets.In this article, we will:Work through detailed examples that illustrate data proces

2016-02-15 21:11:11 2463

原创 《machine learning with spark》学习笔记--聚类

Next, we will consider the case when we do not have labeled data available.This is called unsupervised learning, as the model is not supervised with the true target label. The unsupervised case is very

2016-02-14 23:01:44 1779

原创 《machine learning with spark》学习笔记--分类

In this article, you will learn the basics of classification models and how they can be used in a variety of contexts. Classification generically refers to classifying things into distinct categories o

2016-02-13 22:09:54 1018

原创 《machine learning with spark》学习笔记--推荐模型

Prepare dataDataSource DownloadUpload data to HDFSIt’s easy for the programmers who are familiar to hadoop , not repeat them here, HDFS path data herein is located in hdfs://master:9000/user/root/inpu

2016-02-02 21:21:38 1487

原创 大数据可视化Google Chart实现

本程序调用Weka API及libsvm工具包,对基金数据库进行数据预处理,然后将处理好的数据通过Chart.js 框架来实现数据的可视化,接下来要说明实现流程。完整版源码下载数据读取连接数据库Class.forName("com.mysql.jdbc.Driver").newInstance(); String url = "jdbc:mysql://localhost:3306/test

2016-01-04 19:37:45 4486

原创 JAVA EE 7 SDK Tutorial分析

随着Java平台企业版(Java EE),Java企业应用程序的开发从未如此简单或更快。在Java EE 7平台的目的是向开发人员提供了一套强大的API,同时缩短开发时间,降低了应用的复杂性,并提高应用程序的性能。在Java EE 7平台引入了一个简化的编程模型。随着Java EE 7的技术,XML部署描述符现在是可选的。相反,开发人员可以简单地输入信息作为注释直接到Java源文件,以及Java E

2016-01-02 13:59:32 4062 3

原创 一个用Python编写的股票数据(沪深)爬虫和选股策略测试框架

一个股票数据(沪深)爬虫和选股策略测试框架,数据基于雅虎YQL和新浪财经。根据选定的日期范围抓取所有沪深两市股票的行情数据。根据指定的选股策略和指定的日期进行选股测试。计算选股测试实际结果(包括与沪深300指数比较)。保存数据到JSON文件、CSV文件。支持使用表达式定义选股策略。支持多线程处理。代码main.pyfrom stockholm import Stockholmimpo

2015-12-26 23:18:16 54208 35

原创 eclipse上运行spark程序

最近在学spark,尝试在Windows+Eclipse运行程序,现在分享给大家 首先,你得把你要处理的文件上传带HDFS,怎么上传文件网上都有教程,此处不再赘述。

2015-12-23 21:37:43 8308

原创 Java实现高斯模糊算法处理图像

高斯模糊(英语:Gaussian Blur),也叫高斯平滑,是在Adobe Photoshop、GIMP以及Paint.NET等图像处理软件中广泛使用的处理效果,通常用它来减少图像噪声以及降低细节层次。 简介高斯模糊(Gaussian Blur)是美国Adobe图像软件公司开发的一个图像处理软件:Adobe Photoshop(系列)中的一个滤镜,具体的位置在:滤镜—模糊——高斯模糊!高斯模糊的原

2015-12-21 21:53:11 13574 15

原创 Hadoop环境共享

虚拟机镜像链接1.下载解压后直接用VMVare打开(有点大,7个多G)2.虚拟机登录密码为liu

2015-12-14 09:48:05 1320

原创 TFS(Taobao File System)安装办法

TFS(Taobao File System)是一个高可扩展、高可用、高性能、面向互联网服务的分布式文件系统,主要针对海量的非结构化数据,它构筑在普通的Linux机器 集群上,可为外部提供高可靠和高并发的存储访问。TFS为淘宝提供海量小文件存储,通常文件大小不超过1M,满足了淘宝对小文件存储的需求,被广泛地应用 在淘宝各项应用中。它采用了HA架构和平滑扩容,保证了整个文件系统的可用性和扩展性。同时扁

2015-12-09 11:46:40 6070 2

原创 Hadoop的HA机制

NameNode是HDFS集群的单点故障,每一个集群只有一个NameNode,如果这个机器或进程不可用,整个集群就无法使用,直到重启NameNode或者新启动一个NameNode节点 影响HDFS集群不可用主要包括以下两种情况类似机器宕机这样的意外情况将导致集群不可用,只有重启NameNode之后才可使用计划内的软件或硬件升级,将导致集群在短时间范围内不可用。HDFS的高可用性(HA)就可以

2015-12-06 08:52:59 7277 2

用户心跳数据集

1.txt记录的是某一个用户的心跳周期数据,每一个数值表示一次心跳的周期,单位是秒。例如,0.8表示用户当时的心跳间隙是0.8秒。心跳间期按照顺序存储

2015-11-27

手机电脑之间完美连接

电脑与智能手机之间的完美连接,适合做演示

2013-09-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除