10 春夏秋冬又一年

尚未进行身份认证

我要认证

数据分析师

等级
TA的排名 3w+

数据挖掘-机器学习-深度学习常用数据集

0.0 数据源大的数据收录网站github awesome-public-datasetsskymind open dataset : 保罗万象的数据集搜集网,什么类型的数据都有0.1 普通数据集即被交付给的原始数据集0.2 公开数据集0.2.1 离散和连续型普通数据集uci数据集 :一个公开的用于机器学习的数据集,包含几乎所有类别数据,适用于多种机器学习任务政府公开数据集欧洲政府公开数据集美国政府公开数据集新西兰政府公开数据集印度政府公开数据集中国人民银行,社会融资规模

2020-09-15 22:10:43

数据挖掘-机器学习-深度学习常用数据集.md

## 0.0 数据源大的数据收录网站+ [github awesome-public-datasets](https://github.com/awesomedata/awesome-public-datasets)+ [skymind open dataset](https://skymind.ai/wiki/open-datasets) : 保罗万象的数据集搜集网,什么类型的数据都有### 0.1 普通数据集即被交付给的原始数据集### 0.2 公开数据集#### 0.2.1

2020-09-15 22:08:01

SIFT特征

尺度不变特征变换匹配算法详解原文转载自: http://blog.csdn.net/zddblog/article/details/7521424Scale Invariant Feature Transform(SIFT)Just For Funzdd  zddmail@gmail.com or (zddhub@gmail.com)对于初学者,

2017-07-05 09:08:47

量化交易初试

框架评测首先决定使用哪个框架作为回测使用。详细的评测可以参考这篇量化投资策略:常见的几种Python回测框架 根据评测,我决定选用 PyAlgoTrade github项目地址入门博客系列如果需要对每一步详细学习,可以参考优矿上面的一位博主发布的选矿系列。量化分析师的Python日记知乎上关于如何使用优矿 做基本的代码测试 用 Python 实现你的量化交易策略

2016-11-28 23:23:20

卷积神经网络与图像识别基本概念

此文同步到 : 卷积神经网络与图像识别基本概念一 卷积神经网络的组成图像分类可以认为是给定一副测试图片作为输入 IϵRW×H×CI \epsilon R^{W×H×C},输出该图片 属于哪一类。参数 W 是图像的宽度,H 是高度,C 是通道的个数;彩色图像中 C = 3,灰度图像 中 C = 1。一般的会设定总共类别的个数,例如在ImageNet竞赛中总共有 1000 个类别;在CIFAR10

2016-08-25 11:40:58

使用tensorflow构建简单卷积神经网络

本文翻译自: 使用tensorflow构建简单卷积神经网络个人博客地址: 使用tensorflow构建简单卷积神经网络一 概要CIFAR-10分类问题是机器学习领域的一个通用基准,其问题是将32X32像素的RGB图像分类成10种类别:飞机,手机,鸟,猫,鹿,狗,青蛙,马,船和卡车。 更多信息请移步CIFAR-10和Alex Krizhevsky的演讲报告二 目标本教程的目标是建立一个相对简单的CN

2016-08-19 14:00:04

安装使用python Django

声明:此文章根据Django 使用 整理一 安装略二 Django工程2.1 创建项目假设我们要创建一个名为 mysite的工程,使用Django命令如下: django-admin.py startproject mysite 会在当前目录下生成一个mysite的文件夹,里面的目录如下:|—manage.py |—mysite   |—__init.py   |—settings.py

2016-07-08 13:59:21

python Django连接数据库问题

在Django框架内使用mysql时参考Django连接数据库 但是注意,此文档陈述的是1.4版本。对于1.9版本,运行python manage.py syncdb命令会出错。 参考Django mysql。在安装python mysql库时会出错,需要参考 安装python mysql出错测试安装完以上组件之后,在Django生成的目录下测试。 python manage.py make

2016-07-08 13:53:01

ElasticSearch性能测试

ElasticSearch性能测试 原文翻译自:ElasticSearch官方性能测试基准测试场景注:ES中的文档类似一条记录。 数据 测试使用了860万份文档,取自Geonames的POI数据。 项 参数 文档数 860万 数据大小 2.8GB(JSON) 客户端线程数 8 每个bulk请求 5000份文档 服务器数目 1个或2个服务器配置

2016-06-30 11:26:07

谷歌tensorflow基本概念

start up1.1 谷歌深度学习工具历史:第一代:DistBelief 由 Dean于2011年发起,主要产品有: Inception (图像识别领域)谷歌Search谷歌翻译谷歌照片第二代:TensorFlow 由Dean于2015年11月发起,大部分DistBelief都转向了TensorFlow1.2 产品特性 概念 描述 编程模型 类数据流的模型 语言

2016-06-13 15:45:53

windows下 pycharm开发spark

一 部署本地spark环境1.1  安装好JDK      下载并安装好jdk1.7,配置完环境变量。1.2 Spark环境变量配置      去http://spark.apache.org/downloads.html网站下载相应hadoop对应的版本,我下载的是spark-1.6.0-bin-hadoop2.6.tgz,spark版本是1.6,对应

2016-05-11 10:50:45

hadoop集群选择标准

原文转自 选择 hadoop机器为你的 Hadoop 集群选择合适的硬件随着Apache Hadoop的起步,云客户的增多面临的首要问题就是如何为他们新的的Hadoop集群选择合适的硬件。尽管Hadoop被设计为运行在行业标准的硬件上,提出一个理想的集群配置不想提供硬件规格列表那么简单。 选择硬件,为给定的负载在性能和经济性提供最佳平衡是需要测试和验证其有效性。(比如,IO

2016-04-08 14:49:28

hbase使用问题记录

1 无法关闭其他regionhadoop2: regionserver running as process 45320. Stop it first.hadoop3: regionserver running as process 50231. Stop it first.hadoop1: starting regionserver, logging to /usr/share/hadoop/

2016-03-22 16:46:40

大数据:spark环境部署

1 安装和使用spark1.1 安装spark我们主要以Windows环境为例介绍Spark的安装。 整个安装过程主要分为四个步骤:安装JDK、安装Scala、安装Spark、安装WinUtil。在Linux和Mac OS X下 安装Spark只需要完成前三步即可。1.1.1 安装JDKSpark采用Scala语言编写,而Scala程序是以JVM为运行环境的,因此需先安装JDK以支持Sp

2016-03-12 11:45:42

scala 学习第二章 函数

一  变长参数 函数     实现一个可变长度参数列表 函数,举例如下:    def sum(args:Int*) = { var result =0 for(arg<- args) result +=arg result }函数得到的是一个类型为Seq的参数,但是不能直接传入Seq。比如如下的写法是错误的var s = sum

2016-02-25 22:38:48

随机读取lzo压缩文件的方法

问题  在项目中需要随机读取LZO压缩文件。经测试在本地,如果是顺序读取一个lzo压缩文件是没有问题的。但是如果想从一个文件的多个随机位置开始读取一行数据的话,还是容易出问题。最后的妥协方案是,每次随机读取一个偏移位置,就打开一次文件流。同时,以下是关键代码:    FSDataInputStream in= fs.open(new Path(fileName));lzoIn=new L

2016-02-25 16:51:08

scala学习笔记,第一章

scala伴生对象    scala没有静态方法,不过有个类似的特性叫做 单例对象。通常一个类对应有一个伴生对象,其方法跟java中的静态方法一样。 scala apply方法    scala中有类似函数调用的方法。举例来说,如果s是一个字符串,那么s(i)就是该字符的第i个字符。例如     "Hello"(4) //将输出 o    你可以

2016-02-24 23:29:25

hadoop集群lzo某个机器上报错 Could not load native gpl library

错误         具体错误为:   lzo.GPLNativeCodeLoader: Could not load native gpl library  java.lang.UnsatisfiedLinkError: no gplcompression in java.library.path       测试     首先编辑一个java类,获取当前"java.libr

2016-02-24 16:58:53

maven hadoop hbase 依赖

由于Hbase 0.94对Hadoop 2.x的支持不是非常好,故直接添加Hbase 0.94的jar依赖可能会导致问题。     但是直接添加Hbase0.96的依赖,由于官方并没有发布Hbase 0.96的jar包,通过maven编译项目的时候会出现找不到jar包导致编译失败。     通过网上的资料,得知Hbase 0.94后版本,直接添加Hbase-Client的依赖,

2016-02-17 13:50:08

使用java HBase API查询 小bug记录

java HBase API查询时代码部分如下: Scan scan = new Scan(); //scan.setCaching(1); scan.setStartRow(QueryUtils.byteArray(Bytes.toBytes(indexCol),Bytes.toBytes(startRow),Bytes.toByt

2016-01-26 17:55:14

查看更多

勋章 我的勋章
  • 专栏达人
    专栏达人
    授予成功创建个人博客专栏的用户。专栏中添加五篇以上博文即可点亮!撰写博客专栏浓缩技术精华,专栏达人就是你!