自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(22)
  • 收藏
  • 关注

原创 MNIST进阶(卷积神经网络) 超详细代码注释

# 加载MNIST数据from tensorflow.examples.tutorials.mnist import input_datamnist = input_data.read_data_sets("MNIST_data/", one_hot=True)import tensorflow as tfsess = tf.InteractiveSession()# 权重在初始化时应该加入少量的噪声来打破对称性以及避免0梯度# truncated_normal:产生正态分布的随机数d.

2021-05-12 20:40:19 397

原创 tensorflow MINIST 入门(线性回归+softmax) 超详细代码注释 19行代码直接下载数据并训练

# 加载MNIST数据# i通过nput_data.read_data_sets自动下载和导入MNIST数据集# mnist是一个轻量级的类。它以Numpy数组的形式存储着训练、校验和测试数据集。同时提供了一个函数,用于在迭代中获得minibatch,后面我们将会用到。from tensorflow.examples.tutorials.mnist import input_datamnist = input_data.read_data_sets("MNIST_data/", one_hot=.

2021-05-12 17:02:44 319

原创 facenet validate_on_lfw.py 报错 AssertionError: The number of LFW images must be an integer multip

收集了亚洲人脸进行模型验证的时候,运行如下代码:python validate_on_lfw.py ../data/AsiaStar_160 ../20180402-114759 --lfw_pairs ../data/pairs_AsiaStar.txt报错如下:AssertionError: The number of LFW images must be an integer multiple of the LFW batch size翻译一下就是,图片数量必须是batch siz

2021-04-28 17:02:50 512

原创 facenet在亚洲人脸上的效果测试

准备工作下载FaceNet源码https://github.com/davidsandberg/facenetLFW评估测试数据下载http://vis-www.cs.umass.edu/lfw/lfw.tgz下载亚洲人脸数据CASIA-FaceV5原上传者地址:https://download.csdn.net/download/weixin_42179317/10405384若无csdn积分可以直接用百度云盘下载:https://pan.baidu.com/s/1WS4nooN

2021-04-27 12:18:14 4620 3

原创 centos下 安装tesseract4.0详细步骤 及Syntax error near unexpected token `LEPTONICA,'解决

#安装系统依赖yum install -y automake autoconf libtool gcc gcc-c++yum install -y libpng-devel libjpeg-devel libtiff-develyum -y install python-develyum -y install openssl-devel yum -y install ope...

2020-02-19 13:07:09 1071

原创 利用深度学习(CNN)进行验证码(字母+数字)识别

本文方法针对的验证码为定长验证码,不包含中文。本文的思路是:1. 使用keras中预训练好的模型,在python生成的验证码(5万条)上fine tune,得到python验证码模型;2. 使用python验证码模型,在实际验证码(500条)上fine tune;3. 增加样本,提高精度。通俗的解释2个问题:keras中预训练好的模型是什么东西?答: keras上有很多已经...

2019-10-27 23:20:37 16348 30

原创 keras + django(flask) + uwsgi + nginx 部署问题

最近用KERAS做了一个图像识别的分类问题,单独在Django上运行没有问题,但是用uwsi+nginx上线部署,程序就卡死在predict这一步。查了很久,发现大概问题应该是keras后端的tensflow使用的session与uwsgi的session产生冲突(猜测),google了发现不少人也遇到此类问题(https://github.com/keras-team/keras/is...

2019-10-11 14:17:46 390 5

原创 python数据分析pandas包入门学习(四)处理缺失数据

本文参考《利用Python进行数据分析》的第五章 pandas入门4 处理缺失数据缺失数据(missing data)在大部分数据分析应用中都很常见。Pandas的设计目标之一就是让缺失数据的处理任务尽量轻松。例如,pandas对象上的所有描述统计都排除了缺失数据。pandas使用NaN表示缺失数据。Python内置的None也会被当做NaN处理:

2016-11-23 14:24:53 16008

原创 python数据分析pandas包入门学习(三)汇总和统计描述

本文参考《利用Python进行数据分析》的第五章 pandas入门pandas拥有一组常用的数学和统计方法。它们大部分属于约简和汇总统计,用于从Series中提取单个值(如sum和mean),或从DataFrame的行或列中提取一个Series。跟对应的Numpy数组方法相比,它们都是基于没有缺失数据的假设而构建的。idxmin()/idxmax():返回最

2016-11-23 09:59:23 29448 1

原创 python数据分析pandas包入门学习(二)基本功能

本文参考《利用Python进行数据分析》的第五章 pandas入门2基本功能介绍操作Series和DataFrame中的数据的基本手段。重新索引reindex当调用Series的reindex将会根据新索引进行重排;当某个索引值当前不存在,就引入缺失值;fill_value可以给缺失值赋值。method选项:对于DataFrame,rei

2016-11-16 16:59:51 1966

原创 python数据分析pandas包入门学习(一)pandas数据结构介绍

本文参考《利用python进行数据分析》的第五章 pandas入门1 pandas数据结构介绍pandas有两种主要的数据结构:series和DataFrameSeries:一种类似于一维数组的对象,由一组数据(各种Numpy数据类型)以及一组与之对应的数据标签(索引)组成。第一列为索引,从0开始,第二列为数据值。可以通过values属性获取数组的表示形式,通过

2016-11-16 15:24:55 4719

原创 机器学习--正则化(regularization)防止分类器过拟合

本文参考吴恩达《机器学习》课程。

2016-11-04 16:57:57 4505

原创 机器学习——支持向量机(SVM)

本文主要参考吴恩达《机器学习》课程,以及网上各个大牛们的博文。支持向量机,是一种对线性和非线性数据进行分类的方法。它按以下方法工作:使用一种非线性映射,把原训练数据映射到较高的维上,在新的维上,它搜索最佳分离超平面。使用到足够高维上的、合适的非线性映射,两个类的数据总可以被超平面分开。与其他模型相比,支持向量机不太容易过拟合。下面按照吴恩达《机器学习》的讲义顺序进行讲解。1 间隔(

2016-11-02 10:54:26 2750

原创 逻辑回归python实现实例

这个例子是《机器学习实战》()逻辑回归的一个实例:从疝气病症预测病马的死亡率。疝病是描述马胃肠痛的术语。该数据集中包含了医院检查马疝病的一些指标,我们的目标是通过这些指标(特征),来预测马是否会死亡。数据集包括229个训练样本和67各测试样本,特征数量为22。数据集中包含缺失值,采取的措施是用0替换所有缺失值,这样做的原因是,我们在更新theta值时使用下式(具体参考上一篇),当某

2016-10-28 10:18:15 10395 4

原创 机器学习/逻辑回归(logistic regression)/--附python代码

本文为吴恩达《机器学习》课程的读书笔记,并用python实现。逻辑回归(logistic regression)虽然叫回归,但他做的事实际上是分类。这里我们讨论二元分类,即只分两类,y属于{0,1}。

2016-10-27 15:27:33 8636

原创 机器学习线性回归(linear regression)/梯度下降法(gradient descent)/最大似然函数/--附python代码

线性回归是一个比较简单的算法,这里主要借线性回归,讲一下梯度下降法和最大似然函数,后面逻辑回归也会用到。

2016-10-27 13:57:16 3778 4

原创 python.numpy学习

想要用python写一些算法,发现得用到numpy,大致跟matlab差不多,花了半天时间,看了《利用python进行数据分析》(《python for data analysis》)中的第四章,整理了一下,贴出来分享给大家。注意:有些图中的代码是我自己做的,有些是书中截图的。我做的,我直接from numpy import *,所以直接打函数名就可以了;书中应该是import numpy a

2016-10-26 17:00:00 789 1

原创 R语言实现聚类分析

l  K-均值聚类(K-Means)  十大经典算法l  K-中心点聚类(K-Medoids)l  密度聚类(DBSCAN)l  系谱聚类(HC)l  期望最大化聚类(EM)  十大经典算法 聚类算法软件包主要函数K-meansstatskmeans()K-Med

2014-07-25 10:57:40 28328 36

原创 用R语言进行关联分析

主要参考《数据挖掘:R语言实战》(黄文,王正林编著)

2014-07-23 12:02:02 9193

原创 R语言进行数据预处理

4.R语言进行数据预处理          在实际情况下,数据通常是不完整(缺少属性值或某些感兴趣的属性,或仅包含聚集数据)、含噪声(包含错误或存在偏离期望的离群值)、不一致的,这样的数据必须经过预处理,剔除其中的噪声,回复数据的完整性和一致性后才能使用数据挖掘技术进行分析。          使用mice软件包中的示例数据nhanes2来进行演示。加载mice包前,要先加载lat

2014-07-22 14:18:36 21245

原创 R语言获取数据

获取内置数据看到所有数据集:data(package = .packages(all.available =T))想看具体信息,比如第一个Adult,可以help(Adult) 每个包中所含有的数据集,往往正是适合诠释该软件包内相关函数的功能而收集并添置的,在学习各软件包时,可以多多利用该包中的数据,进行实战训练。 读取CSV格式         csv

2014-07-21 15:43:06 2200

原创 R语言实现数据抽样&创建训练集和测试集

在收集数据过程中,绝大多数情况下,并不采取普查的方式获取总体中所有样本的数据信息,而是以各类抽样方法抽取其中若干代表性样本来进行数据获取和分析。在获得待分析数据集后,需要再次通过抽样技术选取出训练集和测试集,以便比较选择出最优的挖掘算法。         这里主要介绍简单随机抽样、分层抽样、整群抽样三种基本抽样方法。 用到的软件包及函数软件包函数

2014-07-21 15:07:11 46454 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除