- 博客(15)
- 收藏
- 关注
原创 训练集、验证集的划分
有些数据集没有单独划分验证集,只有训练集和测试集,需要自己划分from sklearn.model_selection import train_test_splitfrom sklearn import datasetsiris = datasets.load_iris()# 30%用于测试集,70%用于训练集X_train,X_test,y_train,y_test= train_...
2018-07-27 09:53:56 978
原创 卷积池化后的大小
‘SAME’ ‘VALID’ 比如输入图片是28*28的单通道图片,其输入shape为[batch_size, 28, 28, 1]; 第一层卷积为32个5*5卷积核,其shape为[5,5,1,32],其步长strides为[1,1,1,1],紧接着是第一层的2*2的max_pooling,其形状为[1,2,2,1],其步长strides为[1,2,2,1]; 第二层卷积为6...
2018-06-10 10:19:17 5776
原创 tf.tile()进行张量扩展
tf.tile( input, multiples, name=None )tf.tile()应用于需要张量扩展的场景,具体说来就是: 如果现有一个形状如[width, height]的张量,需要得到一个基于原张量的,形状如[batch_size,width,height]的张量,其中每一个batch的内容都和原张量一模一样。 该操作通过复制输入...
2018-06-02 12:15:02 1763
原创 过拟合的解决方法
一、 data augmentation 过拟合原因就是训练样本的缺乏和训练参数的增加。一般要想获得更好的模型,需要大量的训练参数,如果训练样本缺乏多样性,就造成了过拟合。data augmentation的手段一般有: 1)收集更多数据 2)对已有数据进行crop,flip,加光照等操作 3)利用生成模型(比如GAN)生成一些数据。 二、weight decay 常用的weight d...
2018-06-01 16:02:57 2644
转载 关于slim
可能很多tensorflow的老版本玩家没见过这个东西,slim这个模块是在16年新推出的,其主要目的是来做所谓的“代码瘦身”。但事实上它已经成为我比较喜欢,甚至是比较常用的模块,github上面大部分tensorflow的工程都会涉及到它,不得不说,撇开Keras,TensorLayer,tfLearn这些个高级库不谈,光用tensorflow能不能写出简洁的代码?当然行,有...
2018-05-28 09:59:19 433
转载 多任务学习
最近比较忙,之前一些博客没来得及完善,今天难得有时间,索性整理下之前的内容,让大家有个更加完整的学习过程。 如题,本篇介绍的是tensorflow实现验证码的识别,之前我们已经生成了数据集,并且转换成了tfrecord格式的文件,现在我们开始利...
2018-05-27 20:30:29 2296 1
原创 sys.stdout.write 与print
使用print输出线程标识和每个线程执行的次数。经常会出现多个线程输出到同一行中的情况,导致无法清晰看到每条信息。 使用sys.stdout.write 代替 print,自己输出换行符“/n”:sys.stdout.write('\r>> Converting image %d/%d' % (i+1, len(filenames))) sys.stdout.flush(...
2018-05-27 16:59:23 1443
原创 批量改变图片尺寸
之前写过单张图片尺寸的改变,针对大量数据集图片,如何批量操作,记录一下,为以后数据集预处理提供一点参考:from PIL import Imageimport os.pathimport globdef convertjpg(jpgfile,outdir,width=1280,height=720): img=Image.open(jpgfile) new_img=...
2018-05-26 18:29:55 273
原创 单张图像变换大小—— img.resize()
这个是一段学过的简单程序,可以改变图像的大小,jpg,png都可以的:#encoding=utf-8#author: walker#date: 2014-05-15#function: 更改图片尺寸大小from PIL import Image'''filein: 输入图片fileout: 输出图片width: 输出图片宽度height:输出图片高度type:输出图片...
2018-05-26 13:18:21 28548 1
原创 验证码测试
接上面,验证码的验证import tensorflow as tfimport numpy as npfrom PIL import Imageimport osimport matplotlib.pyplot as plt CAPTCHA_LEN = 4MODEL_SAVE_PATH = 'F:\\YanZhengMa\\1\\yz\\'TEST_IMAGE_PATH ...
2018-05-21 18:24:27 1625
原创 验证码的训练
像MNIST的一些数据集,一般是一张图像对应一个标签,而对于一张图片多个标签的情况怎么识别?这篇博客可以提供一个思路,拿验证码举例,大概思想就是将多个数字转化成数列的形式。下面是实现代码import tensorflow as tfimport numpy as npfrom PIL import Imageimport osimport randomimport time#...
2018-05-21 18:18:10 1685
原创 #四位数字验证码数据库的生成
只是为了记录一下多任务学习的历程,首先就是数据库的生成,需要一张图片里面有多个标签,为了方便学习,先简单的建立一个四个数字组成的验证码import sysimport osimport shutilimport randomimport time#captcha是用于生成验证码图片的库,可以 pip install captcha 来安装它from captcha.image ...
2018-05-21 17:26:32 1748 1
原创 tf.shape与get_shape()
import tensorflow as tf import numpy as np x=tf.constant([[1,2,3],[4,5,6]] y=[[1,2,3],[4,5,6]] z=np.arange(24).reshape([2,3,4])) sess=tf.Session() # tf.shape() x_shape=tf.shape(x) ...
2018-05-13 10:32:59 1061
原创 #猫狗大战——TensorFlow的实现
新手一枚,记录一下学习的艰辛历程,如果有什么错误,欢迎大家多多指教。根据所学知识,神经网络是允许图片直接输入进行训练的,可是当输入数据集太大时就不大方便啦,一般是生成tfrecords的形式进行训练,实践证明,这样做真的很方便!所以猫狗的识别第一步就是将数据图片生成TF文档。本人使用的是数据集来源于Kaggle,数据集有12500只猫和12500只狗。数据集可以去网站下载~一 TFreco...
2018-05-04 21:02:28 2602 2
原创 tensorflow-gpu版本安装
1. 安装CUDA8.0,一定要找对应版本的,我安装的是Windows。修改环境变量:左击桌面的“计算机”图标,依次选择“高级系统设置”--“环境变量”,在“系统变量(S)”中找到Path选项,双击编辑“变量值(V)”:你需要以下的路径是否在Path中,如果没有,就添加对应的路径(一般是最后两个路径没有):C:\Program Files\NVIDIA GPU Computing Toolkit\...
2018-03-18 11:51:37 222
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人