lzher0-CSDN博客

原创 Linux下统计文件夹、文件数量的命令

参考链接：https://www.cnblogs.com/TreeDream/p/10108822.htmlls -l第一列：文件类型(共10个字符) + 权限 --> manfind搜索type可看-:普通文件d:目录c:字符设备 --> /dev/tty例如 US...

2019-09-20 15:14:03 1524

原创解决TensorFlow GPU版出现OOM错误

问题：在使用mask_rcnn预测自己的数据集时，会出现下面错误：ResourceExhaustedError: OOM when allocating tensor with shape[1,512,1120,1120] and type float on /job:localhost/replica:0/task:0/device:GPU:0 by allocator GPU_0_b...

2018-11-29 16:29:40 23090 4

原创机器学习实战第七章 adaBoostTrainDs函数报错TypeError: max() got an unexpected keyword argument 'fill_value'

源码：# 基于单层决策树的AdaBoost训练过程def adaBoostTrainDS(dataArr, classLabels, numIt=40): weakClassArr = [] m = shape(dataArr)[0] D = mat(ones((m, 1)) / m) aggClassEst = mat(zeros((m, 1))) ...

2018-11-16 15:45:56 2617

原创机器学习算法梳理3-支持向量机SVM

支持向量机SVM推导及求解过程一、前言1.1 什么是支持向量机（Support Vector Machine）对于线性可分的两类数据，支持向量机就是一条直线（对于高维的数据就是一个超平面）。在二维空间中，将数据分成两类的线有无数条，SVM就是这是无数条中最完美的一条，所谓完美就是指这条线距离两类数据点越远，这样当有新的数据点的时候我们使用这条线将其分类的结果也就越可信。找到这条完美的直...

2018-10-25 17:08:43 531

原创机器学习算法梳理2-逻辑回归

机器学习算法-逻辑回归一、前言1.1、回归问题的条件/前提：1、收集数据2、假设的模型，即一个函数，这个函数里含有未知的参数，通过学习，可以估计出参数，然后利用这个模型去预测/分类新的数据。回归算法是一种通过最小化预测值与实际值之间的差距，从而得到输入特征之间的最佳组合方式的一类算法。对于连续值预测我们可以用线性回归等，而对于离散值/类别预测，我们可以用采用逻辑回归。逻辑回归是...

2018-10-15 20:34:29 379

原创 ubuntu16.04更新sublime text 3

1、安装 GPG key：网上是直接用下面这行命令执行的，但我的用了却报错了：wget -qO - https://download.sublimetext.com/sublimehq-pub.gpg | sudo apt-key add -gpg: 找不到有效的 OpenPGP 数据。分两步管道符 | 前后分两步进行就没问题了，curl -O https://pac...

2018-10-11 15:02:30 1939

原创 abaqus2017关联vs2013失败， ERROR: Cannot determine the location of the VS installation.

在使用abaqus关联vs2013时，进行abaqus verification时出现下面情况：网上都是这种错误：ERROR: Cannot determine the location of the VS Common Tools folder.解决办法是：添加PATH环境变量，值为：C:\Windows\System32 并没有找到有我遇到的这种情况，对于我这种情况采...

2018-10-10 20:01:53 9107

原创机器学习算法梳理1-线性回归

机器学习算法-线性回归一、相关理论基础1.1 凸函数某个向量空间的凸子集（区间）上的实值函数，如果在其定义域上的任意两点，有 f(tx + (1-t)y) <= tf(x) + (1-t)f(y)，则称其为该区间上的凸函数；1.2 线性线性并不等于直线。线性函数的定义是：一阶（或更低阶）多项式，或零多项式。当线性函数只有一个自变量时，y = f(x)；如果有多个...

2018-10-08 20:48:31 708

原创 sklearn中的pipeline的用法总结

Pipeline可以将许多算法模型串联起来，比如将特征提取、归一化、分类组织在一起形成一个典型的机器学习问题工作流。主要带来两点好处：1、直接调用fit和predict方法来对pipeline中的所有算法模型进行训练和预测。2、可以结合grid search对参数进行选择。from sklearn.pipeline import Pipelinepipsline = Pipeli...

2018-09-07 17:05:59 8812 1

原创谷歌cola上加载谷歌云盘文件

https://mikulskibartosz.name/how-to-load-data-from-google-drive-to-pandas-running-in-google-colaboratory-a7f6a033c9971、使用下面代码，安装必要的文件!pip install -U -q PyDrivefrom pydrive.auth import GoogleAuth...

2018-09-06 10:56:57 1635

原创谷歌GPU服务器关联谷歌硬盘

1、打开谷歌云端硬盘网址：https://colab.research.google.com2、新建一个python记事本后，输入下面代码：!apt-get install -y -qq software-properties-common python-software-properties module-init-tools !add-apt-repository -y ppa...

2018-09-04 15:34:25 283

原创使用export_graphviz可视化树报错解决

在使用可视化树的过程中，报错了。说是‘dot.exe’not found in path原代码：# import tools needed for visualizationfrom sklearn.tree import export_graphvizimport pydot#Pull out one tree from the foresttree = rf.estimat...

2018-05-23 20:46:24 11595 1

主成分分析（PCA）是最常见的降维方法，其主要是找到一个方向向量，当我们把所有数据都投影到方向向量上时，希望投射平均均方误差尽可能地小。该方向向量是一个经过原点的向量，而投射误差是从特征向量向该方向向量作垂线的长度。PCA从n维减少到k维的过程：1、均值归一化。需要计算所有特征的均值，然后令Xj = Xj -μj 。如果特征是在不同的数量级上，还需要将其除以标准差。2、计算协方差矩阵：3、计算协方...

2018-05-17 17:09:28 804

原创逻辑回归模型和支持向量机模型选择原则

从逻辑回归模型可以得到，支持向量机（SVM）模型，下面是一些普遍使用的准则：n为特征数，m为训练样本数。1、如果相较于m而言，n要大许多，即训练集数据量不够支持我们训练一个复杂的非线性模型，我们选用逻辑回归模型或者不带核函数的支持向量机2、如果n比较小，而且m大小中等，例如n在1-1000之间，而m在10-100000之间，使用高斯核函数的支持向量机。3、如果n比较小，而m较大，例如n在1-100...

2018-05-16 22:23:51 2139

原创机器学习笔记——模型选择和交叉验证集

通常为了选择能适应一般情况的模型，需要使用交叉验证集来帮助选择模型。即，使用60%的数据作为训练集，使用20%的数据作为交叉验证集，使用20%的数据作为测试集。模型的选择方法为：1、使用训练集训练出10 个模型2、用10个模型分别对交叉验证集计算得出交叉验证误差（代价函数的值）3、选取代价函数值最小的模型4、用步骤3中选出的模型对测试集计算得出推广误差（代价函数的值）...

2018-05-16 14:57:02 936

原创机器学习中使用神经网络的步骤

使用神经网络时的步骤：网络结构：第一件要做的事是选择网络结构，即决定选择多少层以及决定每层分别有多少个单元。第一层的单元数是我们训练集的特征数量。最后一层的单元数是我们训练集的结果的类的数量。如果隐藏层数大于1，确保每个隐藏层的单元个数相同，通常情况下隐藏层单元的个数越多越好。而我们真正要决定的是隐藏层的层数和每个中间层的单元数。训练神经网络的步骤：1、参数的随机初始化2、利用正向传播方法计算所有...

2018-05-16 09:52:55 273

原创机器学习中，发生过拟合的问题的两条处理方法

1、丢弃一些不能帮助我们正确预测的特征。可以是手工选择保留哪些特征，或者使用一些模型选择的算法来帮忙（例如PCA）2、正则化。保留所有的特征，但是减少参数的大小（magnitude）。...

2018-05-16 09:36:34 245

原创改进机器学习算法性能的几条途径

获得更多的训练实例，通常来说是有效的，但代价比较大，以下是几种可以先考虑的方法：1、在过拟合的情况下，可以尝试减少特征的数量。2、在欠拟合的情况下，可以尝试获得更多的特征。3、尝试增加多项式特征。4、尝试减少正则化程度λ。5、尝试增加正则化程度λ。...

2018-05-16 09:33:35 922

原创 Ubuntu16.04安装tensorflow遇到的问题总结

安装的过程主要参考TensorFlow中文社区：基于 VirtualEnv 的安装：1.先安装必备的Python虚拟环境：$ sudo apt-get install python-pip python-dev python-virtualenv2.接下来, 建立一个全新的 virtualenv 环境. 为了将环境建在 ~/tensorflow 目录下, 执行:$ virtualenv --sys...

2018-05-02 00:42:11 844

lzhero的博客