自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 资源 (1)
  • 问答 (1)
  • 收藏
  • 关注

原创 pycaret的具体使用流程

PyCaret的具体使用流程PyCaret是Python中的一个开源、低代码机器学习库,旨在减少从数据处理到模型部署的周期时间。PyCaret库只需几行代码就可以完成从准备数据到部署模型,其中包括有数据处理,模型训练,参数搜索,模型可解释性,模型选择,实验日志查询。一、PyCaret安装在使用pycaret库进行机器学习处理时,pycaret2.3要求scikit-learn在是0.22版,然而,在python3.7下没有找到相应匹配的版本。为避免安装不兼容,我首先尝试了将pycaret降级为2.0版

2022-01-02 23:34:45 4417 2

原创 在Centos 7环境下安装python3

对于刚安装的服务器,我们想跑个程序啥的,由于服务器默认的Python版本为2.7,很多包都无法下载,因此需要对Python进行升级处理,这里面会有pip的安装问题。这里有个小小的坑,建议先对Python进行升级后,然后安装相应的pip。具体流程如下:首先不管你当前在哪个目录下,输入以下命令。[root@localhost /]# cd /[root@localhost /]# 默认Centos7中是有python安装的,但是是2.7版本,我们需要安装py3。我们去看一下默认的py2.7在哪里。[

2021-03-25 13:47:29 339

原创 linux服务器下mysql安装及使用

在搭建完服务器后,进行数据库的安装时,往往会遇到一些问题。以mysql为例,下面大致列下载安装数据库时的流程及一些常见的命令。一、安装mysql使用yum安装mysql1、首先,将MySQL Yum存储库添加到系统的存储库列表中(wget 将yum源下载到指定服务器,我这里放在了 /user/local 上) https://dev.mysql.com/doc/refman/5.7/en/linux-installation-yum-repo.html2、安装下载的发行包 sudo yum l

2021-03-24 20:09:26 386 1

原创 机器学习之ROC曲线绘制

问题当我们在使用机器学习分类算法时,例如使用逻辑回归来对鸢尾花进行样本分类,是否准确率为95%就代表模型非常成功呢?如何来判定我们使用模型的好坏呢?ROC曲线其实,这种好坏的评判标准一直都有,而且随着时代的进步不断更迭。十几年前在《machine learning》一文中就提出了分类精确的概念来划定模型的好坏;此后,学术界又引入信息检索(IR)领域中的recall和precision进行判定。然而,在现实中样本在不同类别上的不均衡分布(class distribution imbalance

2021-02-18 23:10:46 7016 2

原创 Python——球面两点距离及两条直线夹角的计算

问题描述:平常为了得出地理位置上两点的实际距离(譬如北京与杭州之间的实际距离),除了利用经纬度计算出两点的空间距离,还需要考虑地形因素。由于之间考虑地形造成误差较大,因此采用微分的办法来解决,简单来说就是将两点细分为多点间的距离(当然这个多点是有限的)。图中计算AB之间的距离,可以计算出中间多个点位的距离(如AC),然后计算在AB直线上的投影。在此之前,需要计算出球面上两条直线间的夹角以及两点在球面上的距离。1)球面上两条直线间的夹角方法一:简易版,将球面弧线看成是直角坐标系下的直线,采用向量乘积

2021-02-16 11:10:00 3426

原创 利用docker来部署自己的项目(续篇)

在上篇我们可以将自己的项目部署在服务器上,多个项目都可以。但在使用时发现,现在使用的仓库为公有的,如果想用作商业方面,从数据安全角度这会是个比较大的漏洞,基于此,本篇来说说部署私有仓库来保存自己的镜像。...

2021-02-07 17:05:54 167

原创 利用docker来部署自己的项目

在部署自己项目时,开始时一头雾水。如果直接放在服务器上跑,既麻烦又不稳定。后来看到有写采用docker进行项目部署,前后折腾了一天,总算部署上去了,分享出来让大家少走点弯路。整体的流程大概是这样的:首先,准备环境,需要在本地部署docker,在下面网站进行下载即可,直接next就可以。http://mirrors.aliyun.com/docker-toolbox/windows/docker-toolbox/安装完后,编写自己的项目文件app.py,以及Dockerfile。在

2021-02-03 17:03:31 1296

转载 docker常用命令大全

Docker是一个用于开发、交付、运行应用程序的开放平台。利用Docker可以快速交付,测试和部署代码。所以值得我们学习下。安装Docker1、下载Docker的依赖环境yum -y install yum-utils device-mapper-persistent-data lvm22、设置下载Docker的镜像源yum-config-manager --add-repo http://mirrors.aliyun.com/docker-ce/linux/centos/docke

2021-01-28 12:09:05 239

原创 tmux常用命令大全

tmux常用命令大全最近需要使用tmux来进行后台程序控制处理,弄去弄来碰到了一些问题,以及有些需要常用的命令,现将其列出来供大家参考。(1)安装tmux在ubuntu系统中使用sudo apt-get install tmux安装tmux工具在linux下也可以采用yum安装yum install ncurses-develtar -xzf tmux-1.7.tar.gzcd tmux-1.7CFLAGS="-I/tmp/libevent/include" LDFLAGS="-L/tm

2021-01-28 11:37:29 1911

原创 机器学习之逻辑回归

逻辑回归(Logistic Regression) 最初是为了解决二分类问题。线性回归模型帮助我们实现了回归但无法进行分类,LR就是在线性回归的基础上,构造的一种分类模型。对于线性模型要想进行如二分类任务,最简单的办法就是通过阶跃函数(unit-step function),即将线性模型的输出值套上一个函数进行分割,大于z的判定为0,小于z的判定为1。如下图左所示但这有个问题是,分段函数不连续且不可微。因此,提出对数几率函数能够有效地解释这个问题,见上图右,简称Sigmoid函数,该函.

2021-01-12 14:32:30 188

转载 机器学习算法之线性回归

线性回归是机器学习算法中最为简单的分类法。一来是学习过线性代数的人都能理解,二来没有复杂的数学处理方式,代码实现起来也比较容易。下面用尽量简单的语言来介绍它到底是个什么概念,以及在什么情况下能够加以使用。回归分析是一种预测性的建模技术,它是研究自变量(预测器)与因变量(目标)之间的关系。通常使用曲线/线来拟合数据点(也就是回归),使曲线到数据点的距离差异最小。线性回归只是众多回归问题中的一种,是假设目标值与特征之间线性相关,满足一个多元一次方程。通过构建损失函数,来求解损失函数最小时的参数w和b。通

2021-01-12 10:50:06 1121 1

转载 CNN参数的计算(转)

1、基本计算原理    动态过程:  滤波器(过滤器:filter)的权值是根据你要检测的特征来决定的,在深度学习中,也即是要经过训练得到。检测的特征不同,权值就不一样。  如上单层的图像一般表示的是灰白图,既是没有颜色的,有颜色的RGB图像,会包含三个相同大小的图层,这时对应的滤波器也要变成三层,滤波器的层数(通道数)必须时刻与图像层数保持一致。。。    注意输出的是一个单层图    因为当一个三通道的过滤器与图像进行卷积时,是直接对27个数去加权计算它们的和得到

2020-07-30 17:20:09 1621

转载 利用python画各类世界、中国、区县地图(转)

首先安装对应的python模块$ pip install pyecharts==0.5.10$ pip install echarts-countries-pypkg$ pip install echarts-china-provinces-pypkg$ pip install echarts-china-cities-pypkg$ pip install echarts-china-counties-pypkg世界地图from pyecharts import Mapvalue

2020-07-24 17:01:22 8397 9

转载 如何区分并记住常见的几种 Normalization 算法(转)

神经网络中有各种归一化算法:Batch Normalization (BN)、Layer Normalization (LN)、Instance Normalization (IN)、Group Normalization (GN)。从公式看它们都差不多,如 (1) 所示:无非是减去均值,除以标准差,再施以线性映射。image.png这些归一化算法的主要区别在于操作的 feature map 维度不同。如何区分并记住它们,一直是件令人头疼的事。本文目的不是介绍各种归一化方式在理论层面的原理或应用

2020-07-24 14:43:43 588

转载 使用python读取数据科学最常用的文件格式(转)

1、什么是文件格式?文件格式是在文件中存储信息的一种标准方法。首先,文件格式指定文件是一个二进制或ASCII文件。其次,文件展示了文件的组织形式。例如,逗号分隔值(CSV)文件格式存储在纯文本的表格数据。image.png2、为什么数据科学家需要懂得不同的文件格式?通常,你遇到的文件都取决于你使用的应用。例如,在一个图像处理系统中,你需要将图像文件作为输入输出,所以你会看到一个JPEG,GIF或PNG格式。作为数据科学家,你需要了解各种文件格式的底层结构以及它们的优缺点等。除非你.

2020-07-24 14:12:49 566

原创 机器学习在业务中的一些应用(一)

情况描述:目前,有些地方环境污染情况较为严重,相关单位对问题进行排查,针对这些排查情况,来预测未来哪些区域可能会存在问题,然后将这类有问题的区域推送给相应的主管单位。之前碰到此类问题,基本都采用粗放式的解决办法,通过分析区域污染物浓度(过去几天的数据),来推送哪些区域是否有问题,但这种指标的筛选显得太过随意,采用的大多也是一些经验公式。基于此,想着是否能够采用机器学习的办法来找到一种更合理,推荐更准确的办法。这样,就开启了这种简单根据业务分析选择算法的应用场景。如果有大量的数据,咱们进行各.

2020-07-16 20:11:18 361

原创 Pytorch垃圾分类搭建CNN模型中遇到的坑

背景就是利用pytorch进行图形分类处理,采用的是cnn算法,在使用过程中碰到了一些小麻烦。1、在对图片进行压缩时的报错,报错形式为:raise ValueError("empty range for randrange() (%d,%d, %d)" % (istart, istop, width)) ValueError解决办法:添加transform.Resize((256,256))train_transforms = transforms.Compose([ tran

2020-06-17 18:02:50 912 2

原创 机器学习之概念理解

    什么是机器学习?先来对比百度百科与维基中的定义看看。    百度百科:    机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。  维基百科:  Machine learning is a su...

2018-06-30 07:24:41 181

China_town.shp

不可多得比较全的全国乡镇shp文件,在分析地理空间分布是很好补充资料。在arcgis中可以直接打开使用,可极好的满足大比例尺小范围制图使用,现在分享给大家,希望能有所帮助!

2020-06-07

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除