自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

u013044310的博客

公众号:布吉岛青年。重点写大数据和Python相关的文章,但又不止于技术,欢迎关注。

  • 博客(87)
  • 资源 (4)
  • 收藏
  • 关注

原创 机器学习超详细实践攻略(9):手把手带你使用决策树算法与调参

一、什么是决策树既然要用决策树,那么我们首先要知道决策树的基本原理。初听到决策树这个名字的时候,我觉得他是一种最不像机器学习算法的算法。我们生活中的和决策树相关的例子比比皆是,假如你出去买东西,如果价格合适,那就买下来,如果价格太高,那就和商家讨价还价,如果商家同意打折,那就买下来,如果商家不同意便宜点,那就放下东西走人。这就会构建出下图这样的一个决策树。这不就是编程里最基本的if-el...

2020-01-16 22:24:47 3382 2

原创 FaceNet源码解读2:史上最全的FaceNet源码使用方法和讲解(二)

史上最全的FaceNet源码使用方法和讲解(二)这是对:史上最全的FaceNet源码使用方法和讲解(附预训练模型下载)的一个补充。对模型进行测试:用到的函数:validate_on_lfw.py 在pycharm中配置的参数如下:数据集所在路径 模型所在路径 示例:【】2【】0【】1【】7【】0【】5【】】】1【】2【】-110547 1.png 2.png这...

2018-06-07 19:46:04 35082 153

原创 FaceNet源码解读:史上最全的FaceNet源码使用方法和讲解(一)(附预训练模型下载)

文章地址:史上最全的FaceNet源码使用方法和讲解(一)(附预训练模型下载)转载请注明出处。前提条件:已安装并配置好Tensorflow的运行环境。第一步:准备facenet程序:一、下载FaceNet源码。下载地址:facenet源码二、精简代码。作者在代码里实现了很多功能,但是对于初学者来说,很多代码是没有必要的,反倒找不到学习这个程序的入口。建议先精简一下代码,便于...

2018-03-21 22:23:32 76390 205

原创 windows下配置chrome浏览器驱动的详细攻略

selenium使用前的必备环境搭建教程

2022-12-18 15:36:40 16428 5

原创 人工智能小白必懂专有名词解释【AI名词字典】

在AI告诉发展的大背景下,很多名词概念层出不群,对于初学者或者第一次接触到这些名字的AI从业者来说很懵,这篇文章就是专门记录自己看过的一些AI领域的专有名词。

2022-12-09 15:46:16 1348

原创 让生活不吃亏的技巧—《谈判》|每周一本书(7)

最近读了一本关于谈判的书:《谈判——如何在博弈中获得更多》初看书名,原以为是一本比较专业的书籍,只有西装革履在办公桌前侃侃而谈的谈判专家才能用得到。其实这本书的副标题是:如何在博弈中获得更多。我们的生活中无时无刻都在与他人博弈和谈判。包括买卖闲置物品、不同部门之间分工协作、谈恋爱、甚至哄小孩子吃饭,都是一场场的谈判,所以这本书值得任何人去读。我们先来做一个小测试:如果你有一台闲置的显示器,希望在闲鱼上500块出售,那么你初始的标价最好是多少?是不是需要写清楚可议价?如果将显示器挂在闲鱼之前,正好有.

2021-03-13 23:32:20 1015

原创 用Python一秒自动美化表格|python的1024种玩法(3)

之前写过一篇文章:大学生们都在读什么书?让Python用数据告诉你!在这篇文章中,我用Python爬虫爬取了全国20多个图书馆的热门借阅图书信息,并按照一定的规则做了统计汇总,得到了这一份大学生各领域必读TOP150书单,这份书单分领域保存在Excel的50多个sheet页中,每个sheet页的文件是这样子的:虽然内容非常全面,但是这些挤在一块的内容,总觉得根本没有人会有兴趣看下去,起码得调整一下格式,做个简单的美化,让excel更易读。而50多个shee页如果分别去调格式的话,也是个不小的工作量.

2021-03-07 11:33:48 1672 1

原创 【赶紧收藏】大学生都在读什么书?让Python用数据告诉你

知乎里有个问题:有没有推荐的大学生书单?看了下,回答里推荐的书都比较主观。其实我觉得,书也要讲究在对的时间读到合适的书,在人的成长阶段中,对你帮助最大的,并不一定是该领域经典的书,而应该是现阶段适合你的书。如果你是一个金融初学者,上来就啃《金融学》这种大部头,反倒不如读《图解金融学》这种偏入门的书对你帮助大,虽然前者比后者评分高了太多。所以,对于大学生来说,最好的选书方式,不是盲目追求那些经典著作,而是要看同龄人、同专业的人都在读什么。因为大学生们大多有着相似的视野和生活经历、这样更有参照性。于是.

2021-02-16 16:20:33 323

原创 机器学习超详细实践攻略(10):随机森林算法详解及小白都能看懂的调参指南

一、什么是随机森林前面我们已经介绍了决策树的基本原理和使用。因为决策树会非常细致地划分样本,如果给决策树分太多的节点,就会导致在训练集上出现过拟合,而如果不增加节点的个数,决策树的表现又不会很理想。为了解决这个两难困境,聪明的专家们想出了这样的思路:既然我没有办法增加树的深度,那我就用多棵树来做预测。这也是集成学习的思想。其实让我们换个角度想,老子说过:祸兮福之所倚,福兮祸之所伏。正是因为每棵...

2020-05-10 20:01:11 19477 17

原创 看个天气预报都能理解大数据?人工智能和大数据对我们生活产生了哪些影响?

提起“大数据”这个词,很多人第一印象可能是:高科技、遥不可及。但是,我们生活中,很多传统的数据服务已经或多或少地被大数据所赋能,通过不同的形式走进了我们生活。因为从业于大数据相关领域,所以对身边数据服务的变化非常敏感,而近年来也的确颇为深刻地感受到了身边数据服务形式的变迁,以及带给我们生活的变化。数据服务的形式经历了:结果型数据服务、灵活型数据服务、个性化数据服务,未来也必将发展为智能化数据服...

2020-04-19 18:32:40 1498

原创 【建议收藏】六个免费的在线OCR识别网站,显著提高你的工作效率!

日常生活中,很多时候,我们需要将图片信息转换成文字。比如读一本纸质版的书时,读到有价值的片段,希望保存成电子存档以后翻出来看;比如希望将照片里的文字信息提取出来保存。照着图片一个字一个字地敲在word文档上固然可以,但是作为一个程序员,对于这种低效重复的事情,只要机器能做,是不会自己动手的。现如今,深度学习算法已经大幅度提高了文字识别的准确率,让自动化的OCR识别(Optical Charac...

2020-02-22 22:48:57 26897 1

原创 谷歌强势出手,人工智能学习者有福了,从此数据资产跨入搜索时代!

1995年,正是互联网方兴未艾之时,雅虎横空出世,雅虎以提供互联网各种信息目录起家,迅速崛起成为世界互联网巨头,整个互联网行业也迎来了门户网站时代。彼时的第一批互联网居民,要想在互联网上获取信息,就需要登录雅虎等门户网站,一页页地翻找目录。即使这样,也极大地方便了大家获取信息。然而,随着互联网信息爆炸式增长,门户网站的这种收录目录的形式根本不能适应日渐暴涨的互联网内容。于是,以谷歌为代表的搜索...

2020-01-30 11:39:11 938

原创 机器学习超详细实践攻略(23):三板斧干掉样本不均衡问题之3——通过集成学习方法解决样本不均衡

解决样本不均衡问题的第三种策略

2020-01-29 18:14:56 1974 3

原创 机器学习超详细实践攻略(22):三板斧干掉样本不均衡问题之2——对正负样本设置不同权重

二、通过正负样本的惩罚权重解决样本不均衡1、简单粗暴法:在算法实现过程中,给样本量比较少的类别得到的损失值赋予更高得权重,给样本量较多的类别得到的损失值赋予更低得权重,然后进行说白了就是简单粗暴地为小样本标签增加损失函数的权值,原理很简单。对于交叉损失函数来说,具体公式在:https://blog.csdn.net/weixin_42462804/article/details/998210...

2020-01-28 20:56:24 4349 1

原创 解决github加载不了图片的问题

其实就是hosts的问题,搜索了一圈,发现解决方案直接明了:解决方法,打开路径C:\Windows\System32\drivers\etc下的hosts文件# GitHub Start 192.30.253.112 github.com 192.30.253.119 gist.github.com151.101.184.133 assets-cdn.github.com151.101...

2020-01-07 21:53:51 11387 16

原创 机器学习超详细实践攻略(21):三板斧干掉样本不均衡问题之1——过(欠)采样

想象一下,假如今天是你作为数据分析师入职的第一天,老板交给你一个数据分析任务:通过公司已经有的信用卡用户和交易信息,预测用户未来是否会逾期还款。这个问题看似简单,实则隐藏了一个非常大的坑:据粗略估计,全国的信用卡平均不良率只有不到1%,也就是说,银行贷出100万,可能只有1万没有办法正常收回,这样,如果你拿到一个信用卡还款数据集,很大可能是这个数据集里有99%的正样本,1%的负样本,在预测的时...

2019-12-26 22:12:16 2374 1

原创 机器学习超详细实践攻略(1):盘点scikit-learn里那些有趣又有用的彩蛋级入门数据集

在机器学习算法的学习过程中,找到用来适合用来练手的数据集是我们面临的第一道门槛,毕竟俗话说得好,巧妇也难为无米之炊嘛。为此,我在知乎上写过一篇回答:机器学习需要的大量数据集从哪里找?这篇回答主要是介绍了从各个比赛平台寻找机器学习相关实战数据集的方法,目前已经获得了1.5k个赞同,看来大家对于数据集的需求还是挺旺盛的。不过,虽然这些数据集都是从实际的业务场景抽离出来的,都有着实际的义务含义,但...

2019-12-24 10:10:37 1594

原创 python concat时报错‘InvalidIndexError: Reindexing only valid with uniquely valued Index objects’

在使用pd.concat((A,B)axis = 1)这个函数合并两个相同的DataFrame的时候,出现了报错:InvalidIndexError: Reindexing only valid with uniquely valued Index objects原因是待合并的两个dataFrame索引并不相同,需要对他们分别重新设置索引:A = A.reset_index()B = ...

2019-11-11 10:01:35 20834 2

原创 利用Git构建云服务器实现多台电脑同步工作

公司里有电脑,自己电脑就赋闲在家。为了,探索两台电脑的无缝协作模式。尝试了用有道云笔记等云笔记软件备份,每次拖拽到本地电脑更新,但是上传到云笔记的文件只能单个另存到本地,不能批量操作,严重阻碍了工作效率,最后还是拿起了无数程序员五星好评的git利器。一、安装git首先安装git,下载网址在这里:git 直接一路点下一步安装即可。二、构建本地仓库在你的本地建立一个目录。以后在这里放置需...

2019-10-23 22:38:45 1930

原创 win10下配置conda的环境变量时遇到:LoadLibrary() argument 1 must be str,not None问题

换了新电脑,重新安装了一下anaconda。但是在配置环境变量的时,网上大多给出的配置方案都是在系统路径里配置anaconda的根目录和script目录。但是这是一个误导,亲测win10在配置之后还会出现这样的问题:最后经过查阅资料,其实总共需要配置三个变量(前边的具体路径根据自己的anaconda安装路径来确定):C:\Anaconda3C:\Anaconda3\ScriptsC:\A...

2019-10-11 14:05:50 1664 2

转载 Python生成正态分布

参考链接:Python使用numpy产生正态分布随机数的向量或矩阵操作示例

2019-09-25 22:48:59 3738

原创 入门Pandas数据分析,这篇文章就够了

一、pandas的两大数据类型Series:一维数组,与Numpy中的一维array类似。二者与Python基本的数据结构List也很相近,其区别是:List中的元素可以是不同的数据类型,而Array和Series中则只允许存储相同的数据类型,这样可以更有效的使用内存,提高运算效率。Time- Series:以时间为索引的Series。DataFrame:就是二维的Series。...

2019-09-09 21:49:19 799

原创 在安装Python包的时候报错:error: Unable to find vcvarsall.bat的解决办法

在使用openpose这个人体姿态检测程序过程中,用到了一个C++包,但是在windows系统下需要利用swig组件编译一下才可以使用,但是windows下比较坑的一点就是编译工具不完善,在使用swig的过程中老是报错:error: Unable to find vcvarsall.bat,费了好大劲终于折腾好了,同时了解了一下Windows下的Python包编译原理,记录一下。一、vcvars...

2019-07-17 23:37:46 3585

转载 亲测可用的一种加速下载github项目的方法

https://www.jianshu.com/p/9b677a053e6e

2019-07-16 23:24:38 2990

转载 Windows平台下Python使用swig调用C++

偶然用到了swig这个工具,这篇文章写的很好,转载一下,链接:https://www.jianshu.com/p/a257e630fe42

2019-07-16 17:07:09 529

原创 用python手刃Lintcode(一)

lintcode(8)题目:给定一个字符串和一个偏移量,根据偏移量旋转字符串(从左向右旋转)。样例对于字符串 “abcdefg”.offset=0 => “abcdefg”offset=1 => “gabcdef”offset=2 => “fgabcde”offset=3 => “efgabcd”挑战在数组上原地旋转,使用O(1)的额外空间解答:...

2019-07-04 12:09:52 139

原创 Pytorch从0到1系列之(1)---Pytorch的基本数据类型

正如numpy包中的array,Pandas包中的Series和Dataframe一样,为了方便计算,Pytorch也在Python数据结构的基础上封装了几个基本的数据结构。一、张量(Tensor)没错,就是TensorFlow名字里的Tensor,本来谷歌给TensorFlow命名的时候就是给这个框架赋予了深度学习就是“张量流动”的深刻内涵。因为深度学习处理的数据量和维度都比较大,所以很多深...

2019-06-14 20:00:52 1157

原创 Pytorch从0到1系列之(0)---安装Pytorch

1、前言以前在做深度学习项目的时候常常使用TensorFlow框架,但是明显感觉到,TensorFlow1.X版本在运行深度学习程序之前需要进行建立计算图、会话等操作,对于快速入门和尝试自己的小想法来说是一个不小的麻烦。就好比你想尝一口蛋炒饭的味道,虽然TensorFlow已经给你准备好了米、鸡蛋和各种调料,但是你依旧需要在吃这口饭之前煮米、打鸡蛋,生火(不过目前TensorFlow2.X版本正...

2019-06-10 12:22:41 313

原创 一些PyQt5相关控件的汇总博客

前言:最近在编写一个前端界面的时候用到了很多PyQt5的控件,发现这些控件使用起来很简单:只要首先知道每个控件都是什么样子,能够完成什么功能,然后导入对应的控件包,一句函数就可以直接生成,最后查查每个控件的方法和事件列表,进行符合自己需求的逻辑设计就好。需要本来想自己写一个系列的,但是很多博客已经介绍得很详细了,就不浪费时间重复造轮子了,有这个时间多研究研究最新的深度学习论文了。所以这里把自己查...

2019-05-10 22:42:08 1700

原创 利用Python中的numpy包实现PR曲线和ROC曲线的计算

闲来无事,边理解PR曲线和ROC曲线,边写了一下计算两个指标的代码。在python环境下,sklearn里有现成的计算函数,这里为了深入理解这两个指标,写代码的时候只用到numpy包。事实证明,实践是检验真理的唯一标准,在手写代码的过程中,才能真正体会到这两个评判标准的一些小细节,代码记录如下。

2019-05-06 20:51:34 6101 3

原创 Latex利用bibtex引用参考文献的方法。

首先,新建一个后缀名为.bib的文件,准备放置参考文献。(可以新建一个.txt文件并更改后缀名)。参考文献可以从google学术上直接导出,比如,我需要引用一篇mask-Rcnn相关的论文,在谷歌学术里搜索。找到对应的论文之后,点击栓双银引号图标,弹出对话框。如果用word写论文,可以直接复制第一个带格式的参考文献粘贴到word文献即可。对于Latex来说,还需要点击BibTex链接,得到Bi...

2019-04-25 21:31:13 28564

原创 用Latex写论文时如何简单方便地插入图片、表格和公式

学习Latex,有时不需要纠结每一行代码的含义,最好的方式就是百度到实现具体功能的代码,然后先放在ctex编译器里,再慢慢调整。对于复杂的功能尤其如此。比如我需要一个表格,直接搜索三线表的Latex代码,然后慢慢调整成自己需要的大小。图片和表格的引用使用Latex写论文,最大的优点主要有三个:1)可以利用代码方便地编辑公式;2)插入图表、公式不需要自己费心思排版,也不需要手动对图表和公式编号...

2019-04-20 11:26:06 5230

原创 Visual Convolutional Neural Network论文关键点

前言:这篇论文是2013年11月发表在CVPR上的,当时正值卷积神经网络在计算机视觉任务中初放光彩。17年刚刚接触深度学习的时候看过这篇论文,当时也是在组会上讲过。以下就是大概的讲解思路。但是当时看这篇论文没有太大的感觉,觉得这篇论文只是做了一个非常简单的事情。前两天偶然翻出来这篇论文,却觉得有些地方挺有意思的,果然论文和人颇有相似,讲究的是对的时间遇到对的人。这里先把当时讲的一些要点摘抄过来,...

2019-04-18 22:30:15 267

原创 深度解析SSD论文

前言:以前对SSD算法只有一个比较粗浅的理解,这周为了在组会上讲清楚SSD算法,自己又仔细看了好几遍论文,算是抠得比较细的一篇论文了,总结如下。一、背景当前基于深度学习的通用目标检测框架主要分为两大类,一类是基于候选区域选择的深度学习目标检测算法,该方法将检测分两步完成,其基本步骤是:第一步生成可能存在目标的区域,第二步将每个该区域都输入分类器中进行分类,去掉置信度较低的候选区域,并修置信...

2019-04-18 18:21:17 5041 2

原创 Tensorflow打印tensor值的方法

Tensorflow由于经过了封装,所以它的值在控制台上是打印不出来的,只能打印出维度,例如这样:import tensorflow as tfA = tf.constant(666)print(A)输出结果:<tf.Tensor ‘Const:0’ shhape=() dtype=int32>这是因为tensorflow的基本执行原理是数据流,以上语句只是占用了一个...

2019-03-09 11:24:38 3015

原创 python数组各元素取整

对于python数组来说,可以有三种格式:numpy包里的array格式,例如,创建一个三行而列的数组:A = np.array([[1,2],[3,4],[5,6]])。matrix格式,例如:B = np.matrix([[1,2],[3,4],[5,6]])。下边,分别进行mat格式,例如:A = np.matrix([[1,2],[3,4],[5,6]])。利用list组成的数组,...

2019-03-06 20:29:53 25392 1

原创 tensorflow报错:``ValueError:No op named NonMaxSuppressionV3 in defined operations.``

在tensorflow上测试一个训练好的pb模型时报错:ValueError:No op named NonMaxSuppressionV3 in defined operations.排查报错原因,最后发现我的pb模型是在tensorflow1.11版本下训练得到的,而加载这个模型的tensorflow版本是1.6,所以需要将原有低版本tf卸载,进行高版本的安装。当然可以直接用pip安装,...

2019-03-05 23:10:18 4715 1

转载 Tensorflow可视化--tensorboard

最近在准备写论文用到的数据,为了凑几张图片,开始接触tensorboard。才发现tenboard真心强大。好后悔没有早接触这个东西。以前很多时候都是瞎调参数。把数据扔进去,然后一顿操作猛如虎。得到的结果时好时坏,只能听天由命。但Tensorboard提供了训练过程中的loss等参数的实时观察,就好比在这个炼丹炉上添加了温度计,压力表等多种现代化仪器,可以让你实时观察训练过程,早点发现训练异常。...

2019-03-04 23:19:19 405

原创 sklearn光速入门实践[1]——实现一个简单的SVM分类器

首先,准备好数据,为了方便起见,我们这里不需要下载什么机器学习里常用来做范例的鸢尾花数据集,只是简单地准备几个二维平面上的点。我们把[2,0],[0,2]这两个点当作类别1;[3,0],[0,3]这两个点当作类别2。1、组装数据集。在组装数据集的时候,要注意数据的组合,data中每行元素作为一个样本:data = np.array([[2,0],[0,2],[3,0],[0,3]]) 。l...

2019-02-15 23:57:48 3944

转载 怎么理解anchor?

前言:这个知乎:faster rcnn中rpn的anchor,sliding windows,proposals之间的联系是什么?问题下的一个回答,这个回答首先解决了anchor是什么(what)的问题,对于初次接触到anchor这个概念的朋友来说,理解到这个深度已经够了。以后研究相关的论文之后,再来补充为什么这么设置anchor的问题(Why)。首先我们需要知道anchor的本质是什么,本...

2019-02-07 18:05:59 2990 2

Greedy function approximation - A gradient boosting machine (1).pdf

GBD的出处论文,看到好多人10积分下载,真的奸商啊。这里直接最低积分分享

2019-09-29

Python初学教程:《简明Python教程》

Python初学教程:《简明Python教程》。python方面的入门书籍,python基础知识一网打尽

2017-10-13

与孩子一起学编程(中文完整版)

与孩子一起学编程(中文完整版),编程小白入门必读书籍

2017-10-13

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除