自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(62)
  • 资源 (7)
  • 收藏
  • 关注

原创 人群统计

人群分析、人群计数 开源代码文献及数据库

2018-08-27 10:48:52 1507

原创 ubuntu下安装matlab,caffe,CUDA,CUDNN

网上有很多安装教程,但有的很坑,有的可以,这里总结成功安装上述软件时参考的网址1、ubuntu下安装matlab2、ubuntu16.04 + cuda9.0(deb版)+Cudnn7.13、超详细配置Caffe(gpu版本+ubuntu16.04)考虑各种问题...

2018-08-27 10:35:49 381

原创 新安装ubuntu需要解决的问题汇总

1、source源配置:图形界面修改源,将默认的源修改成一个比较快的源。1.图形界面就可以修改,打开Ubuntu软件中心,点击顶部面板的“编辑”然后就可看到“软件源”选项了。2.点击之后填出软件源编辑窗口,选择“其他站点”。3.可以选择最佳服务器,也可以直接在左边选择一个你觉得快的源,163.com其实挺好。4.选择服务器,弹出授权,输入你的系统密码就可以了。5.在终端修改...

2018-08-22 15:53:52 492

原创 数字图像处理——pillow,scikit_image,dali(英伟达)

目前基于python 的图像处理库有很多,比如传统的opencv。但是这里将通过网址总结的形式介绍最近常用的图像处理库,用于图像增强等。1、python skimage图像处理(一)、(二)、(三)2、...

2018-08-21 16:57:22 1146

转载 计算机视觉方向数据集(转)

 转自:https://blog.csdn.net/qq_14845119/article/details/51913171ImageNet         ImageNet是一个计算机视觉系统识别项目,是目前世界上图像识别最大的数据库。是美国斯坦福的计算机科学家李飞飞模拟人类的识别系统建立的。能够从图片识别物体。目前已经包含14197122张图像,是已知的最大的图像数据库。每年的Im...

2018-08-20 15:35:55 3340 1

原创 VMWare、SVN、Linux遇到问题及解决方法

1、VMware Tools安装 与环境配置2、SVN安装与教程3、Linux命令与查询4、Authorization failed解决办法5、Authorization failed解决办法26、Authorization failed解决办法3——服务器赋予客户端的文件下载权限与客户端的文件需求不对应!!!7、SVN图标8、SVN Checkout cleanup...

2018-07-04 15:57:23 645

转载 计算机视觉开源代码集合(转)

声明:本文转载:http://www.ihalcon.com/read-3733.html一、特征提取Feature Extraction:SIFT [1] [Demo program][SIFT Library] [VLFeat]PCA-SIFT [2] [Project]Affine-SIFT [3] [Project]SURF [4] [OpenSURF] [Matlab Wrapper]A...

2018-06-20 21:44:52 543

原创 windows7+opencv+caffe+linux安装总结

Introduce这一类网上教程很多,有的很好,有的不靠谱,今天我就把成功的几个总结在一起方便大家使用。在windows7下安装opencv3.0和caffe以及linux双系统网址如下:1、VS2013下OpenCV3.0环境配置Note: 1、opencv和VS版本要匹配,最好是网上实践成功的版本、          2、opencv文件中的vc12对应vs2013,vc1...

2018-05-15 14:14:06 315

转载 Python2 与 Python3的区别

概述#原稿地址:使用 2to3 将代码移植到 Python 3几乎所有的Python 2程序都需要一些修改才能正常地运行在Python 3的环境下。为了简化这个转换过程,Python 3自带了一个叫做2to3的实用脚本(Utility Script),这个脚本会将你的Python 2程序源文件作为输入,然后自动将其转换到Python 3的形式。案例研究:将chardet移植到Python ...

2018-05-12 20:40:13 306

转载 计算机视觉——人脸检测与识别

原文参考: https://blog.csdn.net/u014568921/article/details/52816578人脸检测长文干货!走近人脸检测:从 VJ 到深度学习(上)长文干货!走近人脸检测:从VJ到深度学习(下)【Caffe实践】基于Caffe的人脸检测实现人脸检测——DDFD人脸检测——CascadeCNNCascadeCNN人脸检测学习笔记python批量预处理图片(Casc...

2018-05-12 13:56:27 2160

原创 一些值得关注的网址

       最近,总是能看到特别好的网站(知乎解答、博客等),欣喜之余,担心以后难有机会再次浏览里面内容。之前,使用过浏览器收藏网址功能,然而,遇到浏览器卸载,重装系统的情况时,之前的总结全部付诸东流,甚是可惜。因此,在这里汇总一下最近看到的比较好的网站,便于以后学习。也希望各位网友在评论区补充,我会不断更新。。。人工智能——计算机视觉1、YOLO(Real-Time Object De...

2018-03-02 14:56:48 524

原创 RNN,LSTM,GRU以及其变型

对于自然语言处理和时间序列问题,需要神经网络具有记忆特性,而传统神经网络并不能满足其要求。因此,具有记忆特性的神经网络结构相继被发明。包括RNN,LSTM,以及attention等。这里参考一些好的博文,可以从图解,公式,关键点解释和为什么会产生这种效果等方面理解这些算法;同时从前向传播到后向传播等也可以更加详细的去理解。参考博文:推荐给初学LSTM或者懂个大概却不完全懂的人详解 LSTM零基础入...

2018-02-11 15:49:08 734

转载 提高论文写作能力的方法论

转载于:http://www.sohu.com/a/150966243_7865811.要写好科研论文,必须先养成读英文文章的习惯,争取每天30-60分钟。刚开始可以选择以读英文报纸、英文新闻为主,逐渐转为读专业杂志。我会在近期专门写一篇博客文章介绍一套行之有效的增强读专业杂志能力的办法。2.写科研论文,最重要的是逻辑。逻辑的形成来自对实验数据的总体分析。必须先讨论出一套清晰的思路,然后按照思路来...

2018-01-22 15:23:27 922

原创 计算机视觉学习总结

计算机视觉工具:opencv+caffe+tensorflow+python+c++关注网址:斯坦福李飞飞-深度学习计算机视觉,计算机视觉领域的一些牛人博客,超有实力的研究机构等的网站链接,https://arxiv.org/list/cs.AI/recent关注期刊和会议:计算机视觉的顶级期刊有两个PAMI和IJCV,顶级会议有ICCV和CVPR或者CVPR+ICCV+ECCV+IC

2017-11-20 20:32:05 1781

转载 不平衡数据的分类评价指标总结

识别任务中混淆矩阵(Confusion Matrix)用于评价算法好坏的指标。下图是一个二分类问题的混淆矩阵:TP:正确肯定——实际是正例,识别为正例FN:错误否定(漏报)——实际是正例,却识别成了负例FP:错误肯定(误报)——实际是负例,却识别成了正例TN:正确否定——实际是负例,识别为负例 相关术语:

2017-10-30 19:39:19 15891 2

原创 激活函数总结(一)

Introduce激活函数可以理解为非线性映射,增加网络的复杂性。为什么这么说? 如图所示: 第一部分是对输入的加权求和的过程,是一个线性化表示。如果不用激励函数,每一层输出都是上层输入的线性函数,无论神经网络有多少层,输出都是输入的线性组合。如果使用的话,激活函数给神经元引入了非线性因素,可以证明可以任意逼近任何非线性函数,这样神经网络就可以应用到众多的非线性模型中。都有哪些激活函数?有什

2017-10-30 16:43:31 1094

原创 数据降维方法总结

Introduce经过这几天面试后,我发现数据降维这一块在工业界用的很多或者说必不可少,因此,这方面需要重点关注。今天,我将数据降维总结于此,包括他人成果,这里对他们的内容表示感谢。Method对数据降维作用有多个角度的理解。吴恩达在他的视频中说,降维是用于数据压缩,降低噪声,防止运行太慢内存太小;当降到2或3维可以可视化操作,便于数据分析;不要将降维用于防止过拟合,容易去掉和标签有关的重要特征。但

2017-10-30 11:51:35 24135 2

原创 机器学习的训练算法(优化方法)汇总——梯度下降法及其改进算法

Introduce今天会说两个问题,第一,建议大脚多看看大牛的博客,可以涨姿势。。。例如:1、侧重于语言编程和应用的廖雪峰https://www.liaoxuefeng.com/2、侧重于高大上算法和开源库介绍的莫烦https://morvanzhou.github.io/第二,加深对机器学习算法的理解。个人理解:经典机器学习算法,例如SVM,逻辑回归,决策树,

2017-10-23 21:32:25 6810 1

原创 tensorflow安装

Introduce这将近一个星期的tensorflow环境配置,发现了很多问题,对conda和pip有了更深入的认识,包括:比较了1、pip install tensorflow2、conda install tensorflow3、打开Anaconda Prompt,输入清华的仓库镜像,更新包更快:     conda config --add channelshttps

2017-10-21 16:46:40 351

原创 关于CNN的一些疑问总结

Introduce很早就听说CNN这个硬骨头,但始终没有尝试去啃,更别说消化吸收和转化了!昨天尝试了CNN初探例程——MNIST,虽然有不少收获,但还有很多疑问,这里进行整理和统一解答,以便以后再看。Q&A1、如何计算卷积和池化后特征维度?2、如何识别Tensorflow正在使用CPU还是GPU?3、为何程序中加入with tf.device("/gpu:0")

2017-10-20 09:55:55 481

原创 卷积神经网络(CNN)和Tensorflow初探——MNIST

Introduce之前,对于卷积神经网络(CNN)只停留在理论层面,基本专业术语(卷积层、池化层等),最多计算卷积后的值之类的。今天,依托于tensorflow官网例程,学习tensorflow框架同时进一步学习CNN,熟悉CNN中的超参数以及如何调超参数?为了以后复习方便,这次讲解会特别细!参考:https://www.leiphone.com/news/201705/6Zi5evpIa

2017-10-19 22:07:16 1002

原创 xgboost的前世今生

https://www.2cto.com/kf/201607/528771.html

2017-10-10 23:40:15 474

原创 非数值型多分类问题——Kaggle旧金山犯罪类型分类问题

十一前面了一家公司——极智嘉(Geek++), 做物流分拣机器人的。去之前一直在考虑,还是挺兴奋的,因为终于找到一家将机器人和机器学习结合的公司(除了视觉和聊天)。但是始终没有想清楚物流分拣与数据挖掘有什么关系?换句话说,结合点在哪儿?直到和四位算法工程师交谈之后才逐渐明白。(具体做啥包括面试过程,这里先卖个关子,以后再介绍)总之,这次面试之后,我开始关注非数值型分类问题。也算是自然语言处理中文本

2017-10-07 17:05:42 3560

原创 SVM的传奇故事——SVM知识点总结

IntroduceSVM是机器学习算法工程师面试必问算法,原理、推导、应用场景、算法比较等等,遂总结于此,方便他人和自己复习!SVMSVM的核函数如何选取?https://www.zhihu.com/question/21883548(1)如果特征维数很高,往往线性可分(SVM解决非线性分类问题的思路就是将样本映射到更高维的特征空间中),可以采用LR或者线性核的SVM;(2

2017-09-15 16:51:25 1578

原创 机器学习基础概念理解

最近在知乎上遇到一个测试题,检验自己对机器学习知识的掌握情况。好吧,觉得自己还没入门了,很多东西都不知道啊!于是乎,就把这些知识点总结下来,以便以后复习。而且,越来越多的信息表明,机器学习算法面试注重基础:算法原理以及背后的思考,自己的想法等等。当然,项目啥的必不可少这是后话了。问题:https://www.zhihu.com/question/63881885 马氏距离(

2017-09-15 09:37:26 1039

转载 剑指offer——python实现(面试必备)

原文:http://blog.csdn.net/u012505432/article/details/52071537特别感谢原文作者,转载过来,深入研究!2017年8月28日,开始刷题从剑指offer开始,python实现!数据结构markdown格式链表及常见操作平衡查找树AVL三种方法检测变位词Anagram构建堆二分查找二

2017-08-28 21:31:52 32844 3

原创 机器学习算法——KNN

Introduction学完python基本用法、numpy、pandas等数据分析库、机器学习应用的基本流程,kaggle竞赛的简单实践之后,下一步计划系统学学机器学习算法。一方面,理解算法中超参数的含义和理解他们是如何影响模型性能,在模型调优的过程中可以手动调节;另一方面,理解每种算法的应用范围和他们的优缺点等,在选择算法时不再盲目。同时,加深自己理论推导能力和抽象概念理解能力,进一步,提

2017-08-07 17:41:34 408

原创 sklearn学习——SVM例程总结(PCA+Pipline+cv+GridSearch)

Introduction其实对于SVM调节超参数不需要这么复杂,因为gamma可能更重要一点,固定C=1,手动调节gamma即可。此外,sklearn的网格搜索极其的慢,下面的代码出来结果至少要半个多小时,如果有经验根本不需要。对于有经验的人来说或许看学习曲线就能知道调什么参数。但是为什么还要这么做呢?可能是为了装吧,或许更直观一点,不需要老中医式的随便开点良药,看看效果再换药了!PCA:

2017-07-26 22:19:44 3470

原创 提高模型识别率——偏差、方差问题

Introduction本篇是针对当凭直觉做完一个Baseline以后,如何提高现有的识别率?依然凭直觉有以下几种方法:增加训练数据集挑选出更少的特征增加其他特征增加多项式x1*x2减少或增加惩罚系数然而,事实上虽然花了大量时间完成上述工作,效果不一定好(以上一篇Titanic为例,事实证明,三天的优化,识别率下降了。。。。)。再思考一下,识别率低的原因是什么?——欠拟

2017-07-22 22:09:56 9597

原创 python——数据可视化:matplotlib,seaborn,pandas

Introduction先给出先验知识:可视化方法对机器学习至关重要(系列)之一箱线图(Boxplot/violinplot);直方图(histogram);散点图矩阵(scatter plot matrice/splom);径向坐标可视化(radviz);平行坐标图(parallel coordinate);双标图(jointplot)

2017-07-22 16:36:29 1025

原创 python——pandas总结

Introduction先吐槽一下,CSDN博客编写模块太难用,很多bug!!!!!!!做了几个kaggle比赛之后,突然发现数据处理能力太差,包括缺省值处理,各种索引方式以及各种数据类型,彼此之间用法很容易搞混,因此有必要对pandas做做总结。参考了以下内容:1、十分钟搞定pandas2、七月在线——python数据分析班总结内容很多,这里只贴出部分内容

2017-07-18 21:53:18 1077

原创 kaggle竞赛——Titanic:Machine Learning from Disaster

题目地址:https://www.kaggle.com/c/titanic根据所提供的乘客信息,判断该乘客Survived or not?Introduction机器学习这块停了整整三个月,主要原因是一方面课题需要推进尤其是修改论文,进度特别慢,终于知道为啥修改论文要至少三个月了!另一方面,学习了数据结构与算法方面的内容,目的是提高自己编程能力,之前从未想过手编梯度下降、逻辑回归、BP

2017-07-12 13:13:01 1140

原创 机器学习岗位的面试准备——总结1

之前还想看完再自己总结,后来发现高估自己了,信息量太大,直接给参考链接:1、如何准备机器学习工程师的面试 ?内容过于丰富导致感觉自己就是个文盲,套用总结公式:数据结构算法水题+常用机器学习算法推导+模型调优细节+业务认识每一个都很重要,尤其是最后一个,最后给出算法工程师的特质,可以写在简历上:善于对事物深入思考2、写给准备参加秋招的学弟学妹们~一定要来看哦~

2017-07-04 21:16:36 18909 6

转载 kaggle初探——如何在 Kaggle 首战中进入前 10%

原文地址:https://dnc1994.com/2016/04/rank-10-percent-in-first-kaggle-competition/Introduction本文采用署名 - 非商业性使用 - 禁止演绎 3.0 中国大陆许可协议进行许可。著作权由章凌豪所有。Kaggle 是目前最大的 Data Scientist 聚集地。很多公司会拿出自家的数据并提

2017-07-04 16:51:25 1388

原创 python3小项目——爬取智联招聘信息(二)

这两天,心血来潮又把前几天的爬取招聘信息程序丰富了一下,是对爬取到的信息再处理以及分类保存。具体功能:将全部信息保存成矩阵形式,去除无用信息,并在当前目录下生成文件夹并此文件夹下把信息分类保存成.csv格式 #删除除"公司规模": "20人以下", "20-99人"; "最低学历": "博士","大专"; "经验": "3-5年","5-10年", "10年以上"的情况根据公司

2017-06-17 10:50:02 8087 11

原创 python3小项目——爬取招聘信息(智联招聘)

2017年6月,花了大概一周的时间学习了以下内容,并基于此写了一个小项目。这里对其进行总结,说明其中遇到的问题和解决方案以及下一步计划。

2017-06-09 11:36:44 2213 5

原创 python3.5——爬虫实现批量下载图片(正则表达式法和BeautifulSoup第三方库法)

先来例程:正则表达式法:(不推荐)# -*- coding: utf-8 -*-"""Created on Thu Jun 1 16:22:10 2017@author: qiu"""import urllibimport re##下载网页def get_content(url): ''' @url:需要下载的网址 下载网址 '''

2017-06-04 23:15:47 4825

原创 python ——网页爬虫乱码以及转码问题

前言:Python 3最重要的新特性大概要算是对文本和二进制数据作了更为清晰的区分。文本总是Unicode,由str类型表示,二进制数据则由bytes类型表示。Python 3不会以任意隐式的方式混用str和bytes,正是这使得两者的区分特别清晰。你不能拼接字符串和字节包,也无法在字节包里搜索字符串(反之亦然),也不能将字符串传入参数为字节包的函数(反

2017-06-01 15:26:25 3462

原创 基础算法——查找(二分法)(python)

二分查找法(BinarySearchST)应用十分广泛,是必须要掌握的查找方法。适用对象是有序数组。具有最优的查找效率和空间需求,能够进行有序相关的操作。但插入操作很慢。从编程技巧上来说,二分法适用于含有两个单调相关变化的量的情况,正相关或负相关。其中二分法过程可以抽象出模板,直接迁移套用。所需变量为区间边界:L、R,数学描述为[L,R);二分中点:mid=(L+R)/2;目标值x:用于决

2017-05-17 20:02:05 2346

转载 基础算法——排序(一)

总结:排序算法维基百科经典排序算法 - 快速排序Quick sort 经典排序算法 - 桶排序Bucket sort经典排序算法 -  插入排序Insertion sort经典排序算法 - 基数排序Radix sort经典排序算法 - 鸽巢排序Pigeonhole sort经典排序算法 - 归并排序Merge sort经典排序算法 -

2017-05-02 17:30:29 320

吴恩达手稿(Machine Learning Yearning)

最新更新的版本,本人将会持续更新并尝试翻译,敬请期待。。。

2018-07-17

吴恩达手稿版本(Andrew Ng Draft Version)

吴恩达手稿版本(Andrew Ng Draft Version),目前没有出书,只需要注册邮箱,就可获得该书籍,且该书还在更新中!

2018-07-01

目标检测经典论文:RCNN系列,YOLO系列,SSD,相关综述类论文

目标检测经典论文:RCNN系列,YOLO系列,SSD,相关综述类论文包括算法对比分析等

2018-07-01

深度学习关键词中英文对照

阅读英文论文会涉及到一些关键词翻译问题,这里给出了《计算机视觉与深度学习》课程中的关键词中英文对照

2018-07-01

python——pandas总结1

pandas基本用法和例程

2017-07-18

leetcode 经典题总结

leetcode 经典题分类总结 多种解法 数据结构+算法

2017-04-29

极限学习机改进算法

用于预测和分类的极限学习机改进算法

2016-10-30

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除