自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

数据科学爱好者

数据时代,我们一同学习、记录、分享、成长!

  • 博客(14)
  • 收藏
  • 关注

转载 机器学习小卡片(1)——Adaboost算法

2018-12-06 23:17:32 234

原创 正态分布

简介正态分布(Normal distribution)又称为高斯分布(Gaussian distribution),是统计学中一个重要且常见的连续概率分布。若随机变量X服从一个均值为μ, 的正态分布,其中μ为均值, 为方差,则记为:其概率密度函数为:正态分布的概率密度曲线呈钟形,因此又被称为钟形曲线。如图所示:特殊的,我们将μ=0,=1的正态分布称为标准正态分布。主要特征:正...

2018-11-12 11:04:20 9376

原创 L1、L2正则化

简介在之前的博客里介绍了常见的防止过拟合的方法,这次主要就其中的L1、L2正则化方法进行介绍并比较它们的不同。我们使用L1、L2正则化方法的目的,在于减缓机器学习中的过拟合现象。为什么它们能减缓过拟合现象呢,由于正则项的加入,使得权重矩阵的值减小,因为它假定一个拥有更小权重矩阵的神经网络将产生更简单的模型,进而在一定程度上能减缓过拟合。在L1和L2中,所采用的正则化项是不同的。...

2018-11-07 21:07:42 481

原创 我的个人博客

欢迎关注我的个人博客,不定期更新文章,相互交流,一起学习成长。网址:http://www.xiepeng21.cn 

2018-09-22 15:39:32 159

原创 nvidia-smi命令的参数解读

在命令行终端输入nvidia-smi,可以进入nvidia的系统管理界面,查看主机的显存使用情况。图中参数的含义:GPU:GPU编号Name:GPU的名称Persistence-M:持续模式,默认为关闭,比较节能,如果设置成on,耗能比较大,但新的GPU应用启动时,花费的时间更短Fan:风扇转数,在0~100%之间变化Temp:GPU的温度,单位为摄氏度Perf:性能状态,从P0到P12,P0表示...

2018-05-06 22:21:46 5310 2

原创 完全分布式Hadoop集群搭建(Ubuntu16.04+hadoop2.6.5)

准备工作:三台虚拟机,其中一台主机,两台节点;需要提前下载好的文件:ubuntu-16.04.4-desktop-amd64.iso.jdk-8u92-linux-x64.tar.gz.hadoop-2.6.5.tar.gz.完全分布式Hadoop集群安装Step1 安装3台Linux虚拟机。1.在Vmware workstation软件里面,新建虚拟机,将一台ubuntu-16.04.4安装好,...

2018-05-02 20:50:37 15336 3

原创 Hexo搭建个人博客教程

在寒假期间,我用hexo+github搭建了自己的博客,比较方便、省钱,而且网上相关教程也很多。在搭建的过程中,遇到了一些问题,折腾相关的配置花了不少时间,现在把搭建博客的过程记录下来,方便以后查询,也希望能让搭建博客的新人少走一些弯路。本地博客搭建安装Node.js。下载网址:https://nodejs.org/en/download/ 根据自己的操作系统,选择下载,安装完成即可。安装Git。...

2018-04-24 20:17:04 272

原创 【机器学习】防止过拟合的方法

什么是过拟合?从训练样本中尽可能学出适用于所有潜在样本的“普遍规律”,这样才能在遇到新样本时做出正确的判别。然而,当学习器把训练样本学得“太好”了的时候,很可能已经把训练样本自身的一些特点当作了所有潜在样本都会具有的一般性质,这样就会导致泛化性能下降。这种现象在机器学习中称为“过拟合”(overfitting)。与过拟合相对的是“欠拟合”(underfitting),这是指对训练样本的一般性质尚未...

2018-04-14 16:59:55 1007

原创 科研PPT-配色

黄底+黑字:适用于对于需要突出的文字并加以强调,但是不适合大片的黄色背景,会显得刺眼和不舒服。红底+黑字:适合于节日汇演,但不适合在科研报告中,除非需要调动观众情绪。黑底+红字:黑底红字的阅读速度最慢,一般很少用。科研报告中的常用色是在白色背景上使用深蓝色和深绿色的字体。图表也可以使用这两种颜色。总结:制作科研PPT时,选用的PPT配色还需根据实际需求,

2018-01-10 22:01:23 5413 2

原创 自然语言处理简介

一、定义实现人机间自然语言通信意味着要使计算机既能理解自然语言文本的意义,也能以自然语言文本表达给定的意图、思想等。前者称为自然语言理解,后者称为自然语言生成。自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。(百度百科定义)二、自然语言处理的测试要

2018-01-08 20:29:13 3700

原创 windows下的Anaconda或Miniconda安装

Anaconda是一个开源的Python发行版本,包含了conda、python等180多个科学包及其依赖项。因为包含了大量的科学包,所以Anaconda的安装包比较大。如果为了省时间,也可以使用Miniconda这个较小的发行版。Miniconda是最小的conda安装环境。Miniconda的下载网址为https://conda.io/miniconda.htmlAnaconda的下载

2017-12-28 21:13:35 22796

原创 python-提取一串字符串中的数字

有时候,我们需要把一串字符串中的数字提取出来,那么python中提供了isdigit()函数来判断字符是否是数字。问题:提取‘abc123qwer456tyui789’这个字符串中的数字并打印出来。程序实例:str = 'abc123qwer456tyui789'num ''.join([x for x in str if x.isdigit()])print(num)运行结果如下...

2017-09-18 11:44:31 34335 6

原创 python-循环

1、打印10以内的乘法表。效果如下:代码如下:#!/usr/bin/env python3m = 1print('-'*50)while m < 11: n = 1 while n <= 10: print("{:3d}".format(m * n),end=' ') n += 1 print() m += 1print('-'*50)2、(1)打印星

2017-09-12 23:40:41 333

原创 已连接网络,出现浏览器无法连接到代理服务器

今天打开电脑,连接上网络后,打开浏览器,出现“浏览器无法连接到代理服务器”的错误提示,无法正常访问网页。开机重启,修改DNS都无果后,查阅网上的资料,终于解决了这个问题,记录下来,以免以后再次遇到时,可以查阅,也分享这个解决办法给遇到同样问题的大家。1、以谷歌浏览器为例,点击浏览器右上角菜单栏,再点击“设置”2、进入设置之后,点击“高级”,展开3、点击“打开代理设置”

2017-09-11 20:09:06 15798

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除