自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(29)
  • 资源 (4)
  • 收藏
  • 关注

原创 Excel实战:时间转换、字符串拆分和多条件判断

本文通过通话记录数据判断拨打国内电话还是国际电话的例子,介绍了时间转换函数date,字符串拆分函数mid,条件判断函数if,以及透视表的分类汇总功能。

2017-09-20 16:19:05 3657

原创 Python批量修改文件名

工作中经常会遇到需要批量修改文件名的情况,比如: 有这样一个文件夹,里面是249个国家的国家,按照ISO 3166-1标准中的国家二位简称进行命名: 现在面临这样的需求,需要将二位英文简称命名的文件换成国家代码命名的文件。 比如,第一个国家Andorra,简称AD,根据表格对应的国家码,需要将AD.png修改为20.png。 资源下载链接:http://download.csdn.net/d

2017-08-21 15:26:35 3842 1

原创 机器学习之Logistic回归与Python实现

logistic回归是一种广义的线性回归,通过构造回归函数,利用机器学习来实现分类或者预测。一 Logistic回归概述1.1 分类函数1.2 Cost函数1.3 梯度上升法求J(w)J(w)J(w)最大值二、Python算法实现2.1 梯度上升法求最佳回归系数2.2 算法改进三 实例3.1 通过logistic回归和氙气病症预测马的死亡率...

2017-06-01 15:42:03 17239 2

原创 机器学习之朴素贝叶斯(NB)分类算法与Python实现

朴素贝叶斯(Naive Bayesian)是最为广泛使用的分类方法,它以概率论为基础,是基于贝叶斯定理和特征条件独立假设的分类方法。文章总结在学习《机器学习实战》过程中的心得体会,对朴素贝叶斯的原理和Python实现方法进行了归纳总结。

2017-05-09 23:22:32 25288 9

原创 机器学习之决策树(ID3)算法与Python实现

机器学习中,决策树是一个预测模型;他代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象,而每个分叉路径则代表的某个可能的属性值,而每个叶结点则对应从根节点到该叶节点所经历的路径所表示的对象的值。决策树仅有单一输出,若欲有复数输出,可以建立独立的决策树以处理不同输出。 数据挖掘中决策树是一种经常要用到的技术,可以用于分析数据,同样也可以用来作预测。

2017-05-07 16:48:52 19730 8

原创 机器学习之k-近邻(kNN)算法与Python实现

k-近邻算法(kNN,k-NearestNeighbor),是最简单的机器学习分类算法之一,其核心思想在于用距离目标最近的k个样本数据的分类来代表目标的分类(这k个样本数据和目标数据最为相似)。一 k-近邻kNN算法概述概念特点kNN算法流程二 Python算法实现KNN算法分类器kNN算法用于约会网站配对KNN算法用于手写识别系统一 k-近邻(kNN)算法概述1.概念kNN算法的

2017-05-04 17:01:17 22614 5

原创 用Python实现数据的透视表

在处理数据时,经常需要对数据分组计算均值或者计数,在Microsoft Excel中,可以通过透视表轻易实现简单的分组运算。而对于更加复杂的分组运算,Python中pandas包可以帮助我们实现。

2017-04-06 23:36:39 23735 1

原创 神农尝百草---Windows环境下为Python3.X安装basemap

basemap是matplolib的一个插件,提供了许多将地理位置(如经度和纬度)转化为二维matplotlib图的方式,是地图数据可视化的重要工具。相比较于Python2.7,Python3.6安装basemap却复杂一些,因此本文分享Windows系统下为Anaconda集成的Python3.6安装basemap的失败和成功过程,供大家参考。

2017-04-01 21:03:30 24911 77

原创 MySQL数据库存储过程

本文以MySQL数据库为例对数据库存储过程进行介绍,包括创建、查看、执行和删除存储过程,并对比了WHILE和repeat循环的差别。存储过程(Stored Procedure)是在大型数据库系统中,一组为了完成特定功能的SQL 语句集,存储在数据库中,经过第一次编译后再次调用不需要再次编译,用户通过指定存储过程的名字并给出参数(如果该存储过程带有参数)来执行它。存储过程是数据库中的一个重要对象。——百度百科

2017-03-22 19:34:29 14271 9

原创 MySQL数据库视图:视图定义、创建视图、修改视图

视图是指计算机数据库中的视图,是一个虚拟表,其内容由查询定义。视图不直接存储数据,不知真正的表。关系型数据库中的数据是由一张一张的二维关系表所组成,简单的单表查询只需要遍历一个表,而复杂的多表查询需要将多个表连接起来进行查询任务。对于复杂的查询事件,每次查询需要输入SQL命令,重复且低效,视图可以大大降低查询的重复性。

2017-03-20 11:54:15 183371 21

原创 MySQL数据库索引:删除、查看、创建索引

索引(index)是对数据库表中一列或多列的值进行排序的一种结构,使用索引可快速访问数据库表中的特定信息。正常的一张表,是无序,如果要进行查询操作,理论上会将表中所有记录进行遍历。并且每次查询都需要从第一条到最后一条挨个查找,以防查漏。这样显然是低效的。 为了解决这个问题,引入了索引的概念。索引是将记录按照某个关键字段(key)进行排序,因此,索引的存在是为了便于检索。本文多索引进本的指令代码进行介绍。

2017-03-16 16:40:45 2615

原创 MySQL数据库事务处理

事务处理用于有效记录某机构感兴趣的业务活动(称为事务)的数据处理(例如销售、供货的定购或货币传输)。通常,联机事务处理 (OLTP) 系统执行大量的相对较小的事务。事务处理是将多个操作或者命令一起执行,所有命令全部成功执行才意味着该事务的成功,任何一个命令失败都意味着该事务的失败,因此,事务处理不是一荣俱荣,而是一毁全毁。本文对数据库事务处理相关的存储引擎、事务处理的概念、分离水平、以及死锁进行简单介绍。

2017-03-16 15:43:33 24273 7

原创 MySQL数据库表的管理(修改表,复制,新增、修改列,删除表列)

关系型数据库的数据通常都是以表的形式存储和展现,因此可以简单而粗暴地讲,一个关系就是一个表。在创建表格后,在后期对数据库表的管理工作中,表的维护、修改是重要工作,如增加一个新列,删除一列,修改某属性的数据类型等,本篇文章总结表管理的基本操作。包括复制和删除表,新增、修改、删除列。

2017-03-14 14:39:39 7446 3

原创 MySQL基本操作:数据库的创建、查询、更新、插入、删除表格

MySQL体积小、响应速度快、成本低,是时下最流行的关系型数据库管理系统之一,受到众多用户的追捧和喜爱。本文对MySQL的基本操作,如创建数据库、创建表格、查询、删除进行简单的总结。

2017-03-11 17:31:00 4575 1

原创 python 使用过程问题总结

对于刚接触Python,在使用过程中存在许多简单或复杂的问题,本文总结Python使用过程中常见的一些问题,欢迎补充。

2017-03-06 11:16:24 6952

原创 R语言基础画图/绘图/作图

语言免费且开源,其强大和自由的画图功能,深受广大学生和可视化工作人员喜爱。这篇文章对如何使用R语言作基本的图形,直方图,点图,饼状图以及箱线图进行简单介绍。

2016-11-29 21:34:14 73959 1

原创 MySQL安装过程问题:服务器名无效,发生系统错误 5 拒绝访问

1 服务器名无效安装好MySQL之后,使用CMD系统命令程序,输入命令启动MySQL,提示“服务器名无效”。 原因1:服务器名字错误 解决方法: 检查命令行中服务器名是否正确,MySQL5.7.15默认服务器名是“net start mysql57”2 发生系统错误5 拒绝访问 原因1:不是管理员权限打开 解决方法:用管理缘方式打开CMD,具体方式如下:在Windows搜索栏中搜索CMD

2016-10-15 11:22:16 6610 2

原创 数据挖掘的基本概念:数据库、数据仓库、机器学习,统计学

“数据挖掘“(Data Mining)又被称为“数据中的知识发现”(KDD),顾名思义,也就是通过数据清理、数据集成、数据选择、数据变换、数据挖掘、模式评估、知识表示等一些列步骤,对数据进行分类、聚类,发现其中的关联关系或者离群点,来发现新的知识。

2016-09-24 20:01:07 3725

原创 Stata基本功能及其函数实现

Stata简介:Stata使用简单,功能强大,是数据分析中常用的统计计量软件。本人使用的是Stata14,如若需要,可评论留言!1 Stata基本描述1.1主窗口   如图所示,Stata大致可以分为五个部分。   最上面是菜单栏,或者成为工具栏,功能栏,包括file,Edit,Data,Graphics,Statistics,User,Window,Help八个主要菜单,其中每个菜单下又

2016-06-28 11:30:27 46881 6

原创 单样本和两样本的统计推断:置信区间和假设检验

根据样本可以推断总体均值,总体比例,总体方差等的置信区间,并对假设进行检验。其中,样本按照来源可以分为单样本和两样本,按照样本容量大小可以分为大样本容量和下样本容量,根据中心极限定理,大样本容量下的总体均值、总体比例的抽验分布近似正态分布,而小样本容量下的抽样分布一般采t分布。

2016-06-12 20:44:17 18147

转载 产品开发中项目与项目管理

《人人都是产品经理》读书笔记3之前提到产品立项之前会有需求的采集、分析和筛选,需求的采集主要从定性与定量,说与做四个维度进行,需求分析需要将用户需求转化为产品需求,确定需求基本属性、分析商业价值,编写BRD,评价实现难度和计算性价比,通过产品会议确定产品进度和状态。之前的都是准备工作,如果产品会议通过,进入立项开发阶段,那么项目就算正式起飞了,也就是项目的管理,包括立项、需求开发、产品开发、测试再到发布。

2016-06-08 19:29:46 6437

转载 样本统计量与总体的关系,抽样分布的概念性质

本文对抽样分布的概念、无偏差和最小偏差等性质,以及中心极限定理和样本比例的抽样分布进行总结。2 抽样分布基本概念 参数(parameter):参数是对总体的数值描述,因为是总体,所以值经常是未知的。 样本统计量(sample statistics):样本的数值描述,利用样本计算而来。常见的参数和样本统计量如下表所示。总体参数样本统计量均值μ\mux¯\bar{x}中位数η\etam

2016-06-08 11:39:25 15506

转载 用户需求和产品需求的采集、分析、筛选和管理

1 需求管理流程产品的需求管理有需求采集、需求分析和需求筛选几个阶段,经过这几个阶段之后才会进入立项的阶段。 需求管理流程图2 用户研究方法需求采集主要是从用户的角度进行需求的采集,横向看,用户有说和做,顾名思义,说,就是让用户说话,而做,就是让用户实际去做;用户的说和做,往往是不完全一致的。纵向来看,用户的研究有定量研究和定性研究,定性研究一般是用户研究较早阶段,从无到有,找出原因,偏于理解

2016-05-22 13:02:35 20276

翻译 UCD的产品设计原则

一. UCD UCD,user-centered design ,也就是以用户为中心的设计原则,是在产品开发和设计过程中的核心原则。 所谓的以用户为中心,就是以用户的需求为中心,产品的研发和设计始终围绕着用户的需求。与之相对应的是BCD(boss-centered desing),以老板为中心的设计准则。 UCD是一种设计思想,并不是一种实际的设计方法,可以避免设计开发人员自己钻牛角尖,凭自己

2016-05-18 21:10:52 6980

翻译 统计学:离散型和连续型随机变量的概率分布

1. 离散型和连续型随机变量的定义离散型随机变量(discrete random variable):取值是可数的个值的随机变量, 比如投掷一枚骰子的朝上的点数,可能是1,2,3,4,5,6;比如南京大学四食堂吃饭的人数,可能是0,1,2···。 连续型随机变量(continuous random variable):取值是一个区间中的任意一点(也就是不可数)的随机变量,比如南京大学同学身高。

2016-05-18 11:16:58 40583 3

原创 概率论中基本概念回顾

概率论和统计学恰好是两个相反的概念,统计学是抽取部分样本进行统计来估算总体的情况,而概率论是通过总体情况来估计单个事件或者部分事情的发生情况。笔者回顾统计学中概率论部分的基本概念。

2016-05-17 18:40:35 4480

原创 图形和数值的数据集描述方法

图形方法对数据集的描述1. 条形图(bar graph) 条形图一般横向表示类别(class),纵向表示该类别所对应的类别频率(class frequency)。 2. 饼状图(pie graph) 饼状图是一个圆周,每个类别对应的扇形面积大小和类别相对频率(class relative frequency)成比例。 3. 帕累托直方图(pareto diagram) 帕

2016-05-12 20:08:04 3445

原创 统计学中的基本概念

《商务与经济统计学 》读书笔记一. 统计学思维 1. 统计学几个基本概念 描述统计 和 推断统计(统计的两大应用)描述统计(descriptive statistics):利用数字或者图标的方法,寻找数据的规律,总结其中的信息,以恰当的方式展示这些信息。推断统计(inferential statisticss):利用样本数据信息,对总体情况估计、推断、预测或

2016-05-12 17:33:47 6523

翻译 敏捷UX开发与UCD

1新产品开发流程的三种类型类型A:瀑布型开发模式,各个步骤按照顺序进行类型B:各个步骤首尾部分迭代进行类型C:多个步骤以重叠的方式同时进行2 敏捷开发和UCD开发模式敏捷开发是渐进式的开发模式,把产品分成很多小块,以小块儿作为单位进行开发。UCD是迭代式的开发模式,从一个大概的轮廓开始,逐渐提高完成度。

2016-05-10 15:46:27 1155

simpletest.py

basemap 测试脚本simpletest.py

2017-08-30

python批量修改文件名“资源”

运用Python按照要求批量修改文件名

2017-08-21

KNN测试用数据

KNN训练数据

2017-05-04

约会网站训练样本集数据

机器学习实战KNN算法训练数据

2017-05-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除