自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

新手写博客

初学编程和数据分析

  • 博客(19)
  • 收藏
  • 关注

原创 机器学习入门第四天

分类报告sklearn.metrics提供了分类报告相关API,不仅可以得到混淆矩阵,还可以得到交叉验证的查准率、召回率、f1得分的结果。这样可以方便的分析出哪些样本是异常样本。import sklearn.metrics as sm# 获取分类报告cr = sm.classification_report(实际输出, 预测输出)print(cr)决策树分类决策树分类模型会找到与样...

2019-04-18 20:53:32 358

原创 机器学习入门第三天

特征重要性作为决策树模型训练过程的副产品,根据每个特征划分子表前后的信息熵减少量就标志了该特征的重要程度,此即为该特征的特征重要性指标。通过模型训练得到的model对象提供了属性:feature_importances_来存储每个特征的特征重要性指标值。获取特征重要性相关API:model.fit(train_x, train_y)fi = model.feature_importance...

2019-04-17 22:06:54 217

原创 数据分析报告

数据分析报告到底是什么,有什么用,该怎么写。这个我也不知道,我觉得就可能跟毕业论文相似吧。但想到接下来的工作需要写大量的数据分析报告,就先查一查这个东西吧。先说一说数据分析报告是干什么的吧。数据分析报告的作用就是展示分析结果以及提供决策依据。那么数据分析报告长的什么样子呢? 据说是图文并茂,有清晰的分析框架,结论明确,通俗易懂,能够让读者一目了然。它的结构有总分总结构(感觉有点像小学时候写作文...

2019-04-16 21:42:44 14008

转载 (转)数据分析方法论

数据分析方法论主要有两大块:统计分析方法论:描述统计、假设检验、相关分析、方差分析、回归分析、聚类分析、判别分析、主成分与因子分析、时间序列分析、决策树等营销管理分析方法论:SWOT、4P、PEST、SMART、5W2H、User behavior等。一、统计分析方法论:1.描述统计(Descriptive statistics):描述统计是通过图表或数学方法,对数据资料...

2019-03-27 22:13:53 531

原创 机器学习面试题

本文来自七月实验室,无意间发现的一个公众号,感觉挺有用的,就摘录一下。(tips:一个在线的公式编辑工具:http://latex.codecogs.com/eqneditor/editor.php)1,哪些机器学习算法不需要做归一化处理?解析:在实际应用中,通过梯度下降法求解的模型一般都是需要归一化的,比如线性回归,logistic回归,KNN,SVM,神经网络等模型。但是树形模型不需...

2019-03-27 00:10:34 1151

原创 VBA 两小时快速入门

此教程适合有一定编程基础的人对象常用属性常用方法不懂得方法可以录制宏。(选中录制好的方法,f1可以查看帮助文档)变量与常量变量声明: dim a常量赋值:Const pi = 3.14变量赋值:set a = 10数据类型运算符条件判断语句1)if 条件 then 结果Elseif 条件 then 结果…End If2)Selsect C...

2019-03-19 14:34:18 2424

原创 superset 安装

1,创建虚拟环境conda create -n superset python=3.62,创建虚拟环境成功后,启动虚拟环境:activate superset3,安装pip install superset -i https://pypi.douban.com/simple 4,初始化切换到 \Anaconda3\envs\superset\Lib\site-packages\...

2019-03-07 12:39:33 762 2

原创 Win下安装 Mysql

Mysql 下载先去官网下载 :https://dev.mysql.com/downloads/mysql/按照图片的步骤,就下载好了。下载完之后需要手动解压一下解压完之后 就是上面这个样子。不过没有data这个文件夹。注意:不要解压到C盘。前辈的经验,所以我也没有解压到C盘。在当前目录下新建 my.ini文件,复制如下内容[mysqld]port = 3306basedi...

2019-03-07 10:42:00 130

原创 机器学习入门第二天

线性回归线性回归的本质为针对符合线性数学模型的一组数据,可以找到一个线性方程拟合样本数据。从而当给出自变量后,通过线性方程实现预测输出的目的。预测函数: y = w0 + w1xx: 输入y: 输出w0 w1: 模型参数所谓模型的训练,就是根据已知的x与y,找到最佳的模型参数 w0 w1,使得尽可能的精确描述所有输入和输出的关系(误差最小)。单样本误差:根据预测函数求出输入为x...

2019-02-26 13:15:18 233

原创 机器学习入门第一天

什么是机器学习机器学习是一门能够让编程计算机从数据中学习的计算机科学。一个计算机程序在完成任务T之后,获得经验E,其表现效果为P,如果任务T的性能表现(P),随着E增加而增加,那么这样的计算机程序就被称为机器学习系统。拥有自我完善,自我增进,自我适应的特点。机器学习的问题1. 建模问题所谓机器学习,形式上可以这么理解:在数据中通过统计或推理的方法,寻找一个接收特定输入x,并给出预期输出y...

2019-02-23 10:21:05 186

原创 Numpy 学习日志

Numpy基础ndarray数组ndarray 对象是用于存放同类型元素的多维数组。它是一系列同类型数据的集合。起初以为ndarray数组是矩阵,实际上并不是。ndarray中可以存储多种类型的数据,字符串,时间等。矩阵只能存储数值类型的。ndarray对象的创建np.array(任何可以被解释为Numpy数组的逻辑结构)import numpy as nparray = np.a...

2019-02-20 20:16:04 358

原创 matplotlib 第一天入门

用 matplotlib 做的一个简单的sin(x)和1/2cos(x)的函数图像import numpy as npimport matplotlib.pyplot as mp# #设置窗口颜色等属性# mp.figure(facecolor='gray')#将-π到π拆成1000个点x = np.linspace(-np.pi,np.pi,1000)y = np.sin(x...

2019-02-14 15:45:20 176 1

原创 python面试题

1.words = ‘Python is a very funny language!’,请用相关方法得出字符串:‘Python3 is a very funny language!’ 赋值给变量s,请写出语句:1、words = ‘Python is a very funny language!’,请用相关方法得出字符串:‘Python3 is a very funny language!’ ...

2019-01-11 20:00:12 158

原创 Python 第一阶段面试题答案

此答案不是标准答案1,break 表示循环终止continue表示结束本次循环,进行下次循环break 用在条件满足即结束循环,进行下一步程序的循环语句中continue用在需要把循环语句的每一个case都验证一下,符合条件的case跳过,执行后面的循环中...

2018-11-17 13:15:32 310

原创 Python 第一阶段面试题

一、Python 基础continue 和 break 有什么区别?Python 中的作用域?谈谈对闭包的理解?Python 里的拷贝?理解引用和 copy(),deepcopy()的区别。Python 垃圾回收机制?什么是 lambda 函数?它有什么好处?请写出一段 Python 代码实现删除一个 list 里面的重复元素?Python 里面如何...

2018-11-16 20:30:44 242

原创 Case When Else End用法详解

更新数据update table set 字段1=case when 条件1 then 值1 when 条件2 then 值2 else 值3 end where …… 查找数据select 字段1, 字段2, case 字段3 when 值1 the...

2018-11-06 14:02:39 2186

转载 【转】mysql中为同一张表取多个别名

select employee1.name as employee from employee employee1,employee employee2 where employee1.managerId=employee2.id and employee1.salary>employee2.salary;这里给同一张表取别名的方法...

2018-11-05 20:21:16 5412 1

原创 LeetCode 数组排序问题

给定一个非负整数数组 A, A 中一半整数是奇数,一半整数是偶数。对数组进行排序,以便当 A[i] 为奇数时,i 也是奇数;当 A[i] 为偶数时, i 也是偶数。你可以返回任何满足上述条件的数组作为答案输入:[4,2,5,7]输出:[4,5,2,7]解释:[4,7,2,5],[2,5,4,7],[2,7,4,5] 也会被接受。 长的代码是我自己写的:class Soluti...

2018-11-02 20:19:34 187

原创 用Python print 动态时间

def t_clock():import timewhile True:s = time.asctime()print(s[11:19],end="")time.sleep(1)print("\b"*8,end="",flush = True)t

2018-10-20 17:12:18 6303 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除