自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 收藏
  • 关注

原创 机器学习算法之决策树与随机森林的原理和常用参数

综述:随机森林和决策树一样都可用于分类和回归,然而随机森林的模型结果往往优于决策树。 本篇文章主要讲解以上两种ML算法的原理和常用参数。

2021-10-02 17:48:17 1641

原创 matplotlib中 生成图片之后如何设置图片大小?只能用set_figwidth() 、 set_figheight()、set_size_inches 么?

答案先行:是的。只能通过 set_figwidth() 和 set_figheight() 来改变图片的大小,而非figsize()1、创建了一个33布局的图片:from matplotlib import as pltfig,((ax1,ax2,ax3),(ax4,ax5,ax6),(ax7,ax8,ax9)) = plt.subplots(3,3)2、发现呈现效果并不好:拥挤,我们期待可以调整图片的大小,让它变得更易读一些。 因为惯性,尝试了利用创建图片时常用的方法 常用方法:plt.f

2021-08-14 17:16:49 2665 1

原创 SQL语句报错,一直检查不出来哪里出错怎么办?

总体原则:逐层检查,去掉部分语句检查1、多个表连接,可以分别检查左右连接中的左表和右表,即把左右表单独运行;2、多层嵌套的复杂SQL语句,从最内层子查询开始查起,逐层检查,即由内而外逐层运行;3、莫慌,机器干不过人的。稳住,能赢。...

2021-06-03 22:00:09 1898

原创 数据分析之新零售超市APP商品购买

针对新零售超市 App 的商品购买情况**1、制定一套事件设计(埋点),包含需要采集的事件和事件属性2、制定对商品购买分析的指标3、该超市本月付费用户较上月下降了 10%,老板非常担心,希望数据分析团队能够针对该问题进行深入分析,定位到问题所在,请把分析思路及拆解指标进行详细描述和展示- 1、新零售超市 App 的商品购买情况的埋点设计针对事件设计,绿色标注的为事件。2、制定对商品购买分析的指标-3、针对付费用户较上月下降了 10%,进行相关分析为简化描述:定义本月为8月,8月付费

2021-03-20 20:59:31 811

原创 SQL:如何在建表时创建一个13位的时间戳字段

知识预备:- 1、 INT - 正常大小的整数,可以带符号。如果是有符号的,它允许的范围是从-2147483648到2147483647。如果是无符号,允许的范围是从0到4294967295;- 2、BIGINT - 一个大的整数,可以带符号。如果有符号,允许范围为-9223372036854775808到9223372036854775807。如果无符号,允许的范围是从0到18446744073709551615。则13位时间戳应选用bignit- 3、current_timestamp()时间戳

2020-12-06 17:32:15 1326

原创 excel设置数据点的标记格式

工具:excel20191、选中所有数据点2、右键–设置数据系列格式3、在功能栏中点击最左边的选项(红色方框),来到如下界面4、点击标记(蓝色圆圈里的选项)5、来到如下界面,打开“标记选项”,选择内置,即可进行形状、大小设置6、填充和边框里可进行颜色等的设置7、这个折线图你大概会很喜欢了...

2020-12-06 11:47:14 5737 1

原创 数据看板/商业智能分析仪表盘

数据看板/商业智能分析仪表盘利用excel处理42400+条数据1、通过商业智能分析仪表板的形式,结合数据透视图和表展示客户消费额在不同维度(国籍、性别、职业等)上的分布2、不同门店的销售情况3、不同价格商品的销量分布4、目标额和完成率等关键指标...

2020-11-30 14:02:05 595

原创 数据分析案例学习---关于“线上教育提升毛利额问题

数据分析案例学习—关于“线上教育提升毛利额问题”思路总结如下一、背景分析拆解:1、某教育公司成立于1999年,早年发展线下职业教育,已做到一定规模,有一定的群众基础。近年,互联网教育火热,公司积极互联网转型。如今,已开设9个方向的大专业,覆盖如今互联网企业的多个热门职业。该公司的优秀增长效果得益于其完备的用户平台和高效的用户变现体系。该公司在转型初期,并不是简单的线上教育模式,而是教育社区+线上课程平台的模式。通过教育社区吸引用户讨论职业问题,在有一定的职业知识信息积累之后。通过SEO(搜索引擎优化)、

2020-11-01 22:09:40 634

原创 Excel表格把一列数据转换为多行多列数据的方法&表单控制的数据选择&excel表格行列互换的快捷方式&构建offset函数&excel中隐藏单元格内的数据的方法

文章内容输出来源:拉勾数据分析训练营第一章作业中遇到的问题及解决方案一、Excel表格怎么把一列数据转换为多行多列数据(EXCEL2019)例如:将一列60个数据转换为5行12列。1、首先,在B1格输入“源数据 起始数据的单元格代号”,C1格输入“源数据 第二个数据的单元格代号”,然后选中B1、C1,将鼠标移到选中框的右下角(此时鼠标变为“+”形,下同),按住左键不放将框向右拉至B5处。此时D1\E1\F1格将分别填充“源数据第三单元格代号”、“源数据第四单元格代号”、“源数据第五单元格代号”。2

2020-09-01 20:42:25 1755

原创 excel中#N/A的解释&同比环比基比&画四象限图的小tips&字符串截取函数substitute的深入理解

文章内容输出来源:拉勾数据分析训练营第一章分组分析,同比环比定基比,字符串截取等问题的总结EXCEL中#N/A,是“不适用”的意思,多用在填写表格的时候,表示“本栏目(对我)不适用“,在没有东西可填写但空格也不允许留空的时候,就要写N/A。N是单词Not的缩写,A是单词Not Applicable 的缩写,连起来就是N/A 。同比环比定基比利润是绝对数,利润率是相对数,用利润率来做环比画四象限图的小tips:如果不是在正中心交叉:1,修改中心交叉点,至均值2,以均值为中心修改最大值和最小

2020-09-01 20:31:03 1671

原创 Excel中数据透视表数据源更新的三种方式

文章内容输出来源:拉勾数据分析训练营第一章-Excel中数据透视表数据源更新的三种方式1、在原有的基础上重新选择数据源2、变数据源为表格形式,在创建一个透视表,之后如果添加的数据,选中透视表右键刷新即可3、利用更新过的数据源再重新创建一个透视表...

2020-09-01 20:24:08 4557

原创 excel中roundup使用指南

文章内容输出来源:拉勾数据分析训练营第一章excel中roundup使用指南语法ROUNDUP(number, num_digits)ROUNDUP 函数语法具有下列参数:◾ Number 必需。 需要向上舍入的任意实数。◾ num_digits 必需。 要将数字舍入到的位数。备注◾ROUNDUP 的行为与 ROUND 相似,所不同的是它始终将数字进行向上舍入。◾如果 num_digits 大于 0(零),则将数字向上舍入到指定的小数位数。◾如果 num_digits 为 0

2020-09-01 20:22:45 1008

原创 箱线图&上下四分位数

文章内容输出来源:拉勾数据分析训练营第一章箱线图学习笔记四分位数(Quartile)也称四分位点,是指在统计学中把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值。多应用于统计学中的箱线图绘制。它是一组数据排序后处于25%和75%位置上的值。四分位数是通过3个点将全部数据等分为4部分,其中每部分包含25%的数据。很显然,中间的四分位数就是中位数,因此通常所说的四分位数是指处在25%位置上的数值(称为下四分位数)和处在75%位置上的数值(称为上四分位数)。与中位数的计算方法类似,根据未分组数据

2020-09-01 20:20:28 13946

原创 EXCEL中两个条件以上条件语句的使用方法

文章内容输出来源:拉勾数据分析训练营第一章EXCEL中两个条件以上条件语句的使用方法1、(教学文档里的)2、3、(注意是大于号)3的参考文献:https://jingyan.baidu.com/article/63acb44a15c57f61fdc17e66.html...

2020-09-01 20:12:41 446

原创 数据的无量纲处理定义及方法

文章内容输出来源:拉勾数据分析训练营第一章-数据的无量纲处理定义及方法数据的无量纲处理定义在对实际问题建模过程中,特别是在建立指标评价体系时,常常会面临不同类型的数据处理及融合。而各个指标之间由于计量单位和数量级的不尽相同,从而使得各指标间不具有可比性。在数据分析之前,通常需要先将数据规范化,利用规范化后的数据进行分析。数据规范化处理主要包括同趋化处理和无量纲化处理两个方面。数据的同趋化处理主要解决不同性质的数据问题,对不同性质指标直接累加不能正确反应不同作用力的综合结果,须先考虑改变逆指标数据性质,

2020-09-01 20:08:11 3167

原创 矩阵关联法(象限分析法)

文章内容输出来源:拉勾数据分析训练营第一章学习之矩阵关联法(象限分析法)第一象限:少数明星商品可以做到,也是利润主要来源的地方第二象限:正当季需要补货,季节交替时让她正常进行就可以,以便退役。需要针对业务的具体情况来决定补货还是退役第三象限:大部分产品的正常的情况第四象限:季节交替,为下一季的产品再备货的一个情况,预售;库存积压太多了...

2020-09-01 20:00:24 2558

原创 相对引用和绝对引用&日期在excel中的表达&rank函数

文章内容输出来源:拉勾数据分析训练营第一章EXCEL学习相对引用和绝对引用的说明相对引用:单元格上的公式为”=SUM(C4:E4)“,其中C4:E4中的数字”4“是随着行号的变化而自动变化得来的,这就是相对引用的特点。相对引用的特点就是公式或函数中的行或列会随着行号和列标的变化而自动发生变化。绝对引用:绝对引用也是Excel常用的一种引用方式。其格式为:列号列号列号行号。你会发现绝对引用在列号或行号前加了一个""符号,这就是绝对引用符号。如:""符号,这就是绝对引用符号。如:""符号,这就是绝对引用

2020-09-01 19:54:11 2574

原创 EXCEL图表系列公式报警;“&”在excel的含义

文章内容输出来源:拉勾数据分析训练营第一章EXCEL系列公式报警;“&”在excel的含义问题描述:给图标标题输入一个可以联动的名字,引用了两个单元格内容,并用&来连接,出现报错在excel中&的意思是:合并连接符号,可以用该符号实现两个及以上的单元格内容合并为一个单元格内显示的功能。使用“&”的方法:1、首先在excel表格的A1/B1/C1单元格内输入三组字符或数据,需要将这三组数据合并到一个单元格中。而&可以算作连接运算,在系列公式中不能出现运算

2020-08-26 21:12:15 1940

原创 数据分析概述和5W2H

文章内容输出来源:拉勾数据分析训练营第一阶段学习笔记之数据分析分析概述和5W2H1\数据分析概述描述现状;发现规律;推动改进2\5W2H

2020-08-26 20:14:20 123

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除