自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(33)
  • 问答 (1)
  • 收藏
  • 关注

原创 从情景中学习数据分析,大家平时用过小红书app吗~有没有在上面购买过服装呢~今天给大家分享的是小红书服装店铺的粉丝分析

从情景中学习数据分析,大家平时用过小红书app吗~有没有在上面购买过服装呢~今天给大家分享的是小红书服装店铺的粉丝分析

2022-06-02 11:02:36 333

原创 今天给大家分享一些关于面试数据分析岗位的时候需要注意的一些问题

92年大专学历3天面试5家公司拿到4个office先就是在写简历的时候,如果要放照片,最好放一张正式一点的、好看一点的照片,花点钱去拍个最美证件照不亏的,可千万别整个非主流自拍或卡通头像就往简历上放学历方面,一定要实打实地写,可以把最高学历放第一位,但别刻意隐藏弱势学历。我见过有些专升本、或者硕士学历的候选人可能觉得自己第一学历没有优势,就没写,这样一不诚实,二给人不自信的印象。然后是技能方面,作为数据分析师,是需要掌握一些基础工具的,但是每个公司重点要求的分析工具和能力不一样。比如很多国企喜欢用Fi

2022-05-21 23:27:39 487

原创 今天给大家分享的是关于地理空间的数据分析

今天给大家分享的是关于地理空间的数据分析数据璐大数据分析岗位推荐师我们做数据分析之前首先要了解业务地理空间数据可以用来描述地球表面的任何物体或特征,举几个常见的例子来帮助大家理解比如:一个品牌的下一家店应该开在哪里?天气如何影响区域销售?开车的最佳路线是什么?哪个地区将受到飓风的严重打击?冰盖融化与碳排放的关系如何?哪些地区将面临最高的火灾风险?本次案例中我们用到的是geopandas和shapely,它们是用Python进行地理空间分析的两个最有用的库S

2022-05-13 10:11:10 629

原创 应用教学:用Tableau做客户分析

应用教学:用Tableau做客户分析注:数据文件来自Youtube。总变量 = 实际价格 * 交易量-折扣Tableau 仪表板:客户分析加载数据:1. 单击“连接到数据” → 文本文件 → 选择 csv 文件创建工作表:单击“新建工作表”,选择变量面板1)各州收入Tableau 工作表:各州收入行:State(维度),列:Total(度量) 通过将“Total(度量)”拖到“Marks:Label”来添加数据标签。 制作一张地图:单击右上角的“Show

2022-05-11 08:26:14 1143

原创 【无标题】

怎么去理解python中的偏函数?偏函数,是对原始函数的二次封装,是将现有函数的部分参数预先绑定到指定值,从而获得新的函数。定义偏函数,需要使用partial关键字(位于functools模块中。语法:偏函数名 = partial(func, *args, **kwargs)实例:from functools import partial # 导入functools模块中的partial函数#定义个原函数def display(name,age):print("name:

2022-05-10 10:59:15 51

原创 用Power BI对超市数据进行分析

注:这里使用的是某家在线商店的数据集。这个数据集包含销售家具、办公用品和科技产品在内的订单编号、订单/发货日期、客户信息、产品信息、总销售额、利润……现在假设营销部门带着这个数据集来找我们,他们想知道我们对现有数据的看,并提出了以下问题:- 我们能否就数量、销售额或利润确定出最佳产品/子类别/类别?- 什么物品一般是一起卖的?- 你还能为我们提供哪些有用的建议?- 你能帮我们监控这些 KPI 吗?营销部门的需求收到了,下面我将用 Power BI 来回答他们的问题!1、导入数..

2022-05-07 10:57:04 1365 1

原创 本次的案例分析主要围绕整体消费情况和用户消费行为进行分析

本次的案例分析主要围绕整体消费情况和用户消费行为进行分析,找出高价值用户人群,了解用户留存以及流失等情况,为平台指定策略提供数据方面的支持和建议首先第一步是什么呀,大家应该都很熟悉了对不对,数据处理和清洗!我们导入数据包,同时设置好列标签我们可以发现该数据集总共有69659行*4列数据,4张列标签分别是:user_id:用户idorder_dt:下单日期order_products:购买商品数量order_amount:购买金额order_dt字段为数值型,需要将其更

2022-05-06 14:29:42 508

原创 今天分享的案例是关于某电商店铺的年终销售业绩

从情境中学习数据分析,体会数据分析逻辑。今天分享的案例是关于某电商店铺的年终销售业绩的分析哦~在2011年的圣诞节前两周,老板希望回顾一下过去一年的销售业绩,数据来自该店铺的实际销售记录,其数据周期为2010年12月1日到2011年12月9日。首先第一步!老生常谈了啊!对基础数据的准备,导入数据并处理。具体过程:重命名字段、排除重复记录、标记特殊订单、处理客户ID、调整日期字段、补充分析字段、计算预处理后的数据情况然后导出数据。清洗数据之后导入数据和库,我们得到我们可以看出,过去

2022-05-05 15:23:25 1483 1

原创 今天的案例是关于化妆品电商平台的分享

从情境中学习数据分析,体会数据分析逻辑。今天的案例是关于化妆品电商平台的分享哦首先,第一步,就是查看数据基本情况以及数据预处理主要有'事件时间','事件类型','产品id','产品类别id','产品类别代码','品牌','价格','用户id','用户会话'这几个变量1、5个表的数据读取以及拼接,最终合成为20692840行, 9个字段的数据。数据量较为庞大。因此在后续的数据处理过程中,要尽量关注内存消耗情况,及时删除不必要的变量释放内存,并且尽量使用性能较好的代码实现方式。2、统计总计有

2022-05-05 15:18:19 309

原创 入行大数据分析师

大数据分析要注意哪些因素?】大数据分析要注意多维度的对数据进行整理和分析,注意每一种大数据分析工具的适用性,注意正确的整合数据,注意将数据结果可视化,注意数据不是越多越好,注意数据的精确度。场景:随着互联网的高速发展,数据分析的应用场景越来越丰富,从行业来看,主要有互联网、电力、政务、司法、租赁、银行、制造、教育、医药、金融、汽车、房地产和物流。数据:例如,企业在经营或者生产的过程中产生的经营管理数据、财务数据、销售数据等等。工具:一般做大数据分析,首先会使用大数据数据库,比如M

2022-05-01 18:58:06 645

原创 数据分析面试都会问到哪些问题

听说有小伙伴最近在找工作?数据分析面试都会问到哪些问题呢?一起来看看吧~1.第一个问题来了哈~如果某一次分析的结果数据特别大,有些结果数据扛不住了,请问该怎么办?其实一般的结果数据的数据量没有那么大,也就几十万是样子,这样的数据级别,对于MySQL这样的数据库是没有任何压力的但是如果这个数据量千万或者亿级别,同时有复杂的SQL查询,这个时候MySQL就肯定扛不住了。这是需要结合实际情况去考量的了,这个问题考察的还是数据量的问题。出现这个情况的时候就需要我们构建索引(例如通过lucene来对于要检索的

2022-05-01 18:44:52 7633

原创 今天给大家分享的案例就是关于电影的啦,我们一起来看看IMDBtop10000的电影排行榜数据

今天给大家分享的案例就是关于电影的啦,我们一起来看看IMDBtop10000的电影排行榜数据首先第一步,相信大家已经是非常非常熟悉了对吧~那就是对数据进行处理,今天的案例中呢我们先来对数据进行整理和探索那数据整理有没有一个标准啊,具有普适性一些的来看一下基本的流程:构建数据框——清洗数据——探索全局特征——探索分组特征这个流程在我们遇到新的数据集的时候可以给我们提供一些思路经过以上几步数据整理后,可以增加我们对数据特征的基本了解,同时也可以帮助我们去发现问题、提出新想法回到今天的案例本身哈,

2022-05-01 18:38:28 1297

原创 国内大厂数据分析师面试流程是怎么样

国内大厂数据分析师面试流程是怎么样的?面试官会提问哪些?大厂常见面试问题揭秘!你做好准备了吗?某易数据分析的其中一道面试题?我们先来看问题前提哈~用户分析是电商数据分析中重要的模块,在对用户特征深度理解和用户需求充分挖掘基础上,进行全生命周期的运营管理(拉新—>活跃—>留存—>价值提升—>忠诚)请回答下面2个问题:第一个:当你发现本月的支付用户数环比上月大幅下跌(超30%),你会如何去探查背后的原因?请描述你的思路和其中涉及的关键指标第一步,我们先明确问题

2022-05-01 18:19:09 314

原创 【数据分析能力是指什么?】

【数据分析能力是指什么?】数据分析能力是指能用适当的统计分析方法对收集来的大量数据进行分析,从中提取有用信息并形成结论,对数据加以详细研究和概括总结的能力。那数据分析在企业中的作用大家应该都清楚哈,它可以帮助企业识别机会、规避风险;帮助企业诊断问题、亡羊补牢;帮助企业评估效果、改进营销;帮助企业提高效率、加强管理。如果说数据分析只懂整理数据、做图表是不够的,更需要掌握更业务相结合的数据分析思维建立体系化的数据分析框架,基于业务流程确定需要哪些数据。 对目标指标进行拆解,针对不同的运营场景和

2022-05-01 17:11:38 3126

原创 从情境中学习数据分析,体会数据分析逻辑。今天给大家分享的案例是关于美食

从情境中学习数据分析,体会数据分析逻辑。今天给大家分享的案例是关于美食的哦我们来看看B站美食视频的分析~大家平时喜欢看美食视频吗~首先,我们把现成的数据包导入,加载这部分涉及的具体代码这里就不给大家展示了哈我们把数据集合并然后开始数据分析,首先先统计一下缺失值然后,我们要确定从哪些维度去进行分析美食up最喜欢做什么样的食材通过数据我们可以发现食材可以来自——标题:50买了一个两斤半的猪肘,小马今天做“红烧猪肘”软烂入味,肥而不腻!视频介绍: 吃不完的猪肉,直接放..

2022-04-29 16:44:23 280

原创 大数据培训需要有基础吗

是否需要基础这个要看选择的培训类型,如果是针对零基础入门的大数据培训课程,那么他面对的人群就是零基础小白,不需要基础就可以就行培训。如果是进阶型的,那么就需要有基础就行。在大数据领域,国内发展的比较晚,从2016年开始,仅有200多所大学开设大数据相关的专业,也就是2020年第一批毕业生才刚刚步入社会,而且目前的能力还达不到企业的要求。很多大数据行业的从业人员也都是零基础转行进入的,所以大家其实不用对培训抱有偏见哈...

2022-04-29 14:02:35 1277

原创 数据分析师有哪些等级

这个问题也是小璐老师经常听到的一个问题哈~~~数据分析师一般可以分为:初级数据分析师、中级数据分析师、高级数据分析师以及数据专家这些,当然不同企业可能根据企业自身情况也会有所拆分或是职级划分。初级数据分析师要求熟练使用Excel,统计概率,简单的SQL查询。中级数据分析师不仅要会技术还要懂业,要求精通SQL,编程语言Python或者是R。高级数据分析师要求掌握统计概率、数学,精通SQL、编程语言Python或者R、机器学习,偏重于工程。基本上没有5年以上的工作经验很难达到这个层次的呦【Pyt

2022-04-29 14:01:26 3370

原创 大数据通俗的解释

大数据通俗一点的说就是巨量资料,规模巨大,形式多样,所涉及的资料量规模巨大到无法透过主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。大数据的特征有哪些呢?容量:数据的大小决定所考虑的数据的价值和潜在的信息。种类:数据类型的多样性。速度:指获得数据的速度。可变性:妨碍了处理和有效地管理数据的过程。真实性:数据的质量。复杂性:数据量巨大,来源多渠道。价值:合理运用大数据,以低成本创造高价值。...

2022-04-29 14:00:15 2263

原创 产品留存率低你作为数据分析师应该怎么分析

留存率低算是一个开放性的问题了,我们可以描述一下问题,确定目标我们可以参考一下这个回答:首先我们需要了解这个产品是在什么阶段,如果是在早期的发展过程中留存率低,那我们要知道产品的易用性;如果我们的产品已经成熟,但留存率较低,要知道是业务出现了问题还是改版出现了问题,产品在新时期和发展阶段留存率低,我所应对的方式也是不同的。渠道没有精准用户我们注册率很高,但是留存率不好,那我们首先要解决用户的问题,获取用户的渠道在哪里?是否是我们的精准用户人群?如果是精准用户,可以通过用户访问,发现是产品问题,那我们

2022-04-29 13:59:04 1201

原创 指标体系如何建立

一般情况,碰到这种提问方式,主要是面试官担心你对行业的敏感度低,通常是拿来测试你的逻辑以及对自己将来的工作内容是不是有清晰的认知所以我们在回答的过程中要明确目标,你的用户是谁、你的产品如何,遵循:人、货、场的方式了解业务:知道产品所有相关性指标 如何构建:利用用户的行为和用户的生命周期去判断,用户的注册、访问、点击、浏览、留存、流失等关键动作,访问在注册之间,就会有很多数据如:下载成功率、哪些渠道过来的。我们需要多关注量级指标:人数、单数、购买额度、购买总额质量指标——人均购买、购买深度等3

2022-04-29 13:57:37 193

原创 从情景中学书数据分析,体会分析逻辑 :药店销售数据分析

一、数据分析的目的:  本篇文章中,假设以朝阳医院2018年销售数据为例,目的是了解朝阳医院在2018年里的销售情况,通过对朝阳区医院的药品销售数据的分析,了解朝阳医院的患者的月均消费次数,月均消费金额、客单价以及消费趋势、需求量前几位的药品等。  数据分析基本过程包括:获取数据、数据清洗、构建模型、数据可视化以及消费趋势分析二、数据准备  数据是存在Excel中的,可以使用pandas的Excel文件读取函数将数据读取到内存中,这里需要注意的是文件名和Excel中的sheet页的名..

2022-04-28 15:05:53 327

原创 某在线音乐零售平台用户消费行为分析

一、项目背景  CDNow曾经是一家在线音乐零售平台,后被德国波泰尔斯曼娱乐集团公司出资收购,其资产总价值在最辉煌时曾超过10亿美元。本文主要通过分析CDNow网站的用户购买明细来分析该网站的用户消费行为,使运营部门在营销时更加具有针对性,从而节省成本,提升效率。二、提出问题  首先对用户进行消费特征分析。分析框架如下:三、数据处理3.1 导入数据加载包和数据,文件是txt,用read_table方法打开,因为原始数据不包含表头,所以需要赋予。字符串是空格分割,用..

2022-04-28 14:37:01 580

原创 数据璐SQL零基础入门教程学习一共10天 练习题合集

0604第一天 主知识点一:select&from 自己完整敲一遍知识点中出现的代码吧~ 主知识点二:where 【1】SELECT from WORLD Tutorial - SQLZOO第四题 【题目】 查询南美洲(south america)所有国家的名称以及它们以百万(1000000 )为单位的人口数量 【正确答案】 select name , population/1000000 p

2022-04-22 15:10:59 398

原创 数据璐SQL零基础入门教程学习第十天主知识点九:窗口函数

主知识点九:窗口函数【知识点引入】 最后我们要来学习窗口函数 【标准语法】 窗口函数 over (partition by 用于分组的字段名 order by 用于排序的字段名) 常用窗口函数 【例题讲解】 我们以排序窗口函数rank()over()为例 窗口函数rank()over()是在指定分区(partition by)对指定字段排序(order by)然后依次赋予排名的函数 【指定分区partition by和排序or

2022-04-20 14:31:06 517

原创 数据璐SQL零基础入门教程学习第九天主知识点八:常用函数

【知识点引入】 接着我们再来补充一些mysql中常用函数 【条件函数语法】 case when case 字段名 when 值1 then 值2 else 值3 end 【解释】 创建新的一列字段,当某字段等于值1在新列中就等于值2,除此之外的数据在新列中就等于值3 或 case when 字段名 运算符 值1 then 值2 else 值3 end 【解释】 创建新的一列字段,字段名 运算符 值1这一部分可以看成是条件代码

2022-04-20 14:28:03 262

原创 数据璐SQL零基础入门教程学习第八天主知识点七:表连接

【知识点引入】 接下来让我们一起学习表连接join,通过两个或多个表中的列之间的关系连接,再从连接的表中跨表查询数据 【基础语法】 内连接 select 字段名 from 表格名1 inner join 表格名2 on 表格名1.字段名 = 表格名2.字段名 注意内连接inner可以省略,直接使用join默认为内连接 左连接 select 字段名 from 表格名1 left join 表格名2 on 表格名1.字段名 = 表格名2.字段名

2022-04-20 14:25:43 174

原创 数据璐SQL零基础入门教程学习第七天主知识点六:子查询

主知识点六:子查询【知识点引入】到这里我们已经把sql的主要子句学完啦,接下来就是sql语法的进阶学习首先是造就了sql语句千变万化的子查询子查询本身就是一个完整的查询语句,然后用括号()包裹嵌套在主查询语句中,子查询可以多层嵌套之前所涉及到的都是从数据库中检索数据的单条语句,但当我们想要检索的数据并不能直接从数据库表中获取,而是需要从筛选后的表格中再度去查询时,就要用到子查询,相当于我们无法直达时,需要进行换乘子查询的执行优先于主查询执行,因为主查询的条件用到了子查询的结果子查

2022-04-20 14:23:05 1733

原创 数据璐SQL零基础入门教程学习第六天主知识点五:limit

主知识点五:limit【知识点引入】select 字段名1from 表格名[where 条件代码][group by 字段名1][having 条件代码][order by 字段名 asc|desc]limit n【例题讲解】【查询结果返回某几行】点击链接分页查询employees表,每5行一页,返回第2页的数据_牛客题霸_牛客网【总结】【查询结果返回前n行】select 字段名1 from 表格名 [where 条件代码] [group by

2022-04-20 14:17:21 70

原创 数据璐SQL零基础入门教程学习第五天 主知识点四:order by

主知识点四:order by【知识点引入】我们再来认识第六个子句order by【标准语法】select 字段名1 from 表格名 [where 条件代码] [group by 字段名1] [having 条件代码] order by 字段名 asc|desc【语法解释】order by 子句会对最后查询出的结果集进行排序 order by 字段名,表明根据指定的字段进行排序 asc指定该字段升序排序,desc为降序排序,不写则默认为升序排序 order by 可以对

2022-04-20 14:13:43 150

原创 数据璐SQL零基础入门教程学习第四天主知识点三:聚合函数、group by&having

主知识点三:聚合函数、group by&having【知识点引入】我们先来认识最常见的聚合函数 有时候我们只是需要获取数据的汇总信息,比如说行数啊、平均值啊这种,并不需要吧所有数据都检索出来,只需要使用聚合函数即可【函数说明】AVG() 返回某列的均值COUNT() 返回某列的行数MAX() 返回某列的最大值MIN() 返回某列的最小值SUM() 返回某列的和注意聚合函数都会忽略列中的NULL值,但是COUNT(*)也就是统计全部数据的行数时,不会忽略

2022-04-20 12:57:42 119

原创 数据璐SQL零基础入门教程学习第三天 主知识点二:where

主知识点二:where【知识点引入】我们来认识第三个子句where,where子句写在from之后【标准语法】select 字段名 from 表格名 where 条件代码【语法解释】where 条件代码 表明从数据库表中选取满足条件的数据where子句主要用来进行数据的筛选,从表格中筛选出符合条件的行数据接下来让我们来快速应用where子句吧~【例题讲解】【运算符】条件代码中最常用的是运算符。先来看这个表格,比较运算符,用于判断表中的哪些数据符合条件,an

2022-04-20 12:42:01 225

原创 数据路自学SQL第二天:主知识点一:select&from

主知识点一:select&from【知识点引入】首先我们先认识两句子句,select和from【标准语法】 select 字段名 from 表名称 【语法解释】 select 字段名 表明选择查询表格中的哪几列进行查看 from 表格名 表明你查询的数据来自哪一个数据库表 但凡大家要从数据库中查询数据,必不可少的就是select和from语句现在给大家5秒的时间记忆这两个单词,5,4,3,2,1好啦,大家现在已经学会最基础的sql查询语句啦接下来让我们一

2022-04-20 12:21:33 2062

原创 数据璐SQL零基础入门教程学习第一天

SQL是什么?SQL是一种能指挥数据库自动&批量处理大量Excel表格的超级简单的语言语法标准由ANSI美国国家标准化组织统一制定,主流数据库的关键语法都是相同的 如select、update、delete、insert、where等 只针对结构化数据进行处理,不处理乱糟糟非结构化数据 非结构化数据 结构化数据 有严格的语法结构和运行顺序(所以学起来非常简单) 语法结构:select--from--where--

2022-04-20 12:07:58 221

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除