3 古杜且偲

尚未进行身份认证

我要认证

Just do it

等级
TA的排名 3w+

生成总行数的数据

一般的,如果我们想统计频数,可以用select count(*) from table但是,如果想生成全是频数的一列,可以用下面的语句:select sum(1) over(partition by null) as rn11from table

2020-10-16 10:24:45

Hive分析窗口函数(三) CUME_DIST,PERCENT_RANK

参考网址:Hive分析窗口函数(三) CUME_DIST,PERCENT_RANK – lxw的大数据田地,自己试着在mysql里做了一遍。数据准备:表salaryCUME_DISTCUME_DIST 小于等于当前值的行数/分组内总行数比如,统计小于等于当前薪水的人数,所占总人数的比例select dept,userid,sal,cume_dist() over(order by sal) as rn1,cume_dist() over(partition by dept o.

2020-10-16 10:21:39

MySQL中TIMESTAMPDIFF和DATEDIFF函数的区别

下面说的前面减去后面,或者后面减去前面的意思是这样操作,结果是正数,如果将两个时间换个位置,将得到一个负数的结果。简记一下:D--大的前(大的时间在前)T---大的后(大的时间在后)1、TIMESTAMPDIFF:后面的时间减去前面的时间SELECT-- 时间相差不到24小时不算一天 timestampdiff(DAY,'2020-02-25 00:00:00','2020-02-26') day1, -- 1timestampdiff(DAY,'2020-02-25 00:0

2020-10-16 09:42:38

SQL知识体系

2020-10-14 22:47:05

sql分任意区间统计频数

用excel生成随机数,然后导入mysqlselect count(case when scores>=90 and scores<=100 then id end) as "[90,100]",count(case when scores>=80 and scores<=89 then id end) as "[80,89]",count(case when scores>=70 and scores<=79 then id end) as "[70,

2020-10-14 22:05:30

Tableau 使用背景图像

在您的视图中使用背景图像 - Tableau

2020-10-10 13:42:23

tableau画各种图

堆积柱状图对总和记录数处理:快速表计算--合计百分比,计算依据--表(向下),可以得到下图:频数直方图先创建数据桶,则数据桶自动为离散,如果是先拉进去再创建数据桶,则数据桶为连续 。数据明显呈现左偏分布,对于评分较高的记录,我们也可以再一步进行细分,从而观察数据在更小区间的分布。创建字段:评分(高级分组)IF [评分]<4 THEN '1.5-4'ELSEIF [评分]>=4 AND [评分]<4.2 THEN '4.0-4.1'ELSEIF [评.

2020-10-09 20:55:26

tableau 创建集、使用集

集与组有许多相同之处,他们的作用都是改变原有的数据展现形式。但又有所不同。集的作用更加灵活,它更像是过滤器,过滤出我们所需要展示的部分。我们在做数据展示的时候有的时候会格外关注一些特定维度的数据。我们当然可以通过过滤器来显示我们想要看到的数据,但是这也就意味着每一次我们都需要进行许多重复的步骤:拖拽并点选指定维度。这时使用固定集,可以减少许多重复性工作,大大提高我们的工作效率。学习创建集 - Tableau,大概可以了解集的一些设置。有两种类型的集:动态集和固定集。动态集的成员会在基础数

2020-10-07 19:40:03

tableau 进行会员留存分析

1.数据源数据进行简单的拆分,把会员创建日期提取出来。创建新的字段:距离创建会员的月份数:datediff('month',[会员创建日期(拆分)],[销售日期])2.图表分析 我们可以看到当月注册会员,当月消费的人数是最多的,随着时间的推移,基本趋于稳定,也就是留存下来的会员数量变化幅度不大。 如果有消费记录,我们则认为会员没有流失,在距离注册时间过去7个月的时候,我们可以看到有一个留存提升的情况,可能是由于某种产品的使用周期性,让...

2020-10-07 11:09:42

tableau 创建数据桶

对于分组观察数据的频数,从而了解数据在不同区间的分布,我们可以创建数据桶。创建分为按照建议的区间长度进行划分,也可以自行设置参数。这里主要讲解自行设置参数,将最大值,最小值,步长设置好。对于频数的大小,一直不是很清楚,所以自己创建一个小数据集,研究了一下。tableau应该是按照左开右闭的规则统计频数的。数据源:1.5 2 3 4 5 6.5 7 7.1 9 10区间划分含义:区间 包含的数字 频数 [1,2) 1.5 1 [2,3) ...

2020-10-07 09:45:00

tableau进行价格-促销分析

1.数据源2.数据清洗创建计算字段:用券比例:[用券数]/[获券数]用券数不能比获券数多,所以这里用券比例要小于等于1。3.图表分析由已有字段创建数据桶

2020-10-06 23:24:54

tableau进行客户RFM分析

原始数据及twbx:链接:https://pan.baidu.com/s/1ZlN4ixsUm60NaenDkiJx9g提取码:5hrs1.数据预处理数据源:创建字段:购买点生命周期(日):IIF(DATEDIFF('day',[会员创建日期],[销售日期])>=0,DATEDIFF('day',[会员创建日期],[销售日期]),NULL)最后购买点生命周期(日):{FIXED [UseId]:MAX([购买点生命周期(日)])}2.图表分析...

2020-10-06 20:54:48

tableau进行会员分群

1.数据清洗点击每个字段的倒三角,然后点击描述,可以大致观察数据的情况,当点击到消费金额时,发现金额出现负值,如下图:所以需要进行数据清洗:2.数据标准化3.图表分析创建计算字段:把会员ID拖入维度分群:选择分群用到的变量和分群的个数。(原理:k均值聚类)统一强制y截距为0:把群集拖到维度,以便后面复用。下面的图就是复用了...

2020-10-06 20:03:37

关于直播、电商

如何衡量一场直播带货的好坏?对于直播带货,相当于短视频+电商的一个融合模式。短视频行业,我们可以用AAARR模型来构建短视频的业务指标体系,如果单纯地从视频端,忽略电商端对成交的影响,我们仍然可以选择用AAARR模型。对直播带货的看法认知:是一种依靠名人效应聚集观众,然后进行现场使用推销,当然,也有非名人带货,均有现场代入感,能让观众直接感受商品质量的好坏,从而让观众产生购买欲望的线上方式。优点:1.对客户,免除人们逛商场的麻烦的同时,对商品依然有很好的了解;2.对商家,直播需.

2020-10-06 11:13:28

辛普森悖论

辛普森悖论_绝望的乐园-CSDN博客

2020-10-05 20:58:58

sql的with子句

有一张学生表student,包括学生id,姓名,年龄,班级,分数字段。--用with子句得到成年且成绩及格的学生名单with adult as (select stu_idfrom studentwhere age >=18),pass_stu as (select stu_idfrom studentwhere grade >=60)select a.stu_id, age, gradefrom student as ajoin adult as b .

2020-10-02 20:21:40

sql 字符串函数

字符串函数:substring(string,start,length) 截取字符串string,从start开始的length个字符,类似excel的mid left(string,length) 截取字符串string,从最左边开始的length个字符,类似excel的left right(string,length) 截取字符串string,从最右边开始的length个字符,类似excel的right instr(string1 , string2 [,start..

2020-10-02 20:01:07

sql中any,some,in,not in

准备两个表:T1(2,3),T2(1,2,3,4)all:在T2表中查询比T1表中所有id都大的id;select * from T2 where id>all (select id from T1)any:在T2表中查询比T1表中任意一个id大的id;只需大于一个就可以select * from T2 where id>any(select id from T1)any,some是一样的结果,即父查询中的结果集大于子查询中任意一个结果集中的值,则为...

2020-10-02 19:05:32

详细级别表达式: INCLUDE

INCLUDE 详细级别表达式除了视图中的任何维度之外,INCLUDE 详细级别表达式还将使用指定的维度计算值。如果您想要在数据库中以精细详细级别计算,然后重新聚合并在视图中以粗略详细级别显示,则 INCLUDE 详细级别表达式可能非常有用。当您在视图中添加或移除维度时,基于 INCLUDE 详细级别表达式的字段将随之更改。示例 1以下 INCLUDE 详细级别表达式计算每个客户的总销售额:{ INCLUDE[Customer Name] : SUM([Sales]) }将该计算放.

2020-10-02 14:00:30

tableau 对比销售额分析(利用参数、EXCLUDE)

目的:找出与选定类别的差异步骤:首先,必须隔离选定类别的销售额。然后,需要使用 EXCLUDE 表达式在所有其他类别中重复该值。之后,便可轻松了解每个类别的销售额与其他类别的差异。因为类别是不固定的,可能是所有类别中的任意一个,所以需要设置参数:鼠标放在Category上,右键创建参数创建计算字段:[Category] = [参数].[Category],名称为Selected Category创建计算字段:IF [Category] = [参数].[Category] THEN S

2020-10-01 21:56:50

查看更多

勋章 我的勋章
  • 签到新秀
    签到新秀
    累计签到获取,不积跬步,无以至千里,继续坚持!
  • 阅读者勋章Lv3
    阅读者勋章Lv3
    授予在CSDN APP累计阅读博文达到30天的你,是你的坚持与努力,使你超越了昨天的自己。
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv4
    勤写标兵Lv4
    授予每个自然周发布9篇以上(包括9篇)原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。
  • 学习力
    学习力
    《原力计划【第二季】》第一期主题勋章 ,第一期活动已经结束啦,小伙伴们可以去参加第二期打卡挑战活动获取更多勋章哦。