4 木东居士

尚未进行身份认证

数据搬运工一只,欢迎光临个人小站:http://www.mdjs.info/about/

等级
TA的排名 7k+

小案例:数据仓库搭建中的流量日志维度表案例

关于作者:小姬,某知名互联网公司产品专家,对数据采集、生产、加工有所了解,期望多和大家交流数据知识,以数据作为提出好问题的基础,挖掘商业价值。0x00前言我将整理文章分享数据工作中的经验,因为业务内容上的差异,可能导致大家的理解不一致,无法体会到场景中的诸多特殊性,不过相信不断的沟通和交流,可以解决很多问题。前面我们分析了职场基本功、数据指标体系,少量的数据仓库内容,今天我们来就工作中经常遇到的...

2019-11-13 20:07:56

如何成为数据科学家?这有一条完整的学习路线和方法!

0x00前言数据科学家,一个被评为21世纪最“性感”的职业,近些年一直备受推崇。从事数据科学家的工作,不仅意味着你将能够在工作中实践前沿的技术去解决业务问题,同时意味...

2019-11-12 08:00:00

数据团队思考:小型数据团队发展的6大建议

数据团队思考:小型数据团队发展的6大建议0x00前言最近遇到了不少待在小型数据团队的朋友在吐槽自己的团队如何如何的坑,比如说:基础建设特别差,用什么没什么!人太少,每个人只能忙于提数,基本上没有成长!数据没有体现价值,成就感很低!总之,这个吐槽内容是挺多的,就不多写了,有过类似工作经历的朋友应该会有很多共鸣。鉴于这些吐槽的内容,居士将从如下几个方面来分享本篇的主题:小型数据团队发展的6大建议为...

2019-11-11 08:05:00

特征工程系列:时间特征构造以及时间序列特征构造

0x00前言数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。由此可见,特征工程在机器学习中占有相当重要的地位。在实际应用当中,可以说特征工程是机器学习成功的关键。那特征工程是什么?特征工程是利用数据领域的相关知识来创建能够使机器学习算法达到最佳性能的特征的过程。特征工程又包含了DataPreProcessing(数据预处理)、FeatureExtraction(特征提取...

2019-11-09 10:00:00

分享整理的 Python 学习路线图,(附工具+视频+书籍+面试)

Python有多火?据了解,Python已经入驻小学生教材,未来不学Python不仅知识会脱节,可能与小朋友都没有了共同话题……不少读者总说想学Python却...

2019-11-09 10:00:00

数据人必读的一篇数据可视化文章【值得珍藏】

0x00前言数据可视化,对于很多人来说,并不是高不可攀和陌生的东西,无论是否是数据行业从业者,在日常的工作和汇报当中,都不免会使用到各种图表来直观的呈现数据。简单一点的,可以用Excel将数据绘制成各种可视化图形,如:柱状图、折线图、饼图、散点图、组合图等;抑或是用其它可视化工具tableau、powerBI等制作可视化Dashboard;或者是用Python/R中的一些可视化库,来进行数据...

2019-11-08 08:12:00

【数据科学家学习小组】之可视化(第一期)

0x00前言数据可视化,对于很多人来说,并不是高不可攀和陌生的东西,无论是否是数据行业从业者,在日常的工作和汇报当中,都不免会使用到各种图表来直观的呈现数据。可以说,...

2019-11-08 08:12:00

小尝试:基于指标体系的数据仓库搭建和数据可视化

小尝试:基于指标体系的数据仓库搭建和数据可视化关于作者:小姬,某知名互联网公司产品专家,对数据采集、生产、加工有所了解,期望多和大家交流数据知识,以数据作为提出好问题的基...

2019-11-07 12:16:12

廖雪峰历时3个月打磨出价值1980的数据分析教程,终终终于免费啦!

对比互联网各个岗位的裁员程度可以发现,数据分析相关岗位正在不断的扩招,已经成为了这波逆流中的黑马,什么原因导致的数据分析人才如此紧缺?因为数据分析是大势所趋,未来的发展空...

2019-11-05 09:00:00

不到70行Python代码,轻松玩转RFM用户分析模型(附案例数据和代码)

本文从RFM模型概念入手,结合实际案例,详解Python实现模型的每一步操作,并提供案例同款源数据,以供同学们知行合一。注:想直接下载代码和数据的同学可以空降文末看这篇文章前源数据长这样:学完后只要敲一个回车,源数据就变成了这样:是不是心动了?OK,闲话少叙,我们来开动正餐!RFM,是一种经典到头皮发麻的用户分类、价值分析模型,同时,这个模型以直白著称,直白到把需要的字段写在了脸上,让我们再念一遍...

2019-11-05 09:00:00

写点碎碎念的东西

0x00前言最近写文章有点进入瓶颈期的感觉,打开电脑半天写不出来东西,不知道大家有没有过类似的阶段。从我个人来讲,一方面是对自己写的内容不太满意,想写的再完善一些,结果就导致很难产出一篇满意的文章。另外一方面也是随着关注的人越来越多,写东西也开始畏手畏脚,太干货的文章写了阅读量容易崩盘,水一些的文章写了阅读量会高一些但是感觉价值也不大。总之也是纠结的很。不管那么多了,自己先写点絮絮叨叨的内容,...

2019-11-03 09:14:50

模型之母:简单线性回归的代码实现

模型之母:简单线性回归的代码实现关于作者:饼干同学,某人工智能公司交付开发工程师/建模科学家。专注于AI工程化及场景落地,希望和大家分享成长中的专业知识与思考感悟。0x00前言在《模型之母:简单线性回归&最小二乘法》中,我们从数学的角度理解了简单线性回归,并且推导了最小二乘法。本文内容完全承接于上一篇,我们来以代码的方式,实现简单线性回归。话不多说,码起来0x01简单线性回归算法的实...

2019-11-01 10:45:08

从一家餐厅鸟瞰数据仓库工作流

从一家餐厅鸟瞰数据仓库工作流关于作者:大圣归来,一个有数据信仰的sql工程师,积极进取、喜欢思考,期待与大家一起交流学习~0x00前言数据仓库中很多理论都源于生活,深入研究你会发现不光是数据仓库,包括Kafka数据写入流程、数据结构、MySQL事务一致性等一些技术的核心部分都可以在实际生活中找到他们的影子。今天,我们就从餐厅就餐的场景切入,来探讨数据仓库工作流。0x01场景切入-数据采集首...

2019-10-31 17:50:00

特征工程系列:GBDT特征构造以及聚类特征构造

特征工程系列:GBDT特征构造以及聚类特征构造本文为数据茶水间群友原创,经授权在本公众号发表。关于作者:JunLiang,一个热爱挖掘的数据从业者,勤学好问、动手达人,期...

2019-10-25 08:37:00

【数据科学家学习小组】之统计学(第二期)

【数据科学家学习小组】之统计学(第二期)0x00前言统计学的第一期顺利结束了,总参加人数:258人,恭喜大家的坚持!应大家的要求,现在开启统计学的第二期!截止公众号发...

2019-10-24 23:58:54

模型之母:简单线性回归&最小二乘法

模型之母:简单线性回归&最小二乘法本文为数据茶水间群友原创,经授权在本公众号发表。关于作者:Japson。某人工智能公司AI平台研发工程师,专注于AI工程化及场景...

2019-10-23 08:37:00

数据分析基础——EXCEL快速上手秘籍

EXCEL从入门到熟练?缺乏体系和数据源?练好这篇就够了!这篇文章是本系列的第一篇,选择性汇总了EXCEL的常用且重点的模块和公式,用作内部员工EXCEL基础操作培训,以...

2019-10-17 09:00:00

数据百问系列:DAU为何会骤降?

数据百问系列:DAU为何会骤降?0x00前言本次讨论的主题是:DAU骤降的分析思路有哪些?问题:假设你在一家游戏公司做数据分析,现在发现从8月份开始公司运营的某款游戏出...

2019-10-16 09:00:00

特征工程系列:笛卡尔乘积特征构造以及遗传编程特征构造

特征工程系列:笛卡尔乘积特征构造以及遗传编程特征构造本文为数据茶水间群友原创,经授权在本公众号发表。关于作者:JunLiang,一个热爱挖掘的数据从业者,勤学好问、动手达...

2019-10-14 08:50:00

想进大厂?请做好这三方面准备!

想进大厂?请做好这三方面准备!本文为草核儿创作,经授权在本公众号原创首发。关于作者:草核儿,互联网行业沉思者!希望传播的是正能量,但偶尔会被误以为是散播焦虑!欢迎大家多多...

2019-10-12 09:00:00

查看更多

勋章 我的勋章
  • 专栏达人
    专栏达人
    授予成功创建个人博客专栏的用户。专栏中添加五篇以上博文即可点亮!撰写博客专栏浓缩技术精华,专栏达人就是你!
  • 勤写标兵Lv4
    勤写标兵Lv4
    授予每个自然周发布9篇以上(包括9篇)原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。