5 木东居士

尚未进行身份认证

数据搬运工一只,欢迎光临个人小站:http://www.mdjs.info/about/

等级
TA的排名 7k+

业务团队和独立团队的数据分析,哪个更好?

0x00 前言 昨天,有朋友在群里抛出了一个话题【业务团队的数据分析和独立团队的数据,哪个更好?】。居士万万没想到这个话题能引起如此大量的讨论,以至于几个数据分析的交流群里面都讨论炸锅了...

2020-02-21 09:42:14

数据分析师必备知识点:置信度与置信区间

今天这篇聊聊统计学里面的置信度和置信区间,好像没怎写过统计学的东西,这篇试着写一写。1.点估计在讲置信度和置信区间之前先讲讲点估计,那什么是点估计呢?给你举两个例子你就知道了。现在你想要...

2020-02-20 09:00:00

数据分析师必备知识点:统计学的假设检验

上次写了统计学里面的置信度与置信区间以后,文章反响还不错,这次再来试着写写统计学里面的假设检验。假设检验的核心其实就是反证法。反证法是数学中的一个概念,就是你要证明一个结论是正确的,那么...

2020-02-20 09:00:00

关于数仓里画像层的构建的一些思考

0x00 前言 写一些关于数据仓库里面,数据集市(画像层)的东西吧最近一直都没写文章,因为太忙了,公司很多事情,主要画像层的一些重构,搞得我死去活来,所以写一篇文章给大家分享一下,如何构...

2020-02-19 20:30:16

为什么BI取数这么难?

大多数企业,都有BI或类似BI的部门或团队,它们肯定有两项基础工作,一项是提供报表,这个大家都懂,还有一项是取数,即根据业务要求临时性的提供数据解决方案,比如提供营销清单或决策分析的数据...

2020-02-19 20:30:16

超级菜鸟如何入门数据分析?

今天这篇文章是居士推荐的宝器兄,在知乎上的一个问答,超级菜鸟如何入门数据分析?文章很精彩,值得收藏~回答全文大致如下(全文很长,建议收藏阅读):经常看到很多朋友会问,入行数据分析之前我要...

2020-02-18 09:00:00

如何在技术和业务中保持平衡?

如果时间退回到十多年以前,新兴互联网公司的技术人员几乎都是从「业务开发」开始自己的职业生涯的。然而到了今天,不知道你有没有发现,业务开发和纯技术的开发已经有了明显的分野。最开始,互联网业...

2020-02-17 12:00:06

如何才能成为顶级的数据分析师?

正文开始每个行业都有好的数据分析师,但如何定义顶尖呢?顶级的数据分析师一定会在数据变现最牛逼的行业里存在,比如金融风控或者数字广告行业,这些业务是真正的数据驱动,因为数据上差一点点,效益...

2020-02-17 12:00:06

关于“如何让一个数据从业者产生职业焦虑”的一种方法!

0x00 前言 善良比聪明更重要!本文尝试从一个职业焦虑师的角度,讲述如何让一个数据从业者产生职业焦虑的一种方法。0x01 为什么是数据从业者的职业焦虑? 开始分析方法之前,我们要先说明...

2020-02-15 13:05:40

戴着枷锁跳舞:漫谈重构数据仓库的辛酸

0x00 前言 如果,让我回想一下有哪些幸福快乐的工作经历,怕是很难想到。但是,如果让我回想,有哪些痛苦不堪的工作经历,我第一个能想到的就是数据仓库的重构。所以,本文算是一个回忆文,记录...

2020-02-13 09:06:00

如何在打杂的数据工作中找到可以展示的亮点?

0x00 前言 本篇分享一些总结自己工作中亮点的思路。为什么会聊这样的一个话题?因为自从居士的《最近面了十多个数据分析师,聊一聊我发现的一些问题》这篇文章发出后,很多同学都反馈自己日常工...

2020-02-12 21:09:49

一个校招面试官的一天!

本文由土豆原创。土豆在BAT从业多年,曾负责产品经理团队的部分校招、社招工作。全文分成4部分:1.校招和面试背景;2.面试失败的原因;3.面试成功的原因;4.校招面试的建议。1校招和面试...

2020-02-11 12:02:00

​每个数据分析师都该有自己的分析框架

0x00 前言 在文章《最近面了十多个数据分析师,聊一聊我发现的一些问题》发出后,很多朋友私聊或者在评论中希望居士能否提供一份文中提到的完善的分析框架。本来,居士认为这是一篇相对好写的文...

2020-02-09 12:30:52

最近面了十多个数据分析师,聊一聊我发现的一些问题

最近面了十多个数据分析师,聊一聊我发现的一些问题团队缺数据分析的小伙伴,因此最近一段时间一直在面试,这俩月差不多也和十多个小伙伴聊过,居士发现了不少的问题,在此和大家分享一下。分享的内容...

2020-02-08 23:20:22

数据降维3:降维映射及PCA的实现与使用

数据降维第三弹来啦!0x01 高维数据向低维数据映射 在之前已经学习了如何求一个数据集的前n个主成分,但是数据集本身已经是n维的,并没有进行降维度。那么PCA是如何降维的呢?如何从高维数...

2020-01-08 19:19:00

关于数据质量的一些想法

0x00 前言 最近不少朋友都咨询过居士关于数据质量的问题,群里面也有很多相关的话题讨论。正巧,一位群友(Z)昨天发给我了一些他关于数据质量的思考,在此分享给大家。关于数据质量,也可以参...

2020-01-06 09:07:00

数据挖掘面试:不得不学的AUC!

数据挖掘面试:不得不学的AUC!关于作者:Milter,一名机器学习爱好者、NLP从业者、终生学习者,欢迎志同道合的朋友多多交流。https://www.yuque.com/liwenj...

2020-01-04 17:15:30

为什么看过无数的BAT秋招帖,不如自己踩坑来的真实?

前几天的1024程序员日,当程序员(媛)们在疯狂debug中欢度节日时,即将入坑的程序yuan们正在墙外翘首期盼。。。2020届互联网秋招即将进入尾声,暑期实习/提前批的神仙们已经盆满钵...

2020-01-02 21:17:00

知识图谱的自动构建

导读:知识图谱的构建包括逻辑建模、隐含空间分析、人机交互和本体模型支撑等多种方法。我们将分析各种构建方法的问题和挑战,指出自动构建的要素和应用场景。——背景——知识图谱是明略科技的核心技...

2019-12-31 09:00:00

均值与期望到底是不是一回事?

均值和期望是我们平常接触比较多的两个概念,均值大家都知道,就是若干个值先求和,然后再除值的个数;那期望又是什么。一般人们为了便于理解,就会说,你把期望也理解成是均值就可以了。那到底可不可...

2019-12-30 21:51:00

查看更多

勋章 我的勋章
  • 专栏达人
    专栏达人
    授予成功创建个人博客专栏的用户。专栏中添加五篇以上博文即可点亮!撰写博客专栏浓缩技术精华,专栏达人就是你!
  • 勤写标兵Lv4
    勤写标兵Lv4
    授予每个自然周发布9篇以上(包括9篇)原创IT博文的用户。本勋章将于次周上午根据用户上周周三的博文发布情况由系统自动颁发。