9 Leo.yuan

尚未进行身份认证

我要认证

专注企业数据分析应用和数字化转型。关注公众号“商业智能研究”,回复“资料”,整理了6G的数仓、数据中台、数据治理、企业数据化管理案例,供免费领!

等级
TA的排名 505

985硕士面试20场全被拒,被竞争困住的数据分析人,太难了

前几天在论坛上看到这样一个帖子:《数据分析是不是互联网行业最内卷的职位?》帖子中的主人公是一位留学归来的统计学专业硕士,学习和实习履历非常光鲜亮丽,然而秋招开始后,陆陆续续面试了20多场数据分析岗位,却无一成功!这让我想起了最近一个非常火的名词:内卷!什么叫做内卷比如,从前一亩普通的土地里,播种半斤的种子就可以收获800斤的粮食而一个农名却发现,如果播种1斤的种子,就只能收获900斤的粮食;如果播种2斤的种子,就只能收获1000斤粮食了;如果播种4斤种子,仍然只能收..

2020-10-30 10:05:42

有了数据湖,距离数据仓库消失还有几年?

很多人跟我一样,对于数据湖充满好奇,也许还读了不少数据湖文章,但无论别人怎么说,你还是会觉得难以把握数据湖的本质。有些人会望文生义说,数据湖嘛,就是什么东西都可以往里面扔,特别是对非结构数据的处理比较方便。是这样吗?有案例才有鉴别,有的人找了数据湖的作者AWS来说明数据湖是什么东西,比如下图:不懂数据的人也许会觉得数据湖很厉害,而懂数据的人也许会觉得仅是一堆数据仓库技术的堆砌包装而已,你看上面那张框架图,哪个专业词汇数据人士会不懂?凭什么数据湖被炒作成了一个新概念?有比较才有鉴.

2020-10-29 15:41:26

大数据分析工具鄙视链:Python成老大,Excel小弟都称不上?

佛说,一切众生相皆是无相。数据分析做到极致,也可以“无相无生”。在说今天的话题之前,我想先抛出一个结论:“做数据分析,不要建立一种以掌握的软件来给自己分级的心态,但是一定要用工具避免误入职业发展的歧途!”为什么今天要谈关于数据分析工具分级的问题呢?其实这涉及到职场中一个非常常见的现象——工具鄙视链:会python编程语言的,瞧不起用自助BI工具做数据分析的; 会用Tableau、FineBI这种分析工具的,瞧不起会用SPSS、SQL这种数据工具的; 会用SPSS、SQL的,.

2020-10-29 10:17:43

应届生月薪2W,财务人却不涨薪?那是你不会这种财务分析

俗话说,金九银十,最近正是找工作的高峰期。无论是去传统企业,还是去互联网公司,钱应该都是刚刚毕业的大学生考虑的要素,而现在动不动就月薪2W的情况下,这比工作几年的人都要高很多,不少人表示真香!虽然这个数,2011年的时候,base上海的某家国外的ERP公司就能给到了,但是它现在还是这么多,说明什么?说明行业有希望,而不是一成不变的。于是我就看见了这样的评价:什么时候像财务一样,不管到哪里就是6-8k,怎么跳槽也不涨薪,那就说明这个行业真的完了。财务不涨薪?认真的吗?这可是大大小小的.

2020-10-28 10:36:28

Python入门教程!手把手教会你爬取网页数据

其实在当今社会,网络上充斥着大量有用的数据,我们只需要耐心的观察,再加上一些技术手段,就可以获取到大量的有价值数据。这里的“技术手段”就是网络爬虫。今天就给大家分享一篇爬虫基础知识和入门教程:什么是爬虫?爬虫就是自动获取网页内容的程序,例如搜索引擎,Google,Baidu 等,每天都运行着庞大的爬虫系统,从全世界的网站中爬虫数据,供用户检索时使用。爬虫流程其实把网络爬虫抽象开来看,它无外乎包含如下几个步骤模拟请求网页。模拟浏览器,打开目标网站。 获取数据。打开网站之后,就可以自动化的

2020-10-27 10:34:34

低代码工具让人人都是程序员?别再吐槽了,它能做这些事

前有人人都是产品经理,后有人人都是程序员?低代码的出现,可能让这个现象变成现实,怎么?以前是工作难找,低代码的出现,直接让我失业了?以前是35岁不能从事IT和互联网?现在是45岁连卖菜都不行了?内卷很严重。不过,今天要说的低代码平台,真的不会让各位IT开发者失业,只是为了更好地去做别的事,重复造轮子,谁都不愿意吧。数据行业有个灵魂拷问:你究竟是写了5年的sql,还是1年的sql重复了5年?其实,低代码工具的作用,不仅仅是为了公司的效率,也是为了个人。比如说一些复杂的开发,可.

2020-10-26 10:52:14

从可视化模板,到数据仓库、数字化的资料,我整理并分享出来

一个可视化大屏,大家都想要模板,让我感受到了你们对于数据的重视。于是我一天都处在高强度的压力之下,找到了和数字有关的资料干货,毕竟我们是“用户至上”。你认识我们也好,不认识我们也罢,你只需要知道,是真的有人在做事情的。听了我自己都感动了,扯远了哈哈哈哈。1、各行业的数字化架构前阵子,我参加了数字化大会,有李宁集团的CIO,还有各大行业的大公司,都对自己的数字化转型做了一定的分享,这资料你得看看:其实不只有这些,名企也有:2、IT规...

2020-10-23 10:49:41

数据分析、python速成班?包就业?扒一扒数据行业黑幕

今天这篇文章必然会引来不少口水战,但我还是想让一些正在学习数据分析,或者对数据分析行业蠢蠢欲动的朋友了解真相。灵感来源于前天在朋友圈看到几个人同时转发了一篇文章,标题的意思大概就是教你快速掌握数据分析能力,这类标题我已经再熟悉不过了,大概率是卖课的(今年推出我的数据分析课程之前,我也花了一些时间去研究各家的营销手段和玩法,对于这样的标题是再熟悉不过的)。但,当我在朋友圈连续刷到3次同一篇文章之后,好奇心驱动,我点进去了,纯粹想学习一下这篇文章的写作套路是怎么让读者追捧愿意转发的。亮点在这里:

2020-10-22 10:18:08

Excel和PPT已经落后了,可视化大屏强在哪?一次看过瘾

文末有...今天看见这么一个问题:我得说,这真是一个好问题!可能会有如下回答:Excel的数据透视表操作麻烦,用BI拖拽一下就能有结果 整合多源数据,很多类型的数据就能一起分析了 可视化快速、美观,特别是联动的功能作为一个在数据行业多年的人,我觉得最后一个是比较值得注意的:可视化。可能会有很多人不懂什么叫联动,看这个:FineBI做的联动很好理解,就是让数据动起来,Excel和PPT做成这样,需要很久,而且效果要差不少。说到BI,可能很多人不了解,那报表总..

2020-10-21 10:58:30

贝壳总监分享数据中台与大数据平台架构,数字化房企早该如此

今天给大家说一下贝壳一站式大数据开发平台实践,图片不太好看,还请见谅。贝壳的大数据平台主要的数据源可以分为三类:人:卖家(业主)、买家(买房的、租房的)、经纪人; 物:楼盘字典,之前我分享的文章里介绍过(文末有链接),贝壳08年就弄了一个团队专门整楼盘主数据,建了一个2亿套房子的楼盘字典,给每套房子都编了唯一的ID,这不就是数据中台的ONE ID么;行为:线上浏览行为、线下沟通、看房、谈判等各种行为。对于大数据平台来说,最重要的能力就是低成本、快速、准确的为各个部门提供各种形式的数.

2020-10-20 10:35:59

以ERP和CRM为例,谈谈阿里工程师对数字化的架构认知

自顶向下 VS 自底向上,代表了软件开发的两种主流方式,前者指从应用的最顶层开始设计,一直做到最底层的代码;后者指从应用的最底层编码开始设计,逐步开发出整个软件架构。自顶向下属于典型的瀑布开发模式,讲究的是先确定好系统的架构模型与规范体系,明确模块之间的依赖关系,就像计划经济一样,好处是有明确的开发指导思路,缺点是不适应快速变化的外部需求;而自底向上属于典型的敏捷开发模式,先构建出一个原型,再不断的去循环优化和改进,就像打仗一样,首要目标是验证系统的可行性。对于大多数工程师而言,这两种.

2020-10-19 10:52:08

阿里创业员工分享公司的BI选型之路!自研、开源的坑都踩过

一、业务背景与需求梳理年初盘年度计划的时候计划今年要上BI的,但疫情的原因一拖再拖,也正好在那时候需求爆发,各种业务各种问题各种数据各种分析,意识到不上不行了,负荷扛不住啊,于是就开始立项,进行BI选型调研。这里把自己的调研笔记整理成文分享,仅代表个人观点。公司现在的数据需求主要分为两类:临时需求:业务突然想看看这波活动的效果怎样,(数据指标的定义可能随时改,随时加)固化需求:每周要看,每月要看的数据,(数据的定义已经非常明确)。对于这两类需求,我们现在的处理方案是:对于临时需.

2020-10-16 17:28:51

50套可视化报表模板直接用,做报告不用愁了!快收藏

总有人头疼:报表怎么做?数据怎么展现给领导才是最合适的?年终总结怎么让人眼前一亮?用Excel吧,太低端了,而且是真的丑,万一被pass不就惨了?用python自动化吧,不会代码,不给自己找事了。就拿财务报表来说,里面涉及到很多公式、维度,靠自己从头梳理并且做好真的不简单, 而且样式都千篇一律,这样的谁愿意看?但是这样的就好像换了一个样了:你以为这个很难?不,你有调整报表布局和为数据不对头而烦恼的时间,我早就做好好多张报表了。怎么做的?肯定是有报表的模板,事半功倍..

2020-10-16 11:21:04

1年sql数据库经验,却说数据模型一文不值?你还没懂数据仓库

平时在工作中,一般都会遇到拿着 Excel 直接分析,给报表的场景,或者更近一些互联网的分析工作,会用 SQL 取数,再用 Excel 分析。那说到分析,就必然离不开BI、数据仓库、数据建模等了,spark,hadoop等大数据平台,也是搞这行的人得懂的知识。可是,相比于那些架构、算法,更让我头疼的是数据结构和模型。现在回首,我依然对广义的数据结构和算法抱着极高的敬畏。同时,我也庆幸,我掌握了解决信息领域的数据结构与算法,即关系型数据库的数据模型。如果说,广义的数据结构,比如..

2020-10-15 11:16:16

0基础小白都说简单!10秒做好酷炫图表,可视化工具帮了大忙

优秀的数据可视化,选择正确的图表类型是第一步。再酷炫,再黑科技的可视化大屏,不也是一个个图表组成的吗?图表制作,其实要说难也不算太难,但是选择图表却是一个令人头疼的难题。柱状图、散点图、饼图、气泡图等,什么时候用,怎么用,一直让人头疼,用不好图表,那想要做出好看且易懂的可视化,那就很难了。我总结了一下图表的使用选择,可以看上面这张图,从你想展示什么入手,将数据展现类型分为比较、联系、分布和构成这4个方面。要了解每个数据图表适用的场景,才能根据工作需求制作对应的图表...

2020-10-14 11:46:12

夺冠没含金量!用python和BI可视化分析,湖人赢在这点上

在经历了很多很多之后,湖人队终于获得了总冠军,众望所归。如果科比还在的话,一定也很自豪吧,毕竟上一次夺冠还是10年前。那问题来了,为什么湖人能赢?比对手强在哪些地方?口说无凭,我觉得只有数据能说明一切,为此,我特地爬取了NBA和湖人以及季后赛对手的相关数据,意在从数据的角度看看球员的表现。注:数据来源准确,所使用的爬虫工具为Python,分析工具为国产数据分析工具FineBI。大家都应该知道python是干什么的吧,那这里就不再重复了,从获取数据的角度上来看,python确实是.

2020-10-13 10:20:37

阿里腾讯都在做的可视化大屏,我用这工具里的100个模板实现了

必须得给各位来点干货东西。阿里腾讯都在做的可视化大屏,我用这工具里的100个模板实现了。我听很多人说,很多景区、医院、工厂的入口处都有这种可视化大屏,其实你不知道的是,这些东西不仅仅是所谓的“面子工程”(你要这么想就太单一了),其实对领导和决策层有很大的作用。这句话怎么解释?因为动态可视化大屏能火起来,是因为它强大到阿里、网易、腾讯都在做,前景就不要我过多描述了吧。不过上网搜索可视化大屏的制作,要么就是vue、echarts等代码工具,要么就是一些厂商服务,都成不了大..

2020-10-12 11:03:53

人人都是程序员?一边吐槽,一边却偷偷用,低代码工具真香

人人都是产品经理,这句话从15年就开始说了,意思是每个人都可以对产品(比如你使用的app,网页)进行设计,只需要对整个产品了解就可以。那人人都是程序员呢?很多人都知道,程序员加班是日常,久坐、掉发、发胖是特征,可是,提到被轻易替代,咱可是靠技术吃饭的,怎么可能?(心理活动:最多华为干不下去,换个小公司,一样风生水起)低代码平台的到来,仿佛打脸了:那些没学过的,也能学习SQL,甚至跳过这一步,然后用低代码工具做和我一样的事情。Gartner预测,4年之后,低代码占比将超过65%,到时候内卷会更

2020-10-09 11:15:01

千字搞定数据产品选型!报表、BI、大数据平台、中台都在这了

来吧,废话不多说,直接上干货!到现在还在做报表的,已经很少了。上面三家都是中国主流报表厂商。不过在国外BI厂商的市场压力面前,也都做了BI套件。主流的就帆软,水晶报表最近见的少了。普通小厂,1、2个数据工作者,建议采购一个报表平台就行了,不用买BI软件。帆软功能齐全,生态很好,人比较好招,还有升级版帆软BI。润乾价格便宜,一套万把块钱,可惜现在只有便宜这个优点了。早期都是国外市场的天下,BO、Brio、Cognos、MSTR等,都是老牌BI厂商了,...

2020-09-29 10:53:50

机器学习概念和经典算法,我用大白话给你讲清楚了!入门必看

在数据领域,很多人都在说机器学习,但是只有很少的人能说清楚怎么回事。网上关于机器学习的文章,大多都是充斥各种定理的厚重学术三部曲(我搞定半个定理都够呛),或是关于人工智能、数据科学魔法以及未来工作的天花乱坠的故事。尽管数据分析实际工作中用到机器学习的机会真的不多,但我觉得它仍是数分从业者所需的技能之一,所以今天这篇文章,主要对那些想了解机器学习的人做一个简单的介绍。不涉及高级原理,只用简单的语言来谈现实世界的问题和实际的解决方案。不管你是一名程序员还是管理者,都能看懂。怎么理解啥叫机器学习这里讲

2020-09-27 15:57:02

查看更多

CSDN身份
  • 博客专家
勋章 我的勋章
  • 签到新秀
    签到新秀
    累计签到获取,不积跬步,无以至千里,继续坚持!
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 1024勋章
    1024勋章
    #1024程序员节#活动勋章,当日发布原创博客即可获得
  • 勤写标兵Lv3
    勤写标兵Lv3
    授予每个自然周发布7篇到8篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。
  • 原力计划专属勋章
    原力计划专属勋章
    2019年《原力计划【第一季】》专属勋章,现已经开启第二季活动啦,小伙伴们快去参加吧
  • 原力探索
    原力探索
    参与《原力计划【第二季】——打卡挑战》的文章入选【每日精选】的博主将会获得此勋章。
  • 原力突破
    原力突破
    参与《原力计划【第二季】— 打卡挑战》的文章入选【打卡挑战周榜】的博主,即可获得此勋章。
  • 原力王者
    原力王者
    在《原力计划【第二季】》活动中,入选本季总榜的博主,即可获得此勋章。
  • 学习力
    学习力
    《原力计划【第二季】》第一期主题勋章 ,第一期活动已经结束啦,小伙伴们可以去参加第二期打卡挑战活动获取更多勋章哦。
  • 原力新人
    原力新人
    在《原力计划【第二季】》打卡挑战活动中,成功参与本活动并发布一篇原创文章的博主,即可获得此勋章。
  • 原力探索 · S
    原力探索 · S
    在《原力计划【第二季】》打卡挑战活动中,发布 12 篇原创文章参与活动的博主,即可获得此勋章。(本次活动结束后统一统计发放)
  • 1024达人勋章
    1024达人勋章
    10月24日粉丝/获赞/评论/收藏累计达到1024,即可获得“1024达人”勋章