自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1466)
  • 收藏
  • 关注

转载 Pandas表格样式设置技巧,漂亮!

大家好,我是阿粥今天给大家分享如何给Pandas DataFrame添加颜色和样式。前排提示,文末送两本商业分析的好书~通过这一方法,增强数据的呈现,使信息的探索和理解不仅内容丰富,而且具有视觉吸引力。Pandas Styler是Pandas库中的一个模块,它提供了创建DataFrame的HTML样式表示的方法。此功能允许在可视化期间自定义DataFrame的视觉外观。Pandas Styler的...

2024-03-21 22:03:39 83

转载 Polars ,最强Pandas平替?

转自:数据studio大家好,我是阿粥~今天给大家分享关于Polars库的内容,前排提示,文末送两本好书~Polars是一个用于操作结构化数据的高性能DataFrame库,可以说是平替pandas最有潜质的包。Polars其核心部分是用Rust编写的,但该库也提供了Python接口。它的主要特点包括:快速: Polars是从零开始编写的,紧密与机器结合,没有外部依赖。I/O: 对所有常见数据存储层...

2024-03-05 22:03:52 116

转载 Linear Regression 读书笔记

1. 原文内容概要1)首先阐释了线性回归模型(linear regression)的核心概念,包括线性关系的假设(assumption)、参数估计(coefficient estimate)以及最小二乘法(least squares)的应用,并详细讨论了如何评估系数和模型的有效性和精度;2)然后,作者还深入探讨了线性回归在实际问题中的应用,并介绍了如何处理复杂的数据问题,如分类变量(Qualit...

2024-02-29 22:03:42 80

转载 5个强大的EDA探索性数据分析神器!

来源:Deephub Imba作者:Sharod Dey大家好,我是阿粥EDA或探索性数据分析是一项耗时的工作,但是由于EDA是不可避免的,所以Python出现了很多自动化库来减少执行分析所需的时间,今天就跟大家聊聊几个好用的库。前排提示:文末送两本好书EDA的主要目标不是制作花哨的图形或创建彩色的图形,而是获得对数据集的理解,并获得对变量之间的分布和相关性的初步见解。我们在以前也介绍过EDA自动...

2024-02-29 22:03:42 144

转载 Sora模型解密,AI如何让视频制作翻天覆地?!

新智元报道编辑:编辑部OpenAI首个AI视频模型Sora横空出世,再次创造历史。这个堪称「世界模型」的技术报告也在今天发布了,不过依然没有公开具体训练细节。最近,「现实不存在了」开始全网刷屏。「我们这么快就步入下一个时代了?Sora简直太炸裂了」。「这就是电影制作的未来」!谷歌的Gemini Pro 1.5还没出几个小时的风头,天一亮,全世界的聚光灯就集中在了OpenAI的Sora身上。...

2024-02-19 22:03:48 115

转载 klib,一个加速数据清洗的神器!

今天给大家分享一个klib库。klib提供了一系列非常易于应用的函数,具有合理的默认值,几乎可以用在任何DataFrame上,用于评估数据质量、获得灵感、执行数据清洗和可视化,从而更轻便、更高效的处理Python Pandas DataFrame数据。klib可视化数据-klib.cat_plot(df)#展示分类特征数量和频率-klib.corr_mat(df)#相关性矩阵-kl...

2024-01-24 09:03:48 181

转载 优衣库畅销款数据分析案例。

内容来源授权转载:知乎@李启方从人、货、场三个维度,即客户维度、产品维度、区域维度对优衣库畅销款商品的销售情况进行数据分析和可视化报告展示。(数据来源:2023年某时段取样)分析维度:人(顾客)维度、货(产品)维度、场(区域维度)、时间维度数据指标:销售额、订单数、销量、客户数、利润、客单价及其派生指标等。1、销售分析A类产品包括T恤、当季新品、配件和毛衣;B类产品包括牛仔裤、裙子;C类产品包括袜...

2024-01-23 22:03:56 258

转载 SQL实际执行顺序,你真的懂了吗?

来源:网络这是一条标准的查询语句:这是我们实际上SQL执行顺序:我们先执行from,join来确定表之间的连接关系,得到初步的数据where对数据进行普通的初步的筛选group by 分组各组分别执行having中的普通筛选或者聚合函数筛选。然后把再根据我们要的数据进行select,可以是普通字段查询也可以是获取聚合函数的查询结果,如果是集合函数,select的查询结果会新增一条字段将查询结果去重...

2024-01-19 22:03:47 167

转载 了解GPT大模型,读这本书就够了!

大家好,我是阿粥~今天给大家推荐好友佳哥的新书:《GPT图解大模型是怎样构建的》下面是详细的内容:最近发现,当国外OpenAI的权力的游戏反转再反转的时候,国内的AI创业者们除了吃瓜之外也没闲着。有很多程序员正在AIGC赛道中默默发财,有通过短视频做内容爆火,接广告的;有卖AI解决方案的;有卖AI课程的;也有卖AI产品,慢慢做大做强的......更不必说,那些拿下“人均年薪100万”大模型相关岗位...

2024-01-18 22:03:08 125

转载 2023虎扑高校排名公布!

来源:虎扑、双一流高教、募格学术等高校排名榜大家应该都很常见吧,每一年,泰晤士排名、US排名、软科排名..... 各类榜单层出不穷,根据各自的算法指数给高校排个高低,供学子们参考。但如果让已经就读的学生,来进行一场高校评分排名的话,会产生怎样的排分呢?近日,虎扑围绕高校的打分排名,成为话题热点。引发众网友关注。打分评价是再普通不过的功能,但和高校组合在一起,就有了不一样的味道。一句话锐评母校大学生...

2024-01-17 22:03:58 96

转载 (此文价值极大)ChatGPT搞钱的新路子,数据分析师快上车!

Open AI 最新成果炸裂ChatGPT裂变成无数个GPTs“苹果”替代“诺基亚”的时代又要来临了!!2年内,传统 IT 岗位将失业被重塑!5年内,医疗/量化/互联网/办公等行业涌现新业态现在还不学习AI大模型训练技术或将很快面临“被淘汰”!作为普通程序员,如何不被时代抛弃,享受AI技术带来的红利?!????知乎知学堂特发起:行业前沿资源——AI大模型公开课已为本号粉丝开通免费领取权限预计24小时...

2024-01-16 22:03:16 63

转载 MoviePy,一个超强的Python库!

作者:小小明地址:https://xxmdmst.blog.csdn.net/article/details/134938026CSDN - 小小明本文用于讲解Python的moviepy库的自带函数的用法,主要目的是讲一下每个函数的每个参数的含义,无需一开始就全部掌握,粗略看一下就行,可以在后面自己开发过程,遇到不会用的函数再回过头来看看本文档。moviepy简介及基本概念moviepy概述Mo...

2024-01-15 22:03:13 204

转载 10万字、近20家企业智能分析决策合集

如今,企业组织正面临越来越多样化的挑战。一方面,需要构建跨越周期的组织能力,应对可持续发展的长期性问题;另一方面,需要打造敏捷应变的短期能力,来迎接当下大量的不确定性因素。越来越多的企业从过去依赖人脑的战略规划,逐步走向数据驱动的战略迭代,以抵御多变风险,提升韧性增长力。这其中,挖掘数据价值,驱动业务决策已成为企业关注的重点。正所谓“谁来呼唤炮火?应该让听得见炮声的人来决策。”要在不确定的VUCA...

2024-01-12 08:57:09 52

原创 如何计算指标波动贡献率?(附Pandas实现)

大家好,我是阿粥“为什么这个月销售额提升了30%?”“为什么转化率又降了,同比竟然降低了42%,什么原因导致的呢?”这些都是数据分析师在工作中经常会遇到的问题,甚至有些基础岗的数据分析师要花80%以上的精力处理这类问题:指标降低或者提升了多少,以及波动的原因是什么。这类问题可以概括为指标波动归因分析,很多时候用的是根据经验探索拆分的办法,非常占用数据分析师的时间,而且数据分析师获得的价值感也不高。...

2024-01-08 22:03:33 1000

原创 谈谈我眼中的用户分层分析!

大家好,我是阿粥。用户分层是几乎所有品牌都会思考的一个重要命题。合理的分层能够帮助品牌有效提升用户的忠诚度。这篇文章,我会带大家熟悉用户分层的基本概念、价值以及分层分析的思路。内容略干,在看的时候可以喝两口水。同样,和昨天一样,文末送我签名版新书一本。一、无处不在的用户分层用户分层,顾名思义,是把用户按照一定的规则划分成不同的层级:想玩游戏了,打开王者荣耀,看到新出的英雄皮肤效果酷炫,忍不住充值...

2024-01-04 22:03:47 884

原创 以电商为例,如何认识一个行业?

大家好,我是阿粥。今天来聊聊,关于“行业认知”这个对分析师来讲非常重要的问题。前排提示,文末送我的新书签名版一本:一、为什么要认识一个行业?岗位之于公司,犹如扁舟之于大海。公司之于行业,亦是扁舟泛于海上。作为一个分析师,精专手头的项目当然是好事。不过,如果只瞅着眼前分析的一亩三分地,不尝试从更高的视角去俯瞰去认识整个行业,难免陷入一叶障目的分析困境。为了更加具象化,这篇内容以电商行业为例,从侧面讲...

2024-01-03 22:03:33 641

转载 摊牌了,我写了本书!

大家好,我是阿粥(也是小z)可能有老粉知道我在写书,写了很久很久,进度也不太明确...这不,这本新书:《Python电商数据分析实战:从电商实际案例出发洞悉数据分析全流程》终于终于终于发布了!今天,和大家聊聊写这本书的心路历程,既有这本书的内容摘要,也有作为一个老分析师,对数据分析行业的一点感悟体会。为什么要写这本书通过公众号的机缘巧合,这些年来我认识了很多很多数据分析相关的朋友,交流下来,发现大...

2023-12-19 09:05:20 169

原创 聊聊分析师应该如何搞定业务!

大家好,我是阿粥,也是小z。前几天朋友圈做了个调研:发现大家对于思维和分析师遇到的具体问题很感兴趣,点赞也远超30,这不,我来交作业了!今天聊的,是对于分析师极其重要却很少有资料讲到的一个软性能力——搞定业务方的能力。数据分析师和业务之间,有两对主要矛盾。一是业务无穷无尽的取数需求和分析师对重复单一工作排斥的矛盾。二是分析师“呕心沥血”加班加点总结的分析结论和业务方嗤之以鼻不屑一笑的矛盾。这两对矛...

2023-12-10 22:03:23 951

原创 最近数据分析面试的一点感悟...

我是阿粥,也是小z最近面了不少应届的同学(数据分析岗位),颇有感触,与各位分享。简历可以润色,但要适度运用一些原则,如STAR法则,让简历逻辑更清晰,条块分明,突出自己在经历和项目中的努力,并用结果量化,这很棒。但我也看到有同学,注水要素太明显。例如在描述自己短暂的实习经历时,强调基于自己的数据分析输出建议,最终影响集团业务决策,提升某关键指标50%+。从概率上讲这是可能的,但从现实来讲又是不现实...

2023-11-26 22:03:12 1011 1

转载 数据分析统计学最全思维导图!(附下载)

原创:ZOE酱来源:https://zhuanlan.zhihu.com/p/25884239文末附高清大图下载链接本文用一系列「思维导图」由浅入深的总结了「统计学」领域的基础知识,是对之前系列文章做的一次完整的梳理,也是我至今为止所有与统计有关的学习笔记。众所周知,「统计学」是深入理解「数据分析/机器学习/数据挖掘」的重要基础学科。思维导图描述性统计:表格与图形法描述性统计:数值方法概率概率...

2023-11-23 22:03:32 400

转载 90个常用的思维模型.pdf

思维模型可以被看作是解决问题、做决策和理解信息的框架或者方法,经过很多大神的总结和沉淀形成了一套成熟的方法论和思考体系。在职场和生活中,正确的思维模型可以帮助我们在职场中做出更加明智和合适的决策。例如,系统思维帮助我们看到整体,而不仅仅是局部,可以更加系统地分析问题,找到最佳解决方案。好的思维模型为我们提供了清晰、有逻辑的、多角度的视角去看待问题,从而做出更好的决策;坏的思维模型可能会导致我们的视...

2023-11-20 22:03:48 271

转载 一文彻底了解卡方检验!

卡方检验(Chi Square Test)被广泛使用,特别是在涉及医学、产品设计、工程和几乎所有研究项目的决策中。为了理解什么是卡方检验,首先需要了解什么是假设检验,因为卡方检验是假设检验的一种。一旦知道什么是假设检验,就能够在此基础上了解许多不同种类的假设检验,例如卡方检验、t检验、Z检验、Wilcoxon检验等。1. 什么是假设检验?假设检验是一种统计分析方法,它查看样本并确定样本的测试结果是...

2023-11-07 22:03:51 473

转载 绝了!懂行的程序员都开始用AI搞钱了!

随着ChatGPT大热“AI大模型”无疑是最火爆的话题!Google、百度、腾讯等等巨头互联网公司,无不在布局人工智能技术和市场,甚至还有60k*16的高薪,挖掘AI大模型人才!作为普通程序员,如何不被时代抛弃,享受AI技术带来的红利?!????知乎知学堂特发起:行业前沿资源——AI大模型公开课已为本号粉丝开通免费领取权限预计24小时后关闭通道!速进!AI大模型-重塑程序员核心竞争力(不限年龄!不限...

2023-11-07 22:03:51 312

转载 大公司病(太TM形象了)

作者:南之鱼来源:芝麻观点(ID:zmgd808)大家好,我是阿粥今天分享的这篇内容,很形象地描绘了大公司的一些通病,以及其形成的原理。同时,文末也会送两本好书~..........................................................................................................................

2023-11-05 22:03:25 509

转载 Jupyter 和 Chatgpt 合体,Chapyter来了!

来源:机器之心大家好,我是阿粥,也是小Z相信很多小伙伴是Jupyter的重度使用者,本篇介绍一个利器Chapyter它将目前火爆的 ChatGPT 代码解释器与 Jupyter Notebook 结合了起来,让编码更加地高效。顺便前排提示,文末送两本GPT相关的好书~在 AI 的帮助下,开发者的编码效率能够大大提升。开发者们将从简单、重复的编码工作中解脱出来。但是随之而来的诸多问题,往往让使用...

2023-10-23 22:03:19 345

转载 中国成年男女私密数据更新了...

来源:好奇博士今天给大家分享一系列私密又有趣的数据(前排提示,文末送书)

2023-10-19 22:03:52 308

转载 Python中进行特征重要性分析的9个常用方法

特征重要性分析用于了解每个特征(变量或输入)对于做出预测的有用性或价值。目标是确定对模型输出影响最大的最重要的特征,它是机器学习中经常使用的一种方法。为什么特征重要性分析很重要?如果有一个包含数十个甚至数百个特征的数据集,每个特征都可能对你的机器学习模型的性能有所贡献。但是并不是所有的特征都是一样的。有些可能是冗余的或不相关的,这会增加建模的复杂性并可能导致过拟合。特征重要性分析可以识别并关注最具...

2023-10-15 22:03:39 1150

转载 没房贷的下属太可怕了。。。

在微博上看到一个热搜话题:#没房贷的下属太可怕了#。咋回事呢?起因是越来越多公司领导发现,新一代“三无”年轻人不好管了,你骂他,他敢顶嘴。何为“三无”,即“无房贷、无车贷、无后代”。这类年轻人,完全不按传统职场套路出牌,你让我不爽,我分分钟拍屁股走人,他们正用行动整治职场风气。话说这“三无”年轻人到底有多可怕?我们听听年轻人们的声音。听到这些话,想想我们身边的职场,好像确实如此。我在身边就能看到类...

2023-10-15 22:03:39 361

转载 我在代码里面故意留个漏洞,违法吗?

昨天在逛知乎的时候,看到了这么一个问题:有三个非常有意思的回答,分享给大家一看。首先是这个为了防止项目交付后收不到尾款埋下后门的回答:答主:特立独行的猪链接:https://www.zhihu.com/question/531724027/answer/2487270093早年给某台企做外包项目,定制一个Android系统的ROM。开发费用16万,一年期维护费用2万。开发费用分三期打款,订金4万,...

2023-10-14 22:03:47 435

转载 社会内卷的真正原因:华为内部论坛的这篇雄文火了!

作者:丘小海来源:华为内部论坛大家好,我是阿粥,也是小z今天给大家分享华为内部论坛很火的一篇文章。文末顺便送两本Python相关的好书~内卷这个概念的内涵很丰富,与我们的生活息息相关。为了普及和传播知识,我参考了相关的信息,把我个人的粗浅理解奉献给朋友们。内卷 involution,与之对应的是 evolution,即演化。直观地说,内卷就是“向内演化,或绕圈圈”。更宽泛一点说,所有无实质意义的消...

2023-09-27 22:03:28 171

转载 10000字!超全图解机器学习特征工程(文末送书)

原文链接:https://www.showmeai.tech/article-detail/208作者:showmeAI大家好,我是阿粥,也是小z今天分享一篇关于机器学习特征工程的干货,顺便提一句,文末送2本ChatGPT相关的好书~下图为大家熟悉的机器学习建模流程图,整个建模流程非常重要的一步,是对于数据的预处理和特征工程,它很大程度决定了最后建模效果的好坏。特征工程简介首先我们来了解一下『特征...

2023-09-21 22:03:43 278

转载 解决野鸡大学水硕、水博?中国首次发布海外大学排名!

本文分享中国首次发布的海外大学排名。来源:全国高校信息资料研究会与中国人民大学评价研究中心、新东方在线托福、青塔等平台编辑:学妹不久前,我国一科研机构首次发布了对海外学校的评估!网传,这或许会成为以后中国看待海归大学的背景考核依据之一!图源:央视网教育根据新闻显示,2023年8月19日,由全国高校信息资料研究会与中国人民大学评价研究中心联合研制的《境外大学学科分级目录(人文社会科学)》在京发布。...

2023-09-11 22:03:35 304

转载 Python exe文件打包神器-Nuitka!

来源:Raymond运维链接:https://www.lixiaofei2yy.website一. pyinstaller和Nuitka使用感受1.1 使用需求这次也是由于项目需要,要将python的代码转成exe的程序,在找了许久后,发现了2个都能对python项目打包的工具——pyintaller和nuitka。这2个工具同时都能满足项目的需要:隐藏源码。这里的pyinstaller是通过设置...

2023-09-07 22:03:56 239

转载 万字详述银行全面自助分析BI体系!

《2023商业银行智能决策能力建设白皮书》是观远数据与亿欧智库联合正式发布,针对银行智能决策的建设背景、难点、路径与实践等进行全面阐述和分析的行业白皮书。《2023商业银行智能决策能力建设白皮书》《白皮书》详细阐述了商业银行“统计报表分析”、“局部自助分析”、“全面自助分析”、“智能决策”四大BI发展阶段,为银行智能决策发展情况提供印照路径。受限于数据应用程度影响,大多数银行仍处于局部自助分析阶段...

2023-09-06 22:03:52 265

转载 利用ChatGPT进行数据分析!

大家好,我是阿粥(也是小z)今天给大家强烈推荐俊红的新作——利用ChatGPT进行数据分析!比尔·盖茨曾说过:“ChatGPT 像互联网发明一样重要,将会改变世界。”如今 ChatGPT 已经变得非常热门,人们可以通过与 ChatGPT 进行天马行空的对话,获取自己需要的答案。它可以按照人的指令生成各种文本,来满足不同领域和场景的需求,例如翻译文本、撰写诗歌、代码、剧本、商业计划书等等。如果你实际...

2023-08-30 22:03:13 1270

转载 微软终于把 Python 弄进 Excel 了!

量子位 | 公众号 QbitAI大家好,我是阿粥(也是小z)前排提示:文末送BI相关的好书~最近Excel相关比较重磅的新闻,就是微软把Python搞进Excel中了~例如:搭建一个机器学习天气预测模型,在Excel里即可实现。而且无需任何设置,在单元格里输入“=PY”,就能开搞。数据清理、预测分析、可视化等等任务,都能轻松实现。还和Anaconda达成了合作。各种常见Python库都能直接用,如...

2023-08-27 22:03:12 150

转载 将Pandas换为交互式表格的库~

Pandas是我们日常处理表格数据最常用的包,但是对于数据分析来说,Pandas的DataFrame还不够直观,所以今天我们将介绍4个Python包,可以将Pandas的DataFrame转换交互式表格,让我们可以直接在上面进行数据分析的操作。PivottablejsPivottablejs是一个通过IPython widgets集成到Python中的JavaScript库,允许用户直接从Data...

2023-08-18 22:03:28 170

转载 绝了!某公司查员工VX聊天记录...

来源:程序媛山楂2023年了,居然还有公司在查员工的聊天记录...肯定有朋友就想,不同意看不就行了吗,难道还能直接翻打开电脑看我聊天记录不成?这可是妥妥的违法呀!想多了,现在的技术是可以直接监控的,也就是说由不得你,只要你安装了某些管理软件,用了公司被root的电脑,你将被扒的底裤都不剩。注意,私人微信也不可避免,甚至还有一些公司会明目张胆的抽查聊天信息,也是够无耻的!网友亲自下场证明作为某司安全...

2023-08-18 22:03:28 239

转载 零售消费行业BI最佳实践案例!(附下载)

在大消费领域,市场越来越细分,消费者了解信息的渠道越来越多元,消费者偏好与行为变化越来越快,抓住消费者的心好像越来越难了。而市场响应能力,一直以来都是零售消费企业成败关键所在,谁能够更快更好的了解客户、服务客户,才有机会从激烈的市场竞争中占据取胜先机。至今,观远数据已深入服务了包括联合利华、3M中国、丝芙兰中国、安踏、元气森林、蜜雪冰城等400+零售消费行业领先企业。凭借领先行业的BI产品、完善的...

2023-08-17 21:57:50 196

转载 一本书讲透AI绘画

引 AI太狠,这一次开始欺负“灵魂画手”。2023年之前,很多人认为AI可能会取代流水线工人、话务员、翻译。但一直觉得AI再厉害,20年内不可能会画画。你强任你强,春风佛山岗,算法你再嚣张,艺术也是你永远跨不过去的门槛。艺术,那可是承载着人类至高无上的神性啊。话音未落狼来了,AI又攻克了绘画堡垒。对抗算法谁的面子也不给,diffusion技术同样“干掉你与你无关”?AI这个没有人性的屠夫,连温柔...

2023-08-11 22:03:48 150

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除