自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

积跬步,慕至千里的博客

想,都是问题;做,才有答案!

  • 博客(269)
  • 资源 (4)
  • 收藏
  • 关注

原创 14-pyspark的DataFrame使用总结

PySpark实战笔记系列第五篇:DataFrame使用总结

2024-04-11 20:02:52 689

原创 13-pyspark的共享变量用法总结

PySpark实战笔记系列第四篇:共享变量用法总结

2024-04-09 20:12:35 588

原创 12-pyspark的RDD算子注意事项总结

pyspark入门学习笔记第三篇:RDD算子注意事项总结

2024-04-08 20:00:00 1110

原创 11-pyspark的RDD的变换与动作算子总结

pyspark入门学习笔记第二篇:RDD的变换与动作算子总结

2024-04-06 23:04:54 1152

原创 10-用PySpark建立第一个Spark RDD

pyspark入门学习笔记第一篇

2024-04-05 10:21:12 1239

原创 clickhouse常用函数总结

formatDateTime(def_datetime, '%y') AS def_datetime_year_litter, -- 19(指定日期为19年,Year, last two digits (00-99),本世纪的第19年)formatDateTime(def_datetime, '%M') AS def_datetime_get_minute,-- 20(得到指定事件的“分”,minute (00-59))-- 30(得到指定事件的“秒”,second (00-59))

2024-04-03 18:06:46 621

原创 pyecharts画图结果存为图片

通过pyecharts绘制的图像,我们尝尝保存在html文件中,以保持其原有的良好的交互性。但当我们在word或者ppt中使用时,保存为图片的形式,则是我们最想要的方式。针对此问题,通过查找相关实现方式,总结其渲染的html文件保存图片方式。在 Python 中,模块pyecharts模块中存在make_snapshot函数,其作用是生成静态图像快照,能够将 pyecharts 生成的图表保存为图片文件。

2023-11-21 20:09:48 1284

原创 仪表盘:pyecharts绘制

利用pyecharts绘制仪表盘

2023-11-21 19:59:05 213

原创 【案例卡】clickhouse:多行数据拼接在一行

groupArray 是 ClickHouse 提供的一种聚合函数,用于在 GROUP BY查询中将行组的某个列的值组合成一个数组。groupArray 函数在分析数据时非常有用,它可以将行组中的数据合并成数组形式,方便后续的处理和分析。

2023-11-07 16:43:13 1984

原创 【总结卡】clickhouse数据库常用高级函数

clickhouse常用高级函数总结

2023-11-07 10:07:05 556

原创 01 Excel常用高频快捷键汇总

Excel软件是我们工作学习必备的工具之一,作为如此高频使用的一个工具,如果能够掌握其中一些常用的快捷方式,将对轻易提升我们的工作效率,事半功倍,快捷工具的熟练使用,使我们达成所愿的捷径之一,也是相对来说,学习投入最少却最易获益的一种方式。基于此,本文对常用的一些高频快捷键进行了汇总和介绍,以期帮助到有需要的人。

2023-07-26 15:26:51 1159

原创 案例卡:pandas数据框(DataFrame)转换为嵌套列表的两种常见方法

DataFrame转换为嵌套列表的两种实现方式。

2023-03-07 22:04:44 1844 1

原创 python自动发送邮件实现

使用python来实现自动发送邮件的功能,本质上也是模拟我们实操的这一过程。用python来实现邮件的定期发送,可以极大的节省人工成本。

2023-02-11 22:16:37 5496 1

原创 python正确读取文件路径的三种解决方法

日常用程序读取文件数据等时,常常会显示一些诸如文件路径不存在等错误信息。常用解决的三种方法。

2023-01-30 11:05:21 9590

原创 2022阅读数据分析报告

2022,不安的一年,阅读小记,回顾之余,思未来,从零出发,磨砺以须,保持阅读,坚持小事!

2023-01-03 22:11:33 704

原创 二、postgre数据库SQL优化:查看执行计划

sql优化是一项必备技能,为了优化sql任务,则需要明确需要优化的内容。除了经验之外,可以借助工具,查看sql执行过程中的耗时环节,从而针对性的进行优化,本文即为对执行计划的一些基本信息进行了总结学习。

2022-11-03 22:30:00 5720

原创 一、postgre数据库SQL优化:相关视图介绍

关于sql优化,面试或工作中,都是高频遇到的问题。本文对优化的思考的和相关优化参考用的视图信息进行了整理介绍。

2022-10-24 22:00:00 2079 1

原创 关于手动回车换行操作引起的问题处理方式

这次事件的起因是在数据库中配置一些shell脚本,方便部署在服务器上的脚本的运行。过程中,在数据库中配置的shell脚本存在一个换行操作,常见的操作自然是直接回车操作了,没想到,也正是因为这种操作,导致配置的shell脚本,无法在服务器上正常运行。总是报一些语法错误,但肉眼看脚本,怎么看也看不出毛病。,我则是选择了另一种方式,在notepad++中将 ‘\r’ ,'\n’均进行了字符串替换,进而在数据库中更新对应的配置信息。原来,这一切的起因都是因为linux不支持诸如’\r’等,它会当作一个字符处理。

2022-09-16 17:19:50 401

原创 【模型篇】01 记点脑子里还残存的关于模型分类的三种方式

从不同的角度出发,观察同一模型,会让我们对同一个模型,有更多的了解,更深刻的体会。

2022-09-02 16:33:06 620

原创 【商分篇】02 数据指标及指标体系,商业分析的起跑线

简述数据指标及指标体系的概要信息,为后续进一步学习商业分析做准备和铺垫。

2022-08-18 15:45:14 421 1

原创 【商分篇】01 我开始了解商业数据分析了

简述什么是商业分析,怎么定义和描述一个完整的数据指标。

2022-07-28 16:53:57 768

原创 《变量:大国的腾挪》摘记

不管几岁,童心万岁。

2022-06-02 19:43:54 374 1

原创 《阅读的方法》做一点小努力

“做一点小努力,对自己很满意”。点滴的改变,积跬步,至千里。

2022-05-29 21:11:44 410

原创 《用图表说话》脑图笔记

字不如表,表不如图,图不如自媒体。图表可视化,也是可以有迹可循的。

2022-05-16 08:00:00 319

原创 《数据中台:让数据用起来》前四章笔记

目录1.数据中台的3个核心认知2.数据中台必备的4个核心能力3.大数据平台与数据中台的区别4.数据中台建设方法论1.数据中台的3个核心认知数据中台1需要提升到企业下一代基础设施的高度,进行规模化投入。数据中台的目标是提供普惠数据服务,在“互联网+”行动计划和“智能+”的推动下,数字产业化和产业数字化成为数字经济的两大基础。数据中台需要全新的数据价值观和方法论,并在其指引下形成平台级能力数据中台围绕业务、数据、分析会衍生出全新人才素养要求,需要尽快启动人才储备2.数据中台必备的4个核心能力

2022-05-13 21:00:00 299

原创 《吴军阅读与写作讲义》笔记

目录1 前言2 脑图笔记2.1 序章2.2 如何阅读与写作2.2.1 阅读的意义:理解他人2.2.2 写作的核心:表达自己2.2.3 日常实用写作2.2.4 听和说的艺术2.3 部分语录摘记3 小感1 前言      如若时光可倒流,这种书搁在自己眼前可能也不一定会打开瞅一眼吧。大概是五六年前的某一个瞬间,自己突然开始看一些所谓的课外书,也差不多大概从那时候起,习惯虽然坚持的不太好,但每年学业相关也好,学业无关也罢,都开始涉猎,粗略统计每年2

2022-05-12 20:00:00 1026

原创 读书日之《历史的温度》

目录零、前言一、摘记二、小结三、参考资源零、前言读书日,现在觉得也是个十分有纪念意义的日子。简单了解了下读书日的历史:4月23日世界读书日全称“世界图书与版权日”,又称“世界图书日”。最初的创意来自于国际出版商协会。由西班牙转交方案给了联合国教科文组织。1995年11月15日正式确定每年4月23日为“世界图书日”。其设立目的是推动更多的人去阅读和写作,希望所有人都能尊重和感谢为人类文明做出过巨大贡献的文学、文化、科学、思想大师们,保护知识产权。每年的这一天,世界一百多个国家都会举办各种各样的庆祝.

2022-04-23 23:28:45 183

原创 《成为学习高手》小记

目录零、碎语一、前言二、碎碎语零、碎语        这本《成为学习高手》1 是无意在得到看到的,近些日子,总是看到各种方法,诸如沟通的方法、阅读的方法、学习的格局等等,万事万物皆有法可循,so,练就下学习的方法,成为学习高手,这不是人人所梦寐以求的吗。所谓事半功倍,那就可以腾挪出更多的自己可自由安排的时间,岂不是心想事成。就这样,你上了我的书架。一、前言     &

2022-04-20 21:48:12 911 2

原创 《做出好选择》小感

目录零、碎语一、摘记二、小感零、碎语       原本没想写碎碎语的,今天偶然看到,近期读完的这本书:《做出好选择》1,自己还是做了一些标注,每个标注处即兴还写过两字的临时感触。一个可以多出标注的书,那说明自己对它有同感或者强烈不同感。简言之,此次开卷有益。一、摘记工作,不能只追求价值感,而是需要追求价值感和使命感的平衡。有句话有趣且真实,“职场不是权力的游戏,而是演员的诞生”。选择每一种生活,背后都是有代价的,所谓的.

2022-04-17 22:27:08 2503

原创 《深入浅出Pandas》脑图笔记

书本是人类进步的阶梯,现在的阶梯,每一年会新搭几十万阶,在这浩瀚的阶梯中,凑得几阶唯己所能用,所享用,所被用,所有用,足矣。前提是,拿起这一阶。

2022-04-13 00:11:17 890

原创 《数据分析思维》脑图笔记

目录零、阅读前带的问题一、业务指标1.1 如何理解数据1.2 常用指标1.3 如何选择指标1.4 指标体系和报表二、分析方法概述三、分析方法详解3.1 5W2H分析方法3.2 逻辑树分析方法3.3 PEST分析方法3.4 多维度拆解分析方法3.5 对比分析方法3.6 假设检验分析方法3.7 相关分析方法3.8 群组分析方法3.9 RFM分析方法3.10 AARRR模型分析方法3.11 漏斗分析方法四、用数据分析解决问题五、参考资料零、阅读前带的问题一、业务指标1.1 如何理解数据1.2 常用指

2022-03-29 14:56:54 746

原创 数据库窗口函数总结

文章目录@[toc]一、什么是窗口函数1.1 定义1.2 基本语法1.3 注意事项1.4 窗口函数分类1.4 窗口函数的万能模板二、窗口函数的作用2.1 解决的问题类型2.2 具备的功能三.几种常用窗口函数的使用3.1 专用窗口函数rank, dense_rank, row_number[^4][^sql]3.2 聚合函数作为窗口函数[^sql]四、参考资料一、什么是窗口函数1.1 定义窗口函数,也叫OLAP函数(Online Anallytical Processing,联机分析处理),可以对数据库

2022-03-10 14:12:32 132

原创 《还是要相信》读书笔记

目录一、散感二、摘录一、散感路过中信书店,就随性走进去看看。这个书店已经是自己在大族逗留和溜达最长的一个店铺了,偶尔无事或者兴致所来,就会在里边随性挑本书,然后连着几天造访,只为了将随性拿起的那本书翻阅完。可能那本书引人入胜,也可能百无聊赖,但只要打开看过一些,自己还是会尽量翻阅完,偶尔看到感觉随自己心意的句子,还会打开手机的备忘录,简单摘记一下。《还是要相信》看到的最初不是书名,而是鲁豫这个人像。人在手机短视频或者电视节目见过好多次,所以也算熟识吧,一眼就认识了。对她的感觉向来不错,不过从来没有看

2022-02-28 16:08:12 265

原创 慕的2021阅读数据分析报告

慕的2021阅读数据分析报告目录零、前言壹、数据简介及预处理贰、阅读情况分析2.1 行为分析2.1.1 阅读方式分析2.1.2 阅读天数分析2.1.3 并行阅读书籍数2.1.4 各月份阅读情况分析2.1.5 小结2.2 书籍基本信息分析2.2.1 作者国别分析2.2.2 中图分类分析2.2.3 类型分析2.2.4 关键词云图2.2.5 简介词云图2.2.4 出版社分析2.2.5 出版发行地分析2.2.6出版年份分析2.2.7 小结2.3 大众评分数据分析2.3.1 豆瓣评分分析2.3.2 用户推荐指数叁.

2022-01-03 19:47:51 600

原创 《跑者脑力训练手册》脑图笔记

文章目录零、前言壹、脑图笔记贰、脑图文本一、跑步重塑大脑,大脑让你跑得更好01 大脑,跑者的最大资本02 跑步强化脑力03 脑力让你成为更优秀的跑者二、优秀跑者的六大思维策略策略1:设定目标,保持前进的动力策略2:让成效可视化,实现突破性表现策略3:控制你的想法,建立反应机制策略4:进入最佳状态,找到跑步的意义策略5:增加跑步的仪式感,取得独特优势策略6:增强着装认知,用脑选择装备三、跑步中应对各种问题的思维方式一个人跑,还是加入跑团你适不适合参赛当面临赛前紧张和赛后抑郁时该怎么办如何应对世界上最难跑的四.

2021-12-15 23:06:20 259

原创 二、婴儿用品信息数据初了解

文章目录一、问题背景二、数据集介绍2.1 数据集介绍2.2 字段含义三、分析框架3.1 欲分析的业务问题3.2 有助于解决问题的字段3.3 需要的描述统计信息一、问题背景当下互联网时代,人们的购物方式,已经逐渐从线下门店转移到了线上购物。通过记录用户在网站的购物信息,根据父母的购买行为来预测孩子的年龄,或根据孩子的信息(年龄、性别等)预测用户会购买什么样的商品,为用户提供更好的搜索结果或者,更加实际准确的推荐产品,提升用户对网站的粘性和提高用户的消费次数将十分重要。因此,本文将对由淘宝网&天

2021-12-05 22:12:44 856

原创 数据库窗口函数总结

文章目录一、什么是窗口函数1.1 定义1.2 基本语法1.3 注意事项1.4 窗口函数分类1.4 窗口函数的万能模板二、窗口函数的作用2.1 解决的问题类型2.2 具备的功能三.几种常用窗口函数的使用3.1 专用窗口函数rank, dense_rank, row_number[^4][^sql]3.2 聚合函数作为窗口函数[^sql]四、参考资料一、什么是窗口函数1.1 定义窗口函数,也叫OLAP函数(Online Anallytical Processing,联机分析处理),可以对数据库数据进行

2021-12-03 17:14:41 1100

原创 稳扎稳打数据分析路

目录1.个人现状2.现在的困惑3.学习的目标4.职业规划1.个人现状        简单对自己的现状做一个介绍。自己本科和研究生都是数学专业,时间真的飞快,不觉间已经工作两年半了,在数据分析岗做过一年,感觉一直在孤军奋战,并且一直没有接触到实实在在的数据分析内容。因此在单位内部,做了一次转岗,现在是一名数据开发工程师,。当初转岗就是想更近距离的接触单位内部的数据,了解单位自有的数据现状,同时对sql技能也实战提升一下,为

2021-11-30 19:13:48 147

原创 草拟一个写读书笔记的框架

        最近看书又开始关注输出了,也关注到底输入的信息到底有没有真正内化或者尽可能的让它最大程度的内化掉。因此,也在逐渐思考,到底怎样做输入和输出,才能使输入的信息内化掉,同时,也能产出比较清晰简明的输出。        单纯论输出的话,其实还是比较简单的,阅读各类东西的时候,尽可能多的记录一些信息,或许,单纯看起来的输出信息,看着是满满

2021-11-16 20:43:54 340

原创 高质量项目进度管理培训 笔记脑图

目录壹、脑图笔记贰、高质量项目进度管理培训脑图文稿[^1]一、项目管理——时间、预算、范畴项目管理经典语录定义项目成功项目管理铁三角:三点来保障项目质量项目进度管理定义项目进度管理内容方法:网络计划技术二、高质量项目管理——情绪、认知、心理账户just in time定义知识经济时代项目情绪劳动工作流战略——16个工具团队创造力三、项目管理问题解决方法问题管理的浪费改善方法——4728515TrainingWithinIndustry——JobRelation壹、脑图笔记扫码关注下方博主的微信公众

2021-11-14 21:41:54 636

聚类性能度量.png

对常见的聚类性能的度量标准进行了梳理,总结了优缺点、对应的python实现方式,通过表格化的形式,方便展现不同度量标准之间的差异,。

2020-11-06

复工复产日报数据原始数据集 .zip

复工复产情况日报样例数据集,对应个人博客《复工复产日报数据整理处理脚本个人备份版(:https://blog.csdn.net/weixin_42521211/article/details/109271145 )的代码完整原始数据样例

2020-10-25

《python常见图形代码可视化大全整理(包括动图)更新中... 》提及的部分数据

个人博文:https://blog.csdn.net/weixin_42521211/article/details/105711518#comments_13282630 提及的一个数据表,供学习参考

2020-09-28

北京市投资与GDP数据

对应博客: https://blog.csdn.net/weixin_42521211/article/details/105769520?utm_medium=distribute.pc_aggpage_search_result.none-task-blog-2~all~sobaiduend~default-3-105769520.nonecase&utm_term=%E5%9B%9E%E5%BD%92%E7%B3%BB%E6%95%B0%E7%9A%84%E6%98%BE%E8%91%97%E6%80%A7%E6%A3%80%E9%AA%8C%E6%AD%A5%E9%AA%A4 的数据

2020-09-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除