自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(165)
  • 资源 (3)
  • 收藏
  • 关注

原创 Python中numpy数组切片:print(a[0::2])、[::-1]、[::2]、[:,2]、[1:,-1:]、[ : ,: -1],[:,-2:]、[ : n]、[m : ]等含义(详细)

numpy 一维、二维数组切片操作,附详细示例。数组切片用到的负数值怎么理解附了很多例子!a[:-1],a[::-1],a[-2:-1],a[-2::-1]、X[ : , :-1],X[ : ,-1: ],x[:,-2:],x[:,-2:-1]可以自己试一试就懂了。

2019-09-21 22:44:33 168702 20

原创 Hive 常见数据倾斜场景及解决方案(Map\Join\Reduce端)

Hive 中常见的数据倾斜场景及解决方法

2023-09-27 23:09:08 716

原创 窗口函数-分组排序:row_number()、rank() 、dense_rank()、ntile()

select ROW_NUMBER()over(order by name) as 排序,* from temp— 排序,即使值一样,也不会重复排序。例如1,2,3,4,5select RANK()over(order by name) as 排序,* from temp— 排序,值一样,就重复排序,有间隙。例如1,1,3,4select DENSE_RANK()over(order by name) as 排序,* from temp— 排序,值一样,就重复排序,没有间隙。

2023-09-04 16:22:11 785

原创 两表union 如何保证group by 字段唯一

当要计算的指标可能来源多个表时,可能会使用到union all把不同的表中计算的指标合起来。写法一:group by之后union all ,之后再次group by保证分组字段的唯一。Union:对两个结果集进行并集操作,不包括重复行,同时进行默认规则的排序;写法二:开始不分组,将查到的分组字段union all 之后group by。Union All:对两个结果集进行并集操作,包括重复行,不进行排序;另外,回顾union和union all的区别:union会自动。

2023-09-04 15:21:17 1144

原创 数仓中的维度、度量、指标、事实、属性几个概念如何区分?有何异同?

数仓中维度、指标、度量等概念的区分

2023-08-31 11:39:51 1011

原创 数仓数据建模中的概念总结(数据域、主题域、总线矩阵、指标...)

概念归纳业务分类:业务板块是某一大类业务的指标和维度的集合,如电商,文 娱。数据域:数据域是指一个或多个业务过程或者维度的集合,如交易域, 日志域。业务过程:业务过程指企业的业务活动事件,如下单,支付。数据集市:面向某个应用场景或者产品的数据组织,一般会依赖数据 公共层。主题域:将数据集市按照分析视角进行切分,比如在电商行业,通常分 为会员、交易、商品等。维度:维度是用于分析数据的一个角度,一方面对维度进行可控管理, 另一方面指导维度表的设计,如地理维度,时间维度。维度属性:维度属性隶属于一

2023-08-31 11:17:53 655 1

原创 数仓建模之维度表&指标表

对数仓中的维度&指标进行解释

2023-08-31 10:57:24 502

原创 数仓中怎么做模型设计--关于分层建模(结合阿里OneData规范)

结合阿里OneData规范,对数仓的维度建模方法进行整理,关于分层建模的一些注意点。

2023-07-27 19:12:47 416

原创 操作HDFS文件系统常用命令(启停、创建、查看、上传、下载、追加、删除.etc)

操作HDFS文件系统常用的命令行

2023-04-22 10:15:02 1465 2

原创 HDFS集群部署成功但网页无法打开如何解决(显示配置通过浏览器访问hdfs的端口)

HDFS集群部署成功(3台虚拟机)但是网页端无法打开,通过显示指定端口解决!!

2023-04-19 23:36:36 4388 1

原创 【黑马2023大数据实战教程】VMWare虚拟机部署HDFS集群详细过程

【黑马2023大数据实战教程】VMWare虚拟机部署HDFS集群详细过程:包括1.配置workers:2.配置hadoop-env.sh文件3.配置core-site.xml文件4.配置hdfs-site.xml文件准备数据目录分发Hadoop文件夹配置环境变量授权为hadoop用户格式化文件系统错误排查方法!!

2023-04-19 21:19:11 2939 1

原创 【黑马2023大数据实战教程】使用3台虚拟机搭建大数据集群详细步骤

2023新版黑马程序员大数据教程中的集群配置步骤记录

2023-04-17 21:54:45 1563

原创 【大数据Hive3.x数仓开发】数仓中数据发生变化如何实现数据存储--拉链表详解

拉链表专门用于解决在数据仓库中==数据发生变化如何实现数据存储==的问题。拉链表的设计是==将更新的数据进行状态记录==,没有发生更新的数据不进行状态存储,用于存储所有数据在不同时间上的所有状态,==通过时间进行标记每个状态的生命周期==,查询时,根据需求可以获取==指定时间范围状态的数据==,默认用9999-12-31等最大值来表示最新状态。

2023-04-09 00:01:16 496

原创 【大数据Hive3.x数仓开发】HiveSQL如何使用explode&lateral view实现单列转多行

列转行的应用案例,附重要函数explode的详细解释

2023-04-08 11:43:25 252

原创 【大数据Hive3.x数仓开发】HiveSQL行转列应用-多行转多列case when&多行转单列concat_ws,collect

关于多行转多列,多行转单列的应用场景及实现,涉及case when,concat_ws,collect等函数。

2023-04-08 11:20:04 818

原创 Neo4j初学者使用记录(在更)

打开Neo4jcmd+R 输入neo4j console浏览器中输入框中网址:http://localhost:7474/即可打开新建库服务器版需要更改配置文件,若neo4j服务正在运行,则按Ctrl+c,停止该服务。 配置完后,再重新开启服务,刷新网页即可。桌面版直接界面上新建数据库即可。找到neo4j安装目录 ,编辑conf文件夹中的neo4j.conf然后再次启动neo4j,重新打开网页:http://localhost:7474/,可以看到新数据库被添加进neo4j了:

2023-04-05 23:24:26 283

原创 模型CRONKGQA实现 避坑记录(更ing)

时序知识图谱问答模型CRONKGQA复现时的问题记录(不完全)

2023-04-05 23:11:25 143

原创 Torch常用函数随记

使用Pytorch时常用到的一些函数,没有系统整理,暂时作为个人备忘目的使用

2023-04-05 23:06:05 384

原创 【大数据Hive3.x数仓开发】窗口函数案例:连续N次登录的用户;级联累加求和;分组TopN

Hive SQL 中必须掌握的窗口函数的使用案例记录,包括:连续N次登录的用户;级联累加求和;分组TopN三大常见需求,与普通的自连接语法进行了比较。

2023-04-05 23:02:17 2296

原创 【大数据Hive3.x数仓开发】Hive SQL窗口函数详解(rank(),dese_rank(), row_number(),LAG(),LEAD(),FIRST VALUE...))

主要对Hive中很重要的窗口函数进行总结,附带视频中的讲解实例。

2023-03-29 23:18:26 636

原创 【大数据Hive3.x数仓开发】数仓基础理论

大数据Hive3.x数仓开发之数仓基础理论部分

2023-03-27 00:11:16 249

原创 【数据可视化】Tableau零基础-常用操作记录(人口金字塔和漏斗图绘制过程)

零基础学习过程中一些基础操作记录。主要记录人口金字塔和漏斗图绘制过程。

2023-03-17 16:41:20 992 1

原创 【SQL刷题】三个表查询时使用inner joinVS三表直接连接查询

牛客SQL刷题的一些记录

2023-03-13 00:08:41 468

原创 【数据分析】Excel必备函数汇总

数据分析基础工具Excel的必备函数使用

2023-03-11 11:56:54 586

原创 Excel查找函数(VLOOKUP\SEARCH\FIND\MATCH)

Excel查找函数的语法,附VLOOKUP()的几个示例

2023-03-11 11:55:44 1616

原创 【数据分析师求职面试指南】实战技能部分

内容整理自《拿下offer 数据分析师求职面试指南》—徐粼著 第五章数据分析师实战技能.包括指标体系构建、数据监控集报表设计、数据报告设计、AB测试、用户画像、完整的数据挖掘项目流程等必备知识!

2023-03-09 17:56:12 1824

原创 【数据分析师求职面试指南】必备编程技能整理之Hive SQL必备用法

内容整理自《拿下offer 数据分析师求职面试指南》—徐粼著 第四章编程技能考查主要整理Hive SQL 部分必备知识

2023-03-09 14:00:14 480

原创 【数据分析师求职面试指南】必备基础知识整理

内容整理自《拿下offer 数据分析师求职面试指南》---徐粼著 第三章基础知识考查对数据分析必备的统计知识、数据挖掘知识、常见模型及评估方法进行总结。

2023-03-09 10:10:22 581

原创 【Leetcode 剑指Offer】第 14 天 搜索与回溯算法(中等)

矩阵搜索题,复习到DFS、递归和剪枝的知识

2023-03-06 22:06:15 158 1

原创 【Leetcode 剑指Offer】第 12 天 双指针(简单)

双指针的一些题目

2023-03-06 17:17:55 282

原创 【Leetcode 剑指Offer】第 11 天 双指针(简单)

双指针的一些题目

2023-03-02 16:18:45 223

原创 【Leetcode 剑指Offer】第 8 天 动态规划(简单)

动规分析必备:状态定义、状态转移方程、初始状态和返回值。考虑动规的优化:在第i项只与少数项有关时,用少数几个变量代替可降低复杂度。

2023-03-02 15:35:05 167

原创 图注意网络GAT理解及Pytorch代码实现【PyGAT代码详细注释】

对GAT的Pytorch版本PyGAT进行注释,包括Cora数据集的处理和使用!

2023-03-01 15:27:12 7606 2

原创 【Leetcode 剑指Offer】第 6 天 搜索与回溯算法(简单)

复习到python双端队列实现二叉树遍历知识

2023-02-28 22:21:19 245

原创 【Leetcode 剑指Offer】第 5 天 查找算法(中等)

剑指offer 查找算法,涉及到python字典基础、有序哈希表知识

2023-02-27 21:57:40 701

原创 数据可视化-Echarts官网及社区整理

Echarts

2023-02-24 17:03:23 3920 1

原创 【Leetcode 剑指Offer】第 4 天 查找算法(简单)

查找类题型

2023-02-23 22:06:49 322

原创 【Leetcode 剑指Offer】第3天 字符串(简单)

剑指offer 第三天

2023-02-22 21:24:16 222

原创 【Leetcode 剑指Offer】第2天 链表(简单)

【Leetcode 剑指Offer】第2天 链表(简单)

2023-02-21 21:32:43 276

原创 【LeetCode 剑指offer】 第1天 栈与队列(简单)

LeetCode 上剑指offer题目记录

2023-02-19 23:01:45 212

第七版《计算机网络》运输层.xmind

结合课程PPT与第七版计网书籍

2021-03-14

第七版《计算机网络》应用层.xmind

结合课程PPT与第七版计网书籍

2021-03-14

第七版《计算机网络》网络层.xmind

结合了课程PPT与计算机网络书本

2021-03-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除