自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

彷徨的博客

我自风情万种,与世无争

  • 博客(144)
  • 资源 (1)
  • 收藏
  • 关注

原创 用Obsidian打造一个强大的写作辅助系统

API address: 服务地址,填写自己的API地址。我搭建了一个示例服务,里面包含了英文模型、对话模型、工作报告模型、腾讯welm模型。地址:https://fwzd.myfawu.com/Type: 可以选择不同的创作模型。token: 用于登录腾讯welm的token。可自己去腾讯welm官网申请。enable searching: 是否启用全文检索。目前为report模型提供全文检索。Number of choices: 多少个候选项。不要选太多,影响速度。

2022-11-30 22:14:59 1584 2

原创 数据倾斜原理及解决方案

导读相信很多接触MapReduce的朋友对'数据倾斜'这四个字并不陌生,那么究竟什么是数据倾斜?又该怎样解决这种该死的情况呢?何为数据倾斜?在弄清什么是数据倾斜之前,我想让大家看看数据分布的概念:正常的数据分布理论上都是倾斜的,就是我们所说的20-80原理:80%的财富集中在20%的人手中, 80%的用户只使用20%的功能 , 20%的用户贡献了80%的访问量 , 不同的数据字...

2018-11-20 16:03:22 59490 14

原创 大数据实战项目--中国移动运行分析

1、项目背景中国移动公司旗下拥有很多的子机构,基本可以按照省份划分. 而各省份旗下的充值机构也非常的多.目前要想获取整个平台的充值情况,需要先以省为单元,进行省份旗下的机构统计,然后由下往上一层一层的统计汇总,过程太过繁琐,且统计周期太长,且充值过程中会涉及到中国移动信息系统内部各个子系统之间的接口调用,接口故障监控也成为了重点监控的内容之一,为此建设一个能够实时监控全国的充值情况的平台,...

2018-10-24 14:13:07 23892 19

原创 写作人的福音——obsidian非官方插件之senGener

之前的是转发作者的项目文档,这次应作者要求,写了个试用报告。刚用这个插件的时候,还磕磕碰碰,总有点小问题,按快捷键不反应,服务器崩溃什么的,并不指望真的用起来,权当个玩具。某天,朋友说,他已经github上release了。我下载更新了下,跟之前他给我的私货天壤之别,速度也快了、模型也多了,并且好几个模型还都附带了全文检索,感觉光是工作报告的全文检索就很拉风了。

2022-12-08 09:26:39 1065 2

原创 用Obsidian打造一个强大的写作辅助系统

API address: 服务地址,填写自己的API地址。我搭建了一个示例服务,里面包含了英文模型、对话模型、工作报告模型、腾讯welm模型。地址:https://fwzd.myfawu.com/Type: 可以选择不同的创作模型。token: 用于登录腾讯welm的token。可自己去腾讯welm官网申请。enable searching: 是否启用全文检索。目前为report模型提供全文检索。Number of choices: 多少个候选项。不要选太多,影响速度。

2022-11-30 22:13:32 1806

原创 Oracle常用代码总结

【代码】Oracle常用代码总结。

2022-11-30 22:11:04 316

原创 over (partition by xxx order by yyy)开窗函数介绍

over(order by xxx) 按照xxx字段排序进行累计,order by是一个默认的开窗函数;over (partition by xxx,yyy)按照 xxx,yyy 字段分区;over (partition by xxx order by yyy)按照 xxx 字段分区,并按照yyy字段排序进行累计。

2022-11-30 22:10:24 421

原创 Oracle分区表介绍

此功能需要版本在 Oracle9i 以上。

2022-11-30 22:09:32 4439

原创 Oracle用户详细操作

授予连接权限和数据权限的语句,完成这一步,我们就可以用客户端连接改用户了。将 test1 账号的 密码修改为 test2。

2022-11-30 22:08:46 439

原创 数据库导入导出详解

Sql格式:.sql格式的文件,可用文本编辑器查看,通用性比较好,效率不如第一种,适合小数据量导入导出。Pde格式:.pde格式的文件,.pde为PL/SQL Developer自有的文件格式,只能用PL/SQL Developer工具导入导出,不能用文本编辑器查看;优点:代码书写简单易,从本地即可直接导入,不用在服务器中操作,降低难度,减少服务器上的操作也就保证了服务器上数据文件的安全性。导出步骤:工具,导出表,选好表以后,下方有Oracle导出是对应的dmp文件,SQL插入是对应的SQL文件。

2022-11-30 22:07:56 8302

原创 Oracle表空间详细介绍

Oracle的表空间属于Oracle中的存储结构,是一种用于存储数据库对象(如:数据文件)的逻辑空间,是Oracle中信息存储的最大逻辑单元,其下还包含有段、区、数据块等逻辑数据类型。表空间是在数据库中开辟的一个空间,用于存放数据库的对象,一个数据库可以由多个表空间组成。可以通过表空间来实现对Oracle的调优。(Oracle数据库独特的高级应用)。字段名称字段含义表示表空间名字FILE_ID表示表空间所在文件IDBLOCK_ID表示空闲块开始的块IDBYTES表示空闲的字节数。

2022-11-30 22:07:09 6192 1

原创 Oracle各类序号函数详解

Oracle各类序号函数详解

2022-11-30 22:05:23 5274 1

原创 Hadoop各配置文件详解

1、Hadoop各目录说明文件夹名称作用bin存放对hadoop相关服务(HDFS,YARN)进行操作的脚本sbin存放启动或停止hadoop相关服务的脚本etchadoop的配置文件目录,存放hadoop的配置文件lib存放hadoop的本地库(对数据进行压缩解压缩功能)share存放hadoop的依赖jar包和文档,文档可以被删除掉2、各个配置文件的作用配置文件的名称作用core-site.xml核心配置文件,主要定义

2021-10-06 10:41:31 10322

原创 Linux中的用户与权限

1、Linux中的用户Linux作为一种多用户的操作系统(服务器系统),允许多个用户同时登陆到系统上,并响应每个用户的请求。任何需要使用操作系统的用户,都需要一个系统账号,账号分为:管理员账号与普通用户账号。在Linux中,操作系统根据UID来判断用!根据UID来判断用户! 而不是用户名!只要id为0就是管理员,哪怕有多个id为0 的账号系统在新建账号时,会根据账号类型,自动分配递增账号的UID与GID (用户身份编号,组编号),也可自行分配。通常情况下,应当保证UID与GID唯一且不重复。在Li

2021-10-06 10:30:50 1797

原创 Linux中查找文件

1、find 命令1.1、基本语法使用 Linux find 命令可以用不同的搜索标准如名字、类型、所属人、大小等来搜索目录树。基本语法如下:[root@hadoop01 ~]# find -help用法: find [-H] [-L] [-P] [-Olevel] [-D help|tree|search|stat|rates|opt|exec] [path...] [expression]默认路径为当前目录;默认表达式为 -print表达式可能由下列成份组成:操作符、选项、测试表达式以及动

2021-10-06 10:29:42 393

原创 CentOS8.2时间同步

CentOS8.2 已经没有ntp时间同步服务了,使用的是chrony。1、修改配置文件vim /etc/chrony.conf将第三行注释,添加第四行# Use public servers from the pool.ntp.org project.# Please consider joining the pool (http://www.pool.ntp.org/join.html).# pool 2.centos.pool.ntp.org iburstserver 192.168.

2021-10-06 10:23:35 508

原创 Linux自定义脚本整合

1、集群分发文件应用场景我们经常需要将新建的活着修改后的文件,循环复制文件到所有节点的相同目录下,一次一次执行scp命令显得并不那么友好。基础知识(a)rsync命令原始拷贝:[root@bigdata801 hadoop-3.3.1]# rsync -av /opt/module/hadoop-3.3.1/ bigdata802:/opt/module/hadoop-3.3.1/(b)期望脚本:xsync 要同步的文件名称(c)期望脚本在任何路径都能使用(脚本放在声明了全局环境变量的路

2021-10-06 10:14:43 1028

原创 scp、rsync与集群分发

1、scp(secure copy)安全拷贝定义scp可以实现服务器与服务器之间的数据拷贝。(from server1 to server2)基本语法scp -r $pdir/$fname $user@$host:$pdir/$fname命令 递归 要拷贝的文件路径/名称 目的地用户@主机:目的地路径/名称实操在 bigdata801,将文件从 bigdata801 堆到 bigdata802[root@bigdata801 module

2021-10-06 10:12:58 333

原创 CentOS8.2安装Hadoop3.3.1

1、安装Hadoop之前,环境的配置1、配置免密登录当我们远程登录一个机子的时候,ssh hostname(ip) 会发现需要输入密码,每次输入密码未免太麻烦,就需要我们配置免密,如果不配的话,传输文件的时候输密码会输到怀疑人生。安装SSHyum install -y openssh-clients首先产生公钥和私钥ssh-keygen -t rsa查看产生的公钥和私钥[root@bigdata801 ~]# cd .ssh/[root@bigdata801 .ssh]# lltot

2021-10-06 10:11:22 518

原创 拉链表详解

拉链表产生背景在数据仓库的数据模型设计过程中,经常会遇到这样的需求:1、数据量比较大;2、表中的部分字段会被update,如用户的地址,产品的描述信息,订单的状态等等;3、需要查看某一个时间点或者时间段的历史快照信息,比如,查看某一个订单在历史某一个时间点的状态,比如,查看某一个用户在过去某一段时间内,更新过几次等等;4、变化的比例和频率不是很大,比如,总共有1000万的会员,每天新增和发生变化的有10万左右;5、如果对这边表每天都保留一份全量,那么每次全量中会保存很多不变的信息,对存储是极大的

2021-05-23 23:32:43 17119 9

原创 数据分析如何提升对业务的理解

在一个企业的运营过程中沉淀了大量的生产经营数据,在这些数据中蕴涵着无尽的信息资源,通过对这些数据的挖掘整理,合理分析可以得到对企业整个的生产运营具有指导意义的有效数据,使企业的运营过程更具理性的发展,数据仓库、数据挖掘及各种数据分析技术的产生使数据深度分析变得不再复杂。数据分析通过分析数据,发现业务问题,洞察商业机会点,为业务增长提供合理建议及参考依据,并输出数据报告。而现实当中,很多业务场景都可由数据体现出来。数据分析经常有种说法叫做:不懂业务,分析就只是取数。就是在说理解业务对于数据分析的重要性。所以

2021-03-14 22:24:42 3814 8

原创 Oracle排序函数详解

Oracle提供的序号函数:1、rownumrownum为最简单的序号 但是在order by之前就确定值。举例:selectrownum,--序号year_name,--年份名称month_name,--月份名称post_code,--岗位编码post_name,--岗位名称testtype_code,--试验类型编码testtype_name,--试验类型名称cost_amt--产值from test_2021where year_name = '2016年'and mon

2021-03-13 11:10:34 5729 1

原创 数据库三大范式

数据的概念对象object,也称为实体型。在现实世界中具有相同性质、遵循相同规则的一类事物的抽象称为对象。对象是实体集数据化的结果,比如学生、老师、课程等是对象。实例instance 是指对象中的每一个具体的事物,例如学生张三、李四。属性attribute 是实体的某一方面特征的抽象表示,例如学生的姓名、性别、班级、年龄等。主码primary key 能够唯一标识一个实体。次码secondary key 指实体中不能唯一标识实体的属性。域domain 指属性的取值范围,比如性别中的男、女。完整

2021-03-11 21:26:41 826

原创 批量添加注释以及自动生成存储过程抽取数据

★★★★★写在前面:在工作中我们常常需要从不同的业务系统中抽取数据到自己的数据库中然后做各种分析和计算,如果在表多的时候,我们需要写大量的insert,并且为了防止因业务系统因添加或删除字段而导致的程序出错,我们往往需要在inser和select后面指定字段,如:insert into stg_nc_student(id,student_code,student_name,grand,phone,address…)select id,student_code,student_name,grand,p

2021-03-10 18:33:36 973 2

原创 Oracle函数总结(含举例)持续更新

字符函数concat(字符串1,字符串2)将字符串1和字符串2连接成一个新的字符串==========================================select concat('zhang','junjie') from dual;==========================================CONCAT('ZHANG','JUNJIE') zhangjunjie==========================================lp

2021-03-10 18:10:08 896 5

原创 SQL语句的优化

1、开门见山,问题所在sql语句性能达不到你的要求,执行效率让你忍无可忍,一般会是下面几种情况。网速不给力,不稳定。服务器内存不够,或者SQL 被分配的内存不够。sql语句设计不合理没有相应的索引,索引不合理表数据过大没有有效的分区设计数据库设计太2,存在大量的数据冗余…那么我们如何给找出来导致性能慢的的原因呢?首先你要知道是否跟sql语句有关,确保不是机器开不开机,服务器硬件配置太差接着采用sql性能检测工具,分析出sql慢的相关语句,就是执行时间过长,占用系统资源,cpu过多

2021-01-14 21:40:19 2161

原创 自动生成存储过程抽取数据

在工作中我们常常需要从各种业务系统抽取数据到自己的数据库做各种处理与计算,做数据挖掘与分析等等,但是抽取过程中,insert()后面我们最好是需要指定具体的字段的,不然的话原库数据库表结构一变我们就凉凉,要么就是直接报错,要么就是抽取的数据和字段不对应等问题,但是执行字段的话又需要我们去复制字段,非常繁琐。在此背景下,我们开发一个自动生成的存储过程,自动获取表的字段,并且拼接insert(字段)select(字段)信息,并将监控信息插入,然后一编译即可,方法如下:1、首先我们先建一个日志表如下:

2020-08-03 17:52:33 5820

原创 数据库通过存储过程批量添加注释(模板为oracle)

在操作数据库时,我们时常需要给数据库中的表名以及字段名添加注释,如果去写comment语句,或者是直接拼出来一条一条去执行,亦或者使用一些可视化工具去添加,都太过于繁琐。在此背景下,我想到了一个比较方便的、节省成本的方法与大家分享,就是维护一个注释表,然后编写一个存储过程,存储过程中自动拼成一条一条的comment sql语句,然后利用游标去循环执行,效率非常高,而且维护起来也方便,具体操作步骤如下:1、建注释表create table TABCOL_COMMENTS( TAB_NAME

2020-08-03 17:30:00 7141 5

原创 经典SQL语句练习(以Oracle数据库为例)

学生表 Studentcreate table Student(Sid varchar(6), Sname varchar(10), Sage datetime, Ssex varchar(10));insert into Student values('01' , '赵雷' , '1990-01-01' , '男');insert into Student values('02' , ...

2019-10-13 15:29:12 4100

原创 HBase详细介绍

1.1、什么是HBaseHBase的原型是Google的BigTable论文,受到了该论文思想的启发,目前作为Hadoop的子项目来开发维护,用于支持结构化的数据存储。官方网站:http://hbase.apache.org-- 2006年Google发表BigTable白皮书-- 2006年开始开发HBase-- 2008年北京成功开奥运会,程序员默默地将HBase弄成了Ha...

2019-10-11 21:19:43 3151

原创 修改yum镜像为国内镜像(wget: 无法解析主机地址)

备份当前yum源mv /etc/yum.repos.d /etc/yum.repos.d.backup4comex新建yum源设置目mkdir /etc/yum.repos.d设置阿里yum镜像wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-6.repo...

2019-07-20 21:53:39 10479 1

原创 解决Linux域名解析不了的问题(ping不了www.baidu.com)

由于种种原因,我们在ping百度的时候,ping它的ip是可以ping通的,但是ping www.baidu.com却ping不通,这是因为域名解析除了问题,解析不了域名。首先确定已经连接上路由器,并且路由器能够访问外网,可以通过访问网关进行确定如果确定网络没问题的情况下, 可以通过如下步骤寻找解决办法:1) 确定设置了域名服务器, 没有的话, 建议设置Google的公共DNS...

2019-07-20 20:43:58 40621 5

原创 BI驾驶舱大屏(一)bootstrap大数据统计全屏页面

BI驾驶舱大屏(一)bootstrap大数据统计全屏页面(附源码)先看下效果图<!DOCTYPE html><html> <head> <meta charset="utf-8"> <title>大数据统计展示大屏</title> <!-- 新 Bootstrap 核心 CSS 文件 -->...

2019-04-07 18:33:47 11112

原创 DataGrip汉化方式

一、在安装目录的lib文件夹下,找到resources_en.jar这个jar包二、将resources_en.jar这个jar重命名,或者删除,移到其他文件夹备份也可以。三、下载我给大家准备的resources_cn.jar这个jar包,将其复制到lib目录下下载地址:链接:https://pan.baidu.com/s/1GPIgUMhJPAq_roBXmh7BmA提取...

2019-03-25 18:16:00 21861 5

原创 解决Tomcat启动页面中日志中文乱码的问题

Tomcat启动的时候,日志信息中的中文为乱码,效果如下:解决方法为:找到tomcat/conf/目录下的logging.properties文件找到java.util.logging.ConsoleHandler.encoding = utf-8这行更改为java.util.logging.ConsoleHandler.encoding = GBK再次启动...

2019-03-24 14:06:00 2526

原创 虚拟机Linux系统从一个机子拷到另一个机子上,XShell等不能连接解决办法

第一步:1.移除原来的网络适配器2.添加新网络适配器,重新添加3.点击'高级'--->'生成'--->'确定'(把生成的地址记下)4.保存生成的MAC地址,进入虚拟机系统,编辑网卡文件,修改MAC地址,重启服务,重启虚拟机vi/etc/sysconfig/network-scripts/ifcfg-eth0保存退出以后,执行以下命令:s...

2019-03-19 16:02:00 4641 3

原创 Oracle数据库---用户与角色

安装Oracle时,若没有设置默认密码,则以下为默认账户的密码:用户名 / 密码 登录身份 说明 sys/change_on_install SYSDBA 或 SYSOPER 不能以 NORMAL 登录,可作为默认的系统管理员,超级管理员,负责数据库系统的管理 system/manager SYSDBA 或 NORMAL 普通管理员,负责数据库对象的...

2019-02-26 10:56:10 709

原创 ETL详解

ETL是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程,目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据。ETL是BI项目重要的一个环节。 通常情况下,在BI项目中ETL会花掉整个项目至少1/3的时间,ETL设计的好坏直接关接到BI项目的成败。ETL的设计分三部分:数据抽取、数据的清洗转换、数据的加载。在设计ETL的时候我们也是从这三...

2019-02-25 23:11:31 855

原创 Spark精选面试题七(精华篇)

1、driver的功能是什么?1、一个Spark作业运行时包括一个Driver进程,也是作业的主进程,具有main函数,并且有SparkContext的实例,是程序的人口点;2、功能:负责向集群申请资源,向master注册信息,负责了作业的调度,,负责作业的解析、生成Stage并调度Task到Executor上。包括DAGScheduler,TaskScheduler。2、spark的...

2018-12-03 19:32:23 1115

原创 Spark精选面试题六(变态篇)

1、Operation category READ is not supported in state standby是什么原因导致的org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.ipc.StandbyException): Operation category READ is not supported in state st...

2018-12-03 19:26:28 3531

MobaXterm软件

亲测可用,可连接SSH等,很容易上手,非常实用.嗯嗯嗯嗯嗯

2018-08-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除