自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(38)
  • 资源 (26)
  • 收藏
  • 关注

原创 用Python实现办公自动化(自动化处理PDF文件)

要批量添加水印,需准备一个PDF格式的水印文件。“Python程序代码”"""为PDF文件添加水印,防止他人随意盗用"""# 导入pathlib模块中的Path()函数,用于完成路径相关操作# 使用Python第三方模块PyPDF2来操控PDF文件.PdfReader类用于读取PDF文件,PdfWriter类用于输出PDF文件# 使用Python第三方模块reportlab来制作水印文件"""自定义函数:创建水印文件,并对水印文字的字体,字号等格式进行设置"""# 设置水印文件的文件名。

2024-03-28 16:17:55 145

原创 微信公众号开发——测试公众号账号及本地环境搭建

测试公众号申请前言:现在越来越多的web项目都集成到微信公众号中,针对小型项目有诸多好处:是可以免去专门编写一个用处不大的app,缩短开发周期; 是可以获取更多的潜在用户; 是后期维护简单。在开发阶段一般不会将项目直接放到线上服务器,并且开发使用到的公众号一般也是测试账号,造成一个相对封闭、独立的研发环境。由于微信开发文档要求必须在公网能访问到项目,这就使得我们在开发过程中不得不使用内网穿透工具,将本地项目映射到公网上,完成与微信公众号的对接,完成我们的开发任务。 本地部署:因为每次向公

2020-05-13 17:24:26 2650

原创 Windows8下Nginx简单使用

Nginx实现负载均衡这里主要测试如图:下载:http://nginx.org/en/download.html下载后解压,解压后如下:一、Nginx基本使用1、启动(1)直接双击nginx.exe,双击后一个黑色的弹窗一闪而过 (2)打开cmd命令窗口,切换到nginx解压目录下,输入命令 nginx.exe 或者 start nginx ,回车即可...

2020-04-23 15:30:05 333

原创 SpringCloud——(二)组件:eureka

Spring-Cloud项目的搭建因为spring-cloud是基于spring-boot项目来的,所以我们项目得是一个spring-boot项目,这里要注意的一个点是spring-cloud的版本与spring-boot的版本要对应下图:参考:https://spring.io/projects/spring-cloud-alibaba或https://spring.io/pro...

2020-04-23 12:24:09 307

转载 CAP定理

CAP 定理的含义分布式系统(distributed system)正变得越来越重要,大型网站几乎都是分布式的。分布式系统的最大难点,就是各个节点的状态如何同步。CAP 定理是这方面的基本定理,也是理解分布式系统的起点。一、分布式系统的三个指标1998年,加州大学的计算机科学家 Eric Brewer 提出,分布式系统有三个指标。他们第一个字母分别是C,A,PEr...

2020-04-22 19:03:02 218

原创 SpringBoot——【发送邮件几个模板】

SpringBoot发送邮件发送邮件原理:最早的邮件传输协议:SMTP协议:SMTP(Simple Mail Transfer Protocol)即简单邮件传输协议,它是一组用于由源地址到目的地址传送邮件的规则,由它来控制信件的中转方式。SMTP协议属于TCP/IP协议簇,它帮助每台计算机在发送或中转信件时找到下一个目的地。POP3协议:POP3,全名为"Post Off...

2020-03-27 20:06:18 374

原创 Spring——Web作用域:RequestContextListener

Spring——RequestContextListener作用在Spring API中提供了一个非常便捷的工具类RequestContextHolder,能够在Controller中获取request对象和response对象,使用方法如下// 获取request:HttpServletRequest request = ((ServletRequestAttributes) Re...

2020-03-21 16:50:36 1405 1

原创 Spring MVC ——mvc:annotation-driven

Spring MVC ——<mvc:annotation-driven/>SpringMVC配置文件中添加:<?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.o...

2020-03-20 20:03:55 642

原创 Windows7 系统上Tableau安装

Windows7 系统上Tableau安装Tableau中文帮助http://www.tableau.com/zh-cn/support/drivers#数据可视化#Tableau可以连接到本地的Excel表格,文本,Access数据库,统计文件等,也可以连接数据库服务器,例如Microsoft SQL Server数据库,MySQL数据库,Oracle数据库等。Tablea...

2020-03-19 13:42:26 2903

原创 IntelliJ IDEA 2018.2.1——(一)Java Web Servlet 项目

IntelliJ IDEA 2018.2.1第一:IntelliJ IDEA 2018.2.1第二:JDK 1.8.0_77第三:Tomcat8.0.35一、创建Java Project第一种:通过Java工程创建,这个方法需要手动导入Tomcat的servlet包才能使用servlet(本案例使用这个方法)第二种:通过Java Enterprise创建,这...

2020-03-19 13:40:53 506

原创 Python--Django【创建简单应用-URL配置】

项目及应用如下:创建简单应用流程:第一步:编辑myblog.vidws.py每个响应对应一个函数,函数必须返回一个响应;函数必须存在一个参数,一般约定为request;每一个响应(函数)对应一个URL。第二步:编辑mysite.urls.py每个URL都以url的形式写出来;url函数存放在urlpatterns列表中;url函数三个参数:URL(正则),对...

2020-03-19 13:36:15 104

原创 Mysql——使用Spring实现读写分离(MySQL实现主从复制)

1、背景我们一般应用对数据库而言都是“读多写少”,也就说对数据库读取数据的压力比较大,有一个思路就是说采用数据库集群的方案,其中一个是主库,负责写入数据,我们称之为:写库;其它都是从库,负责读取数据,我们称之为:读库;那么,对我们的要求是:读库和写库的数据一致; 写数据必须写到写库; 读数据必须到读库;2、方案解决读写分离的方案有两种:应用层解决和中间件解决。...

2020-03-18 19:37:30 251

原创 MyBatis——(一)代码生成器

MyBatis代码生成器MyBatis Generator简称MBG,是MyBatis 官方出的代码生成器。MBG能够自动生成实体类、Mapper接口以及对应的XML文件,能够在一定程度上减轻开发人员的工作量。本文介绍了使用MBG Maven插件的使用方法。第一:IntelliJ IDEA 2018.2.1第二:JDK 1.8.0_77第三:Mysql 8.0.17第...

2020-01-07 15:36:29 220

翻译 IntelliJ IDEA 2018.2.1——(三)Maven Web SSM项目

IntelliJ IDEA 2018.2.1参考:https://blog.csdn.net/khxu666/article/details/79851070第一:IntelliJ IDEA 2018.2.1第二:JDK 1.8.0_77第三:Tomcat8.0.35第四:MySQL 8.0.17第五:Maven 3.5.3(一)基本概念    使用S...

2020-01-07 11:47:32 397

原创 IntelliJ IDEA 2018.2.1——(二) Maven Web项目

IntelliJ IDEA 2018.2.1第一:IntelliJ IDEA 2018.2.1第二:JDK 1.8.0_77第三:Tomcat8.0.35(一)创建项目注意:第一:选中Creater from archetype;第二:选择maven-archetype-webapp(二)命名项目名称【MavenWeb】注:GroupI...

2020-01-06 17:14:51 250

原创 Eclipse Vaadin Plugin插件安装

软件说明Eclipse: 4.13.0https://www.eclipse.org/downloads/JDK:1.8.0_77https://www.oracle.com/technetwork/java/javase/downloads/index.htmlTomcat:9.0.27https://tomcat.apache.org/download-90.cgi...

2019-11-22 19:53:15 496

原创 Eclipse Tomcat Plugin插件安装

软件说明Eclipse: 4.13.0 https://www.eclipse.org/downloads/JDK:1.8.0_77 https://www.oracle.com/technetwork/java/javase/downloads/index.htmlTomcat:9.0.27https://tomcat.apache.org/download-90.c...

2019-11-22 16:35:59 421

原创 Hive(三)—— Hive Shell

Hive ShellHive帮助文档:https://cwiki.apache.org/confluence/display/Hive/LanguageManualHive的Shell基本常用命令主要包含退出客户端、添加文件、修改/查看环境变量、执行linux命令、执行dfs命令等。除了基本命令,其他的命令主要是DDL和DML等操作数据表的命令。注意:hdfs、yarn、metast...

2019-11-15 19:07:21 219

原创 HBase(二)——下载 HBase

HBase无论是任何安装方式,首先我们需要下载hbase。在官网上点击清华大学的镜像来下载稳定版的hbase。注意:在下载之前,我们要明确自己想要下载的版本:如果没有特殊的要求,我们直接下载稳定版的即可; 如果有特殊的版本限制,我们可以选择相应的版本;另外在我们选择版本的时候还要考虑版本的关联性和依赖性,因为hbase是建立在hadoop基础之上的,而hadoop...

2019-11-13 18:07:02 3919

原创 HBase(二)—— Hadoop集群上安装hbase

HBase安装安装前准备:1、Hadoop集群要启动正常2、Zookeeper集群启动正常HBase 分布式存储的运行依托于Zookeeper和HDFS,所以必须有一个完整的Hadoop分布式运行环境 和 Zookeeper运行环境;注意:ssh免密码登录;修改hostname和hosts,hbase通过hostname获取Ip地址。搭建环境虚拟机操作系统: Cen...

2019-11-13 11:12:44 263

原创 Hive(二)—— Hadoop集群上安装hive

Hive安装Metadata概念:元数据包含用Hive创建的database、table等的元信息。元数据存储在关系型数据库中。如Derby、MySQL等。Metastore作用:客户端连接metastore服务,metastore再去连接MySQL数据库来存取元数据。有了metastore服务,就可以有多个客户端同时连接,而且这些客户端不需要知道MySQL数据库的用户名和密码,...

2019-11-12 20:32:10 292

原创 Hive(一)—— Centos7上安装Mysql 8.0.18

Linux下Mysql数据库Hive组成Hive组成 描述 用户接口 包含shell客户端、JDBC、ODBC、Web接口等 元数据库 定义在hive中的表结构信息,一般保存到关系型数据库中,默认是derby,一般使用mysql进行保存。 解析器 将HQL语句转换为mapreduce代码 数据仓库 由hdfs组成的数据存储容器。 Hive...

2019-11-11 20:23:20 180

原创 Python——【Windows系统下安装Anaconda的Python环境】

环境搭建:Windows 64 位 Python3.7下载一个开源的Python发行版本Anaconda:Anaconda是Python的包管理器和环境管理器。Anaconda包括Conda、Python以及一大堆安装好的工具包,比如:numpy、pandas等。VScode集成git和debug功能,小巧但功能十分强大。。官网:http://www.anaconda.com...

2019-09-27 14:35:46 172

原创 Hadoop安装(二)——Hadoop安装

Hadoop安装部署模式Hadoop部署模式有:本地模式 伪分布模式 完全分布式模式 HA完全分布式模式区分的依据是NameNode、DataNode、ResourceManager、NodeManager等模块运行在几个JVM进程、几个机器。模式名称 各个模块占用的JVM进程数 各个模块运行在几个机器数上 本地模式 1个 1个 伪分布模...

2019-09-03 09:51:33 197

原创 Hadoop安装(一)——准备环境

Hadoop安装前准备环境Hadoop版本信息Hadoop是一款开源软件,并且开源社区比较活跃,所以Hadoop的版本也就比较多,主要三大版本: Apache Hadoop版本(社区版本) 迭代周期较短,更新较快,完全免费。 Cloudera Hadoop版本(CDH)在这版本的基础上进行了一些patch的合并,同时针对hadoop生态圈进行了软件兼容的调整。包括个人免...

2019-09-03 09:51:23 319

原创 Zookeeper安装(一)

Zookeer安装搭建环境虚拟机操作系统: Centos7 64位 JDK:1.8.0_65 64位 hadoop-2.6.0-cdh5.13.0 zookeeper-3.4.5-cdh5.13.0 基础环境配置主机名:master.com IP地址:192.168.1.111 角色:NameNode、ResourceManager、SecondaryNameN...

2019-09-03 09:49:20 325

原创 Zookeeper安装(四)——Zookeeper Java API

Zookeeper Java API 概述Zookeeper提供了Java API方便我们来操作zk服务,可以通过maven引入zk的相关依赖包。 通过org.apache.zookeeper.Zookeeper类创建连接zk服务器的示例对象,在创建过程中给定zk服务器地址、会话持续时间以及监视器三个参数,当连接创建成功后,通过Zookeeper实例提供的接口(或方法)来和服务器进行交...

2019-09-03 09:48:13 141

原创 Zookeeper安装(三)——Zookeeper Shell

Zookeeper命令介绍 概述Zookeeper的命令主要由bin目录下的zkServer.sh(zkServer.cmd)和zkCli.sh(zkCli.cmd)构成; 其中zkServer命令是进行集群管理/zk服务管理,zkCli命令是zookeeper提供的shell客户端。 通过zkServer命令我们可以进行集群zk服务的启动、停止、状态查看等操作; 通过zkCl...

2019-09-02 17:56:36 201

原创 Hadoop安装(六)——Windows平台下Eclipse环境搭建 Hadoop

Windows平台下Eclipse环境搭建 Hadoophadoop部署在linux系统中,开发可以在window系统中,通过eclipse加入插件来实现开发功能。 环境配置信息Eclipse:4.5.2 JDK:1.8.0_77 64位 Hadoop:hadoop-2.6.0-cdh5.13.0 Hadoop插件:hadoop-eclipse-plugin-2.6.0....

2019-09-02 15:05:09 244 2

原创 SQL在数据分析中的应用案例(二)

三个案例具体数据分析:供应商营业额分析、网店销售趋势分析、区域销售分析1、供应商营业额分析eg.列出总销售额最高的10个供应商信息:分析:案例拆解/数据定位选取最终结果---供应商信息【supplier_info】 过滤数据---供应商总销售额计算:单个产品总销售额=产品订单记录的消费记录之和(GROUP BY/SUM);【order_details】供应商销售额=供应...

2019-08-22 22:30:54 1794 14

原创 SQL在数据分析中的应用案例(一)

MySQL应用:数据查询与过滤,数据聚合,数据表间的连接,数据的增、改、删,SQL进阶用法温馨提示:案例:【电商数据库表结构及字段定义】1、 数据查询与过滤CONCAT从顾客信息(customer_info)表中选取顾客号码(customer_id),姓名(last_name,first_name)和电话(phone_number)(注意选取列的顺序)...

2019-08-22 22:25:39 6339 60

转载 Java——多线程【线程池】

参考:https://blog.csdn.net/wenjunzendeqingruxu/article/details/794883481. newFixedThreadPool说明:创建一个可重用固定线程数的线程池,以共享的无界队列方式来运行这些线程。在任意点,在大多数nThreads线程会处于处理任务的活动状态。如果在所有线程处于活动状态时提交附加任务,则在有可用线程之前,...

2019-06-12 09:18:57 165

原创 Python——【Windows系统下pip命令和一键安装依赖工具包】

临时使用pip清华镜像源因为国内网络比较慢,所以需要用到清华大学开源镜像站加速pypi镜像使用帮助:https://mirrors.tuna.tsinghua.edu.cn/help/pypi/临时使用清华镜像源:pip install -i https://pypi.tuna.tsinghua.edu.cn/simple some-package以上命令中的some-packag...

2019-03-13 13:28:22 1701

原创 Python——爬虫【Requests设置请求头Headers】

1、为什么要设置headers?在请求网页爬取的时候,输出的text信息中会出现抱歉,无法访问等字眼,这就是禁止爬取,需要通过反爬机制去解决这个问题。headers是解决requests请求反爬的方法之一,相当于我们进去这个网页的服务器本身,假装自己本身在爬取数据。对反爬虫网页,可以设置一些headers信息,模拟成浏览器取访问网站。2、 headers在哪里找?谷...

2019-03-13 13:12:12 249205 14

原创 计量经济学——试题总结

计量经济学——试题总结1、简述计量经济学与经济学、统计学、数理统计学学科间的关系。计量经济学是经济理论、统计学和数学的综合。经济学着重经济现象的定性研究,计量经济学着重于定量方面的研究。统计学是关于如何收集、整理和分析数据的科学,而计量经济学则利用经济统计所提供的数据来估计经济变量之间的数量关系并加以验证。数理统计学作为一门数学学科,可以应用于经济领域,也可以应用于其他领域;...

2019-01-17 10:19:36 26030 1

转载 GitHub资源上的项目下载【Git】

针对GitHub资源上的项目修改及下载可以使用客户端工具Git:https://gitforwindows.org/ 第一步:首先登陆到https://github.com平台上注册一个自己的账号;第二步:输入框中输入开源项目的名字,回车搜索;第三步:进入项目主页面,点击右上角的fork按钮,就是将项目拉到自己的账户下;第四步:复制链接第五步:安装Git工具,步骤略,可以参...

2018-06-26 17:21:40 3960 1

原创 GeoTools 简单记录

选择19.0版本:https://sourceforge.net/projects/geotools/files/GeoTools%2019%20Releases/19.0/主要是记录一:shp文件存在还是不存在调用的方法 // 判断文件是否存在 public void judeFileExists() throws Exception { // 1.创建shape文件对象 File f...

2018-06-21 10:58:03 892

原创 JNA-4.5.1相关网址

JNA包下载网址:https://github.com/java-native-access/jnaJNA API接口文档地址:http://java-native-access.github.io/jna/4.5.1/javadoc/设置Windows开发环境:https://github.com/java-native-access/jna/blob/master/www/

2018-01-30 13:48:01 2158 1

数据分析_电商数据库文件

SQL在数据分析中的应用案例:电商数据库表的结构以及字段定义,还有部分相关数据,都是参考的; 可以进行操作:数据查询与过滤,数据聚合,数据表间的连接,数据的增、改、删,SQL进阶用法

2020-03-21

log4j依赖的包(jms-1.1.jar+jmxri-1.2.1.jar+jmxtools-1.2.1.jar)

log4j依赖的包(jms-1.1.jar+jmxri-1.2.1.jar+jmxtools-1.2.1.jar)

2019-02-28

Hadoop2.6.0版本windows环境搭建

cdh-hadoop版本下载地址:http://archive.cloudera.com/cdh5/cdh/5/hadoop-2.6.0-cdh5.13.0.tar.gz

2019-01-23

Spss实用教程简单说明总结

根据spss实用教程简要总结,有什么不合理的可以提出来。我只是加深印象,方便自己查看的,希望可以帮助到大家

2019-01-17

正态分布概率表

希望可以帮到大家,直接是概率度t对应函数F(t),方便查看

2018-11-20

Python轻量级爬虫【Python3】

个人参考视频,在Python3.7上的做的测试,这只是针对自己的收藏,记录一些

2018-07-03

Scala简单说明

Scala通过观看视频,进行简单测试,记录scala的用法,算法

2018-06-21

OPCProxyStub

还有opc通用接口,自动化接口,OpcDaAuto.dll OPC Data Access Automation Wrapper Opcproxy.dll OPC Data Access 3.00 Proxy/Stub OpcComn_ps.dll OPC Common 1.10 Proxy/Stub Opc_aeps.dll OPC Alarms & Events 1.10 Proxy/Stub Opchda_ps.dll OPC Historial Data Access 1.20 Proxy/Stub opcEnum.exe OPC Server Enumerator 1.10

2017-11-21

局域网下安装离线Ambari终结版

主要是局域网下安装离线Ambari的文档完善,环境基本木有变

2017-10-11

spark 统计图表【在已有集群环境下】操作

我这是在已有的集群环境下,做的一个简单统计查询,图标显示,简单介绍了hdfs的作用,还有spark的rdd操作,使用vaadin框架,highchart插件显示图表

2017-10-11

linux环境下hadoop及其组件分别安装

hadoop 伪分布式安装及其验证,部分组件的安装及配置

2016-03-08

大数据前世今生

概念—数据仓库和数据挖掘的基本概念 大数据时代—大数据时代的新思维

2016-03-08

linux环境下运行Eclipse用来测试WordCount示例

linux环境下,创建eclipse的快捷方式,并且在eclipse中运行示例,查看hdfs中的文件目录

2016-03-08

局域网下离线安装Ambari详细说明

局域网下离线安装Ambari,卸载旧版本数据库,安装新的Mysql,一些组件的验证,详细叙述过程

2016-03-08

hadoop需要注意几个组件端口

ambari离线安装hadoop,及其它组件,配置文件中产看相关ip及端口号

2016-03-07

Hadoop各个组件大概介绍

Hadoop生态系统的组件介绍,简单说明,及其一些特性,和其他组件的区别,也有示图

2016-03-07

Ambari离线环境下的web服务器

Ambari离线环境下,服务器启动有两种:http和tomcat,此处使用tomcat服务

2016-03-02

CentOS关闭防火墙

在Hadoop安装过程中需要关闭 防火墙和SElinux 及其配置文件设置

2016-02-29

hadoop集群遇到的问题及其解决方法

hadoop安装时,会遇到不同问题,这里只是列举我自己遇到的问题

2016-02-29

Gzip+Rewrite+Openssl安装

gzip模块需要 zlib 库 rewrite模块需要 pcre 库 ssl 功能需要openssl库

2016-02-29

Centos7 安装Http服务

Centos7 安装前的检测及其安装测试是否正常安装启动

2016-02-29

安装snmp服务器

详细解说snmp服务器安装,所需rpm包及其安装顺序

2016-02-29

Spark安装及其测试

详细解说spark搭建伪分布环境,及其测试案例

2016-02-29

两台机器之间的SSH无密码登陆

ssh无密码登录,关键的是设置权限,防火墙的关闭

2016-02-26

core-site配置文件说明

hadoop中的一个配置文件,对几个重要属性的简单说明

2016-02-26

Hive几种数据导入方式

Ambari搭建hadoop环境下,hive的数据导入

2016-02-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除