自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

原创 大数据数据倾斜与数据膨胀的优化与经验总结

本文参考多篇有关大数据的数据倾斜的解决思路.

2024-04-18 09:22:50 679

原创 深度学习之多层感知机学习

多层感知机的交叉熵损失函数

2023-05-26 11:55:52 225

原创 深度学习之感知机学习算法

感知机是一种较为简单的二分类模型,但由简至繁,感知机却是神经网络和支持向量机的基础。感知机旨在学习能够将输入数据划分为+1/-1的线性分离超平面,所以感知机是一种线性模型。

2022-10-17 10:52:38 4907

原创 如何把视频文件添加中英文对照字幕

在这里用到了subtitle edit的软件,首先我们先安装好subtitle和vlc软件,见上一篇文章。

2022-08-14 17:33:34 1858

原创 如何用subtitle edit 将英文字幕转换成中文字幕

Subtitle Edit是一个免费、中文化、使用方便、功能强大的影片字幕制作、同步、翻译与修改软件。这个软件内建影片即时预览功能,可以汇入与辨识字幕,支持SubRib、MicroDVD、Advanced Sub Station Alpha、Sub Station Alpha、D-Cinema、SAMI、YouTube和sbv等170多种不同字幕格式之间的转换。...

2022-08-14 14:02:12 9500 4

原创 获取高德POI兴趣点的详细信息

获取高德POI兴趣点的详细信息一,获取高德地图POI数据第一步,申请”Web服务API”密钥(Key);第二步,拼接HTTP请求URL,第一步申请的Key需作为必填参数一同发送;第三步,接收HTTP请求返回的数据(JSON或XML格式),解析数据。二,将获取到的所有POI数据作为目录爬取详细信息第一步,读取Excel文件中的数据第二步,封装请求头信息第三部,发送请求获取详细信息第四步,保存数据效果展示及总结思路介绍:获取高德POI兴趣点主要分为两部分,一,爬取高德地图的想要搜索的兴趣点的数据,比如获取某

2022-04-19 23:05:16 2841 1

转载 Linux常用命令大全

https://blog.csdn.net/devcloud/article/details/112648614

2021-01-19 09:41:31 75

原创 Linux上Tomcat配置HTTPS协议

配置jdk环境(自行百度)很简单不陈述将下载的tomcat放在linux环境解压配置java环境变量具体路径根据java安装路径来决定在tomcat安装目录的bin目录下 执行 sh startup.sh如果报此错误 说明权限问题不够解决方法:在bin目录下执行chmod +x *.sh 重新启动即可7. 如果做好上面四个步骤 tomcat测试连接是否能成功 如果有多个tomcat请参考https://www.cnblogs.com/kingsonfu/p/9778516.html.

2021-01-18 15:25:31 3051 2

原创 什么是拉链表?

一,什么是拉链表拉链表是针对数据仓库设计中表存储数据的方式而定义的,顾名思义,所谓拉链,就是记录历史。记录一个事物从开始,一直到当前状态的所有变化的信息。二,用在什么地方在数据仓库的数据模型设计过程中,经常会遇到这样的需求:数据量比较大;表中的部分字段会被update,如用户的地址,产品的描述信息,订单的状态等等;需要查看某一个时间点或者时间段的历史快照信息,比如,查看某一个订单在历史某一个时间点的状态,比如,查看某一个用户在过去某一段时间内,更新过几次等等;变化的比例和频率不是很大,比如

2020-10-30 11:14:35 11519 3

转载 SQL50之按各科成绩进行排序,并显示排名

让我第一次感觉到sql的强大sql的美丽。https://blog.csdn.net/liyang_nash/article/details/99641571

2020-08-19 21:53:59 4453

原创 idea和git的整合

idea和git的整合1. 在gitee中创建仓库新建仓库指定仓库名称说明,这里的仓库名称最好和你要在idea中创建的项目名称保持一致2. 在idea中创建相关项目2.1. 基于maven聚合项目的讲解概述​ 如果留心比较大型java项目的话,会发现这些项目基本上都由若干个模块来进行构成,那么构成的这些模块是如何基于maven来进行管理的呢?各个模块之间有时什么关系呢?这就是maven的聚合项目。​ 比如,spark、hadoop、hive、spring等等。举例

2020-08-06 23:14:13 1006

原创 数据仓库的分层

为什么数据仓库要分层用空间换时间,通过大量的预处理来提升应用系统的用户体验(效率),因此数据仓库会存在大量冗余的数据;如果不分层的话,如果源业务系统的业务规则发生变化将会影响整个数据清洗过程,工作量巨大通过数据分层管理可以简化数据清洗的过程,因为把原来一步的工作分到了多个步骤去完成,相当于把一个复杂的工作拆成了多个简单的工作,当数据发生错误的时候,往往我们只需要局部调整某个步骤即可。数据仓库分为那些层ODS层:ODS 全称是 Operational Data Store,操作数据存储.“

2020-08-04 23:25:21 303

原创 Zookeeper的原理及核心介绍

Zookeeper的安装1.1 介绍什么是Zookeeper?官方给出的解释:Zookeeper是一个开源的分布式的,为分布式应用提供协调服务的Apache项目。Zookeeper从设计模式角度来理解:是一个基于观察者模式设计的分布式服务管理框架,它负责存储和管理大家都关心的数据,然后接受观察者的注册,一旦这些数据的状态发生变化,Zookeeper就将负责通知已经在Zookeeper上注册的那些观察者做出相应的反应,从而实现集群中类似Master/Slave管理模式。从我自己的角度而言,Zooke

2020-07-28 23:30:46 398

原创 Notepad++安装nppFTP服务

在Windows的notepad++上编辑Linux下的文档使用的步骤:1、下载插件32位和64位资源自己免费提取链接: https://pan.baidu.com/s/19InVAvi2vo8STLnF4k92Aw 提取码: sbq72、解压完之后把bin目录下的NppFTP.dll放到nodepad++的plugins下3、重新启动nodepad++连接连接步骤...

2020-07-21 14:43:17 185

原创 CentOS6.8---大数据集群搭建

CentOS6.8—大数据集群搭建1.1 工具版本虚拟机软件:VMware12客户端软件:SecureCRT8.5服务器:CentOS6.8 英文、基础服务版软件版本:hadopp-2.7.2zookeeper-3.4.101.2 模板机配置1.2.1 关闭SELinuxvim /etc/selinux/config修改SELINUX=disabled1.2.2 修改网络配置种的MAC地址vim /etc/sysconfig/network-scripts/ifcfg-eth

2020-07-07 00:38:40 368

原创 JavaWeb中分页功能的实现

分页功能简述分页功能在javaWeb项目中主要有两种实现方式:第一种叫做物理分页,是将数据库中的数据分次取出,每次只取出一页的数据,多次请求数据库。第二种叫做逻辑分页,是一次性的请求数据库中所有的数据,然后控制每页数据的展示,来达到分页的功能。两种方式各有利弊,在考虑清楚所需要的方式之后在选择,在一般企业级开发当中,多使用到的是物理分页。分页功能的实现pageBean的创建下面讲解一...

2020-04-28 00:31:09 3130

原创 ServletContext域对象

ServletContext简述ServletContext简介ServletContext的生命周期ServletContext的获取方法ServletContext的作用1,获取全局的初始化参数2,获取全局资源3,*==资源共享==*ServletContext常用的API*InputStream getResourceAsStream(String filepath)**String get...

2020-04-16 00:30:50 392 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除