自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(31)
  • 收藏
  • 关注

原创 Java面试准备

一些耗时较长的场景使用多线程,例如读入大量文件写入数据库或者发送邮件=>线程安全问题可以使用原子类=>synchronized是通过monitorenter和monitorexit指令实现=>CAS 比较交换。索引类似于目录,是存储引擎提高访问速度的数据结构,数据是存在磁盘的如果没有引擎会全部加载到内存去检索。hashcode相同 则 不一定相同。

2023-08-05 09:54:12 48

原创 6.17 货拉拉大数据平台开发实习面试

一面 四十分钟先从大数据框架开始问 逐个介绍Java方面回答不是很好:具体需要准备的内容: Java内存模型、Java多线程、线程之间的交互、Java集合、 Mysql事务四个隔离级别 、脏读 幻读什么的~ hive调优、hive的单点故障希望能有二面~...

2021-06-17 15:11:16 441 3

原创 携程数据开发2022留用实习面试

5.27 笔试两道题 一道Java多线程一道SQL题考得比较基础AK6.1 一面 三十分钟hadoop,对hadoop的理解wordcount的mapreduce过程Java8 streaming流hive如何将sql转化为mapreduceJava线程实现方式线程不安全的问题哪些集合是线程安全的kafka消息队列的存储数据机制mapreduce执行错误的恢复机制sql题:求前百分之二十成绩的学生算法题:如何把数组的正数负数分开hive大小表join的问题JVM内存模型J

2021-06-01 14:25:44 267 3

原创 2021.4.27 知乎数仓实习二面

简历从头到尾提问 问的比较深入 比较注重实际的实现过程首先是Java?了解什么锁?区别?HashMap的底层?JVM内存模型?垃圾回收机制? 这个问得深一条sql的具体mapreduce过程?Zookeeper的选举机制?Hive的开窗函数 lag head?Mysql底层?innodb跟MyISAM的区别?单键索引?联合索引?复合索引?HTTP和HTTPS?介绍一下项目?UDF?求互相关注的sql题?这个答得好一点多了一张表?用关联?YARN如何去HDFS上获取数据?

2021-04-27 16:04:41 156

原创 动态规划算法思路!!!

题型:一般都是求最值的题目?核心:穷举法?特点:1.重叠子问题2.状态转移方程!!!!3.最优子结构套路:1.明确 状态2.明确 选择3.明确 dp动态规划函数/数组的定义4.明确 base case初始化 base case =》状态转移穷举状态? 变化的值选择? 导致状态值变化的量函数定义? 分析题目base case? 初始化的状态...

2021-04-25 11:54:24 87

原创 2021.4.23 知乎 数仓数据开发实习面试

一面一个小时 网络不是很好。。。面试官人很好!!!当场过了一面!!!虽然我觉得我答得不是很好~操作系统相关的?进程跟线程的区别?进程跟线程的资源调度?进程线程的开销的区别?计算机网络相关的?HTTP状态码分别代表什么?HTTP和HTTPS相关?HTTPS怎么实现的?HTTP的坏处?数据结构算法?各种排序算法的复杂度?快速排序的思想过程?Java?JVMGC各种代的优势劣势?JVM垃圾回收算法?标记清除?标识整理?大数据?HDFS的读写流程?shuffle阶段?H

2021-04-23 15:15:53 212 1

原创 SSH免密登录

SSH=Secure SHell什么是加密?加密分为:对称加密和非对称加密什么是对称加密?A :加密一个文件a1 通过方式f 加密成文件a2B :获取从A收到的文件a2 通过方式f 解密成文件a1对称加密有什么问题?密钥发送的安全性?A : 首先要发加密方式f(密钥)给B若f1被C截获 C即可冒充B跟A进行通信 也可以冒充A跟B进行通信原因 :A 与 B 不认识~密钥如何安全发送?什么是非对称加密?有一对密钥 f 和 f·A :加密一个文件a1 通过方式f 加密成文件a2B :

2021-03-19 18:32:13 84

原创 Linux Shell 面试提问

常用的五个高级命令ps -ef :标准格式显示进程df -htopiotoprpm -ivhnetstat2. 查看进程、端口号、磁盘使用查看进程:ps -ef 、top查看端口号:netstat查看磁盘使用:df -h3. Shell 脚本启动停止脚本:分发脚本:数仓层级内部导入:数仓 Mysql 导入导出:...

2020-12-30 19:26:37 250 1

原创 Hadoop-HDFS

本文关于Hadoop中的HDFSHDFS=Hadoop Distributed File System 分布式(多节点共享文件)文件系统运行在通用廉价的机器上和普通的文件系统(Linux、Windows:有目录、文件、文件夹\创建修改查看移动删除)相同 也有不同高容错(副本机制)高吞吐量 (适用于大的数据集)前提、设计目标:解决硬件错误(宕机):通过副本(默认3副本)机制(每个机器只存储文件的部分块数据),自动检测是否宕机,快速恢复流式数据访问:...

2020-11-12 21:37:32 72

原创 Shell~

Shell概述Shell:命令行解释器,接收命令,调用操作系统Linux内核控制硬件Shell脚本脚本格式:脚本以#!/bin/bash开头(指定解析器)echo " " 打印字符串执行脚本:sh 脚本.sh变量(使用变量时前+ $):系统变量:$ HOME、$ PWD、$ SHELL、$ USER自定义变量:定义:变量=值撤销:unset 变量声明静态变量:readonly 变量特殊变量:$n:n为数字,$0代表该脚本名称,1-9代表1-9个参数,十个以上用{}

2020-09-19 16:08:23 413

原创 Linux~

Linux介绍Linux( Linux is not Unix)是一套免费使用和自由传播的类 Unix 操作系统,是一个基于 POSIX 和 UNIX 的多用户、多任务、支持多线程和多 CPU 的操作系统。POSIX :可移植操作系统接口Linux内核->二次开发->发行版(Centos(大数据)、Ubuntu(Python))Hard Ware(硬件)->Kernal(内核)->GNU Shell->应用程序Linux安装安装VmWare(Virtual

2020-09-18 15:08:17 146

原创 JavaSE-多线程

线程Thread:任务:做的事情 多任务:同时做很多事情多线程:计算机同时做很多事情 并发控制:对同一份资源的操作 资源抢夺问题主线程:只有一条执行路径 效率低多线程:多条执行路径 主线程和子线程并行交替执行 效率高CPU调度和执行的单位独立执行的路径线程分为守护线程和用户线程进程Process:程序执行的过程计算机中运行的程序就是进程 例如 QQ 游戏进程中可以有多个线程 例如 声音 图片 弹幕 至少有一个线程线程实现的三种方式:第一种实现方式: 继承Thread类

2020-06-05 20:13:35 109

原创 大数据环境安装测试-Hbase

通过Xshell 、 Xftp上传 压缩包解压压缩包tar -zxvf hbase-1.1.5-bin.tar.gz -C /usr/local/hbase/修改环境变量 使用vim /etc/profile 命令export HBASE_HOME= /usr/local/hbase/hbase-1.1.5export ## PATH=PATH:PATH:PATH:HBASE_HOME/bin使环境变量生效并验证环境变量生效source /etc/profile查看版本信息hbase ve

2020-05-22 15:22:52 112

原创 大数据环境安装测试-Hadoop

首先在阿里云购买一个服务器Linux centos使用Xshell连接(通过ip地址账号密码)通过Xftp 把下载好的jdk、hadoop压缩包放到远程服务器上 文件目录/software执行解压命令分别解压jdk和hadoop压缩包jdk:tar -zxvf jdk-8u162-linux-x64.tar.gz -C /usr/local/java/hadoop:tar -zxvf hadoop-2.7.1.tar.gz -C /usr/local/hadoop/查看jdk 和 hadoop版本

2020-05-22 10:51:13 157

原创 大数据原理-图计算

处理图结构数据图结构:数据关联性Pregel:基于BSP模型实现的并行图处理系统有向图作为输入:每个顶点都有:一个String类型的顶点ID一个可修改的用户自定义值与之关联与其源顶点关联并且记录了目标顶点的ID在每个超步S中,图中所有顶点都会执行相同的用户自定义函数每个顶点可以接受前一个超步S-1发给它的信息,修改自身及其射出边的状态,发送信息给其他顶点,甚至修改图的拓扑结构...

2020-05-06 12:01:21 780

原创 大数据原理-流计算

概述静态数据:数据仓库Hive只读数据(批量计算)流数据:大量快速、变化实时(实时计算)三大计算框架hadoop:离线批量处理spark:实时查询storm:流计算概念实时获取数据分析获取价值价值随时间降低流计算处理流程数据实时采集:日志数据Agent主动采集数据推送到CollectorCollector接收后实现有序、可靠、高性能的转发存储到Store数据实时计算:...

2020-04-28 23:06:54 967

原创 大数据原理-Spark

概述:基于内存计算三大分布式计算系统:Hadoop、Spark、Storm特点:采用有向无环图DAG作业调度运行速度快循环数据流容易使用:可以通过Spark Shell交互式编程用途:SQL查询、流式计算、机器学习、图算法组件部署:Hadoop的yarn框架调度、单独部署等等Spark主要语言:Scala(scalable可扩展):多范式编程语言(面向对象、函数式编程)兼容...

2020-04-21 15:08:33 185

原创 算法-绪论

算法: 完成一个任务的具体步骤和方法 解决问题的一种方法或一个过程 有穷指令、无二义性等等 任务: 对各类具体问题设计良好的算法及研究设计算法的规律和方法。 常用的算法有: 穷举搜索法、递归法、回溯法、贪心法、分治法、分支限界法等。 后续更新: 递归与分治策略、动态规划、贪心算法、回溯法、分支限界法 LeetCode/算法(java) DB和OS中的算法:...

2020-04-20 14:07:29 137

原创 Java框架-MybatisPlus入门使用

附上官网,本文基于官网学习先会用,后分析原理!本文创建Mysql数据库表(官方使用H2)DROP TABLE IF EXISTS USER;CREATE TABLE USER( id BIGINT(20) NOT NULL COMMENT '主键ID', NAME VARCHAR(30) NULL DEFAULT NULL COMMENT '姓名', age INT(11) N...

2020-04-19 10:54:30 451

原创 Java框架-Mybatis的入门使用

封装了jdbcORM(对象关系映射)思想实现结果集封装主配置文件—映射配置文件创建工厂—构建者模式生产SqlSession—工厂模式

2020-04-18 17:00:15 156

原创 JavaSE-网络编程

软件结构:C/S:客户端/服务器B/S:浏览器/服务器网络通信协议:TCP/IP协议协议分类:UDP用户数据报协议,无连接TCP传输控制协议,三次握手:发送连接请求、发送收到了连接请求响应、再次发送确认连接请求IP地址:本机localhost/127.0.0.1端口号:...

2020-04-18 11:15:12 182

原创 算法-回溯法

回溯算法算法框架回溯类型、剪枝函数树类型算法框架在问题的解空间(范围)树(数据结构)中,按深度优先搜索策略,从根节点出发搜索,算法到任意点时判断包含解,若不包含则跳过回溯,否则进入子树继续深度优先搜索解空间:可行解:满足约束条件、一个解空间子集(八皇后问题)最优解:目标函数达到极值的可行解(TSP旅行商问题)首先确定求解范围为n元式(X1,X2,X3,…Xn)解向量确定显约束:...

2020-04-17 11:13:29 266 2

原创 大数据原理-HDFS

HDFS概述核心概念:体系结构原理概述HDFS解决海量的数据分布式存储优势:廉价硬件、实现数据流读写、支持大数据集、支持简单文件模型、跨平台兼容局限:实时性不高、无法存储大量小文件、只支持追加核心概念:抽象块概念设计:64或128MB/个 支持大规模数据存储(文件切割-突破单机存储界限);降低寻址开销(三级寻址 -元数据目录-数据节点-取数据) ;适合数据备份名称节点:主节点 HD...

2020-04-16 21:10:21 865

原创 大数据原理-Hadoop

Hadoop概述项目结构核心介绍项目结构:HDFS:MapReduce:概述项目结构核心介绍Hadoop平台是一个开源分布式计算平台,屏蔽了大数据处理底层的细节由Java开发,具有很好的跨平台;可以云计算使用两大核心HDFS+MapReduce:集群分布式处理应用架构:数据分析、数据实时查询、数据挖掘Hadoop利用分布式文件存储作为基础存储数据,用MR(MapReduce)为底层...

2020-04-16 17:08:56 187

原创 大数据原理-关键技术

大数据时代大数据的由来关键核心技术计算模式大数据的由来关键核心技术计算模式大数据的由来:4V大数据量、繁多的数据类型、处理数据的速度快、价值密度低使得出现了大数据时代关键核心技术:分布式存储(HDFS、HBase、NoSql、NewSql)分布式处理(MapReduce)计算模式:批处理:大规模数据的批量处理(MapReduce、Spark等等)流计算:数据流实时计算(St...

2020-04-16 16:34:38 247 3

原创 Java框架-Spring

两大核心:IOC控制反转:把创建对象交给工厂模式—提供资源—解耦Bean(可重用组件)ApplicationContext:立即加载对象(单例)BeanFactory:获取id时创建对象(多例)@Component反射注册Bean:默认id首字母小写三层相同功能注解:@Controller、@Service、@Repository其他Bean类型的注入@Autowired:自动装配...

2020-04-16 10:47:31 119

原创 Java框架-SpringMvc

基于MVC的表现层框架(底层ServletAPI)单例高效率模块化优势(基于组件方式执行):前端控制器:DispatcherServlet(核心控制器/管家)请求到处理器映射:HandlerMapping处理器适配器:HandlerAdapter视图解析器:ViewResolver处理器(页面控制器):Controller(通过Spring注解扫描包创建对象)验证器:Validat...

2020-04-15 17:34:09 131 1

原创 Java框架-SpringBoot

基于约定优于配置的思想内置tomcat服务器封装Spring(底层)核心功能:起步依赖:Maven Pom(项目对象模型)传递依赖打包集成、XXXstart启动器自动配置:底层会自动注入一些手动设置的配置 底层:起步依赖(通过查看源码查看所有依赖):web的起步依赖封装了Spring和SpringMvc所需的依赖、Tomcat的依赖通过父工程(spring-boot-s...

2020-04-14 22:24:51 110 1

原创 机器学习基础

PAC(概率近似正确)

2020-04-14 16:37:33 88

原创 JavaSE-注解与反射(框架底层实现机制)

注解(Annotation)JDK5.0引入内置注解:@Override:重写方法@Deprecated:废弃@SuppressWarnings:镇压警告元注解(meta-annotation): 可自定义注解@Target:描述注解的使用范围,传入value参数指定@Retention:描述注解的生命周期,传入value参数指定 (runtime>class&gt...

2020-04-14 16:14:44 325

原创 JAVAEE-Servlet学习笔记

Servlet:server applet概念:运行在服务器端的小程序 serlet就是一个接口(定义java类被浏览器访问到的规则-tomcat识别) 我们可以自定义实现类来实现Servlet接口,复写其方法Servlet配置...

2020-03-31 14:15:00 174

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除