自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

赵子的博客

靡不有初鲜克有终

  • 博客(34)
  • 收藏
  • 关注

原创 Java 静态常量的坑

写了一段代码,却一直得不到想要的结果:private static final Integer test = 100;Tuple8<Integer, Integer, Long, Double, String, String, Long, Double> tuple8 = list.get(i);tuple8._1() == test; // false, even if _1...

2020-04-08 18:37:29 366

原创 面向面试学习之zookeeper

ZooKeeper在分布式系统中使用很广,比如常用的Dubbo,Kafka,Hadoop中都能看到它的身影。1. ZooKeeper是什么ZooKeeper 是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分布式同步、组服务等。简单...

2019-11-24 17:42:18 195

原创 Java多线程之线程池

1. 创建线程池建议使用ThreadPoolExecutor类来创建,而不是使用Executors中的静态方法来创建,创建出来的对象属于ExecutorService类型,可以执行各种多线程任务。public ThreadPoolExecutor(int corePoolSize, int maximumPoolSize, ...

2019-11-23 16:18:15 186

原创 面向面试学习六(JAVA IO篇)

1. 基本架构I/O 问题是任何编程语言都无法回避的问题,可以说 I/O 问题是整个人机交互的核心问题,因为 I/O 是机器获取和交换信息的主要渠道。在当今这个数据大爆炸时代,I/O 问题尤其突出,很容易成为一个性能瓶颈。正因如此,所以 Java 在 I/O 上也一直在做持续的优化,如从 1.4 开始引入了 NIO,提升了 I/O 的性能。Java 的 I/O 操作类在包 java.io 下,...

2019-11-21 01:48:45 202

原创 面向面试学习六(JAVA集合类篇)

1. 总体框架Java集合是java提供的工具包,包含了常用的数据结构:集合、链表、队列、栈、数组、映射等。Java集合工具包位置是java.util.*Java集合主要可以划分为4个部分:**List列表、Set集合、Map映射、工具类(Iterator迭代器、Enumeration枚举类、Arrays和Collections)**等。框架图如下说明:比较核心的两个接口是Collec...

2019-11-21 01:03:27 127

原创 Logstash瓶颈定位

先不用修改worker数量pipeline.workers(-w),而是先一次修改一个参数,从而确定问题参数检查列表:1. 检查输入源和输出点消费的速度受限于input源服务的速度;生产的速度受限于output端的速度;2. 检查系统性能CPU关注CPU是否占用很高;top -H如果CPU占用高,检查JVM堆进行调优内存Logstash运行在Java VM上,Logstas...

2019-11-18 18:19:52 1757

转载 JUC(一)之AQS

JUC出现的契机是,JDK1.6之前,synchronized重量级锁到性能低下,虽然这1.6进行优化后性能大幅提升,但是灵活性仍然不足,因此才有了JUC中自定义锁大展拳脚的机会。JUC中的锁,大部分都是基于AQS,也就是AbstractQueuedSynchronizer类实现,即队列同步器。它是其他同步组件的基础(ReentrantLock,ReentrantReadWriteLock,Se...

2019-11-11 02:29:59 132

原创 Java多线程

1. 进程与线程区别线程是进程中独立运行的子任务。协程,coroutine,又称微线程。协程看上去也是子程序,但是内部可以中断,转而执行别到子程序。不需要切换线程上下文。停止线程:Thread.stop()已被弃用,大多数停止一个线程使用到方法是Thread.interrupt()方法,这个方法不会中止一个正在运行的线程,还需要加入一个判断才可以完成线程的中止。this.interrupte...

2019-11-10 01:13:47 92

原创 JVM个人笔记

1.为什么Java具有可移植性而C++没有?可移植性:指的是代码一次编写,处处运行。即相同的代码可以在linux、windows或者mac上运行且结果一致;JVM实现:我们知道很多JVM的native方法由C++实现,但是对不同系统,甚至32,64位都有不同的jdk版本,是不是也正好证明了不同的系统需要编写不同的C++代码来实现,而Java框架则不需要选择系统或版本。根本原因:暂时没想到...

2019-11-09 21:32:19 217 1

原创 kibana中过滤条件long型数字显示错误问题

今天同事使用kibana时除了个问题,在filter中对数字进行过滤时,filter显示的数字不是输入的数字,id:69191985155678209,但是在界面上显示的是id:69191985155678210定位问题发现是javascript语言,数字精确度只能到53位,53位以外的精度会被舍弃,比如上面数字,下一个可以输入的是69191985155678218,也就是比前一个大8,最后...

2019-11-04 13:27:20 1162

原创 ElasticSearch架构

1.基础概念集群-cluster,节点-node,索引-index,备份-replicas,分片-shards,文档-document,索引段-segment,事务日志-translog2.解释集群:多个es节点组成,每个集群有一个cluster name作为标识;节点:一个es实例,一台机器可以有多个实例,所以不能说一台机器就是一个节点;索引:一些列documents的集合,相当于一...

2019-10-21 19:01:06 263

原创 LeetCodeContest week140

主要是引用第一名(python),第二名(python)和第五名(java)的代码1.Occurrences After BigramGiven words first and second, consider occurrences in some text of the form “first second third”, where second comes immediately af...

2019-06-10 23:34:33 154

原创 kaggle教程--房屋价格预测代码

https://www.kaggle.com/c/home-data-for-ml-courseimport pandas as pdTRAIN_PATH = '/opt/work/jupyter/data/kaggle/house_price/train.csv'TEST_PATH = '/opt/work/jupyter/data/kaggle/house_price/test.csv'...

2019-06-10 23:32:17 1062

原创 kaggle教程--Intermediate Machine Learning

包括以下tackle data types often found in real-world datasets (missing values, categorical variables),design pipelines to improve the quality of your machine learning code,use advanced techniques for m...

2019-06-05 00:02:29 577

原创 kaggle教程--Introduction to ML

Using Pandas to Get Familiar With Your DataThe first step in any machine learning project is familiarize yourself with the data. You’ll use the Pandas library for this. Pandas is the primary tool dat...

2019-06-04 08:54:06 291

原创 使用find_in_set代替in,设置mysql的in参数

问题,出数据报表时,经常需要设置一个参数,根据该参数执行多个sql,计算整体数据。当这个参数里面是多个时,就没法用IN来进行操作了。看了很多博客,按照sql执行也没成功。最后看到一个find_in_set(str, strlist)的方法,试了下,完美解决;-- 表person,字段(id,name,age,addr)SET @ids = '1,2,3,4'SELECT * FROM per...

2019-05-31 11:22:32 1363

原创 Titanic数据分析(部分)

Titanic文章来源:https://www.kaggle.com/ldfreeman3/a-data-science-framework-to-achieve-99-accuracyMachine Learning的hello worldHow a Data Scientist Beat the Odds克服困难A Data Science FrameworkDefine the ...

2019-05-23 02:49:45 1547

原创 机器学习一些笔记

1.何时使用机器学习大量数据的复杂任务,且无结构数据 --> 自动化问题定义:输出和输入是什么数据:足够多的数据,具有特征和标签(如果监督学习)数据中的规律:必须是有模式可寻的数据特征:ml一般作用在数字上,好的特征=成功一半如何评价:有评价标准2.如何开始问一个尖锐的问题-可以用名字或数字回答。下周股价或第一名的车名?数据科学家可以回答5个问题: 1A还是B,2是否...

2019-05-20 01:43:25 132

原创 读书笔记-统计学习方法-ch01

1.1 统计学习对象统计学习的对象是数据。统计学习关于数据的基本假设是同类数据具有一定的统计规律性,这是统计学习的前提。本书以讨论离散变量为主。目的统计学习用于对数据进行预测和分析,特别是对未知新数据进行预测和分析。方法统计学习有监督学习、非监督学习、半监督学习和强化学习等组成。本书主要讨论监督学习。监督学习方法可以概括如下:从给定的、有限的、用于学习的训练数据集合出发,假设数据...

2019-04-24 00:20:07 105

原创 读书笔记-统计学习方法-ch01

1.1 统计学习对象统计学习的对象是数据。统计学习关于数据的基本假设是同类数据具有一定的统计规律性,这是统计学习的前提。本书以讨论离散变量为主。目的统计学习用于对数据进行预测和分析,特别是对未知新数据进行预测和分析。方法统计学习有监督学习、非监督学习、半监督学习和强化学习等组成。本书主要讨论监督学习。监督学习方法可以概括如下:从给定的、有限的、用于学习的训练数据集合出发,假设数据...

2019-04-24 00:17:46 155

原创 朴素贝叶斯法(统计学习方法四)

朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法。对于给定的训练数据集,首先基于特征条件独立假设学习输入输出的联合概率分布;然后基于此模型,对给定的输入x,利用贝叶斯定理求出后验概率最大的输出y。1.朴素贝叶斯法的学习与分类1.1基本方法设输入空间是χ⊆Rn\chi\subseteq{R}^nχ⊆Rn,为n维向量的集合,输出空间为类别标记集合y=c1,c2,...,ck,Xy={c_...

2019-04-08 03:02:24 211

原创 sklearn中的决策树

参数DecisionTreeRegressor(criterion=’mse’, splitter=’best’, max_depth=None, min_samples_split=2, min_samples_leaf=1, min_weight_fraction_leaf=0.0, max_features=None, random_state=None, max_leaf_nodes=N...

2019-04-08 01:07:51 675

原创 概率论之数理统计的概念

1.数理统计“统计学”一词的英文statistics 源于拉丁文的status(国家),意思为国情资料的收集或国情学,一般地说,数理统计这一学科的研究对象是带随机性的教据,很容易把数理统计与一大堆数据和图表联系起来,但这仅仅是数据的初级处理。数据初级处理阶段的统计称之为描述性统计.描述性统计充满了图表,常见于我们日常生活中.随着统计方法的普及,分析数据并进行各种合理的推断成为数理统计研究的中心。...

2019-04-07 10:21:29 301

原创 概率论之大数定律和中心极限定理

1.大数定律教材说这是概率论最精彩的一章。。。,我觉得说的不错。。。,感觉需要吃透这几个定理。1.1切比雪夫不等式设随机变量XXX的均值EXEXEX及方差DXDXDX存在,则对于任意正数ε\varepsilonε,有不等式P{∣X−EX∣≥ε}≤DXε2P\{|X-EX|\ge\varepsilon\}\le\frac{DX}{\varepsilon^2}P{∣X−EX∣≥ε}≤ε2DX​...

2019-04-06 02:38:55 3415

原创 概率论之随机变量的数字特征

1.数学期望1.1离散型随机变量的期望设离散型随机变量XXX的分布律为XXXx1x_1x1​x2x_2x2​.........xnx_nxn​.........PPPp1p_1p1​p2p_2p2​.........pnp_npn​.........若计数∑k=1∞xkpk\sum_{k=1}^\infty{x}_kp_k∑k=1∞​xk​pk​绝...

2019-04-05 20:39:38 452

原创 概率论之多元随机变量及其分布

1.多元随机变量在实际问题中,有一些实验的结果需要同时用两个或两个以上的随机变量来描述。设n元随机变量X(ω)=(X1(ω),X2(ω),...,Xn(ω)),简记为X=(X1,X2,...,Xn)X(\omega)=(X_1(\omega),X_2(\omega),...,X_n(\omega)),简记为X=(X_1,X_2,...,X_n)X(ω)=(X1​(ω),X2​(ω),...,X...

2019-04-05 02:10:25 3395

原创 概率论 基础(一)

1.条件概率设A、B是两个事件,且P(A)&gt;0A、B是两个事件,且P(A)&gt;0A、B是两个事件,且P(A)>0,称P(B∣A)=P(AB)P(A)P(B|A)=\frac{P(AB)}{P(A)}P(B∣A)=P(A)P(AB)​为在事件A发生的条件下事件B发生的条件概率。由此,得公式P(AB)=P(A)P(B∣A)=P(B)P(A∣B)P(AB)=P(A)P...

2019-04-05 01:40:06 289

原创 概率论之贝叶斯统计

在极大似然估计和矩估计中,我们都将待估参数θ\thetaθ视为参数空间Θ\ThetaΘ的一个未知常数(或常向量),我们坚信这些参数的信息只是由样本携带,于是通过对样本“毫无偏见”的加工,得到参数估计,而后按照判别好坏的标准对估计量进行分析,但事实上,参数θ\thetaθ本身就是一个随机变量。既然我们将参数θ∈Θ\theta\in\Thetaθ∈Θ视为一个取值于Θ\ThetaΘ的随机变量,如果是连...

2019-04-03 23:46:24 547

原创 概率论之极大似然估计

统计的基本任务是以样本推断总体,在很多场合下,总体分布的形式是已知的,需要求得未知参数,这就是数理统计的参数估计问题。参数估计分为两种:一种是点估计,一种是区间估计。前者是用一个适当的统计量作为参数的近似,我们将统计量的样本值称为该参数的估计值;后者是用统计量两个值所界定的区间来指出真实参数值的大致范围。本文主要讲点估计中的极大似然估计。点估计的矩估计和区间估计以后再说。极大似然估计(Maxim...

2019-04-03 02:19:21 1719

原创 链表的环的入口 LeetCode142 Linked List Cycle II

LeetCode原题:Given a linked list, return the node where the cycle begins. If there is no cycle, return null.To represent a cycle in the given linked list, we use an integer pos which represents the p...

2019-04-03 01:34:15 86

原创 机器学习之决策树(三)

1.决策树决策树是一种常见的 机器学习算法,可以用于分类任务,(也有回归的),且模型具有良好的可解释性,基本流程遵循简单且直观的“分而治之”的策略,其算法如下:输入:训练集D=(x1,y1),(x2,y2),...,(xm,ym)D={(x_1,y_1),(x_2,y_2),...,(x_m,y_m)}D=(x1​,y1​),(x2​,y2​),...,(xm​,ym​)​​ 属性集A=...

2019-04-02 00:17:05 294

原创 机器学习之逻辑回归(二)

逻辑回归线性回归模型的作用是来预测,如果我们的任务是分类呢,可以对线性回归模型进行改造,找一个单调可微的函数将输出值转换为0/1,从而达到分类的效果。对数几率函数是一个常用的这样的函数,y=11+e−xy=\frac1{1+e{-x}}y=1+e−x1​,图像如下,函数处处可微,且函数值处于0-1之间,这样我们的函数模型可以写作:y=11+e−(wTx+b)y=\frac1{1+e^{-(...

2019-04-01 23:04:32 103

原创 机器学习之线性回归(一)

机器学习之线性回归(一)作为一名Java后端狗,从今天开始学习机器学习,希望自己有所收获。学习编程语言一般都是从打印hello world入手,这是最简单的程序。而机器学习最简单的模型就是线性模型了。线性回归,也就是LR(Linear Regression)。回归(Regression)首先看下什么是回归:统计学中,回归分析(regression analysis)指的是确定两种或两种...

2019-03-27 01:27:26 419

原创 MySql批量修改字段

最近工作经常需要操作数据库,由于之前很少自己编辑数据库数据,所以很多操作不熟悉,这次是需要将数据库中的数据中某一字段的数据更改后,再插入到原表中,语句如下:1,INSERT INTO api_sip (api_quta_id, server_ip, app_id, service_id, status, create_dt, update_dt) select api_quta_id, serve...

2018-06-11 23:09:40 1271

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除