自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

twostarxx的博客

https://github.com/twostarxx

  • 博客(77)
  • 收藏
  • 关注

原创 深度学习及机器学习

深度学习深度学习基础论文阅读机器学习模型深度学习基础【深度学习基础】《深度学习》李宏毅【深度学习基础】正则化 (18.11.21)【深度学习基础】正反向传播 (18.11.21)论文阅读YOLOmask-RCNNSSD机器学习模型XgboostLightGBM...

2018-11-21 21:15:23 7134 1

原创 【机器学习基础】集成模型

文章目录概述1. Boosting2. Bagging偏差和方差的区别3. Stacking4. Dropout训练Random Forest1.原理2.优缺点拓展:【RF模型能够输出特征的重要性程度】GBDT1. GBDT适用范围?2. GBDT和随机森林(RF)的区别?3. GBDT相较于决策树有什么优点?4. GBDT的gradient体现在哪里?5. GBDT的re-sampleXgboost建树方式树分裂方式:exact树集成方式分布式稀疏数据level_wiseLGBM树分裂方式建树方式:his

2021-05-16 17:45:14 782

原创 这是一篇永不停更的博文

2020年,会是一个特殊的年份,24岁,硕士的最后一年,职业生涯的第一年。2019年,认真了解自己后,放弃读博,选择工作。2019年初,第一次在大厂实习,意识到顶着大厂光环的人不一定很强,大厂也有只想混口饭的人,但是绝对会有让人心服口服的人。春招没有拿到dream offer,面对着两个不同城市的offer,选择了某看重基础的公司。这都是源于对lc的热爱(后来发现刷题和工作无关,全看个人喜...

2021-05-13 01:08:11 265 1

原创 【TensorFlow】踩坑记

文章目录1. tf.estimator.BoostedTreesRegressor1. tf.estimator.BoostedTreesRegressorError:For now, only support Numeric column with shape less than 2, but column `estimator_features` got: (1, 234)运行环境:...

2020-01-08 13:25:22 342

原创 【TensorFlow基础知识】概念入门:Graph Session Tensor

本系列根据模型训练的整个流程,基于TensorFlow(后文统一简写为tf)的源码,对tf中的实际运行进行讲解。开发者不仅需要熟练使用tf,通过了解tf源码中的流程,可以根据tf的bug信息快速定位bug。由于tf的中英文官方文档解释较为简洁,同时,不同bug的报错位置可能存在相同的情况,因此建议读者直接下载tf的源码,阅读注释效率更高。此外,除tf源码外,还需要对第三方包进行下载,例如esti...

2019-11-28 23:07:47 255

原创 【论文】Ad Click Prediction: a View from the Trenches

作者主要展示了CTR预估系统中最近的研究和实验。包括了improvements in the context of traditional supervised learning,这是基于FTRL-Proximal online learning algorithm (which has excellent sparsity and convergence properties)和per-coor...

2019-07-11 23:09:43 506

原创 【论文】Practical Lessons from Predicting Clicks on Ads at Facebook

本文介绍了一种结合decision trees和logistic regression的模型。结果比单个模型均高3%。本文然后探究了参数对模型结果的影响,最重要的因素是正确的特征:包含用户和广告的历史信息。选择最优的learning rate等对结果有一定的影响,但都低于合适的特征和模型对结果的提升。作者使用Normalized Entropy (NE)和calibration作为主要的评估指...

2019-07-11 23:04:53 237

原创 位运算(Java)

1.位运算Java中常用位运算符号包括:操作符描述&如果对应位都是1,则结果为1,否则为0|如果对应位都是0,则结果为0,否则为1^如果对应位相同,则结果为0,否则为1~对运算符翻转每一位,即0变成1,1变成0<<按位左移运算符。左操作数按位左移右操作数指定的位数。>>按位右移运算符。左操作数

2018-12-18 11:23:55 463

原创 【机器学习基础】决策树及其ensemble方法(RF, LGBM, Xgboost, GBDT, 梯度提升boosting)

【机器学习基础】决策树及其ensemble方法(RF, LGBM, Xgboost, GBDT, 梯度提升boosting)1. 关系2. Boostrap3. Bagging3.1 Baggin定义3.2 随机森林(RandomForest)4. Boosting4.1 Boosting定义4.2 Adaboost4.3 Gradient Boosting1. 关系2. Boostrap...

2018-12-09 22:20:25 3732

原创 【机器学习】面试大题

面试1. 数据归一化和标准化区别及原因2. 欧氏距离和曼哈顿距离的区别3. 哪些机器学习算法不需要归一化?4. ML项目流程5. LR为什么要对特征离散化?6. 怎么防止过拟合?7. LR和SVM1. 数据归一化和标准化区别及原因标准化:数据缩放到一个小的特定区间归一化:缩放到(0, 1)之间2. 欧氏距离和曼哈顿距离的区别公式图解3. 哪些机器学习算法不需要归一化?贝...

2018-12-05 11:26:34 1551

原创 【机器学习基础】核函数详解

【机器学习基础】核函数详解1. 核函数的定义2. Gram矩阵3. 常用的核函数4. SVM如何选择核函数?机器学习中,对于线性可分的情况研究的比较透彻,可以采用svm/lr/感知机等成熟的机器学习模型,但是很多情况是我们希望我们的模型学习非线性的模型。通常的做法就是选择一个函数ϕ(x)ϕ(x)将xx映射到另一个空间中,这里的核心就是如何选择ϕ(x)ϕ(x).一般有三种做法1)通过核函数,比如...

2018-12-05 11:23:32 1601

原创 风格迁移(Style Transfer)

风格迁移A Neural Algorithm of Artistic Style. Leon A. Gatys .etcA Neural Algorithm of Artistic Style. Leon A. Gatys .etc本文将一副图像的内容与另一幅图像的风格结合起来,共同最小化损失。...

2018-11-28 22:52:41 1743

原创 【深度网络基础】序列模型

序列模型循环序列模型(RNN)循环序列模型(RNN)通过时间的反向传播计算公式

2018-11-27 20:41:22 638

原创 【深度学习基础】Batch Normalization

@TOC超参调试相较于机器学习中的定步长搜索。在深度学习中,随机选择点进行计算比较超参数设定值的好坏。如果找到部分点效果很好,那么放大该区域,接着进行随机选点计算比较。例如下图所示。Batch Normalization1. 单一隐藏层2. 深度网络tf.nn.batch-normalization()...

2018-11-25 23:03:45 951

原创 【深度学习基础】梯度下降的优化算法

【深度学习基础】Mini-batchMini-batch算法mini-batch size的选择指数加权平均偏差修正(Bias correction)Momentum梯度下降法公式推导RMSprop(root mean square prop)Adam优化算法(Adaptive Moment Estimation)Mini-batch1 epoch:一次遍历了训练集,一次遍历智能做一个梯度下降...

2018-11-23 22:43:57 1108

原创 【深度学习基础】激活函数的优缺点比较

激活函数的优缺点比较激活函数常用的激活函数1. sigmoid2. ReLU3. softmax优缺点比较激活函数常用的激活函数1. sigmoid2. ReLU3. softmax优缺点比较参考https://blog.csdn.net/u011684265/article/details/78039280...

2018-11-22 17:21:01 1129

原创 【深度学习基础】梯度下降

梯度下降具体的梯度下降的理论和公式推导,部分博客已经解释的很详尽了,本文更多的在于梯度下降的拓展问题。

2018-11-22 14:41:40 1207

原创 【深度学习基础】正反向传播

文章目录深度神经网络的前向传播深度神经网络的前向传播前向传播的公式推导

2018-11-21 21:11:29 1012

原创 【深度学习基础】正则化

https://mooc.study.163.com/learn/2001281003?tid=2001391036#/learn/content?type=detail&id=2001701043&cid=2001694281常用L1和L2正则化,随机失活(dropout)。第一周 深度学习的实战 1.4L1 & L2为什么则会

2018-11-21 21:10:42 2107

原创 【深度学习基础】《深度学习》李宏毅

目录Lecture I: Introduction of Deep Learning1. 深度学习的步骤2. 全连接前馈神经网络(Fully Connect Feedforward Network)2.1 神经元2.2. 激励函数2.3 Softmax layer2.4 网络结构2.5 应用举例(数字识别)3. 对函数进行优化(goodness of funct...

2018-11-21 21:09:05 9265 1

原创 常用模型使用

文章目录LightGBMxgboostLearning CurvesLightGBMfrom sklearn.model_selection import train_test_splitcol = [i for i in train_notnull.columns if i not in ['sales', 'date','id']]y = 'sales'train_x, test_x...

2018-11-20 21:37:53 383

原创 Python数据处理常用操作

Python数据处理常用操作垃圾回收机制计数机制垃圾回收机制计数机制python里每一个东西都是对象,它们的核心就是一个结构体:PyObject。PyObject是每个对象必有的内容,其中ob_refcnt就是做为引用计数。当一个对象有新的引用时,它的ob_refcnt就会增加,当引用它的对象被删除,它的ob_refcnt就会减少。...

2018-11-17 22:56:29 206

原创 面向高级对象开发

创建和销毁对象基本原则构造方法 vs. 静态工厂方法构造方法:Fragment fragment = new MyFragment();// orDate date = new Date();静态工厂方法:Fragment fragment = MyFragment.newIntance();// or Calendar calendar = Calendar.getInst...

2018-11-12 21:06:59 198

原创 面向对象系统分析与设计

面向对象系统分析与设计OOA概述1. 分析与设计什么是分析什么是设计总结2. 面向对象功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出...

2018-11-03 21:12:51 9909 2

原创 YOLO

YOLO的意思的You Only Look Once。本文包括对YOLO,YOLOv2/YOLO9000的论文理解。YOLOv1: You only look once unified real-time object detection 对象识别和定位,可以看成两个任务:找到图片中某个存在对象的区域; 识别出该区域中具体是哪个对象。目前的解决方法:最简单的方法:遍历图片,不同...

2018-10-31 11:25:39 1787 1

原创 MapReduce框架和操作流程

目录一、MapReduce概念理解1. Why MapReduce?2. MapReduce的思想:分而治之(Divide and Conquer)3. MapReduce的特性二、MapReduce的核心组件三、Map/Reduce框架四、MapReduce具体操作流程(重点!)1. Map/Reduce的执行流程(1.0版本)2. Map/Reduce的执行...

2018-10-12 00:38:35 353

原创 Maven项目框架构建

运行环境jdk: 1.8mysql: 5.7mysql-connector-java: 8.0 (手动配置)hibernate: 5.2.17 (手动配置)1、最外层test项目File -> New -> Project -> 左侧选择Maven,右侧选择项目的SDK,点击Next 。设置项目名字及位置。2、生成dao层File -&...

2018-09-28 15:56:41 2507

原创 Hadoop和HA

目录1、HDFS概述2、HDFS基本结构3、Block的副本放置策略4、主要组件及其功能5、数据损坏(corruption)处理6、HDFS网络拓扑结构7、实例分析Hadoop的四大组件:HDFS:分布式存储系统 MapReduce:分布式计算系统 YARN:Hadoop的资源调度系统 Common:以上三大组件的底层支撑组件,主要提供基础工具包和RPC工...

2018-09-26 17:43:55 712

原创 《剑指offer》面试题44:扑克牌的顺子

题目:从扑克牌中随机抽5张牌,判断是不是一个顺子,即这5张牌是不是连续的。2~10为数字本身,A为1,J为11,Q为12,K为13,而大小王可以看成任意数字。思路:将大小王设置为0。将5张牌进行排序,计算连续两数直接的空数值有多少个,与0的个数进行比较。如果 > 0的个数,则说明0无法全部填充,不是连续序列;否则,即<=,是连续。public boolean isContin...

2018-08-06 21:50:36 189

原创 《剑指offer》面试题41:和为s的两个数字 VS 和为s的连续正数序列

和为s的两个数字题目一:输入一个递增排序的数组和一个数字s,在数组中查找两个数,使得它们的和正好是s。如果有多对数字的和等于s,输出任意一对即可。思路:由于是递增排序数组,所以考虑两个指针遍历,i 指针从头开始,j 指针从尾开始。如果 i 数和 j 数之和 > target,将 j 指针前移;如果小于target,将 i 指针后移。找到相等则return,找不到即(i=j-1 &am...

2018-08-06 21:46:46 223

原创 Partition总结

partition是快速排序的核心。目的:将数组划分为<=pivot和>pivot两部分,或者是<pivot和>=pivot。实现:单向扫描,或者双向扫描。方法一:单向扫描思路:两个指针,i 用来遍历数组,与pivot进行比较;small用来记录小于pivot的位置+1。for (i),当 i 的值小于pivot时,将其与small的值进行交换,small+...

2018-08-03 13:42:48 151

原创 《剑指offer》面试题19:二叉树的镜像

题目:请完成一个函数,输入一个二叉树,该函数输出它的镜像。方法一:递归思路:去掉空树、单节点的情况,将左子树临时保存,右子树赋值给左子树,递归进行交换。public static void MirrorRecursively(TreeNode root) { if (root == null) return ; if (root.left == null &&...

2018-08-02 21:59:57 894

原创 《剑指offer》面试题18:树的子结构

题目:输入两棵二叉树A和B,判断B是不是A的子结构。思路:分成两步在树A中找到和B的根节点的值一样的节点R; 判断树A中以R为根节点的子树是不是包含和树B一样的结构。因此有两个函数,函数1遍历树A找到等于rootB的节点,函数2比较 “rootA” 是否包含 “rootB”。// 找到tree1中等于tree2的root值相等的节点public static boolean h...

2018-08-01 20:57:32 136

原创 《剑指offer》面试题12:打印1到最大的n位数

题目:输入数字n,按顺序打印出从1最大 n位十进制数。比如输入3,则打印出1、2、3一直到最大的3位数即999。易错点:由于没有规定n的范围,所以当输入的n很大的时候,直接使用int或者long会导致溢出。因此,涉及大数问题,必须使用String。思路:在字符串上模拟数字加法。以n=3为例,模拟加法时存在的几种情况:将字符串设置成char[n+1],便于打印和自增。(+1的原因会在后面...

2018-07-23 18:09:17 170

原创 《剑指offer》面试题6:重建二叉树

题目:输入某二叉树的前序遍历和中序遍历的结构,请重建出该二叉树。假设输入的前序遍历和中序遍历的结果中不含重复的数字。例如输入前序遍历序列{1, 2, 4, 7, 3, 5, 6, 8}和中序遍历序列{4, 7, 2, 1, 5, 3, 8, 6},则重建出下图所示的二叉树并输出它的头结点。思路:在二叉树的前序遍历序列中,第一个数字总是树的根节点的值。但在中序遍历序列中,根节点的值在序列的中...

2018-07-23 17:40:04 226

原创 《剑指offer》面试题4:替换空格

题目:请实现一个函数,把字符串中的每个空格替换成“%20”。例如输入“We are happy. ”,则输出“We%20are%20happy.%20”。思路:StringBuffer类的使用首先,遍历一次字符串,统计出字符串中空格的总数,每替换一次空格,长度增加2,计算出替换之后字符串的总长度。声明两个指针,以“We are happy. ”为例,指针分别为13和16,从后往前复制,直到...

2018-06-19 13:41:43 124

原创 《剑指offer》面试题43:n个骰子的点数

题目:把n个骰子扔在地上,所有骰子朝上一面的点数之和为s。输入n,打印出k的所有可能的值出现的概率。思路:基于循环求骰子点数,时间性能好。在一次循环中,第一个数组中的第n个数字表示骰子和为n出现的次数。在下一次循环中,我们加上一个新的骰子,此时和为n的骰子出现的次数等于上一次循环中骰子点数和为n-1、n-2、n-3、n-4、n-5和n-6的次数的总和,所以我们把另一个数组的第n个数字设为前一个数组...

2018-05-30 15:41:23 467

原创 《剑指offer》面试题42:翻转单词顺序VS左旋转字符串

题目一:输入一个英文句子,翻转句子中单词的顺序,但单词内字符的顺序不变。为简单起见,标点符号和普通字母一样处理。例如输入字符串"I am a student.",则输出"student. a am I"。思路:以"I am a student."为例,翻转整个句子。例子为,".tneduts a ma I"。以空格为界,翻转单个单词。需要辅助方法去翻转void ...(char[], int st...

2018-05-28 18:22:56 160

原创 《剑指offer》面试题41:和为s的两个数字 VS 和为s的连续正数序列

题目一:输入一个递增排序的数组和一个数字s,在数组中查找两个数,使得它们的和正好是s。如果有多对数字的和等于s,输出任意一对即可。思路:以{1, 2, 4, 7, 11, 15}和15为例进行讲解。定义两个指针,第一个指向0,第二个指向最后一个。...

2018-05-28 17:10:34 156

原创 《剑指offer》面试题38:数组在排序数组中出现的次数

题目:统计一个数字在排序数组中出现的次数。例如输入排序数组{1, 2, 3, 3, 3, 3, 4, 5}和数字3,由于3在这个数组中出现了4此,因此输出4。思路:因为输入的数组为排序的,第一反应是二分查找。先二分查找k第一次出现的位置,再二分查找k最后出现的位置,进而位置相减+1。public int getNumK(int[] nums, int k) { int first =...

2018-05-25 18:29:02 128

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除