5 two_star

尚未进行身份认证

Email:xingxin.hsing@gmail.com Blog:https://twostarxx.github.io/

等级
TA的排名 5w+

写在最后一个寒假

2020年,会是一个特殊的年份,24岁,硕士的最后一年,职业生涯的第一年。2019年,认真了解自己后,放弃读博,选择工作。2019年初,第一次在大厂实习,意识到顶着大厂光环的人不一定很强,大厂也有只想混口饭的人,但是绝对会有让人心服口服的人。春招没有拿到dream offer,面对着两个不同城市的offer,选择了某看重基础的公司。这都是源于对lc的热爱(后来发现刷题和工作无关,全看个人喜...

2020-01-16 02:03:29

【TensorFlow】踩坑记

文章目录1. tf.estimator.BoostedTreesRegressor1. tf.estimator.BoostedTreesRegressorError:For now, only support Numeric column with shape less than 2, but column `estimator_features` got: (1, 234)运行环境:...

2020-01-08 13:25:22

【TensorFlow基础知识】概念入门:Graph Session Tensor

本系列根据模型训练的整个流程,基于TensorFlow(后文统一简写为tf)的源码,对tf中的实际运行进行讲解。开发者不仅需要熟练使用tf,通过了解tf源码中的流程,可以根据tf的bug信息快速定位bug。由于tf的中英文官方文档解释较为简洁,同时,不同bug的报错位置可能存在相同的情况,因此建议读者直接下载tf的源码,阅读注释效率更高。此外,除tf源码外,还需要对第三方包进行下载,例如esti...

2019-11-28 23:07:47

【论文】Ad Click Prediction: a View from the Trenches

作者主要展示了CTR预估系统中最近的研究和实验。包括了improvements in the context of traditional supervised learning,这是基于FTRL-Proximal online learning algorithm (which has excellent sparsity and convergence properties)和per-coor...

2019-07-11 23:09:43

【论文】Practical Lessons from Predicting Clicks on Ads at Facebook

本文介绍了一种结合decision trees和logistic regression的模型。结果比单个模型均高3%。本文然后探究了参数对模型结果的影响,最重要的因素是正确的特征:包含用户和广告的历史信息。选择最优的learning rate等对结果有一定的影响,但都低于合适的特征和模型对结果的提升。作者使用Normalized Entropy (NE)和calibration作为主要的评估指...

2019-07-11 23:04:53

位运算(Java)

1.位运算Java中常用位运算符号包括:操作符描述&如果对应位都是1,则结果为1,否则为0|如果对应位都是0,则结果为0,否则为1^如果对应位相同,则结果为0,否则为1~对运算符翻转每一位,即0变成1,1变成0<<按位左移运算符。左操作数按位左移右操作数指定的位数。>>按位右移运算符。左操作数

2018-12-18 11:23:55

【机器学习基础】决策树及其ensemble方法(RF, LGBM, Xgboost, GBDT, 梯度提升boosting)

【机器学习基础】决策树及其ensemble方法(RF, LGBM, Xgboost, GBDT, 梯度提升boosting)1. 关系2. Boostrap3. Bagging3.1 Baggin定义3.2 随机森林(RandomForest)4. Boosting4.1 Boosting定义4.2 Adaboost4.3 Gradient Boosting1. 关系2. Boostrap...

2018-12-09 22:20:25

【机器学习】面试大题

面试1. 数据归一化和标准化区别及原因2. 欧氏距离和曼哈顿距离的区别3. 哪些机器学习算法不需要归一化?4. ML项目流程5. LR为什么要对特征离散化?6. 怎么防止过拟合?7. LR和SVM1. 数据归一化和标准化区别及原因标准化:数据缩放到一个小的特定区间归一化:缩放到(0, 1)之间2. 欧氏距离和曼哈顿距离的区别公式图解3. 哪些机器学习算法不需要归一化?贝...

2018-12-05 11:26:34

【机器学习基础】核函数详解

【机器学习基础】核函数详解1. 核函数的定义2. Gram矩阵3. 常用的核函数4. SVM如何选择核函数?机器学习中,对于线性可分的情况研究的比较透彻,可以采用svm/lr/感知机等成熟的机器学习模型,但是很多情况是我们希望我们的模型学习非线性的模型。通常的做法就是选择一个函数ϕ(x)ϕ(x)将xx映射到另一个空间中,这里的核心就是如何选择ϕ(x)ϕ(x).一般有三种做法1)通过核函数,比如...

2018-12-05 11:23:32

风格迁移(Style Transfer)

风格迁移A Neural Algorithm of Artistic Style. Leon A. Gatys .etcA Neural Algorithm of Artistic Style. Leon A. Gatys .etc本文将一副图像的内容与另一幅图像的风格结合起来,共同最小化损失。...

2018-11-28 22:52:41

【深度网络基础】序列模型

序列模型循环序列模型(RNN)循环序列模型(RNN)通过时间的反向传播计算公式

2018-11-27 20:41:22

【深度学习基础】Batch Normalization

@TOC超参调试相较于机器学习中的定步长搜索。在深度学习中,随机选择点进行计算比较超参数设定值的好坏。如果找到部分点效果很好,那么放大该区域,接着进行随机选点计算比较。例如下图所示。Batch Normalization1. 单一隐藏层2. 深度网络tf.nn.batch-normalization()...

2018-11-25 23:03:45

【深度学习基础】梯度下降的优化算法

【深度学习基础】Mini-batchMini-batch算法mini-batch size的选择指数加权平均偏差修正(Bias correction)Momentum梯度下降法公式推导RMSprop(root mean square prop)Adam优化算法(Adaptive Moment Estimation)Mini-batch1 epoch:一次遍历了训练集,一次遍历智能做一个梯度下降...

2018-11-23 22:43:57

【深度学习基础】激活函数的优缺点比较

激活函数的优缺点比较激活函数常用的激活函数1. sigmoid2. ReLU3. softmax优缺点比较激活函数常用的激活函数1. sigmoid2. ReLU3. softmax优缺点比较参考https://blog.csdn.net/u011684265/article/details/78039280...

2018-11-22 17:21:01

【深度学习基础】梯度下降

梯度下降具体的梯度下降的理论和公式推导,部分博客已经解释的很详尽了,本文更多的在于梯度下降的拓展问题。

2018-11-22 14:41:40

深度学习及机器学习

深度学习深度学习基础论文阅读机器学习模型深度学习基础【深度学习基础】《深度学习》李宏毅【深度学习基础】正则化 (18.11.21)【深度学习基础】正反向传播 (18.11.21)论文阅读YOLOmask-RCNNSSD机器学习模型XgboostLightGBM...

2018-11-21 21:15:23

【深度学习基础】正反向传播

文章目录深度神经网络的前向传播深度神经网络的前向传播前向传播的公式推导

2018-11-21 21:11:29

【深度学习基础】正则化

https://mooc.study.163.com/learn/2001281003?tid=2001391036#/learn/content?type=detail&id=2001701043&cid=2001694281常用L1和L2正则化,随机失活(dropout)。第一周 深度学习的实战 1.4L1 & L2为什么则会

2018-11-21 21:10:42

【深度学习基础】《深度学习》李宏毅

目录Lecture I: Introduction of Deep Learning1. 深度学习的步骤2. 全连接前馈神经网络(Fully Connect Feedforward Network)2.1 神经元2.2. 激励函数2.3 Softmax layer2.4 网络结构2.5 应用举例(数字识别)3. 对函数进行优化(goodness of funct...

2018-11-21 21:09:05

常用模型使用

文章目录LightGBMxgboostLearning CurvesLightGBMfrom sklearn.model_selection import train_test_splitcol = [i for i in train_notnull.columns if i not in ['sales', 'date','id']]y = 'sales'train_x, test_x...

2018-11-20 21:37:53

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。