7 CAM-TAY

尚未进行身份认证

我要认证

暂无相关简介

等级
TA的排名 7w+

Quantities

time-series data vs cross-sectional data:time-series data: observations taken over a period of time at a specific spaced time intervals 在一个时间段内以某个时间间隔划分得到的观测值cross-sectional data: observations take...

2019-12-07 21:34:20

latex常用操作总结,更新……

1、引入bib参考文献,通常使用的模板中会有bst文件来规定参考文献的格式。做法:新建一个bib文件,加入各个需要引用的文中bibtex;在文章末尾\end{document}之前添加:\bibliographystyle{IEEEtran}\bibliography{filename}其中第一行IEEEtran为bst文件的名称,第二行filename为自己新建的bib文件的名称...

2018-11-28 14:08:16

梯度下降

梯度下降定义梯度方向梯度更新缺点批量梯度下降 Batch Gradient Descent功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图...

2018-11-28 14:02:55

java注解

java注解何为注解内置注解注解的定义及使用注解处理器注解元素何为注解也称为元数据,为在代码中添加信息提供一种形式化的方法,使我们可以在稍后某个时刻非常方便地使用这些数据。将元数据和源代码二建结合起来,而不是保存在外部文档中。能够提供更加干净易读的代码以及编译期类型检查。内置注解@Override:表示当前方法定义将覆盖超类中的方法@Deprecated:使用此注解,编译器会发出警告信...

2018-11-27 16:45:37

配置中文XeLaTex环境

  本人初始时懒人一键使用了CTex安装,但无奈写中文论文时版本太低不支持使用的模板,所以开始自行配置TexLive+WinEdt+SumatraPDF的环境。【TeXworks个人觉得真的不太好用其中使用TexLive时遇到的一些问题及解决方案如下: fontspec.cfg: Erroneous variable \c__fontspec_shape_n_n_tl used...

2018-11-12 10:11:54

mac os 更改mac地址

mac os 更改mac地址ifconfig en0 | grep etheropenssl rand -hex 6 | sed ‘s/(…)/\1:/g; s/.$//’ | xargs sudo ifconfig en0 ether这样再通过第一个命令就可以看到修改后的mac地址。如果发现网络有不正常,则断开wifi再重新连接即可。注意:mac地址在电脑重启会变回原来的地址,所以...

2018-09-19 16:23:46

Angular 入门

一、安装 module load ossjs/node/8.11.1 //load Node.js npm install -g @angular/cli ng version //angular version npm run start // run the application locally 通过在package.json文件中修改st...

2018-09-07 13:50:28

fontawesome使用方法

fontawesome中提供了很多各式各样的icon,可以用来增加网页的美观性。使用方法: 1)在index.html的head部分添加:<linkrel="stylesheet"href="https://use.fontawesome.com/releases/v5.2.0/css/all.css"integrity="sha384-hWVjflwFxL6sNzntih27...

2018-09-04 10:36:12

angular + typescript一些知识点

RestFul常用方法:在app.module.ts中 -import {HttpClientModule} from “@angular/common/http”; -在@NgModule中的imports部分加入HttpClientModule在service.ts文件中 -import {HttpClient, HttpParams} from “@angular/comm...

2018-09-03 18:16:20

Primeng中一些组件的格式调整以及css设置

个人觉得primeng提供了很多比较好看的组件,包括输入框input、表格table、按钮button、交互框dialog等等,样式要比angular material好看一些,也比较好上手,官网提供了很多示例代码以及参数的使用说明。但是某些组件的元素样式说明可能没有很直接,所以想开这篇文章,介绍一下我在使用其中一些组件时遇到的问题,以及对应的解决方案,包括一些内部元素的css设置。m...

2018-09-03 17:40:30

聚类、降维与度量学习

降维的必要性 高维数据中很容易出现样本稀疏、距离计算困难等问题,即“维度灾难”,为了缓解维度灾难,常用的就是降维。因为数据样本虽然在高维空间中,但与学习任务相关的可能仅仅是一个低维分布,即高维空间的低维嵌入,所以能够进行降维。常用方法:特征值分解主成分分析PCA:对样本进行中心化后,计算协方差矩阵,对协方差矩阵进行特征值分解,取最大的k个特征值对应的特征向量形成投影矩阵。核化线性降...

2018-07-29 21:20:56

机器学习中缺失值处理

1)平均值、中值、分位数、众数、随机值等替代 2)用其他变量做预测模型来算出缺失变量。 3)把变量映射到高维,也即是把有n个值的特征转化为一个n维特征并进行01填充;连续值特征可以离散化后再做处理。这是在n不是很大的情况下这样处理。如果n很大,可以将nan作为一个值 4)如果只有train中有缺失值,则使用1处理;否则,如果train和test都有很多缺失值,可以将这个作为一个bool型/0...

2018-07-29 17:59:19

特征选择

本文基于周志华老师的《机器学习》中的内容做知识点总结使用特征选择的原因:解决维度灾难:只挑选重要特征;去除不相关特征,降低学习任务的难度。 1) 无关特征:与当前学习任务无关的特征 2)冗余特征:包含的信息可以从其他特征中衍生出来子集搜索:前向搜索:从特征集合中挑选一个最优特征,放入子集;然后在剩余特征中选择一个加入子集,选择最优组合来作为这一轮的子集;当选...

2018-07-29 17:50:45

集成学习总结

内容基于周志华老师的《机器学习》书籍。 集成学习通常将多个“弱学习器”结合从而得到显著优越的泛化性能。如果希望学习器的个数较少,通常会选用较强一些的学习器。 Boosting: 个体学习器间存在强依赖关系,必须串行生成的序列方法Bagging & random forest:个体学习器间不存在强依赖关系,可同时生成的并行化方法。    Bagging和rando...

2018-07-28 21:51:23

线性模型

y=wx+b优点:可解释性强;非线性模型可以通过在线性模型的基础上引入层级结构或者高维映射而得。 将特征转化为模型的输入值离散属性:如果存在序关系(高中低),可以将其转化为对应的连续值;如果不存在序关系(不太相关的值),则可以将其转化为k维向量,k为属性的取值个数。 性能度量:均方误差最小化,对应的方法称为“最小二乘法”。 如果xTx是一个满秩矩阵的话,那么w能够得...

2018-07-28 16:23:04

Spark GBDT vs Random Forests vs xgboost

参考spark API文档算法层面比较: GBDT vs Random Forests (RF)1) GBDT一次只训练一棵树,而RF一次可以并行地训练多棵树,所以GBDT的训练时间更长。所以,GBDT通常会使用更小的树,同时也减少训练一棵树的时间。2)RF更不容易过拟合,训练更多的树能够降低RF过拟合的可能性,却增加GBDT过拟合的可能性。 (因为在统计学角度,RF通过训练更多的树降...

2018-07-22 17:42:54

统计学习方法:逻辑斯蒂回归与最大熵模型 (六)

逻辑斯蒂回归模型 logistic regression逻辑斯蒂分布函数 logistic distribution    对应下面两张示意图摘自维基百科逻辑斯蒂密度函数二项回归模型:将x对应的样本归于概率值较大的分类...

2018-06-14 22:12:22

连续特征如何离散化,为什么要离散化,常用于逻辑回归模型

转自:连续特征离散化达到更好的效果,特征选择的工程方法连续特征的离散化:在什么情况下将连续的特征离散化之后可以获得更好的效果?Q:CTR预估,发现CTR预估一般都是用LR,而且特征都是离散的。为什么一定要用离散特征呢?这样做的好处在哪里?A:在工业界,很少直接将连续值作为逻辑回归模型的特征输入,而是将连续特征离散化为一系列0、1特征交给逻辑回归模型,这样做的优势有以下几点:0、 离散特征的增加和减...

2018-06-14 15:30:24

统计学习方法:决策树 (五)

目标:找到一个与训练数据矛盾较小的决策树,同时具有很好的泛化能力。基本过程:从根结点开始,递归地选择最优特征,根据该特征对训练数据进行分割,直到每个子集都被分到叶结点上,有了明确的分类;但是这样得到的决策树在已知数据上表现完美,但在未知数据上表现未知,可能发生过拟合,所以需要进行剪枝,去掉过分细分的叶结点。   如果特征数量过多,可以在开始时就进行特征选择,只使用对训练数据有足够分类能力的特征...

2018-06-13 19:54:11

mac使用git报错xcrun: error: invalid active developer path

mac使用git突然报错,结果如下:xcrun: error: invalid active developer path (/Library/Developer/CommandLineTools), missing xcrun at: /Library/Developer/CommandLineTools/usr/bin/xcrun

2018-06-13 11:05:06

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。