EricMachineLearning-CSDN博客

转载推荐系统中的召回率与准确率

转自：https://blog.csdn.net/shenxiaoming77/article/details/80746748 准确率，顾名思义，就是准确程度。通过正确数/总数得到。而正确数是什么，总数是什么呢？召回率，我们可以理解为找到的数目与总的需要我们找到的数目的比，...

2019-04-30 09:21:25 2022 1

转载多层注意力模型：Hierarchical Attention Networks for Document Classification

1、简介文本分类问题一直是自然语言处理（NLP）中一个广受人们关注的问题。可能好多刚接触深度学习做NLP的项目就是使用循环神经网络（RNN）对IMDB影评进行分类。但使用循环神经网络时一般会遇到一个问题，那就是当所要处理的序列较长时，就会导致网络容易忘记之前的东西，这在机器翻译、对话系统中会...

2019-04-19 16:25:00 2964 1

转载文档分类的实现原理

文本分类是自然语言处理领域比较常见的一类任务，一般是给定多个文档类别，将文档或语句归类到某个类别中。其本质是文本特征提取+机器学习的多分类问题。解决此问题，最终实现文本分类预测的一般步骤总结如下。1. 文档标注文本分类任务可使用机器学习的多分类算法的思路解决，为了满足训练模型的需要，首先要将样本文档库中的所有文档打标签，将每...

2019-03-19 16:22:07 1673

转载 kafka工作原理介绍

转自：https://blog.csdn.net/qq_29186199/article/details/80827085 两张图读懂kafka应用：Kafka 中的术语 broker：中间的kafka cluster，存储消息，是由多个server组成的集群。 topic：kafk...

2019-02-20 12:37:33 272

转载深入理解HBase的系统架构

转自：https://blog.csdn.net/Yaokai_AssultMaster/article/details/72877127#hbase的异常恢复crash-recovery HBase的构成RegionsHBase的HMasterZooKeeperHBase各组成部分之间的合...

2019-02-20 12:26:37 500

转载 Hbase原理、基本概念、基本架构

转自：https://blog.csdn.net/woshiwanxin102213/article/details/17584043?utm_source=blogxgwz2 概述HBase是一个构建在HDFS上的分布式列存储系统；HBase是基于Google BigTable模型开发的，典型的key/value系统；H...

2019-02-19 12:58:36 267

转载基于内容推荐算法详解

 Collaborative Filtering Recommendations (协同过滤，简称CF) 是目前最流行的推荐方法，在研究界和工业界得到大量使用。但是，工业界真正使用的系统一般都不会只有CF推荐算法，Content-based Recommendations (CB) 基本也会是...

2019-02-18 12:41:07 835

转载结合Scikit-learn介绍几种常用的特征选择方法

特征选择(排序)对于数据科学家、机器学习从业者来说非常重要。好的特征选择能够提升模型的性能，更能帮助我们理解数据的特点、底层结构，这对进一步改善模型、算法都有着重要作用。特征选择主要有两个功能：减少特征数量、降维，使模型泛化能力更强，减少过拟合增强对特征和特征值之间的...

2018-07-31 15:59:15 513

转载 Linux的进程/线程间通信方式总结

Linux系统中的进程间通信方式主要以下几种:同一主机上的进程通信方式   * UNIX进程间通信方式: 包括管道(PIPE), 有名管道(FIFO), 和信号(Signal)   * System V进程通信方式：包括...

2018-07-25 18:02:24 463

转载 Linux如何查看进程、杀死进程、启动进程等常用命令

关键字: linux 查进程、杀进程、起进程 1.查进程     ps命令查找与进程相关的PID号：     ps a 显示现行终端机下的所有程序，包括其他用户的程序。     ps -A 显示所有程序...

2018-07-25 11:27:49 260

转载 softmax，softmax-loss，BP的解释

本文转载自：http://freemind.pluskid.org/machine-learning/softmax-vs-softmax-loss-numerical-stability/ ，看完这个博客让我对softmax，softmax-loss以及BP算法有了更深的理解，以前BP只是知道链式...

2018-07-19 15:12:12 294

转载谷歌系列 :Inception v1到v4

Paper列表：[v1] Going Deeper with Convolutions, 6.67% test error, http://arxiv.org/abs/1409.4842 [v2] Batch Normalization: Accelerating Deep Network Training by R...

2018-07-19 14:28:32 264

转载 c++类继承的成员可见性

1 – C++继承机制的相关知识点继承机制，就是利用已有的数据类型来定义新的数据类型，新数据类型将拥有基类的成员。派生类可以从一个基类派生，也可以从多个基类派生。从一个基类派生的继承称为单继承；从多个基类派生的继承称为多继承。单继承语法：class <派生类名称>:<继承方式...

2018-07-16 17:27:04 712

转载 Logistic Regression--逻辑回归算法汇总

Logistic Regression–逻辑回归算法汇总** 转自别处 有很多与此类似的文章  也不知道谁是原创因原文由少于错误所以下文对此有修改并且做了适当的重点标记(横线见的内容没大明白并且有些复杂，后面的运行流程依据前面的得出的算子进行分类)&...

2018-07-12 17:17:51 1633

转载回归分析中的多重共线性问题

最近做回归分析，出现了相关系数与回归方程系数符号相反的问题，经过研究，确认是多重共线性问题并探索了解决方法。在此将多重共线性的相关知识整理如下。解释变量理论上的高度相关与观测值高度相关没有必然关系，有可能两个解释变量理论上高度相关，但观测值未必高度相关，反之亦然。所以多重共线性本质上是数据问题。造成多重共线...

2018-07-11 09:51:54 15002

转载 SVM学习（五）：松弛变量与惩罚因子

1.松弛变量       现在我们已经把一个本来线性不可分的文本分类问题，通过映射到高维空间而变成了线性可分的。就像下图这样：       圆形和方形的点各有成千上万个（毕竟，这就是我们训练集中文档的数量嘛，当然很...

2018-07-03 14:51:04 2816

转载 AlexNet

一、AlexNet网络简介AlexNet是较早期的一个卷积神经网络，由于其在ImageNet比赛中的出色表现（top1与top5的error rate分别为37.5%与17%），也掀起了学术界对深度学习的研究热潮，下面结合AlexNet的论文，对AlexNet进行简单的总结，有不足的地方，欢迎指正。二、alex...

2018-06-14 09:51:06 736

转载 ResNet-论文解读

摘要更深的神经网络更难训练。我们提出了一种残差学习框架来减轻网络训练，这些网络比以前使用的网络更深。我们明确地将层变为学习关于层输入的残差函数，而不是学习未参考的函数。我们提供了全面的经验证据说明这些残差网络很容易优化，并可以显著增加深度来提高准确性。在ImageNet数据集上我们评估了深度...

2018-06-14 09:46:06 5161

转载 C++中的istringstream 的用法

istringstream是一个比较有用的c++的输入输出控制类。C++引入了ostringstream、istringstream、stringstream这三个类，要使用他们创建对象就必须包含<sstream>这个头文件。istringstream类用于执行C++风格的串流的输入操作。ostrings...

2018-06-06 09:45:05 243

转载百度机器学习工程师职位的面试题

题目：现在有 a 到 z 26 个元素，编写程序打印 a 到 z 中任取 3 个元素的组合（比如打印 a b c ，d y z等）分析：大家看看我这么做行不char a, b, c;for(a = 'a'; a&lt;='z'; a++) for(b= a+1; b&lt;='z'; b+...

2018-05-15 11:34:34 431

转载一元线性回归模型与最小二乘法及其C++实现

        监督学习中，如果预测的变量是离散的，我们称其为分类（如决策树，支持向量机等），如果预测的变量是连续的，我们称其为回归。回归分析中，如果只包括一个自变量和一个因变量，且二者的关系可用一条直线近似表示，这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自...

2018-05-07 11:53:01 1017 1

转载 Random Forest算法参数解释及调优

文章介绍了如何对随机森林模型进行参数调优原文来自：http://www.analyticsvidhya.com/blog/2015/06/tuning-random-forest-model/为什么要调整机器学习算法？一个月以前，我在kaggle上参加了一个名为TFI的比赛。我第一次提交的结果在50%。我不懈努力在特...

2018-04-22 20:59:18 12183 1

转载从 0 到 1 走进 Kaggle

本文结构：kaggle 是什么如何参赛解决问题一般步骤进一步：如何探索数据如何构造特征提交结果kaggle 是什么？Kaggle 是一个数据科学竞赛的平台，很多公司会发布一些接近真实业务的问题，吸引爱好数据科学的人来一起解决。https://www.kaggle.com/点击导航栏的 competitions 可以看到有...

2018-04-20 09:47:44 178

转载 LeetCode 626. Exchange Seats

Mary is a teacher in a middle school and she has a table seat storing students’ names and their corresponding seat ids.The column i...

2018-04-18 09:48:56 301

转载深度模型调参

注意调参看验证集。trainset loss通常能够一直降低，但validation set loss在经过一段降低期后会开始逐渐上升，此时模型开始在训练集上过拟合。着重关注val loss变化，val acc可能会突变，但loss衡量的整体目标。优先调参学习率。通过对模型预...

2018-04-16 21:17:28 1411

转载 python中zip函数

原文地址：https://www.cnblogs.com/ymjyqsx/p/6113495.html python中zip函数 zip函数接受任意多个（包括0个和1个）序列作为参数，返回一个tuple列表。（在海豚实习时自己写了一个要用到zip的函...

2018-04-13 14:32:14 421

转载 Linux MySQL 基本操作

Linux MySQL 基本操作连接到MySQL连接到本机上的MySQLmysql -u username -p 回车后输入密码1连接到远程主机上的MySQLmysql -h主机地址 --port=端口号 -u username -ppassword1开启远程访问权限...

2018-04-13 09:27:24 198

转载 Word2Vec原理推导

文章转载自http://www.hankcs.com/nlp/word2vec.html 本文摘录整编了一些理论介绍，推导了word2vec中的数学原理；并考察了一些常见的word2vec实现，评测其准确率等性能，最后分析了word2vec原版C代码；针对没有好用的Java实现的现状，移植了原版C程序到Java。时间...

2018-04-13 09:17:19 696

转载人脸检测——MTCNN

原文地址：https://blog.csdn.net/shuzfan/article/details/52668935 本次介绍一篇速度还不错的人脸检测文章：《2016 Joint Face Detection and Alignment using Multi-task Cascaded Convolutional...

2018-04-12 16:39:54 405

转载【论文笔记】人脸检测窗口选择办法 NMS convnet

原文地址：https://blog.csdn.net/elaine_bao/article/details/50458463 文章地址： A CONVNET FOR NON-MAXIMUM SUPPRESSION (2016 ICLR Under Review)A brief i...

2018-04-12 16:35:08 350

转载准确率，召回率，F1 值、ROC，AUC、mse，mape 评价指标

在机器学习、数据挖掘领域，工业界往往会根据实际的业务场景拟定相应的业务指标。本文旨在一起学习比较经典的三大类评价指标，其中第一、二类主要用于分类场景、第三类主要用于回归预测场景，基本思路是从概念公式，到优缺点，再到具体应用（分类问题，本文以二分类为例）。1.准确率P、召回率R、F1 值定义准确率（Prec...

2018-04-12 09:15:07 797

转载理解group by

文章出处：理解group by和聚合函数　　先来看下表1，表名为test： 表1　　执行如下SQL语句：12SELECT name FROM testGROUP BY name 　　你应该很容易知道运行的结果，没错...

2018-04-11 11:49:44 188

转载卷积神经网络_训练技巧

下面来介绍几种简单的训练技巧：1.首先说一下filter(感受野)的概念：感受野的大小即特征图中的某一单元是从原始输入图像中多大的一块区域中提取的特征；如上图，第一次卷积后得到的特征图中，每一个小单元的感受野大小为3*3，而第二次卷积后特征图中的每一个小单元对应的感受野大小为5*5，以此类推...

2018-04-11 09:54:49 502

转载 LSTM的推导与实现

最近在看CS224d，这里主要介绍LSTM(Long Short-Term Memory)的推导过程以及用Python进行简单的实现。LSTM是一种时间递归神经网络，是RNN的一个变种，非常适合处理和预测时间序列中间隔和延迟非常长的事件。假设我们去试着预测‘I grew up in France…...

2018-04-11 09:52:44 595 1

转载循环神经网络与LSTM

原文链接：https://blog.csdn.net/u010089444/article/details/552116531. 循环神经网络①基本结构在传统的神经网络模型中，是从输入层到隐含层再到输出层，层与层之间是全连接的，每层之间的节点是无连接的。但是这种普通的神经网络对于很多问题却无能无力...

2018-04-11 09:45:53 286

转载 Valid Anagram

Given two strings s and t, write a function to determine if t is an anagram of s.For example,s = “anagram”, t = “nagaram”...

2018-04-10 15:32:32 153

转载深度学习开放数据集

原文：https://www.analyticsvidhya.com/blog/2018/03/comprehensive-collection-deep-learning-datasets/?spm=a2c4e.11153959.blogcont576274.69.16b3...

2018-04-10 15:30:17 1676

转载卷积神经网络

来源，英文，中文翻译卷积神经网络可以识别场景，也可以提供相关的标签，比如“桥梁”、“火车”和“网球”；最近，卷积神经网络也在一些自然语言处理任务（比如语句分类）上面展示了良好的效果。1、LeNet 架构（1990s）LeNet 是推进深度学习领域发展的最早的卷积神经网络之...

2018-04-10 15:24:19 342

转载 Bagging和Boosting的区别

Bagging和Boosting都是将已有的分类或回归算法通过一定方式组合起来，形成一个性能更加强大的分类器，更准确的说这是一种分类算法的组装方法。即将弱分类器组装成强分类器的方法。首先介绍Bootstraping，即自助法：它是一种有放回的抽样方法（可能抽到重复的样本）。1、Baggi...

2018-04-10 10:24:01 186

转载 SQL的JOIN语法解析

总的来说，四种JOIN的使用/区别可以描述为: left join 会从左表(shop)那里返回所有的记录，即使在右表(sale_detail)中没有匹配的行。 right outer join 右连接，返回右表中的所有记录，即使在左表中没有记录与它匹配 full outer join 全连接，返回左右表中的所有记录在表中存在至少一个匹配时，inner joi...

2018-04-08 09:39:18 412

空空如也

空空如也