自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(22)
  • 收藏
  • 关注

原创 Que2Search: Fast and Accurate Query and Document Understanding for Search at Facebook论文笔记

0、论文资料论文地址:Que2Search: Fast and Accurate Query and Document Understanding for Search at Facebook | Proceedings of the 27th ACM SIGKDD Conference on Knowledge Discovery & Data Mining1、摘要 提出Que2Search,利用多任务和多模态训练方法,学习query和product的表征,在召回阶段召回qu..

2021-10-03 20:55:10 935

转载 彻底搞懂 python 中文乱码问题

前言曾几何时 Python 中文乱码的问题困扰了我很多很多年,每次出现中文乱码都要去网上搜索答案,虽然解决了当时遇到的问题但下次出现乱码的时候又会懵逼,究其原因还是知其然不知其所以然。现在有的小伙伴为了躲避中文乱码的问题甚至代码中不使用中文,注释和提示都用英文,我曾经也这样干过,但这并不是解决问题,而是逃避问题,今天我们一起彻底解决 Python 中文乱码的问题。基础知识ASCII很久很久以前,有一群人,他们决定用8个可以开合的晶体管来组合成不同的状态,以表示世界上的万物。他们看到8个开关状态

2021-07-25 22:27:22 2316

原创 win10+tensorflow+cuda9.0+cudnn7+GTX960安装教程以及填坑过程

1、先查看电脑显卡支持的CUDA版本 (1)打开NVIDIA控制面板(点击鼠标右键就能找到)2、查看CUDA对应的cudnn、tensorflow和python版本3、安装CUDA和Cudnn及配置环境为了方便,我把cuda9.0和cudnn7放在网盘链接:https://pan.baidu.com/s/1kx-uhNSLukQmou1-Z6js-w...

2019-10-29 17:35:00 2036 1

转载 机器学习优化算法中梯度下降,牛顿法和拟牛顿法的优缺点详细介绍

1、梯度下降法梯度下降法实现简单,当目标函数是凸函数时,梯度下降法的解是全局解。一般情况下,其解不保证是全局最优解,梯度下降法的速度也未必是最快的。梯度下降法的优化思想:用当前位置负梯度方向作为搜索方向,因为该方向为当前位置的最快下降方向,所以也被称为是”最速下降法“。最速下降法越接近目标值,步长越小,前进越慢。缺点:靠近极小值时收敛速度减慢,求解需要很多次的迭代;直线搜...

2019-08-12 09:30:42 12402

原创 用最少数量的箭引爆气球

/*思考:首先将样例画图,找出规律理解题意,其次举例子,1个气球最少用1个箭,2个重叠气球最少用一个箭,3个重叠气球最少用一个箭因此,尽量使气球重叠部分最多一些,那么如何算法化呢?当然是排序,然后遍历维护射击区间。1,排序,按照左端点。2,遍历气球数组,维护一个设计区间,初始化就是第一个气球的区间,同时贪心尽可能多的击穿更多气球,然后更新设计区间。3,直到没有新的气球可以被击穿,那么增加...

2019-05-18 22:00:04 161

转载 全面梳理:准确率,精确率,召回率,查准率,查全率,假阳性,真阳性,PRC,ROC,AUC,F1

二分类问题的结果有四种:逻辑在于,你的预测是positive-1和negative-0,true和false描述你本次预测的对错true positive-TP:预测为1,预测正确即实际1false positive-FP:预测为1,预测错误即实际0true negative-TN:预测为0,预测正确即实际0false negative-FN:预测为0,预测错误即实际...

2019-04-14 21:40:26 6954

原创 神经网路权重初始化方式

在开始训练网络之前,还需要初始化网络的参数。方式有: 错误:全零初始化。让我们从应该避免的错误开始。在训练完毕后,虽然不知道网络中每个权重的最终值应该是多少,但如果数据经过了恰当的归一化的话,就可以假设所有权重数值中大约一半为正数,一半为负数。这样,一个听起来蛮合理的想法就是把这些权重的初始值都设为0吧,因为在期望上来说0是最合理的猜测。这个做法错误的!因为如果网络中的每个神经元都...

2019-04-13 17:34:07 458

转载 RNN梯度爆炸原因和LSTM解决梯度消失解释

RNN梯度爆炸原因:经典的RNN结构如下图所示:假设我们的时间序列只有三段, 为给定值,神经元没有激活函数,则RNN最简单的前向传播过程如下:假设在t=3时刻,损失函数为 。则对于一次训练任务的损失函数为 ,即每一时刻损失值的累加。使用随机梯度下降法训练RNN其实就是对 、 、 以及 求偏导,并不断调整它们以使L尽可能达到最小的过...

2019-04-11 16:57:07 10682 2

转载 决策树CART算法讲解

ID3和C4.5在上一篇,点击转载:https://www.cnblogs.com/pinard/p/6053344.html

2019-04-09 14:41:33 987

转载 决策树ID3和C4.5

决策树CART在下一篇:点击转载:https://www.cnblogs.com/pinard/p/6050306.html#!comments

2019-04-09 14:30:44 142

转载 word2vec简单通俗易懂

word2vec 是 Google 于 2013 年开源推出的一个用于获取 word vector 的工具包,它简单、高效,因此引起了很多人的关注。由于 word2vec 的作者 Tomas Mikolov 在两篇相关的论文 [3,4] 中并没有谈及太多算法细节,因而在一定程度上增加了这个工具包的神秘感。一些按捺不住的人于是选择了通过解剖源代码的方式来一窥究竟。 第一次接触 word2...

2019-04-05 15:17:53 461

原创 C++实现归并排序

#include<iostream>#include<vector>using namespace std;void merge(vector<int>&arr, int start, int mid, int end){ vector<int> tmp; int i = start; int j = mid+1;...

2019-04-04 20:41:33 2368

转载 通俗易懂的堆排序C++实现

堆排序  堆排序是利用堆这种数据结构而设计的一种排序算法,堆排序是一种选择排序,它的最坏,最好,平均时间复杂度均为O(nlogn),它也是不稳定排序。首先简单了解下堆结构。堆  堆是具有以下性质的完全二叉树:每个结点的值都大于或等于其左右孩子结点的值,称为大顶堆;或者每个结点的值都小于或等于其左右孩子结点的值,称为小顶堆。如下图:同时,我们对堆中的结点按层进行编号,将这种逻辑结...

2019-04-04 20:38:10 2204 4

原创 C++代码 快速排序总结

实现快速排序算法的关键在于先在数组中找到一个数(基数),接下来把数组分为两部分,把小于该数的数字移到数组的左边,把大于该数的数字移动数组的右边。等于该数的数字不动。先给一张通俗易懂的过程演示图讲解第一次排序3 4 1 7 6 2 0 基数:3第一步:首先找一个基数,以数组第一个数为基数,保存基数。定义两个指针start,e...

2019-03-29 18:07:37 176

原创 pickle.dump()把大量数据写入文件发生MemoryError解决方法

跑了12个小时的代码,最后因为pickle.dump()发生MemoryError错误,实在头疼。pickle.dump()有个bug就是不能存储大量数据,所以只能用别的方法,我用的是joblib读写方式,轻松搞定,Yes!from sklearn.externals import joblib#写的方式save_file = os.path.join(save_path, "detec...

2019-03-11 09:20:54 9386 8

原创 秒懂文件路径 / 和 ./ 和 ../ 和 ../../

/ 表示当前路径的根路径./ 表示当前路径../表示父级路径,当前路径所在的上一级路径。../../ 表示当前路径所在的上上级路径例子:用python读取D:/A/B/C/D/1.jpg文件。用os.getced()当前python所在的路径,比如:D:/A/B/C/D读取方法:1、从cv2.imread(1.jpg) 2、cv2....

2019-03-08 16:43:51 2452

转载 二叉树的深度优先遍历(DFS)与广度优先遍历(BFS)

二叉树的深度优先遍历(DFS)与广度优先遍历(BFS)深度优先遍历:从根节点出发,沿着左子树方向进行纵向遍历,直到找到叶子节点为止。然后回溯到前一个节点,进行右子树节点的遍历,直到遍历完所有可达节点为止。广度优先遍历:从根节点出发,在横向遍历二叉树层段节点的基础上纵向遍历二叉树的层次。DFS:ABDECFGBFS:ABCDEFGDFS实现:数据结构:栈父节点入栈,父节点出栈,先右...

2019-02-28 13:32:19 334

原创 一定能懂的0-1背包视频讲解

点击视频讲解

2019-02-25 20:44:34 276

转载 从Word Embedding到Bert模型—自然语言处理中的预训练技术发展史

张俊林博士的解读, 知乎专栏:从Word Embedding到Bert模型—自然语言处理中的预训练技术发展史PPT链接:https://pan.baidu.com/s/1CR63tX64jIASQ0YgnUbh6ABert最近很火,应该是最近最火爆的AI进展,网上的评价很高,那么Bert值得这么高的评价吗?我个人判断是值得。那为什么会有这么高的评价呢?是因为它有重大的理论或者模型创新...

2019-02-21 17:16:36 473

原创 统计学习方法(—)——统计学习方法概念

 1、统计学习方法概念   统计学习方法包括模型的假设空间、模型选择的准则以及模型学习的算法,称统计学习方法的三要素,简称为模型、策略和算法。    模型的假设空间:包含所有可能的条件概率分布或决策函数。例如,决策函数是输入变量的线性函数,那么模型的假设空间就是所有这些线性函数构成的函数集合,假设空间的模型一般有无穷多个。    模型选择的准则:一个评估方法从模型的假设空间中选择最优模型。...

2019-02-21 17:05:45 284

原创 c++中4个与类型转换相关的关键字总结

C++中,四个与类型转换相关的关键字:static_cast、const_cast、reinterpret_cast、dynamic_cast。1.static_cast------运算符完成相关类型之间的转换**特点:静态转换,在编译处理期间。使用场景:主要用于C++中内置的基本数据类型之间的转换,但是没有运行时类型的检测来保证转换的安全性。如在同一类层次结构中的一个指针类型到另一个...

2019-02-21 10:56:53 307

转载 极大似然估计

极大似然估计 以前多次接触过极大似然估计,但一直都不太明白到底什么原理,最近在看贝叶斯分类,对极大似然估计有了新的认识,总结如下:贝叶斯决策 首先来看贝叶斯分类,我们都知道经典的贝叶斯公式: 其中:p(w):为先验概率,表示每种类别分布的概率;:类条件概率,表示在某种类别前提下,某事发生的概率;而为后验概率,表示某事发生了,...

2019-02-21 10:43:36 117

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除