倔强超-CSDN博客

原创 Que2Search: Fast and Accurate Query and Document Understanding for Search at Facebook论文笔记

0、论文资料论文地址：Que2Search: Fast and Accurate Query and Document Understanding for Search at Facebook | Proceedings of the 27th ACM SIGKDD Conference on Knowledge Discovery & Data Mining1、摘要提出Que2Search，利用多任务和多模态训练方法，学习query和product的表征，在召回阶段召回qu..

2021-10-03 20:55:10 935

转载彻底搞懂 python 中文乱码问题

前言曾几何时 Python 中文乱码的问题困扰了我很多很多年，每次出现中文乱码都要去网上搜索答案，虽然解决了当时遇到的问题但下次出现乱码的时候又会懵逼，究其原因还是知其然不知其所以然。现在有的小伙伴为了躲避中文乱码的问题甚至代码中不使用中文，注释和提示都用英文，我曾经也这样干过，但这并不是解决问题，而是逃避问题，今天我们一起彻底解决 Python 中文乱码的问题。基础知识ASCII很久很久以前，有一群人，他们决定用8个可以开合的晶体管来组合成不同的状态，以表示世界上的万物。他们看到8个开关状态

2021-07-25 22:27:22 2316

原创 win10+tensorflow+cuda9.0+cudnn7+GTX960安装教程以及填坑过程

1、先查看电脑显卡支持的CUDA版本（1）打开NVIDIA控制面板（点击鼠标右键就能找到）2、查看CUDA对应的cudnn、tensorflow和python版本3、安装CUDA和Cudnn及配置环境为了方便，我把cuda9.0和cudnn7放在网盘链接：https://pan.baidu.com/s/1kx-uhNSLukQmou1-Z6js-w...

2019-10-29 17:35:00 2036 1

转载机器学习优化算法中梯度下降,牛顿法和拟牛顿法的优缺点详细介绍

1、梯度下降法梯度下降法实现简单，当目标函数是凸函数时，梯度下降法的解是全局解。一般情况下，其解不保证是全局最优解，梯度下降法的速度也未必是最快的。梯度下降法的优化思想：用当前位置负梯度方向作为搜索方向，因为该方向为当前位置的最快下降方向，所以也被称为是”最速下降法“。最速下降法越接近目标值，步长越小，前进越慢。缺点：靠近极小值时收敛速度减慢，求解需要很多次的迭代；直线搜...

2019-08-12 09:30:42 12402

原创用最少数量的箭引爆气球

/*思考：首先将样例画图，找出规律理解题意，其次举例子，1个气球最少用1个箭，2个重叠气球最少用一个箭，3个重叠气球最少用一个箭因此，尽量使气球重叠部分最多一些，那么如何算法化呢？当然是排序，然后遍历维护射击区间。1，排序，按照左端点。2，遍历气球数组，维护一个设计区间，初始化就是第一个气球的区间，同时贪心尽可能多的击穿更多气球，然后更新设计区间。3，直到没有新的气球可以被击穿，那么增加...

2019-05-18 22:00:04 161

转载全面梳理：准确率,精确率,召回率,查准率,查全率,假阳性,真阳性,PRC,ROC,AUC,F1

二分类问题的结果有四种：逻辑在于，你的预测是positive-1和negative-0，true和false描述你本次预测的对错true positive-TP：预测为1，预测正确即实际1false positive-FP：预测为1，预测错误即实际0true negative-TN：预测为0，预测正确即实际0false negative-FN：预测为0，预测错误即实际...

2019-04-14 21:40:26 6954

原创神经网路权重初始化方式

在开始训练网络之前，还需要初始化网络的参数。方式有：错误：全零初始化。让我们从应该避免的错误开始。在训练完毕后，虽然不知道网络中每个权重的最终值应该是多少，但如果数据经过了恰当的归一化的话，就可以假设所有权重数值中大约一半为正数，一半为负数。这样，一个听起来蛮合理的想法就是把这些权重的初始值都设为0吧，因为在期望上来说0是最合理的猜测。这个做法错误的！因为如果网络中的每个神经元都...

2019-04-13 17:34:07 458

转载 RNN梯度爆炸原因和LSTM解决梯度消失解释

RNN梯度爆炸原因：经典的RNN结构如下图所示：假设我们的时间序列只有三段，为给定值，神经元没有激活函数，则RNN最简单的前向传播过程如下：假设在t=3时刻，损失函数为。则对于一次训练任务的损失函数为，即每一时刻损失值的累加。使用随机梯度下降法训练RNN其实就是对、、以及求偏导，并不断调整它们以使L尽可能达到最小的过...

2019-04-11 16:57:07 10682 2

转载决策树CART算法讲解

ID3和C4.5在上一篇，点击转载：https://www.cnblogs.com/pinard/p/6053344.html

2019-04-09 14:41:33 987

转载决策树ID3和C4.5

决策树CART在下一篇：点击转载：https://www.cnblogs.com/pinard/p/6050306.html#!comments

2019-04-09 14:30:44 142

转载 word2vec简单通俗易懂

word2vec 是 Google 于 2013 年开源推出的一个用于获取 word vector 的工具包，它简单、高效，因此引起了很多人的关注。由于 word2vec 的作者 Tomas Mikolov 在两篇相关的论文 [3,4] 中并没有谈及太多算法细节，因而在一定程度上增加了这个工具包的神秘感。一些按捺不住的人于是选择了通过解剖源代码的方式来一窥究竟。第一次接触 word2...

2019-04-05 15:17:53 461

原创 C++实现归并排序

#include<iostream>#include<vector>using namespace std;void merge(vector<int>&arr, int start, int mid, int end){ vector<int> tmp; int i = start; int j = mid+1;...

2019-04-04 20:41:33 2368

转载通俗易懂的堆排序C++实现

堆排序　　堆排序是利用堆这种数据结构而设计的一种排序算法，堆排序是一种选择排序，它的最坏，最好，平均时间复杂度均为O(nlogn)，它也是不稳定排序。首先简单了解下堆结构。堆　　堆是具有以下性质的完全二叉树：每个结点的值都大于或等于其左右孩子结点的值，称为大顶堆；或者每个结点的值都小于或等于其左右孩子结点的值，称为小顶堆。如下图：同时，我们对堆中的结点按层进行编号，将这种逻辑结...

2019-04-04 20:38:10 2204 4

原创 C++代码快速排序总结

实现快速排序算法的关键在于先在数组中找到一个数（基数），接下来把数组分为两部分，把小于该数的数字移到数组的左边，把大于该数的数字移动数组的右边。等于该数的数字不动。先给一张通俗易懂的过程演示图讲解第一次排序3 4 1 7 6 2 0 基数：3第一步：首先找一个基数，以数组第一个数为基数，保存基数。定义两个指针start，e...

2019-03-29 18:07:37 176

原创 pickle.dump()把大量数据写入文件发生MemoryError解决方法

跑了12个小时的代码，最后因为pickle.dump()发生MemoryError错误，实在头疼。pickle.dump()有个bug就是不能存储大量数据，所以只能用别的方法，我用的是joblib读写方式，轻松搞定，Yes!from sklearn.externals import joblib#写的方式save_file = os.path.join(save_path, "detec...

2019-03-11 09:20:54 9386 8

原创秒懂文件路径 / 和 ./ 和 ../ 和 ../../

/ 表示当前路径的根路径./ 表示当前路径../表示父级路径，当前路径所在的上一级路径。../../ 表示当前路径所在的上上级路径例子：用python读取D:/A/B/C/D/1.jpg文件。用os.getced()当前python所在的路径，比如：D:/A/B/C/D读取方法：1、从cv2.imread(1.jpg) 2、cv2....

2019-03-08 16:43:51 2452

转载二叉树的深度优先遍历（DFS）与广度优先遍历（BFS）

二叉树的深度优先遍历（DFS）与广度优先遍历（BFS）深度优先遍历：从根节点出发，沿着左子树方向进行纵向遍历，直到找到叶子节点为止。然后回溯到前一个节点，进行右子树节点的遍历，直到遍历完所有可达节点为止。广度优先遍历：从根节点出发，在横向遍历二叉树层段节点的基础上纵向遍历二叉树的层次。DFS:ABDECFGBFS:ABCDEFGDFS实现：数据结构：栈父节点入栈，父节点出栈，先右...

2019-02-28 13:32:19 334

原创一定能懂的0-1背包视频讲解

点击视频讲解

2019-02-25 20:44:34 276

转载从Word Embedding到Bert模型—自然语言处理中的预训练技术发展史

张俊林博士的解读，知乎专栏：从Word Embedding到Bert模型—自然语言处理中的预训练技术发展史PPT链接：https://pan.baidu.com/s/1CR63tX64jIASQ0YgnUbh6ABert最近很火，应该是最近最火爆的AI进展，网上的评价很高，那么Bert值得这么高的评价吗？我个人判断是值得。那为什么会有这么高的评价呢？是因为它有重大的理论或者模型创新...

2019-02-21 17:16:36 473

原创统计学习方法（—）——统计学习方法概念

1、统计学习方法概念统计学习方法包括模型的假设空间、模型选择的准则以及模型学习的算法，称统计学习方法的三要素，简称为模型、策略和算法。模型的假设空间：包含所有可能的条件概率分布或决策函数。例如，决策函数是输入变量的线性函数，那么模型的假设空间就是所有这些线性函数构成的函数集合，假设空间的模型一般有无穷多个。模型选择的准则：一个评估方法从模型的假设空间中选择最优模型。...

2019-02-21 17:05:45 284

原创 c++中4个与类型转换相关的关键字总结

C++中，四个与类型转换相关的关键字：static_cast、const_cast、reinterpret_cast、dynamic_cast。1.static_cast------运算符完成相关类型之间的转换**特点：静态转换，在编译处理期间。使用场景：主要用于C++中内置的基本数据类型之间的转换，但是没有运行时类型的检测来保证转换的安全性。如在同一类层次结构中的一个指针类型到另一个...

2019-02-21 10:56:53 307

转载极大似然估计

极大似然估计以前多次接触过极大似然估计，但一直都不太明白到底什么原理，最近在看贝叶斯分类，对极大似然估计有了新的认识，总结如下：贝叶斯决策首先来看贝叶斯分类，我们都知道经典的贝叶斯公式：其中：p(w)：为先验概率，表示每种类别分布的概率；：类条件概率，表示在某种类别前提下，某事发生的概率；而为后验概率，表示某事发生了，...

2019-02-21 10:43:36 117

chao_1083934282的博客