圣诞老人家-CSDN博客

原创核函数学习

定义：通过某非线性变换 φ( x) ，将输入空间映射到高维特征空间。特征空间的维数可能非常高。如果求解过程只用到内积运算，而在低维输入空间又存在某个函数 K(x, x′) ，它恰好等于在高维空间中这个内积，即K( x, x′) =<φ( x) ⋅φ( x′) > 。那么就不用计算复杂的非线性变换，而由这个函数 K(x, x′) 直接得到非线性变换的内积，使大大简化了计算。这样的函数 K(x, x′) 称为核函数。种类：线性核函数:,适合线性可分情况，参数少速度快多项式核函数:，参

2020-07-06 11:20:22 309

原创 HMM学习

待总结

2020-07-06 10:56:54 422

原创 SVM学习

核技巧：当在低维空间线性不可分时，采用核函数将低维空间映射到高维空间中，而且由于在求解SVM的对偶问题过程中，无论是目标函数还是决策函数只涉及实例之间的内积的运算，所以可以直接设置核函数,不必单独设置每个向量的映射函数。...

2020-07-06 09:23:44 225

原创生成式模型vs判别式模型

1.模型差别生成式模型：由数据学习联合概率分布P(X,Y), 然后由P(Y|X)=P(X,Y)/P(X)求出概率分布P(Y|X)作为预测的模型。该方法表示了给定输入X与产生输出Y的生成关系判别式模型：由数据直接学习决策函数Y=f(X)或条件概率分布P(Y|X)作为预测模型，即判别模型。判别方法关心的是对于给定的输入X，应该预测什么样的输出Y。2.模型对比（1）生成模型可以还原出联合...

2020-02-06 11:18:16 507

原创 Learning beyond datasets: Knowledge Graph Augmented Neural Networks for Natural language Processing

概述：现在的机器学习算法的核心都是利用有关领域的有标签或者无标签的数据集，虽然已经存在迁移学习可以将一个领域的知识用于其他领域，但是这些方法还是扩展性比较差，并且只能应用于特定领域。所以能不能有一种训练方式，除了基于训练数据的学习之外，能够为模型注入一般的世界知识的方式进行训练？该论文主要是用世界知识（知识图谱三元组的形式）来增强模型。目标就是建立一种深度学习模型，该模型可以从世界知识中中提取...

2019-12-02 23:17:45 517

原创 tensorflow 学习笔记（一）

1.tensorflow 程序主要分为三个部分（1）import 将要使用的库（2）创建计算图（3）通过会话执行计算图2.import osos.environ['TF_CPP_MIN_LOG_LEVEL']='2'该语句可以忽略警告以及级别更低的输出3.我们可以使用 tf.device() 指定模型运行的具体设备，可以指定运行在GPU还是CUP上，以及哪块GPU...

2019-12-02 15:25:24 224

原创基于神经网络的知识推理

知识推理是知识图谱补全的手段，也是知识图谱领域的研究热点之一。知识图谱补全：补全知识图谱中不完整的或者隐含的知识。面向知识图谱的知识推理大致可以分为三类：（1）基于逻辑的推理方式：通过一阶谓词逻辑、描述逻辑、等利用规则推理出新的实体关系（2）基于统计的方法：通过机器学习从知识图谱中统计出规律（3）基于图的推理方法：path ranking算法和基于神经网络的方法...

2019-12-01 22:47:22 7555 1

原创 Greedy search 和 beam search

1 Greedy search一个自然的想法是贪心搜索(greedy search)，即decoder的每一步都选择最可能的单词，最后得到句子的每一个单词都是每一步认为最合适的单词。但这样并不保证整个句子的概率是最大的，即不能保证整个句子最合适。实际上，贪心搜索的每一步搜索都处理成仅仅与前面刚生成的一个单词相关，类似于马尔科夫假设。这显然是不合理的，具体来说，贪心搜索到的句子yy概率是使得下式...

2019-10-30 22:27:43 848

原创网易笔试最长公共子括号序列

一个合法的括号匹配序列被定义为:1. 空串""是合法的括号序列2. 如果"X"和"Y"是合法的序列,那么"XY"也是一个合法的括号序列3. 如果"X"是一个合法的序列,那么"(X)"也是一个合法的括号序列4. 每个合法的括号序列都可以由上面的规则生成例如"", "()", "()()()", "(()())", "(((()))"都是合法的。从一个字符串S中移除零个或者多个字符得到的序...

2019-10-27 22:00:27 210

原创依存分析 CKY算法

CKY：动态规划：具体算法（类似填表的方法）：

2019-10-19 15:22:07 1236

原创 c++字符串和整数的转化

首先字符串转化为整数可以直接用标准库函数 string->整数 int a=atoi(s1.c_str());（atof double型 atol long型）整数->string int a=10; char s1[10]; itoa(a,s1,10);...

2019-10-17 19:39:56 550

原创 numpy基础

#numpy的用法import numpy as np#创建arrayvector=np.array([1,2,3,4])matrix=np.array([[1,'a'],[2,'b'],[3,'c']])a=np.arange(15).reshape(3,5)print(a.shape)#获取本地数据text=np.genfromtxt("E:/1.txt",delimit...

2019-10-13 22:33:12 87

原创 poj 1833(STL中排列函数和copy()的应用)

题目描述：大家知道，给出正整数n，则1到n这n个数可以构成n！种排列，把这些排列按照从小到大的顺序（字典顺序）列出，如n=3时，列出1 2 3，1 3 2，2 1 3，2 3 1，3 1 2，3 2 1六个排列。任务描述：给出某个排列，求出这个排列的下k个排列，如果遇到最后一个排列，则下1排列为第1个排列，即排列1 2 3…n。比如：n = 3，k=2 给出排列2 3 1，则它的下...

2019-10-13 15:10:05 129

原创正则表达式在NLP中的基本应用

正则表达式在NLP中的作用1.将非结构化文档转化为结构化文本2.去噪#在python中使用re模块来实现正则表达式import re"""text_string='组合范畴语法（Combinatory categorial grammar，），是在AB演算基础上进行扩展而产生的范畴语法。' \ '从语法理论视角看，CCG是一种词汇形式化的方法。...

2019-10-12 23:12:16 1131

转载 beam search 搜索算法

假设一个搜索任务假设现在有一个简化版的中文翻译英文任务，输入和输出如下，为了方便描述搜索算法，限制输出词典只有{"I", "H", "U"} 这3个候选词，限制1个时间步长翻译1个汉字，1个汉字对应1个英文单词，这里总共3个汉字，所以只有3个时间步长。中文输入："我" "恨" "你"英文输出："I" "H" "U"目标：得到最优的翻译序列I-H-Uexhaustive sear...

2019-10-09 13:48:22 1202

转载 transformer 模型

中文博客：https://terrifyzhao.github.io/2019/01/11/Transformer%E6%A8%A1%E5%9E%8B%E8%AF%A6%E8%A7%A3.html英文博客：https://jalammar.github.io/illustrated-transformer/

2019-09-20 10:54:27 257 1

转载 RNN，LSTM与GRU详解

短时记忆RNN 会受到短时记忆的影响。如果一条序列足够长，那它们将很难将信息从较早的时间步传送到后面的时间步。因此，如果你正在尝试处理一段文本进行预测，RNN 可能从一开始就会遗漏重要信息。在反向传播期间，RNN 会面临梯度消失的问题。梯度是用于更新神经网络的权重值，消失的梯度问题是当梯度随着时间的推移传播时梯度下降，如果梯度值变得非常小，就不会继续学习。梯度更新规则因此，...

2019-09-13 16:14:25 3342

原创多元线性回归实战（二元）

一：算法具体实现import numpy as npimport matplotlib.pyplot as pltfrom mpl_toolkits.mplot3d import Axes3Ddata=np.genfromtxt("data1.csv",delimiter=",")x_data=data[:,:-1]y_data=data[:,-1]lr=0.0001k1=k2...

2019-07-03 11:59:30 2368

原创一元线性回归实战

一：算法具体实现import numpy as npimport matplotlib.pyplot as pltdata=np.genfromtxt("data.csv",delimiter=",")x_data=data[:,0]y_data=data[:,1]plt.scatter(x_data,y_data)plt.show()lr=0.01b=0k=0epoch...

2019-07-03 10:18:35 166

原创 numpy 中newaxis函数

x1[:,np.newaxis]：增维，转置从字面上是插入新的维度的意思demo1: 针对一维的情况>>> b = np.array([1, 2, 3, 4, 5, 6])>>> b[np.newaxis]array([[1, 2, 3, 4, 5, 6]])>>> c = b[np.newaxis] ＃equals...

2019-07-03 09:46:16 1168

原创图论基础（bfs+dfs简介）

图是一种灵活的数据结构，一般作为一种模型用来定义对象之间的关系或联系。对象由顶点（V）表示，而对象之间的关系或者关联则通过图的边（E）来表示。图可以分为有向图和无向图，一般用G=(V,E)来表示图。经常用邻接矩阵或者邻接表来描述一副图。在图的基本算法中，最初需要接触的就是图的遍历算法，根据访问节点的顺序，可分为广度优先搜索（BFS）和深度优先搜索（DFS）。广度优先搜索（BFS）广度优先搜索在进一...

2018-03-14 10:09:45 1089

原创网易面试下厨房

牛牛想尝试一些新的料理，每个料理需要一些不同的材料，问完成所有的料理需要准备多少种不同的材料。输入描述:每个输入包含 1 个测试用例。每个测试用例的第 i 行，表示完成第 i 件料理需要哪些材料，各个材料用空格隔开，输入只包含大写英文字母和空格，输入文件不超过 50 行，每一行不超过 50 个字符。输出描述:输出一行一个数字表示完成所有料理需要多少种不同的材料。示例

2017-12-24 11:14:26 319

原创网易面试合唱团

#include #include #include using namespace std;int a[55];long long ans[55][15][2];int flag[55][15];int main(){ int n,k,d; cin>>n; for(int i=1;i scanf("%d",&a[i]);

2017-12-24 10:40:05 661

原创 hdu 4081

During the Warring States Period of ancient China(476 BC to 221 BC), there were seven kingdoms in China ---- they were Qi, Chu, Yan, Han, Zhao, Wei and Qin. Ying Zheng was the king of the kingdom Qin.

2017-10-02 17:00:18 469

原创 hdu 1024 dp

Now I think you have got an AC in Ignatius.L's "Max Sum" problem. To be a brave ACMer, we always challenge ourselves to more difficult problems. Now you are faced with a more difficult problem. Gi

2017-10-02 11:45:22 230

原创 hdu1513 dp

Problem DescriptionA palindrome is a symmetrical string, that is, a string read identically from left to right as well as from right to left. You are to write a program which, given a string, dete

2017-09-29 16:11:29 294

原创 hdu 2577 dp

Problem DescriptionPirates have finished developing the typing software. He called Cathy to test his typing software. She is good at thinking. After testing for several days, she finds that if she

2017-09-29 14:54:46 357

原创 poj-1

#include using namespace std;/** _ooOoo_ o8888888o 88" . "88 (| -_- |) O\ = /O ___

2017-09-23 17:03:05 181

原创最大元，归并排序作业

/*#include #include #include #include #include using namespace std;//最大元int a[100];int dg(int l,int r){ if(l==r) return a[l]; int mid=(l+r)/2; int s1=dg(l,mid);

2017-09-18 14:37:38 372

原创 hdu 4474 dfs+减枝

There are tons of problems about integer multiples. Despite the fact that the topic is not original, the content is highly challenging. That’s why we call it “Yet Another Multiple Problem”. In this

2017-09-16 10:53:09 223

原创 hdu 4465 概率+数学处理

LazyChild is a lazy child who likes candy very much. Despite being very young, he has two large candy boxes, each contains n candies initially. Everyday he chooses one box and open it. He chooses the

2017-09-16 09:26:56 339

原创区间dp小结

区间dp顾名思义就是在一个区间上进行的一系列动态规划，一般就是通过将区间划分成更小的区间，在小的区间中找到最优解，或者是其他的某些操作一：基本题型一般区间dp主要涉及两类问题1.区间最优解一般是枚举区间的分界点，将区间分割，然后将子区间的最优解合并为原区间的最优解2.区间计数区间计数也要分割区间，而且要做到不重叠，不遗漏总之，区间dp问题解决的关键就是区间的分割二.

2017-09-15 14:24:13 261

原创权值线段树小结

线段树大概地球人都知道了，就是以数组的下表建立线段树来进行一些区间操作，这里介绍一下权值线段树，顾名思义，其实权值线段树也是线段树的一种。一：权值线段树线段树与简单线段树的区别就像他的名字一样，他的叶子节点存的并不是数组的下表，而是数组中数的权值，这种操作很简单的解决一些问题。二.例题分析1.求逆序对数好吧，其实这种题直接用归并就可以解决吗，但是我们呢偏要任性用权值线段树解

2017-09-14 09:22:48 4478 1

原创 hdu 6188 贪心

Problem DescriptionNike likes playing cards and makes a problem of it.Now give you n integers, [Math Processing Error]We define two identical numbers (eg: [Math Processing Error]) a Duizi,

2017-09-14 08:21:46 377

原创 hdu 6186

Problem DescriptionLittle A has come to college and majored in Computer and Science.Today he has learned bit-operations in Algorithm Lessons, and he got a problem as homework.Here is the p

2017-09-14 08:15:01 368

原创分治思想小结

在解决一些规模较大问题的时候通常无法直接解决，需要划分为多个规模较小的问题，这种思想就是分治（分而治之）的思想。一.满足分治法的要求首先，一个问题想要用分治法来解决，那么他需要满足一些基本要求（1）该问题规模为n的问题的解可以分为k个规模较小的子问题的解（2）这些子问题相互独立（3）将子问题的解合并得到的就是对应原问题的解二.分治法的基本步骤（1）分：按照一定的规律和策

2017-09-13 14:50:07 506

转载八大排序算法

概述排序有内部排序和外部排序，内部排序是数据记录在内存中进行排序，而外部排序是因排序的数据很大，一次不能容纳全部的排序记录，在排序过程中需要访问外存。我们这里说说八大排序就是内部排序。当n较大，则应采用时间复杂度为O(nlog2n)的排序方法：快速排序、堆排序或归并排序序。快速排序：是目前基于比较的内部排序中被认为是最好的方法，当待排序的关键字

2017-09-13 09:34:04 221

原创 LCA在线算法

LCA算法（最近公共祖先），该算法分为在线和离线两种算法，在线算法ST（RMQ）算法，离线的tarjan 算法，这里先介绍一下在线ST算法首先提到st算法是一维数据的区间最值操作，坑定第一步我们就需要把树映射到一维数组，首先利用dfs序（中序遍历的顺序）将树映射到一维数组中，当然在遍历的过程中我们还需要记录一些值，比如一个节点的深度，该节点在映射的一维数组中的位置例如：

2017-09-13 09:23:00 485

原创 hdu 2586 LCA在线算法

Problem DescriptionThere are n houses in the village and some bidirectional roads connecting them. Every day peole always like to ask like this "How far is it if I want to go from house A to house

2017-09-13 09:03:49 369

原创【SHOI 2002】百事世界杯之旅概率期望

Description……在2003年6月之前购买的百事任何饮料的瓶盖上都会有一个百事球星的名字。只要凑齐所有百事球星的名字，就可以参加百事世界杯之旅的抽奖活动，获取球星背包、随身听，更可以赴日韩观看世界杯。还不赶快行动！……”你关上电视，心想：假设有n个不同球星的名字，每个名字出现的概率相同，平均需要买几瓶饮料才能凑齐所有的名字呢？Input输入一个数字n，2

2017-09-12 08:23:24 455

空空如也

空空如也