自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(24)
  • 收藏
  • 关注

原创 python-含有多个可迭代对象的排序

X,Y…为若干个可迭代的对象,比如数组、字符串等,其中元素的个数相同。需要将这些对象合并后按照某种规则排序。比如X为国家名,Y为金牌数,Z为银牌数。先按照Y排序,Y相等的情况下,按照Z排序。那么代码可以这么写a = sorted(zip(X,Y,X), key=lambda x:(x[1], x[2]))...

2021-10-26 17:39:52 136

原创 NLP基础知识

Transfomer具体构造LSTM 具体构造LDA主题模型是一个生成模型,这个模型假定每个文档都是由一系列话题(topic)混合生成的。假定有k个潜在的topic,这些个话题的分布服从一个多项式分布。LDA首先从Dirichlet(a1,...ak)Dirichlet(a_1,...a_k)Dirichlet(a1​,...ak​)分布中取得参数θ\thetaθ,θ\thetaθ是一个大小为k一维数组,也是前面我们说道的多项式分布的参数,p(zn=i∣θ)=θip(z_n = i|\theta)

2021-01-20 14:47:43 1215

原创 Dropout与过拟合

假设我们要训练这样一个神经网络输入是x输出是y,正常的流程是:我们首先把x通过网络前向传播然后后把误差反向传播以决定 如何更新参数让网络进行学习。使用dropout之后过程变成:首先随机(临时)删掉网络中一半的隐藏神经元,输入输出神经元保持不变(下图中虚线为部分临时被删除的神经元)然后把输入x通过修改后的网络前向传播,然后把得到的损失结果通过修改的网络反向传播。一小批训练样本执行完这个过程后就按照随机梯度下降法更新(没有被删除的神经元)对应的参数(w,b)。然后继续重复这一过程:恢复

2020-05-21 11:35:02 597

原创 TF-IDF: 文本的一种向量表示

TF-IDF是Term Frequency-Inverse Document Frequency的简称。她是一种非常常见的用于将文本转化为有意义的数字表示的算法。这个技术被广泛的应用与NLP的各个方面。本文将会介绍怎样计算和应用TF-IDF。文本的向量表示为了将机器学习算法或统计技术应用到任何形式的文本上,应当将文本转化为数字或向量形式。这种数字表示应当能够描绘出本文的显著特征。有很多技术都可...

2020-05-02 11:15:41 1996

原创 ubuntu 下命令行格式化U盘

查看u盘分区,通常是 /dev/sdbsudo fdisk -l使用 umount 卸载优盘sudo umount /dev/sdb使用 mkfs.vfat 命令将优盘格式化,sudo mkfs.vfat /dev/sdb

2019-01-12 15:23:00 865

原创 DKN: Deep Knowledge-Aware Network for News Recommendation阅读笔记

这篇论文发表在2018年的WWW上。引入知识来进行新闻推荐。 关键词:News recommendation; knowledge graph representation; deep neural networks; attention modelMotivation过去的新闻推荐方法没有引入知识,很难发现潜在的知识层面的关系 另一方面 新闻推荐有高度的时间敏感性并且要随着用户的兴趣...

2018-08-02 15:42:19 2973

原创 bandit算法原理及Python实现

Bandit算法是在线学习的一种,一切通过数据收集而得到的概率预估任务,都能通过Bandit系列算法来进行在线优化。这里的“在线”,指的不是互联网意义上的线上,而是只算法模型参数根据观察数据不断演变。 以多臂老虎机问题为例,首先我们假设每个臂是否产生收益,其背后有一个概率分布,产生收益的概率为p 我们不断地试验,去估计出一个置信度较高的概率p的概率分布就能近似解决这个问题了。 怎么能估计概率p

2017-04-24 09:22:40 1141

原创 混合颜料

题目你就是一个画家!你现在想绘制一幅画,但是你现在没有足够颜色的颜料。为了让问题简单,我们用正整数表示不同颜色的颜料。你知道这幅画需要的n种颜色的颜料,你现在可以去商店购买一些颜料,但是商店不能保证能供应所有颜色的颜料,所以你需要自己混合一些颜料。混合两种不一样的颜色A和颜色B颜料可以产生(A XOR B)这种颜色的颜料(新产生的颜料也可以用作继续混合产生新的颜色,XOR表示异或操作)。本着勤俭节约

2017-02-25 18:33:14 670

原创 最大的奇约数

题目小易是一个数论爱好者,并且对于一个数的奇数约数十分感兴趣。一天小易遇到这样一个问题: 定义函数f(x)为x最大的奇数约数,x为正整数。 例如:f(44) = 11. 现在给出一个N,需要求出 f(1) + f(2) + f(3)…….f(N) 例如: N = 7 f(1) + f(2) + f(3) + f(4) + f(5) + f(6) + f(7) = 1 + 1 + 3 + 1 +

2017-02-24 17:06:11 404

原创 数字翻转

#include <stdio.h>#include <sstream>#include <algorithm>using namespace std;int reverseNumber(int x){ string s = to_string(x); reverse(s.begin(),s.end()); return atoi(s.c_str());}int m

2017-02-23 23:05:24 250

原创 拉格朗日插值——基于scipy实现

拉格朗日插值数学原理在节点上给出节点基函数,然后做基函数的线性组合,组合系数为节点函数值,这种插值多项式称为拉格朗日插值公式 已最简单的两点插值为例,已知函数y = f (x)在给定互异点x0, x1上的值为y0= f (x0),y1=f (x1)线性插值就是构造一个一次多项式 P1(x) = ax + b 使它满足条件 P1 (x0) = y0 ,P1 (x1) = y1 其几何解释就是

2017-02-07 19:48:36 3369

原创 极大似然估计

极大似然估计(ML 估计)已结果去估计参数,使当取某种参数时,得到当前结果的概率最大。比如箱有黑白两个球,有放回的抽两次,一次抽到白球,一次抽到黑球,那么用极大似染的思想,我就可以估计箱中有一个白球和一个黑球。 极大似然估计视待估参数为一个未知但固定的量、不考虑“观察者”的影响(亦即不考虑先验知识的影响),属于频率学派思想。写的什么半拉胡片的啊喂!

2017-02-07 19:38:37 280

原创 剑指offer31——连续子数组的最大和

这就是一道简单的动态规划问题啊! f(i)={f(i−1)+arr(i),arr(i),if f(i−1)>=0if f(i−1) <0 f(i) = \begin{cases} f(i-1)+arr(i), & \text{if $f(i-1)$>=0} \\ arr(i), & \text{if $f(i-1)$ <0}

2017-02-01 20:01:18 180

原创 剑指offer——字符串的排列

void Permutation(char* pStr){ if(pStr==NULL) return; Permutation(pStr,pStr);}void Permutation(char* pStr,char* pBegin){ if(*pBegin=='\0') printf("%s\n",pStr); else

2017-01-31 11:04:11 260

原创 Pandas 合并数据

pandas concat 数据处理 数据挖掘

2017-01-19 10:29:26 4221 1

原创 Pandas 选择数据

主要介绍Pandas中的四种选择数据的方法:简单的筛选locilocix使用判断这是原始数据: A B C D2016-01-01 0 1 2 32016-01-02 4 5 6 72016-01-03 8 9 10 112016-01-04 12 13 14 152016-01-05 16

2017-01-18 21:46:43 2309

原创 tensorflow可视化--tensorboard

tensorflow 可视化 tensorboard

2016-12-23 18:26:41 816

原创 bandit算法原理及Python实现

bandit算法、多臂老虎机问题、在线学习

2016-11-28 09:53:46 18731 5

原创 Python第三方库安装超时问题解决

安装第三方库时出现如下问题:输入命令,增加延时时间:解决!

2016-11-27 17:28:05 4588

原创 CSAPP lab3 bufbomb

在bufbomb实验中level2和level3,需要将攻击代码嵌入到缓冲区中并修改程序返回地址为缓冲区起始地址,但是遇到了栈不可执行的问题。因为ubuntu默认栈不可执行。这里总结了两种修改程序堆栈可执行属性的方法。方法一:(有.c源文件)gcc -g -z execstack -fno-stack-protector stack.c -o stack./stack方法二

2016-10-28 22:31:44 1466

原创 csapp lab2 bomb

csapp lab2 bomb 炸弹实验

2016-10-18 10:32:43 2803

转载 Linux中的ls命令详细使用

ls命令是linux下最常用的命令之一,ls跟dos下的dir命令是一样的都是用来列出目录下的文件,下面我们就来一起看看ls的用法 英文全名:List即列表的意思,当我们学习某种东西的时候要做到知其所以然,当你知道了这个东西大概是个什么了以后你的思维就会联想到很多的东西学习的就会很快。 1. ls -a 列出文件下所有的文件,包括以“.“开头的隐藏文件(linux下文件隐藏文件是以

2016-09-09 16:48:09 1898

原创 动态规划笔记

一、动态规划的原理二、算法-矩阵乘法的问题、最长公共子序列问题、最大不下降子序列问题三、优化子结构的分类

2016-08-25 10:47:35 769

原创 各种排序算法

#includeint a[101];void insertsort(int a[],int n){ int i,j,temp; for(i=2;i<=n;i++) { if(a[i]<a[i-1]) //a[i]插入的是一个有序子表 { temp=a[i]; //循环后移

2016-08-24 11:29:55 175

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除