自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 资源 (9)
  • 收藏
  • 关注

原创 MAP、SRM、ERM与MLE

最大似然与经验风险最小化 当模型是条件概率分布,损失函数是对数损失函数时,经验风险最小化就等价于极大似然估计首先给出对数形式的ERM的公式: min1n∑i=1nL(yi,p(yi∣xi))\min \frac{1}{n}\sum\limits_{i=1}^n L(y_i,p(y_i\mid x_i))其中L(yi,f(xi))L(y_i,f(x_i))是损失函数,输出预测值为f(xi)f(

2017-03-20 15:05:16 2154

原创 ML优化拉格朗日与KKT

拉格朗日乘子法拉格朗日乘子法(Lagrange multipliers)是一种寻找多元函数在一组约束下的极值的方法。通过引入拉格朗日乘子,可将有dd个变量与kk个约束条件的最优化问题转化为具有d+kd+k个变量的无约束优化问题求解基本的拉格朗日乘子法就是求函数f(x1,x2,...)f(x_1,x_2,...)在g(x1,x2,...)=0g(x_1,x_2,...)=0的约束条件下的极值的方法。主

2017-03-16 15:12:38 609

原创 string全排列

字符串全排列规则最简单的思路就是使用递归实现:将最左边字符固定,后面的依次全排上一步的依次安排实际上是一次小集合的字符串全排 将次左边字符固定,剩下的全排将此次左边固定…直到最后一个数第一轮结束,将原始字符串的最左边字符与次左边字符交换位置按照上面的顺序依次进行将原始字符串从左数第3位固定到最左边依次进行…直到左右进行完毕输出实例举例来讲:原是字符串为’abc’a固定,剩下两个

2016-09-19 18:51:10 535

原创 Ngroke

ngrok 是一个反向代理,通过在公共的端点和本地运行的 Web 服务器之间建立一个安全的通道。ngrok 可捕获和分析所有通道上的流量,便于后期分析和重放为了方便本地服务器简单映射到外网访问,我们可以使用Ngroke服务。只需要几条简单的命令即可使用。国内ngrok服务点击进入获取相应平台的最新版本注册/登录 添加隧道列表将本地服务器地址、端口号与Ngroke分配的服务器绑定。本地地址:

2016-09-19 18:48:04 925

转载 AC自动机

文章大部分内容参考自CSDN–飘过的小牛 AC自动机,全程是Aho-Corasick automaton,该算法在1975年产生于贝尔实验室,是著名的多模匹配算法。要讲清楚比较吃力,直接上实例边消化边理解会好很多。示例构造构造一棵Trie,作为AC自动机的搜索数据结构。构造fail指针,使当前字符失配时跳转到具有最长公共前后缀的字符继续匹配。如同 KMP算法一样, AC自动机在匹配时

2016-09-19 18:47:30 387

转载 Trie树

文章大部分内容引用自Encyclopedia Trie树,即字典树。是一种树形结构,哈希树的变种。典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点是:利用字符串的公共前缀来减少查询时间,最大限度地减少无谓的字符串比较,查询效率比哈希树高。Trie树可以用来作为搜索引擎中的分词处理手段。描述根节点不包含字符,除根节点外每一个节

2016-09-19 18:46:47 262

原创 矩阵快速幂

矩阵的快速幂是用来高效地计算矩阵的高次方的。将朴素的o(n)的时间复杂度,降到log(n).最简单的例子来讲,一般我们正常计算实数x的n次幂时,都是从1开始,进行n次的x相乘。但做下简单的改进就能减少连乘的次数,方法如下:把n个矩阵进行两两分组,比如:A*A*A*A*A*A => (A*A)*(A*A)*(A*A)这样变的好处是,你只需要计算一次A*A,然后将结果(A*A)连乘自己两次就能得到A

2016-09-19 18:46:06 515

转载 KMP笔记

文章来源:c_cloud KMP思想 KMP算法是一种改进的字符串匹配算法,由D.E.Knuth,J.H.Morris和V.R.Pratt同时发现,因此人们称它为克努特——莫里斯——普拉特操作(The Knuth-Morris-Pratt Algorithm,简称KMP算法)。KMP算法的关键是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的。具体实现就是实现一个nex

2016-07-11 11:07:11 334

原创 tarjan算法求强连通分量

引入在有向图G中,如果两个顶点间至少存在一条路径,称两个顶点强连通(strongly connected)。如果有向图G的每两个顶点都强连通,称G是一个强连通图。非强连通图有向图的极大强连通子图,称为强连通分量(strongly connected components)。下图中,子图{1,2,3,4}为一个强连通分量,因为顶点1,2,3,4两两可达。{5},{6}也分别是两个强连通分量。tarja

2016-07-03 11:07:44 726

原创 模拟退火

模拟退火算法概述模拟退火算法来源于固体退火原理,将固体加温至充分高,再让其徐徐冷却,加温时,固体内部粒子随温升变为无序状,内能增大,而徐徐冷却时粒子渐趋有序,在每个温度都达到平衡态,最后在常温时达到基态,内能减为最小。根据Metropolis准则,粒子在温度T时趋于平衡的概率为e-ΔE/(kT),其中E为温度T时的内能,ΔE为其改变量,k为Boltzmann常数。用固体退火模拟组合优化问题,将内能E

2016-04-03 17:31:12 768

原创 洗白BT文件

写在前面接着上篇文章,torrent文件编码.在torrent文件编码这篇文章的开始我就说过,种子文件对于青年男士有着巨大的诱惑力。我也不例外,由于国内文化教育方面抓的比较紧,所以某些领域的文件信息无法通过种子文件离线下载、进入高速通道。这个实现的原理很简单,直接通过扫描种子文件的tracker、服务器地址显然不可取,那就遍历torrent包含的文件名吧,这些文件往往会有很多露骨的字眼,净网行动进行

2016-03-16 14:09:44 13112 1

Hadoop YARN权威指南_(美)默西著_北京:机械工业出版社

Hadoop YARN权威指南_(美)默西著_北京:机械工业出版社

2017-05-18

word2vec数学原理

word2vec 是 Google 于 2013 年开源推出的一个用于获取词向量(word vector)的工具包,它简单、高效,因此引起了很多人的关注。文档探究word2vec技术的原理、模型背后的数学推理,是一篇很棒的doc

2017-03-28

tumblr资源下载

一键获取Tumblr站主所有图片、视频下载地址

2016-04-21

torrent洗白

自己使用python造的一个种子洗白程序,可以将单文件、多文件种子文件洗白,通过检测:)

2016-03-16

Selenium-phantomjs

Selenium使用的phantomjs driver,功能自动化测试。可以使用Selenium直接调用driver完成功能自动化测试

2016-03-10

Selenium-phantomjsdriver

Selenium使用的phantomjs driver,功能自动化测试。可以使用Selenium直接调用driver完成功能自动化测试

2016-03-10

Selenium-operadriver

Selenium使用的opera driver,功能自动化测试。可以使用Selenium直接调用driver完成功能自动化测试

2016-03-10

Selenium-IEdriver

Selenium使用的ie driver,功能自动化测试。可以使用Selenium直接调用driver完成功能自动化测试

2016-03-10

Selenium-chromedriver

Selenium使用的chrome driver,功能自动化测试。可以使用Selenium直接调用driver完成功能自动化测试

2016-03-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除