自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(28)
  • 资源 (1)
  • 收藏
  • 关注

转载 互联网面试题——海量数据处理

题目问题一:现有海量日志数据,要提取出某日访问百度次数最多的那个IP(可以将题干简化,假设日志中仅包含IP数据,也就是说待处理的文件中包含且仅包含全部的访问IP,但内存空间有限,不能全部加载,假设只有512MB)解决方案:这是一道典型的分治思想的题目,这种问题处理起来套路比较固定,对于大部分的数据量比较大的前提的问题而言,分治都是一个可选的解决方案,但不一定是最优的,解决方法基本划分为三步走:第一...

2018-05-03 14:54:59 1124 1

原创 二叉树的递归与非递归遍历实现(前序、中序、后序)

        二叉树是一种非常重要的数据结构,很多其它数据结构都是基于二叉树的基础演变而来的。对于二叉树,有前序、中序以及后序三种遍历方法。因为树的定义本身就 是递归定义,因此采用递归的方法去实现树的三种遍历不仅容易理解而且代码很简洁。而对于树的遍历若采用非递归的方法,就要采用栈去模拟实现。在三种遍历 中,前序和中序遍历的非递归算法都很容易实现,非递归后序遍历实现起来相对来说要难一点。一.前序遍...

2018-04-26 14:08:45 555

转载 字符串匹配(KMP)

1. 引言        最近在看一些算法,正好碰到了字符串匹配,著名的KMP算法早就听过,但是一直没有太好的理解。正好看到一篇很不错的博文,特地转载过来分享。文章很长,如果大家有耐心都看完,会有收获的。2. 暴力匹配算法    假设现在我们面临这样一个问题:有一个文本串S,和一个模式串P,现在要查找P在S中的位置,怎么查找呢?    如果用暴力匹配的思路,并假设现在文本串S匹配到 i 位置,模式

2018-01-19 14:39:09 570

原创 C++ STL中string用法

标准C++中提供的string类得功能是非常强大的,一般都能满足我们开发项目时使用。现将具体用法的一部分罗列如下:要想使用标准C++中string类,必须要包含#include // 注意是,不是,带.h的是C语言中的头文件using  std::string;using  std::wstring;或using namespace std;下面你就可以使用string

2018-01-16 16:33:13 553

转载 推荐系统中的exploration-exploitation算法

推荐系统里面有两个经典问题:EE和冷启动。前者涉及到平衡准确和多样,后者涉及到产品算法运营等一系列。Bandit算法是一种简单的在线学习算法,常常用于尝试解决这两个问题,本文为你介绍基础的Bandit算法及一系列升级版,以及对推荐系统这两个经典问题的思考。什么是Bandit算法为选择而生我们会遇到很多选择的场景。上哪个大学,学什么专业,去哪家公司,中午吃什么等等。这些事情,都让选择

2018-01-14 14:38:42 3725

原创 c++中set的用法

对于set这个容器,存储的是自动排序的独特元素。也就是说,在这个容器中,所有的元素都是唯一的。set的元素不像map那样可以同时拥有实值(value)和键值(key),set元素的键值就是实值,实值就是键值。set不允许两个元素有相同的键值。所以set可以理解成一个特殊的map,底层跟map一样用的也是红黑树,它的很多成员函数也跟map非常相似。查找效率也和map一样,都是O(log

2018-01-04 00:22:00 966

原创 win10远程桌面连接Ubuntu 16.04图形界面

*******************************************************************************************************帮非计算机专业的同学安了个服务器,Desktop版的ubuntu,还必须用windows连接到图形界面。感觉挺有意思的需求,特地来总结一下做的过程,网上虽然有不少教程,可是好用的不多

2017-12-19 10:14:21 10569 4

原创 最大似然估计(MLE)和最大后验概率(MAP)

最近在研究概率估计,最大似然估计(MLE)和最大后验概率(MAP)都可以用于估计生成样本数据的概率分布。但二者略有区别,进行一下分析:最大似然估计(MLE,Maximum Likelihood Estimation)给定一堆数据,假如我们知道它是从某一种分布中随机取出来的,可是我们并不知道这个分布具体的参数,即“模型已定,参数未知”。例如,我们知道这个分布是正态分布

2017-11-21 21:00:10 4902

原创 贝叶斯分类——贝叶斯网络

在“贝叶斯分类——朴素贝叶斯算法”中,我介绍了朴素贝叶斯分类的相关知识。其中的核心思想是利用变量之间的“朴素”性质,计算出联合概率密度。这依赖于朴素贝叶斯分类的一个限制条件,就是特征属性必须有条件独立或基本独立。但现实中各个特征属性间往往并不条件独立,而是具有较强的相关性,这样就限制了朴素贝叶斯分类的适用范围。贝叶斯分类中有一种应用范围更广的算法——贝叶斯网络(又称贝叶斯信念网络或信念网络)。

2017-11-16 15:06:03 3026

翻译 增强学习(三)——Q-Learning

原文地址:http://mnemstudio.org/path-finding-q-learning-tutorial.htm这篇教程通过简单且易于理解的实例介绍了Q-学习的概念知识,例子描述了一个智能体通过非监督学习的方法对未知的环境进行学习。假设我们的楼层内共有5个房间,房间之间通过一道门相连,正如下图所示。我们将房间编号为房间0到房间4,楼层的外部可以被看作是一间大房间,编号为5。注

2017-11-06 15:38:53 2104

原创 matlab rand函数

作用:产生均匀分布的随机数或矩阵语法:Y = rand(n):  返回一个n x n的随机矩阵。如果n不是数量,则返回错误信息。Y = rand(m,n)    返回一个m x n的随机矩阵。Y = rand([m n])  返回一个m x n的随机矩阵。Y = rand(m,n,p,...)  产生随机数组。Y = rand([m n p...

2017-10-18 20:05:46 6324

原创 使用rand()产生服从高斯/正态分布的随机数

我们借助于rand()去生成高斯/正态分布。当然,rand是伪随机的问题在此先不考虑。(1)用Box-Muller方法,随机抽出两个从均匀分布的数字和。然后那和都是正态分布的。证明可用极坐标,请参考教科书中的Box-Muller方法。C代码:#include #include #define PI 3.141592654double

2017-10-14 00:31:07 20501 2

原创 贝叶斯分类——朴素贝叶斯算法

在机器学习分类算法中,大多数的分类算法,比如决策树,KNN,SVM等,他们都是判别方法,也就是直接学习出特征输出Y和特征X之间的关系,要么是决策函数Y=f(x) ,要么是条件分布P(Y|X)。但是朴素贝叶斯却是生成方法,也就是直接找出特征输出Y和特征X的联合分布P(Y,X),然后用P(Y|X)= P(Y, X) /P(X)得出。朴素贝叶斯很直观,计算量也不大,在很多领域有广泛的应用。

2017-10-11 21:37:13 1153

原创 MacOS中dyld: Library not loaded的错误修正

今天在用mac编译udt代码时,make完之后会产生一个动态库libudt.dylib。但在 Mac 系统中,默认搜索库的路径是 /usr/lib ,并不像 Windows 一样 dll 放在和 exe 同级目录下也会被搜索到。因此会产生dyld: Library not loaded的问题。每一个 dylib 库自身有一个 id 值会告诉可执行文件自己的位置,例如下面是l

2017-10-09 23:44:53 10004

原创 背景建模和前景提取 (2017研究生数模竞赛D题)

下面主要整理一下这次参加“2017中国研究生数学建模”的收获:我们选择的是D题,一道计算机视觉(CV)的题目。题目描述:问题概括为一句话其实就是:在不同的背景条件下的监控视频中提取前景目标。主要分成一下几种情况:问题1:内容为静态背景、摄像头稳定的监控视频。问题2:内容为动态背景、摄像头稳定的监控视频。问题3:内容为摄像头发生晃动或偏移时导致抖动的视频。问题4:针对拍摄角度不同、同时拍摄、拍摄内容为近似同一地点的多个监控视频,考虑到多角度视频的相关性综合提取前景目标。问题5:利用所获取前景目

2017-09-23 22:35:51 14802 63

转载 互联网公司 概率面试题整理

本文总结了面试或笔试中可能考到的概率和组合题。

2017-09-23 12:30:14 30223 4

原创 针对多媒体的拥塞控制实验测试标准

本篇博客主要基于RMCAT的一个测试样例标准(Test Cases for Evaluating RMCAT Proposals)进行总结。

2017-09-08 15:22:28 1257 3

原创 拥塞控制算法之Verus (2015 Sigcomm)

这两天重读了一下2015 Sigcomm的一篇拥塞控制文章: Verus。整理如下:MOTIVATION:Veurs想要解决的问题:在复杂多变的无线网络环境下的拥塞控制。蜂窝无线网络具有难以预测的特性[3][4][5],并且传统的TCP在其中表现并不好[1][2],会造成bufferbloat现象[6][7]。文中指出,对于无线信道的不可预测性,主要由三大特点决定:第一个,

2017-09-04 20:40:52 2072

原创 增强学习(二)——策略迭代与值迭代

本篇博客对“有模型学习”的两种方法进行介绍,分别是策略迭代和值迭代。我们之前已经说到了MDP可以表示成一个元组(X, A, Psa, R),我们对最优策略的求解方法自然也就与这个元组密切相关:如果该过程的四元组均为已知,我们称这样的模型为“模型已知”,对这种已知所有环境因素的学习称为“有模型学习”(model-basedlearning);与之对应的就是“无模型学习”,环境因素机器无法得知的,主要是指状态转移概率Pxa。

2017-08-30 14:34:52 12517 10

转载 一篇与技术无关的,愿自己常记在心的鸡汤

怎样做科研,愿自己常记在心。

2017-08-27 23:39:22 587

原创 2017阿里巴巴校招在线笔试——货架格子编号

最近有些忙,今天才有时间整理一下之前写的第二题代码。第二道题目是菜鸟仓库的货架格子编号问题,题目的意思是货架可以按下面的方式进行编号,求从头数下来第k个货物编号是多少?

2017-08-27 14:06:17 866

转载 Andrew Ng 的 Deep Learning 教程翻译

Andrew Ng教授写的教程确实比较易懂,深入浅出,有理论有例子,个人感觉会比纯理论的书看上去更舒服。索性转载来了我正在看的翻译教程,据说是一群中国人50天翻译出来的,而且放在了Stanford Deep Learning网站上,着实厉害,我辈楷模。

2017-08-26 18:30:34 1169

原创 拥塞控制算法分类

这几天写了一份项目书,正好对之前看过的拥塞控制算法进行了一次整理,主要是从算法机制分析优缺点。我把现有的拥塞控制技术分成了五大类:传统的基于丢包或基于延迟方法,这两个类别是通用的分类,那些比较远古的算法基本上就可以这么二分;基于链路容量预测,基于延迟目标和基于学习或探测的这三类,主要包含了近几年的一些算法,其中延迟目标方法和传统的基于延迟的方法有些类似,但是也有本身的特点,我就单列了。

2017-08-25 12:15:12 5226 2

原创 增强学习(一)——马尔科夫决策过程(MDP)

增强学习(reinforcement learning,RL)是近年来机器学习和智能控制领域的主要方法之一。在增强学习中有三个概念:状态、动作和回报。 “状态(state)”是描述当前情况的。对一个正在学习行走的机器人来说,状态是它的两条腿的位置。对一个围棋程序来说,状态是棋盘上所有棋子的位置。 “动作(action)”是一个智能体在每个状态中可以做的事情。给定一个机器人两条腿的状态或位置,它可以在一定距离内走几步。通常一个智能体只能采取有限或者固定范围内的动作。例如一个机器人的

2017-08-02 18:03:29 4843

原创 Ubuntu下载编译WebRTC项目

这是我半年多前跟的一个小项目了,是为了改webrtc里面的拥塞控制模块做的。       编译过程非常非常折腾,毕竟这是个连官网都需要翻墙上的开源项目。整理了一下自己的编译过程,亲测有效。如果各位看官有需要,可以问我要已经编译好的代码,我之前只做了Windows和Android版的编译,IOS的爱莫能助了。       下文就是针对Android版的代码下载和编译命令。       *

2017-07-31 18:35:47 1164

原创 拥塞控制算法测试——Planetlab平台实验

总结了一下之前做的一个实验测试。       主要围绕Planetlab平台进行,遇到过不少磕磕绊绊的地方,也花了很多时间和精力去解决。下面进行一些总结,如果后期有同道们也接触到这些问题,可以作为参考。Planetlab:1. 简介:       Planetlab是一个分布于全球的计算机群项目,始于2003年,对研究人员而言使用PlanetLab的好处是:他们能够在真实世界条

2017-07-30 12:24:55 3976 73

原创 机器学习常用算法总结

本文主要归纳了一下最近看的关于机器学习的一些资料,算是一个survey,主要关注常用算法,不讲细节,就是一个概述。具体的算法描述我给了几个链接,大家可以参考里面的。        首先,如果从训练方法(主要针对有无lable)上对机器学习算法进行分类,可以分成三大类:监督学习,无监督学习和半监督学习。本文就按照这个分类进行讲解。其实还有一种比较流行的划分方式:监督学习,无监督学习和增强学习(R

2017-07-28 15:09:54 696

原创 拥塞控制算法之Remy (2013 Sigcomm)

最近研究了一下Remy拥塞控制算法,算是在拥塞控制领域第一次采用了机器学习的方式进行速率决策。论文题目:TCP ex Machina: Computer-Generated Congestion Control,传送门:http://nms.csail.mit.edu/papers/sigcomm13.pdf下面直接开始写读书笔记。核心思想:        Remy通过

2017-07-27 14:18:52 3770 7

BGS 背景建模/前景提取 集成软件

对于视频的背景建模/前景提取,集成了BGS库的可视化软件。且可通过xml修改模型参数。

2017-10-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除