自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 资源 (8)
  • 收藏
  • 关注

原创 网络追踪器介绍

摘要:在2020年6 月 23日的线上苹果开发者大会上,苹果介绍了为 Safari浏览器新引入的隐私报告功能。该功能能够告诉访问的网站上运行的是哪一款网络追踪器,还会给用户一个30天的报告,告知在浏览时发现的、已知的网络追踪器,另外,还会显示出这些追踪器来自哪些网站。那么什么是网络追踪器呢?这些网络追踪器又会对我们的生活产生什么样啊影响呢?下面,我们就跟随本文来了解一下吧。 所谓的网络追踪,是一种用于记住和识别过往网站访问痕迹的技术。到目前为止,网络追踪发展出了三代技术。第一代追踪技术采用...

2020-08-02 14:30:37 7536

原创 如何瓜分会缩水的蛋糕?

设现在有一块蛋糕,其面积为一个单位。博弈双方A,B的规则如下:由A首先提出分蛋糕的方案,B选择接受与否。如果B接受,博弈结束,否则,进入下一轮。下一轮A,B交换操作,即B提方案,A选择接受与否。不接受进入下一轮。以此类推,A,B轮流提议交替进行。但是每一轮提议过后被否决,蛋糕会缩水。即第一轮,你有1个单位蛋糕;第二轮,有1/2个单位蛋糕;第n轮,有1/n单位的蛋糕。那么A,B作为两个...

2020-02-18 20:26:28 1488

原创 MyJupyter,一款支持Python和Java的可移动Jupyter软件包

Jupyter是一个开源的、基于浏览器的强大工具。作为一种虚拟编程语言实验笔记本,它能够研究过程中有效地支持工作流、代码、数据和可视化等功能。它不仅是机器能够识别并执行的而且具有良好的可读性,这对于不同系统间的协同作业和学术交流具有重要意义。通过Jupyter实现的笔记本可以被分享至网络,提供人们交流和学习,因此Jupyter也是使科学更加开放的一种手段。人们可以运用Jupyter进...

2019-12-12 20:13:06 2517 4

原创 关于被3个搞物理的“颠覆”了且数学天才陶哲轩“开始压根不相信”的数学常识的算法实现与理解

近日,网上公布了一篇关于根据子矩阵的特征值求得平方赋范特征向量的一篇文章“Eigenvectors from Eigenvalues”[1]。据网上推文描述,该文章是三位物理学家Peter Denton、Stephen Parke和张西宁在做中微子研究时意外发现的一项成果。该推文名为《3个搞物理的颠覆了数学常识,数学天才陶哲轩:我开始压根不相信》,并于2019.11.15被发布于微...

2019-11-16 19:05:02 2960 1

原创 基于距离积分的交通轨迹聚类算法

为了做好城市规划和交通管理工作,对车辆运动轨迹的分析和研究是必不可少的一项工作。然而,现实中每时每刻都有成千上万的车辆在城市中,短时间内的车辆轨迹采集即可形成大量数据。数据的极度庞大和错综复杂使得人们难以直接通过所采集的轨迹数据获取任何有效信息。而对交通轨迹数据的聚类则可以有效地将数据约简,并从中挖掘出轨迹信息潜藏的规律,为进一步的决策工作提供有价值的参考。为此,本文提出一种实现轨迹聚类的...

2017-12-31 17:00:37 8784 2

原创 差分隐私若干基本知识点介绍(二)

在数周前所发表的博文《差分隐私若干基本知识点介绍(一)》中,介绍了差分隐私中最为常见的拉普拉斯机制以及其与差分隐私之间的关系,并得到了一定的认可。因此,在前文的基础上续写本文,进一步介绍一些与差分隐私相关的基础知识。主要包括拉普拉斯机制的补充内容以及差分隐私的组合原理。相比于前文,本文所介绍的知识在差分隐私研究中处于更重要也更核心的地位,当然同时也更加复杂了一些。为了使读者能够更加清...

2016-06-11 19:57:53 18352 17

原创 差分隐私若干基本知识点介绍(一)

为解决当前信息越来越发达的社会所带来的用户隐私泄露问题,本人所研究的差分隐私模型是一种被广泛认可的严格的隐私保护模型。它通过对数据添加干扰噪声的方式保护所发布数据中潜在的用户隐私信息,从而达到即便攻击者已经掌握了除某一条信息以外的其他信息,该攻击者仍然无法推测出这条信息。因此,这是一种从数据源头彻底切除隐私信息泄露可能性的方法。然而,该模型的最基础来源是基于抽象的数学理论,使得该领...

2016-05-20 20:49:17 38658 17

原创 谱范数的理解与论述

对于任意两点间来说,直线距离最短。而计算两点间距离的公式就是源于众所周知的勾股定理的基础上推导而来的。事实上,不仅对于人们所熟知的二维空间和三维空间如此,对于高维空间亦是如此。在数学上,一般将高维空间的点表示为一个多维向量,而任意一个点到原点的直线距离则称为该点的二范数。对于诸多的计算机或数学相关的应用领域而言,向量的二范数往往都是最为普遍而且重要的概念之一。简而言之,它对于研究者来...

2016-09-25 21:06:09 35591 7

原创 数据库管理工具V1.0

概述 在项目初始阶段,数据库搭建是一件非常重要的工作。然而,常见的数据库管理工具往往都不太友好,自动化程度不够高。对于公司的项目来说,一种较为规范的做法是在每次建立一个数据库表格之前,都需要写明一个与该表格相对应的表格文档用来说明该数据表的具体内容。然后,再由某个人根据文档的内容转化成SQL语句再导入数据库。这样一来,在无形中就增加了不少工作量,同时还增加了许多潜在的出错风险。而且...

2016-07-25 00:23:32 1801

原创 马尔科夫的词性分析三部曲

在自然语言处理(NLP)领域,单词除了其本身的含义可以用来传递信息外,单词的词性属性也包含也包含了非常重要的信息。根据单词的词性,人们可以对文本的单词进行过滤筛选,以筛选掉那些信息含量较少的单词,从而提升处理的文本质量。而如何从文本中有效地甄别每个单词的词性并非是一个简单的问题,原因在于中文单词很多是多词性的,而实际人眼去识别单词词性往往是根据单词的上下文来判断的。但是,如何让机器...

2016-07-08 20:08:12 3598

原创 老板/员工流式并行计算模型

随着大数据时代的到来,人们越来越频繁地需要处理越来越大规模的数据。传统的单线程处理模式已经远远不能满足人们的需要,于是各种分布式计算系统如雨后春笋般不断涌现,其中包括了基于Map-Reduce并行计算的Spark,Hadoop等系统,以及Hdfs,HBase之类的基于分布式存储系统。不过这些系统固然能够处理人们难以想象的海量数据,但由于这类系统考虑了方方面面的繁琐问题,导致这些分布...

2016-06-25 21:15:24 2321

原创 大数据下的多维TopK算法

在数周前所发表的博文《大数据下的TopK算法》中介绍了求解大数据时代中几乎是最为经典的TopK的过程。虽然大数据技术使得大规模数据下的TopK问题得到了有效的解决,但是对于一些该问题的拓展,单单靠大数据技术是无法获得令人满意的解决方案。本文所述的多维数据下的TopK问题就是这一类问题。如果该算法直接采用现有的TopK解决方案,那么一次又一次的运行大数据的过程将会使算法的求解变得令人感...

2016-06-19 11:25:29 2657

原创 基于树状数组的高效轮盘赌算法

在许多经典的遗传算法、蚁群算法的实现过程中,常常需要根据每个对象的生存能力在进行优胜劣汰从而获得尽可能最优的个体。该过程人们一般采用轮盘赌算法来实现。这是一种经典的随机选择算法,在网上只要搜索相关词条就有不少关于该算法的实现。然而,这些算法实现随机选择的过程往往是先生成一个0到1之间的随机值,然后用这个随机值对集合中的对象进行累计遍历,直到选出该随机值对应的对象。显然,该算法在最坏情...

2016-06-03 20:19:10 4261

原创 大数据下的TopK算法

在大数据背景下,TopK问题是一个很常见的问题。常见到这类问题基本在任何从事大数据相关的工作中都会用到。而我以前面试和大数据相关的岗位时也基本每次都会被问及这一问题或者这一问题的简单变种。因此,写本文详细介绍一下在大数据背景下TopK问题的解决方法,供大伙学习学习,尤其是让即将面临找工作面试的同学在面对这类问题时心里有个底。 该问题的求解目标很简单,即从一堆数据中挑出...

2016-05-27 20:30:57 6538

原创 信息增益(互信息)非负性证明

信息增益又称互信息,它是信息论的基本概念之一。同时,它在当今流行的人工智能领域也多有涉及。其中,著名的决策树算法IC3就是以信息增益作为贪心选择的依据。        信息增益的定义如下:                                                                                                

2015-09-11 17:22:14 13703 3

原创 编程之美1.13 威佐夫博奕拓展的分析与论证

在上一篇关于《编程之美》中所涉及的博弈论拓展的文章中,我们就尼姆博弈的两种拓展形式展开讨论,并获得了满意的结果。具体内容请详见本人所写博文《编程之美1.12 尼姆博弈拓展的分析与论证》。尼姆博弈是该文中所提到的三个博弈问题的第一个。而本文将承接上文进一步探讨下一个博弈问题的拓展——威佐夫博奕。威佐夫博奕       威佐夫博奕的问题描述如下:有两堆各若干个物品,两个人轮流从某一堆或同时从两

2015-08-23 17:26:40 906

原创 最小生成树(Prim算法和Kruskal算法)—理解与论证

向世界分享科学之美,让科学流行起来         对于一个给定的连通无向图G=(V,E),其最小生成树被定义如下:取边集E中的子集E‘构成连通树,同时满足,其中表示边(集)的权值。        关于最小生成树的算法,有两个非常经典的算法Prim算法和Kruskal算法。这两种算法非常常见,同时实现也比较简单,具体实现过程可以通过百度等方式轻易获取,这里就不再赘述

2015-08-23 17:16:18 3801

原创 KMP中Next值和NextVal值的定义

在KMP算法中,有两个重要的步骤就是需要对模式串求解其Next数组和NextVal数组。        网络上的文章有许多关于求解这两个数组的文章。然而,绝大多数文章都是告诉你这两个数组是怎么求解的,而且这些文章由于实现的标准不同。对于同样的字符串,他们求解出的Next数组和NextVal数组往往是不相同的,尽管它们都是对的。       这样的文章不仅看起来非常费劲,而且在花了很多功夫看

2015-08-20 13:18:02 3866

原创 编程之美1.12 尼姆博弈拓展的分析与论证

在书籍《编程之美》中,总共讲述了三个关于取石子博弈的问题。书中对这三个博弈问题的本身都有详细的解答。然而,看懂这些解答本身并不是一件难事。我们学知识呢,应该学会举一反三,这样才算是真正掌握了知识,同时也才能真正体会到解决问题的乐趣。本文写作的目的就是从这三个问题出发,然后对一系列与之相关的拓展问题,并给予相应的分析与论证。       与其他类型的问题不同的是,博弈论的问题只要稍做修改,其解答

2015-08-18 19:41:08 1887

原创 编程之美1.13 威佐夫(NIM)博奕(Wythoff Game)涉及的数学定理论证

威佐夫博奕的问题描述如下:有两堆各若干个物品,两个人轮流从某一堆或同时从两堆中取同样多的物品,规定每次至少取一个,多者不限,最后取光者得胜。问给定两堆物品的数量,谁会赢得这个游戏。        这一问题是一个很有趣的问题,而且解法也是十分的巧妙。该题目的解法就是找出奇异局势(即先手必输)。其奇异局势形如:(0,0)、(1,2)、(3,5)、(4,7)、(6,10)、(8,13)、(9,1

2015-08-16 10:11:12 2431 4

原创 《编程之美》1.6 饮料供货——贪心解法证明

向世界分享科学之美,让科学流行起来问题描述:     在微软亚洲研究院上班,大家早上来的第一件事是干啥呢?查看邮件? No, 是去水房拿饮料:酸奶,豆浆,绿茶、王老吉、咖啡、可口可乐……(当然,还是有很多同事把拿饮料当做第二件事)。管理水房的阿姨们每天都会准备很多的饮料给大家,为了提高服务质量,她们会统计大家对每种饮料的满意度。一段时间后,阿姨们已经有了大批的数据。某天早上,当实习生小飞第

2015-08-15 11:37:00 1974 1

MyJupyter1.0-win64(下卷)

MyJupyter是一款支持Python和Java的可移动Jupyter软件包。放在U盘里可以轻松实现即插即用,简单快捷的软件开发。 本软件分为2个分卷压缩包,本资源是其中的下卷。请下载时确保压缩包每个分卷都有下载才能解压。 软件解压密码及详细信息请参见博文: https://blog.csdn.net/MathThinker/article/details/103515424

2019-12-12

MyJupyter1.0-win64(上卷)

MyJupyter是一款支持Python和Java的可移动Jupyter软件包。放在U盘里可以轻松实现即插即用,简单快捷的软件开发。 本软件分为2个分卷压缩包,本资源是其中的上卷。请下载时确保压缩包每个分卷都有下载才能解压。 软件解压密码及详细信息请参见博文: https://blog.csdn.net/MathThinker/article/details/103515424

2019-12-12

遗传算法Demo

matlab开发的遗传算法Demo案例。是初学者学习使用遗传算法的首选

2018-05-07

基于遗传算法任务调度算法

该算法为matlab程序,他通过遗传算法实现了工件设计的任务调度。运行main.m即可看到结果。在运行前,请记得将gatbx-toolbox导入path中!

2018-05-07

EOF分析算法

经验正交函数分析方法(empirical orthogonal function, 缩写为EOF),也称特征 向量分析(eigenvector analysis)。是一种分析矩阵数据中的结构特征,提取主要数据特征量的一种方法。Lorenz在1950年代首次将其引入气象和气候研究,现在在地学及其他学科中得到了非常广泛的应用

2018-04-24

基于离散Hopfield的高校科研能力评价

这是在matlab上的基于离散Hopfield的高校科研能力评价。直接运行main.m即可看到每个高校对每项科研能力的统计图

2018-04-24

乳腺肿瘤诊断的LVQ神经网络的分类

基于matlab的乳腺肿瘤诊断的LVQ神经网络的分类算法。资源中包含了主要数据,算法实现以及交叉验证。直接运行.m文件即可看到效果。效果是根据data中的乳腺的特征判断是否为乳腺肿瘤。交叉验证后效果还行

2018-04-24

基于神经网络的网络入侵分析算法

该资料基于matlab实现了基于神经网络的网络入侵分析算法。压缩包里包含了程序和数据,直接运行其中的.m文件就可以看到结果。

2018-04-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除