自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 收藏
  • 关注

原创 等级保护2.0-大数据安全要求梳理

一、等级保护2.0简介等级保护2.0的相关国标包括:GB/T 22239-2019 信息安全技术 网络安全等级保护基本要求GB/T 25070-2019 信息安全技术 网络安全等级保护安全设计技术要求GB/T 37973-2019 信息安全技术 大数据安全管理指南GB/T 37988-2019 信息安全技术 数据安全能力成熟度模型其中,等级保护2.0特指22239。22239对各种应用形态提出了不同的要求,包括通用、云计算应用、移动应用、物联网应用、工业控制系统应用。从低到高分别为一

2020-05-24 09:35:14 12470

原创 python networkx库学习、使用笔记

项目中用到了networkx库,这个库实现了图论里面很多经典的算法,包括最短路径算法,有向图的最长路径算法。import networkx as nx # 导入networkx库然后我们自定义一个图:图中每个键对应的值存储的是该节点的父节点列表和子节点列表graph_dict = {1: [[], [2, 3, 5]], 2: [[1], [4]], 3: [[1], [4]]...

2019-01-16 15:53:27 1607

原创 C++的输入输出实践

最近很多笔试涉及字符串的输入输出,如果输入输出都搞不定,即使写出了算法也没法AC。为了使自己在这方面更加熟练,进行了实践。C++中iostream里面最常用的就是cin和cout了,即输入输出流。cin>>tmp;的意思是将控制台输入的值存入变量tmp中,但是对于不同场合意义不一样。如果tmp是个整型,那么直接存入即可,但如果是字符串,就不一样了。其实cin>>...

2018-09-13 10:25:33 319

原创 C++ string类实践

自定义了一个MyString类:涉及到了一个类最基本的构造函数、析构函数、深拷贝,内存管理等问题。头文件:#ifndef MYSTRING_H#define MYSTRING_H#include <iostream>#include <string.h>using namespace std;class MyString{public:    fr...

2018-09-12 12:52:29 242

原创 新闻网站开发之MySQL数据库 Server has gone away问题

之前遇到过新闻网站过了几天打不开的情形,查日志发现了错误码是MySQL Server has gone away,最后定位到数据库连接的时间到期问题。其中wait_timeout就是数据库连接的超时时间,单位为秒,28800秒即八小时。为了便于观察,先将其值改小,改成10smysql> set global wait_timeout=10;mysql> show glo...

2018-09-10 10:00:00 344

原创 栈排序,队列排序

同学给我出了一个栈排序的题,意思给一个包含无序数的栈,让输出一个顺序排列的栈。直接排序是不可能的,栈只能在一端进行操作。因此需要借助辅助栈。思路是将原栈s的数据压入辅助栈s2,辅助栈用于保存最终结果。辅助栈中的元素是有序的。压栈过程需要比较两个栈栈顶元素大小关系。如果s栈顶小于s2的栈顶元素,则需要找到s2的栈中第一个大于s1栈顶的元素,然后将s2中的元素出栈到s中。最后将s一开始的那...

2018-08-31 10:39:28 2623

原创 C/C++回调函数学习笔记

之前做过的新闻网站的项目用到了回调函数,那里的主要的应用是线程回调函数,线程的目的就是要取任务队列中的任务进行处理。先往pthread_create函数的第三个参数传入一个函数指针,往第四个参数传入该函数的参数。其实这个传入的函数指针指向的函数就是个回调函数。回调函数的本质就是在提前安排好将来发生的事情,并在合适的时机做相应的事情。也就是说,我们提前将函数执行的逻辑写好,一旦将来满足某种条件,...

2018-08-29 16:22:46 289

原创 C程序调用python程序

最近跟同学一起做后台的项目,用的c语言。由于要用到python下的算法库,因此学习了在c程序中如何调用python程序。由于后台的环境用到了多线程,因此需要考虑多线程环境下的c调用python。在多线程环境下调用python库,需要按照如下步骤:在主线程中:1、初始化python,允许支持多线程。2、python扩展初始化3、释放线程全局锁在子线程中:4、设置GIL(python特有的全局解释锁)...

2018-05-21 16:29:44 14721 2

原创 基于scipy的层次聚类探究

最近又要开始做聚类了,之前做过的层次聚类的方法是用sklearn下的聚类,但是存在一定的缺陷:库并没有给我们提供足够的函数去评价聚类效果,如果想要对层次聚类树自定义损失函数,那么我们就需要剖析整棵层次聚类树了。在这样的背景下,我仔细研究了scipy下的层次聚类的API函数,并运用到了实际项目中。我们分两种情况来进行讨论:1、给定了距离矩阵,2、没给定距离矩阵1、给定了距离矩阵:我们可以基于距离矩阵...

2018-04-08 13:51:57 2377 6

原创 C++标准模板库学习笔记之序列容器(deque、list)

deque是双端队列,可以在头部或者尾部高效的进行添加和删除对象。书上给出的应用场景是数据库事务和超市结账等情形。今天刚好看了数据库的事务处理,后面有空再写。deque<int> deq;//空的双端队列deque<int> deq(10);//包含十个元素为0的双端队列deque<int> deq{1,2,3,4,5};//带初始化元素的双端队列deque有拷...

2018-04-07 20:41:35 210

原创 计算机操作系统学习笔记

本科期间学过操作系统,但仅仅是停留在课堂和考试上的学习,课后并没有系统学习过,更不能说深入了解原理了。现在重新收拾心情,以一种全新的姿态学习这门计算机的基础课程。学习教材是《计算机操作系统》第三版操作系统基本特征一、并发性两个概念:并发与并行。并发指的是在一段时间内发生了两个或者多个事件。并行指的是同一时刻发生了两个或者多个事件。对于多处理机系统,可以实现并行。而对于单处理机系统,同一时刻只有一个...

2018-04-06 16:16:43 3687

原创 C++标准模板库学习笔记之序列容器(vector、array)

序列容器以线性序列的方式存储元素。五种标准的序列容器:array<T,N>,vector<T>,deque<T>,list<T>,forward_list<T>。Arrayarray<T, N>是一个有N个T类元素的序列,类似于数组。既然是数组,那么它没法增加和删除元素,在定义的时候就指定了类型和大小。初始化:  例子:arr...

2018-04-02 16:19:20 283

原创 TCP/IP协议簇学习之TCP连接

TCP连接主要包括三个方面的内容:连接建立,数据传输和连接终止。连接建立连接建立的过程采用三次握手。1,客户端发送一个包含SYN字段的报文段给服务器,该报文段的序号为随机值,假设为8000;2,服务器收到SYN报文段以后,产生一个随机值,假设为15000,将序号填入报文段中,同时在ACK字段中填入客户端期待收到的下一个序号,即8001,同时设置接收窗口大小,将此报文段发送给客户端;3,客户端收到服...

2018-04-02 13:57:13 128

原创 TCP/IP协议族学习笔记之流量控制

网络传输中的两个很现实的问题:发送方的发送速率和接收方的接受速率如果不匹配将导致问题:如果发送方的发送速率大于接收方的接受速率,那么接收方将来不及接受数据,从而导致数据丢失。如果发送方的发送速率小于接收方的接受速率,那么接收方需要等待发送方的数据,从而导致接收方性能降低。流量控制针对的是第一个问题,即如何避免因接收方速率小于发送方而导致的数据丢失。消息的推模式与拉模式推模式指的是无论消耗方是否请求...

2018-03-31 16:41:46 1114

原创 C++语言中的外部变量引用和char[],char*的若干问题探究

今天复习了一下C++的知识点,发现了一些有疑问的地方,查看了一些资料,得到一些结论,记录下来。1,如果在一个工程目录下,存在多个头文件,这些头文件里面是否可以包含相同的变量名呢?思考:头文件给我们的信息其实就是接口信息,我们调用一个头文件其实就是调用跟它相关的源文件,源文件一般要封装起来,因此,我们只能通过头文件调用这个api接口。那么同一个工程下的两个头文件里面如果都包含了头文件,编译器会认为有...

2018-03-17 00:20:43 2446 1

原创 python若干问题总结

今天重新看了一下python的一些知识点,发现有很多遗漏点。可变类型与不可变类型:可变类型指的是值可以改变的类型,例如列表,字典不可变类型指的是值不可改变的类型,例如数值类型int, long, bool, float,字符串str,元组这里的不可变指的是不能通过其它变量来改变当前变量的值。而可变可以通过其它变量来改变当前变量的值。例如:a = 1b = a    # b用a初始化,此时b,a的内...

2018-03-07 19:34:54 187

原创 python下word2vec词向量训练与加载方法

项目中要对短文本进行相似度估计,word2vec是一个很火的工具。本文就word2vec的训练以及加载进行了总结。word2vec的原理就不描述了,word2vec词向量工具是由google开发的,输入为文本文档,输出为基于这个文本文档的语料库训练得到的词向量模型。通过该模型可以对单词的相似度进行量化分析。word2vec的训练方法有2种,一种是通过word2vec的官方手段,在linux环境下编...

2018-01-03 15:14:15 28024 7

原创 python下mongodb基本用法

python下mongodb的基本用法:(假设已安装好pymongo包)使用mongobooster工具创建一个本地的用户localhost。创建好用户以后会自动生成一个local数据库点击connect点击create输入名字点击save&connect如果需要密码,则然后在python的IDE环境下对数据库进行操作:实例化一个MongoClient对象:host = "mongodb://12

2018-01-02 14:48:23 679

原创 python使用总结

本文就项目当中经常用到的python进行总结。enumerate: 对可迭代对象进行迭代,同时将对下标进行迭代for i, val in enumerate(words):    print i, val,extend:对列表进行扩充a = [1,2,3] b = [3,4,5] a.extend(b) # [1,2,3,4,5,6]词频统计:i

2017-12-31 10:49:59 300

原创 基于scikit-learn层次聚类方法

之前写过基于scipy库的层次聚类的博客,前段时间一直在用scikit-learn(sklearn)库的聚类包做层次聚类。下面就sklearn下的层次聚类问题展开描述。sklearn库下的层次聚类是在sklearn.cluster的 AgglomerativeClustering中,AgglomerativeClustering类的构造函数的参数有簇的个数n_clusters,连接方法linkag...

2017-12-31 09:54:20 9945 8

原创 点球大战中的概率问题

本人是个足球迷,从06年世界杯开始看球,09年开始彻底爱上足球。关注五大联赛,欧洲冠军联赛等众多国际赛事。在足球的赛事中,在我看来,最让人刺激的就是终场前的绝杀了,除此之外,就是点球大战了。一直对点球大战中先手后手获胜的概率比较好奇,因此,闲暇时对该问题进行了研究。在这里,我们的前提条件是假设进球概率为p,暂不考虑其他因素,考虑球员踢球这一事件为一次独立实验。那么我们对这个问题建立概率模型,就是做...

2017-09-20 23:22:40 7477

原创 基于scipy层次聚类的python实现

前段时间的项目中碰到一个分层聚类问题,任务是对语料库中的高频词汇进行分层聚类并刻画分类结果中的簇内的层次关系。第一想法是到网上去搜搜看看有没有什么好用的库。看了sklearn上的层次聚类的库函数,尼玛居然要我指定簇的个数,层次聚类的特点就是无需指定簇的个数嘛!逗我?之后发现scipy下的cluster.hierarchy可以做层次聚类。开干!单词的描述用的是word2vec词向量,挺火的一个工具,...

2017-09-19 22:42:59 4086 2

原创 python列表嵌套

最近在做分层聚类,聚类结果可以通过scipy的分层聚类包得到。分层聚类的思想就是不断融合两个“距离最近”的簇,直到不满足用户划定的融合阈值为止。这样,最终将得到一棵二叉树。每个叶子结点对应到原始数据集中的每个观测点。每个簇中的簇我是知道的,但是内部的组织关系不知道。我要做的就是对每个簇的二叉子树的组织结构进行描述。聚类的结果为各个簇的元素,而且各个簇的父节点也可以得到。我现在要把每个簇的聚类过程描...

2017-09-15 10:50:26 2325

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除