惜君Iris-CSDN博客

转载联邦学习深度学习对抗攻击

联邦学习本身“联邦学习” 实际上是一种加密的分布式机器学习技术，参与各方可以在不披露底层数据和底层数据的加密（混淆）形态的前提下共建模型。如果机构之间的数据无法互通，一家企业一家机构数据量有限，或者是少数巨头公司垄断大量数据，而小公司很难获得数据，形成大大小小的“数据孤岛”。在这种没有权限获得足够多的用户数据的情况下，各个公司尤其是小公司，如何建模？在这种情况下，“联邦学习”的概...

2019-11-24 16:56:48 4365

转载网络安全中机器学习大合集

目录数据集论文书籍演讲教程课程杂项↑数据集安全相关数据样本集 DARPA 入侵检测数据集 Stratosphere IPS 数据集开放数据集 NSA 的数据捕获 ADFA 入侵检测数据集 NSL-KDD 数据集恶意 URL 数据集多源安全事件数据集恶意软件训练集 KDD Cup 1999 数据集 Web 攻击载荷 WAF 恶意请求...

2019-08-23 13:46:15 614

转载 RNN - 用「动图」解析

RNN本质上是在原有全连接神经网络的基础上，增加了一个时间轴的概念。所带来的影响是：同样的数据，不同的输入顺序，会得到不同的结果。这样的效果天生适合处理跟时间顺序（时序）有关的数据，比如语音、文本、翻译……，其实，随着RNN的发展，某些变种甚至还能巧妙地用在图像处理问题上，达到不输CNN的效果。基于全连接神经网络发展而来的CNN和RNN，我们可以简单的把他俩的长处区分为：CNN能「看...

2019-08-23 13:41:38 1006

对于深度学习而言，训练网络这一过程是相当乏味的，需要不断根据实验结果调整网络结构和模型。相对于随机初始化后调参而言，有没有更加高效的方式呢？答案是肯定的。一些科研人员发现，将其它训练好的模型重新应用于另外一个任务，或者是将相同的网络模型应用于多任务中，模型性能可能会更好。本文将讨论这两种重要方法——迁移学习（Transfer Learning）和多任务学习（Multi-task Learning）...

2019-08-21 16:18:42 1486

转载多任务学习Multitask Learning与其他学习算法之间的关系

单任务与多任务对比如图1所示：多任务学习（Multitask learning）是迁移学习算法的一种，迁移学习之前介绍过。定义一个一个源领域source domain和一个目标领域（target domain），在source domain学习，并把学习到的知识迁移到target domain，提升target domain的学习效果（performance）。多标签学习（Multil...

2019-08-21 15:59:48 610

转载机器学习之安全数据集

简介本文主要收录安全相关的数据集，适合初创，中小型企业用于训练和验证自己的机器学习的模型，提高准确率和准确度。由于数据集可能比较多，一开始也不能全部列举出来，所以后续会慢慢补充，慢慢增加。数据集每个数据集都会有简单的介绍，内容类型，是否特征化以及适用范围网络流量主机行为文件样本KDD 99KDD CUP 99 dataset就是KDD竞赛在1999年举行时采用的...

2019-08-20 21:52:37 1423 6

转载关于KDD99入侵检测数据集的FAQ

1 KDDCup99网络入侵检测数据集介绍该数据集是从一个模拟的美国空军局域网上采集来的9个星期的网络连接数据,分成具有标识的训练数据和未加标识的测试数据。测试数据和训练数据有着不同的概率分布,测试数据包含了一些未出现在训练数据中的攻击类型,这使得入侵检测更具有现实性。在训练数据集中包含了1种正常的标识类型normal和22种训练攻击类型,如表1-1所示。另外有14种攻击仅出现在测试数据集中...

2019-08-20 21:50:20 4552

转载深入理解RNN和LSTM

循环神经网络（Recurrent Neural Network，RNN）　　为什么使用序列模型（sequence model）？标准的全连接神经网络（fully connected neural network）处理序列会有两个问题：1）全连接神经网络输入层和输出层长度固定，而不同序列的输入、输出可能有不同的长度，选择最大长度并对短序列进行填充（pad）不是一种很好的方式；2）全连接神经网络同...

2019-07-08 11:21:12 1497

转载 GMP和NTL库安装教程

1.m4gunzip m4-1.4.2.tar.gztar xf m4-1.4.2.tarcd m4-1.4.2./configuremakemake checksudo make install12345672.gmpsudo apt-get install lziplzip -d gmp-6.1.2.tar.lztar -xvf gmp-6.1.2...

2019-05-10 15:51:57 1784

转载【修改版本】Python调用C函数,cffi (附具体例子)

“C Foreign Function Interface for Python”(cffi)假设存在一个C语言函数，定义在foo.c文件中，这个函数调用了GSL（GNU Scientific Library）里面的Bessel函数。// foo.c#include double foo(double a, double b){ return gsl_sf

2017-11-19 16:47:54 2385

原创 ubuntu/win7 双系统无法启动修复详解

电脑安装win7及ubuntu 16.04 LTS。因为在使用过程中出现问题，特意写博客记录一下解决方案。Note：双系统安装完成后，开始一直是可以正常使用的。1. win7下无法启动ubuntu，在easyBCD软件中删除ubuntu启动项后重启并设置成默认，之后重启。2. 可以正常进入ubuntu系统，软件中心提示更新软件，强迫症手贱点了。。结果显示/boot剩0字

2017-09-03 15:19:33 6521 1

转载 MySQL存储引擎介绍

前言在数据库中存的就是一张张有着千丝万缕关系的表，所以表设计的好坏，将直接影响着整个数据库。而在设计表的时候，我们都会关注一个问题，使用什么存储引擎。等一下，存储引擎？什么是存储引擎？什么是存储引擎？关系数据库表是用于存储和组织信息的数据结构，可以将表理解为由行和列组成的表格，类似于Excel的电子表格的形式。有的表简单，有的表复杂，有的表根本不用来存储任何长期的数据，有的

2017-08-30 22:33:02 356

转载 MySQL索引的创建、删除 index creat/delete

索引是一种特殊的文件(InnoDB数据表上的索引是表空间的一个组成部分)，它们包含着对数据表里所有记录的引用指针。更通俗的说，数据库索引好比是一本书前面的目录，能加快数据库的查询速度。索引分为聚簇索引和非聚簇索引两种，聚簇索引是按照数据存放的物理位置为顺序的，而非聚簇索引就不一样了；聚簇索引能提高多行检索的速度，而非聚簇索引对于单行的检索很快。如：返回某范围内的数据一项。比如您的某个表有一个时间列

2017-08-30 22:26:55 12635

转载 LIBSVM 参数详解

现简单对屏幕回显信息进行说明：#iter为迭代次数，nu 设置nu - SVC、one-class-SVM 与nu - SVR 中参数nu ，默认值0.5，obj为SVM文件转换为的二次规划求解得到的最小值，rho 为判决函数的常数项b，nSV 为支持向量个数，nBSV为边界上的支持向量个数，Total nSV为支持向量总个数

2017-05-23 15:16:39 4235

转载 Python关键字yield把函数变为generator生成器

您可能听说过，带有 yield 的函数在 Python 中被称之为 generator（生成器），何谓 generator ？我们先抛开 generator，以一个常见的编程题目来展示 yield 的概念。如何生成斐波那契數列斐波那契（Fibonacci）數列是一个非常简单的递归数列，除第一个和第二个数外，任意一个数都可由前两个数相加得到。用计算机程序输出斐波那契數列的前

2017-03-11 22:21:53 917

转载 python 集合比较（交集、并集，差集）

python的set和其他语言类似, 是一个无序不重复元素集, 基本功能包括关系测试和消除重复元素. 集合对象还支持union(联合), intersection(交), difference(差)和sysmmetric difference(对称差集)等数学运算. sets 支持 x in set, len(set),和 for x in set。作为一个无序的集合，sets不记录

2017-03-11 21:52:52 658

转载深度学习框架的介绍与比较（Caffe, TensorFlow, MXNet, Torch, Theano）

当前比较主流的5种深度学习框架，包括 Caffe, TensorFlow, MXNet, Torch, Theano，并对这些框架进行分析。首先对这些框架进行总览。库名称开发语言速度灵活性文档适合模型平台上手难易Caff

2016-11-03 16:59:55 1699

转载深度学习历程回顾

重磅！神经网络浅讲：从神经元到深度学习 LinkinPark 2016-01-14 4:24:25 机器学习评论(7)图1 人脑神经网络神经网络是一门重要的机器学习技术。它是目前最为火热的研究方向–深度学习的基础。学习神经网络不仅可以让你掌握一门强大的机器学习方法，同时也可以更好地帮助你理解深度学习技术。本文以一种简单的，循序的方式讲解神经网络。适合对神经网络了解

2016-10-06 14:20:11 2336 1

转载 BGD(Batch Gradient Descent), SGD (Stochastic Gradient Descent), MBGD (Mini-Batch Gradient Descent)

Batch gradient descent: Use all examples in each iteration；　　Stochastic gradient descent: Use 1 example in each iteration；　　Mini-batch gradient descent: Use b examples in each iteration.

2016-10-03 19:47:53 5886

转载如何理解梯度下降？

从一元导数的几何意义理解梯度下降预备知识梯度下降法介绍wiki批量梯度下降法随机梯度下降法导数偏导数方向导数梯度为什么沿着梯度方向，函数值增加最快总结最优化问题及机器学习算法中非常重要的一部分，很多机器学习算法的核心都是在处理最优化问题。梯度下降法（gradient descent）是一种常用的一阶（first-order）优化方法，是求解无约束问题最简单、最经典的方法

2016-10-03 19:42:29 909

转载梯度(Gradient Descent) 方向梯度 (directional derivative) 以及 gradient descent梯度下降算法(1)

引言　机器学习栏目记录我在学习Machine Learning过程的一些心得笔记，涵盖线性回归、逻辑回归、Softmax回归、神经网络和SVM等等，主要学习资料来自网上的免费课程和一些经典书籍，免费课程例如Standford Andrew Ng老师在Coursera的教程以及UFLDL Tutorial，经典书籍例如《统计学习方法》等，同时也参考了大量网上的相关资料（在后面列出）。

2016-10-03 19:09:12 5925

转载深度学习BP算法 BackPropagation以及详细例子解析

反向传播算法是多层神经网络的训练中举足轻重的算法，本文着重讲解方向传播算法的原理和推导过程。因此对于一些基本的神经网络的知识，本文不做介绍。在理解反向传播算法前，先要理解神经网络中的前馈神经网络算法。前馈神经网络如下图，是一个多层神经网络的简单示意图：给定一个前馈神经网络，我们用下面的记号来描述这个网络： L：表示神经网络的层数； nl：表示第l层神经元的个数；

2016-09-29 19:53:50 11481 1

转载深度学习BP算法 BackPropagation

反向传播算法是多层神经网络的训练中举足轻重的算法，本文着重讲解方向传播算法的原理和推导过程。因此对于一些基本的神经网络的知识，本文不做介绍。在理解反向传播算法前，先要理解神经网络中的前馈神经网络算法。前馈神经网络如下图，是一个多层神经网络的简单示意图：给定一个前馈神经网络，我们用下面的记号来描述这个网络： L：表示神经网络的层数； nl：表示第l层神经元的个数；

2016-09-29 19:53:03 669

转载 Hadoop & Spark

大数据（Big Data）大数据，官方定义是指那些数据量特别大、数据类别特别复杂的数据集，这种数据集无法用传统的数据库进行存储，管理和处理。大数据的主要特点为数据量大（Volume），数据类别复杂（Variety），数据处理速度快（Velocity）和数据真实性高（Veracity），合起来被称为4V。大数据中的数据量非常巨大，达到了PB级别。而且这庞大的数

2016-09-26 19:32:20 402

转载线性回归 linear regression 以及 lasso ridge 解析

在知乎问答中，看到一个很好的回答，记录到此篇博文中，以便于后期查找。普通的线性回归的公式是这样的<img src="https://pic1.zhimg.com/55348094cfdfad25e96219b20d310424_b.png" data-rawwidth="1468" data-rawheight="814&

2016-09-01 15:24:21 3034

转载利用LibSVM做回归(regression)/分类（classification）

-s svm类型：SVM设置类型(默认0)　　0 -- C-SVC　　1 --v-SVC　　2 – 一类SVM　　3 -- e -SVR　　4 -- v-SVR　　-t 核函数类型：核函数设置类型(默认2)　　0 – 线性：u'v　　1 – 多项式：(r*u'v + coef0)^degree　　2 – RBF函数：exp(-r|u-v|^2)　　3 –si

2016-08-26 22:26:20 8712 1

转载 matlab ROC曲线(receiver operating characteristic)/AUC

ROC曲线对于0,1两类分类问题,一些分类器得到的结果往往不是0,1这样的标签,如神经网络,得到诸如0.5,0,8这样的分类结果。这时,我们人为取一个阈值,比如0.4,那么小于0.4的为0类,大于等于0.4的为1类,可以得到一个分类结果。同样,这个阈值我们可以取0.1,0.2等等。取不同的阈值,得到的最后的分类情况也就不同。如下面这幅图: 蓝色表示原始为负类分类得到的统计

2016-08-09 14:35:08 2511

转载 ROC AUC详解

ROC（Receiver Operating Characteristic）曲线和AUC常被用来评价一个二值分类器（binary classifier）的优劣，这篇博文简单介绍ROC和AUC的特点，以及更为深入地，讨论如何作出ROC曲线图以及计算AUC。# ROC曲线需要提前说明的是，我们这里只讨论二值分类器。对于分类器，或者说分类算法，评价指标主要有precision，recall，

2016-08-09 13:02:27 613

转载 Matlab 归一化（normalization）/标准化（standarization）

数据规范中的归一化与标准化：A.归一化 vs. 标准化归一化：要把你需要处理的数据经过处理后（通过某种算法）限制在你需要的一定范围内。首先归一化是为了后面数据处理的方便，其次是保正程序运行时收敛加快。一般指将数据限制在[0 1]之间。》把数变为（0,1）之间的数，主要是为了数据处理方便提出来的，把数据映射到0-1之间处理，更便携快速；

2016-08-08 14:51:36 90267 1

转载交叉验证（Cross Validation）

一、训练集 vs. 测试集在模式识别（pattern recognition）与机器学习（machine learning）的相关研究中，经常会将数据集（dataset）分为训练集（training set）跟测试集（testing set）这两个子集，前者用以建立模型（model），后者则用来评估该模型对未知样本进行预测时的精确度，正规的说法是泛化能力（generalization

2016-08-03 20:55:47 539

转载如何在c++中调用java代码

在我们的日常工作中，可能会遇到不同语言之间相互调用的问题，常见的有java调用C/C++或者在C/C++中调用java，我们可以基于sun提供的jni技术来实现这两种语言之间的相互调用，这篇文章来说一下在c++中调用java的情况，至于java如何调用c我会在另外一篇文章中单独讲。 c++调用java其实并不复杂，分为几个步骤：在说调用之前，我们先来看看我们需要调

2016-07-31 23:40:31 869

转载 HElib 库如何使用？加密解密数据

Install (Compilation)Installation/compilation of HElib is quite easy if you get things right. First of all you will need NTL (number theory library). I tried using the default version of NTL for

2016-05-22 17:55:53 6318 7

转载朴素贝叶斯垃圾邮件检测 Naive Bayes Spam detection

目录(?)[-]摘要一认识朴素贝叶斯分类二朴素贝叶斯分类数学原理1贝叶斯定理2朴素贝叶斯分类的概率论原理1 贝叶斯分类概率论描述2 先验条件概率的计算方法3 算法改进三Python实现朴素贝叶斯分类算法四朴素贝叶斯分类用于文本分类1文本分类的两种模型2Python实现1 naviebayes 对象2NavieBayes用于标示垃圾邮件测试Machin

2016-04-27 13:41:25 10076

转载 SVM三层境界

内容很多，参见原文链接 http://blog.csdn.net/macyang/article/details/38782399目录(?)[-] 支持向量机通俗导论理解SVM的三层境界前言第一层了解SVM10什么是支持向量机SVM11线性分类111分类标准1121或-1分类标准的起源logistic回归113形式化标示12线性分类的一个例子13函数间隔

2016-02-22 16:17:41 743

转载 svm小结

SVM最基本的应用是分类。求解最优的分类面，然后用于分类。最优分类面的定义：对于SVM，存在一个分类面，两个点集到此平面的最小距离最大，两个点集中的边缘点到此平面的距离最大。从直观上来看，下图左边的，肯定不是最优分类面；而右边的能让人感觉到其距离更大，使用的支撑点更多，至少使用了三个分类面，应该是最优分类面。那么，是不是一个最优分类面需要两个或三

2016-02-22 15:03:49 4696

转载 Python教程

[-]Python是一门动态语言如何运行PythonPython以缩进来区分语句块操作符注释与文档折行一行写多个语句基本数据类型List和Tuple字符串String字串格式化符Dictionary字典分支语句while循环for语句数组推导函数一些常用的内置函数执行系统命令行命令正则表达式推荐资料重要说明这不是给编程新手准备的教程,如果您入行编程不久,或者

2015-09-17 22:41:04 584

原创 python 如何安装cffi

sudo apt-get install python-pipsudo pip install cffiError:after copying all the .h files to /usr/include/python2.7, it fails with.In this case, try to install python-dev and libffi-dev

2015-09-17 16:31:17 18606

转载 VirtualBox 4.1安裝Ubuntu 12.04

Ubuntu是一個以桌面應用為主的GNU/Linux作業系統，目前最新的版本為12.04版，它是一個開放原始碼、功能強大且免費的作業系統，除了作業系統以外，還有文書資料處理、影像處理、影音播放、燒錄、……等免費軟體，想要了解與體驗這套軟體，可以到官方網站下載光碟映像檔（ISO檔案），將映像檔直接掛載在VirtualBox（關於VirtualBox的安裝詳見：VirtualBox 4.0下載、安

2015-09-17 11:15:06 425

转载 ubuntu系统升级

Ubuntu 13.10桌面版升级步骤：在升级之前对系统进行更新。在升级前，你需要更新系统，打开终端，输入如下命令。sudo apt-get update && sudo apt-get dist-upgrade 现在开始新版本升级。sudo update-manager -d Software Updater（软件更新）打开，开始寻找新的版

2015-09-16 22:25:31 498

转载常用MySQL图形化管理工具

MySQL是一个非常流行的小型关系型数据库管理系统。目前MySQL被广泛地应用在Internet上的中小型网站中。由于其体积小、速度快、总体拥有成本低，尤其是开放源码这一特点，许多中小型网站为了降低网站总体拥有成本而选择了MySQL作为网站数据库。1、phpMyAdmin（http://www.phpmyadmin.net/） phpMyAdmin是最

2015-09-15 11:41:28 615

空空如也

空空如也