自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 Python存储文件

这篇博客记录本人实验过程中的一些细节,既是对过往总结,也希望能够对别人有所帮助一、存储文件的重要性为什么要在实验过程中存储文件,因为有些算法的内容存在一些重复计算的步骤,这些步骤往往消耗很大一部分时间,在有大量参数的情况时,需要在多次不同参数的情况下重复试验,因此可以考虑将一些不涉及参数运算的部分结果存入文件中,程序运行到需要该结果的时候可以直接调用,不再浪费时间。可以参考一下本人这篇博客里思路PMU算法Python实现二、存储文件的方式python里有多种格式数据和文件,目前机器学习里常用的文

2020-12-01 20:26:27 966

原创 Python实现Feature selection for multi-label classification using multivariate mutual information文章算法

本博客实验代码源自如下文章所提算法思想: LEE J,KIM D W. Feature Selection for Multi-label ClassificationUsing Multivariate Mutual Information. Pattern Recognition Letters,2013,34(3): 349 -357.该算法的核心是下面这个公式:就是通过这个公式可以计算出三元变量的互信息。再通过对高维联合熵进行近似计算,结合前向贪心搜索,过滤出特征子集。由于有大量的重

2020-11-15 22:44:08 931 9

原创 Python实现ReliefF-based Multi-label Feature Selection文章算法

本博客代码基于如下文章算法思想实现:Y.P. Cai, M. Yang, Y. Gao, H.J. Yin, ReliefF-based multi-label feature selection, International Journal of Database Theory and Application. 8 (4) (2015) 307–318.该算法是基于非转化的多标记ReliefF特征选择算法,与传统多标记ReliefF算法的区别在于没有从标记转化的角度去实现特征权值计算,避免了转化损失

2020-11-15 22:15:44 1210 3

原创 Nginx安装、配置流程

目前,网站所采用的的服务器主要有传统的APache和04年发布的Nginx,前者出现时间久,就导致了现在世界上大多数重量型网站采用的都是Apache架构,至于为什么后来又出现了Nginx架构,纯粹因为采用前者的网站已经越来越不适应现在高并发量请求的实际需求了。比较著名的某宝的服务器架构就是基于Nginx魔改的Tengine,你想想如果用Apache部署淘宝服务器,那得需要多少服务器资源才能支撑那么大的运算量需求。现在已经有越来越多的网站采用Nginx架构的服务器,至于为什么还有那么多Apache服务器的网站

2020-10-20 12:30:23 149

原创 个人建站流程

1、购买域名目前国内比较大的域名代理商有很多,我这次选的是阿里云,阿里云域名注册是基于原来万网的基础。地址:[万网域名注册](https://www.hichina.com/)根据需要选择适合自己的地址,可以先注册一年,到期之后选择续费或者暂停购买域名之后需要先实名认证,上传身份证证件照,等待一天左右认证成功2、购买云服务器个人网站不建议用本地服务器部署,虽然需要花钱,但是云上服务器可以时刻运行,并且基础配置十分齐全。本次我买的是阿里云的云服务器ECS,这个是弹性服务,根据个人网站的流量可以选

2020-10-19 15:00:57 348

原创 Python实现基于邻域粗糙集的多标记特征选择算法

算法思想源自论文:段洁、胡清华、张灵均,等. 基于邻域粗糙集的多标记分类特征选择算法 [J]. 计算机研究与发展,2015,52(1):56-65因为没找到Python源代码,所以自己试着写了一下,结果是对应上的。代码分享在这里,需要的自取""" Author: wzk Date: 2020-10-11 theme: 多标记邻域互信息特征选择算法"""from settings.setting import *class ARMLNRS: """

2020-10-12 20:26:52 3019 11

原创 多标签ReliefF算法的Python实现

先声明一下,Python是有第三方ReliefF包的,安装方式直接在pycharm终端输入:pip install ReliefF -i https://pypi.tuna.tsinghua.edu.cn/simple导入方式:from ReliefF import ReliefF但是,这个包有一些问题。首先,只针对单标签且数据类型是离散类型的数据集第二,没有对标签下的每个类别进行计算;第三,它的选取样本的策略是循环全部样本,没有进行随机选取。所以,在这个第三方包的基础上,我对它进行了一

2020-09-16 15:04:28 4235 6

原创 MLKNN算法Python实现

本文所用的代码来自sklearn包里MLKNN类,并修改了最终概率的计算方式,得到了符合预期的结果。您在阅读过程中可以对照一下MLKNN的源码方便理解。MLKNN算法主要用到KNN和贝叶斯估计。在进行未知样本的概率估算的候,需要用到两个已知的概率。1,先验概率,就是训练集中每个标签下标签值为1的概率。2,后验概率,就是计算每个标签集下对于所有样本的K个近邻中出现1的11种可能情况的概率。得到这两个概率计算结果之后,对于测试集中的每个样本,只要知道每个样本的K个近邻的所有标签中出现1的次数,拿对应的标

2020-09-14 22:49:31 2251 4

原创 多标签分类评价指标HL,RL,OE, Cov的计算及Python实现

AP的计算见本人另一篇博客HL,RL, OE, Cov是多标签分类的评价指标,通常越小表明模型越好。一,HL计算公式:大意是,有N个样本的数据集,对每个样本的标签集部分,计算真实标签与预测标签部分有多少个不同的部分,举个栗子:样本1,y_true = [1, 0, 1, 0, 0],y_pred = [0, 1, 1, 0, 0],可以看到它有2个预测出错的部分,记样本1汉明损失为2/5 = 0.4样本2,y_true = [1, 0, 1, 0, 1],y_pred = [1, 1, 0,

2020-05-24 01:59:13 5394 2

原创 连续型数据集互信息的计算

两种方法一、数据集离散化,离散化函数如下:def dataDiscretize(dataSet): m,n = dataSet.shape #获取数据集行列(样本数和特征数) disMat = np.zeros((m, n)) #初始化离散化数据集 num = np.sqrt(m) for i in range(n): #遍历特征列 x = dataSet[:, i] #调用cut函数,将特征离散化为样本的根号类,可根据自己需求

2020-05-23 23:10:29 5189 9

原创 python关于信息增益 信息熵的计算

首先信息熵和信息增益的通俗理解这里不多解释,想了解的看这里:信息增益通俗理解](https://blog.csdn.net/It_BeeCoder/article/details/79554388)设置了两个数组:a = np.array([1,2,3,4,5,6,7,8,9])b = np.array([1,2,3,1,3,1,3,3,2])a是全体样本在某一特征下的取值,b是对应...

2019-12-23 14:52:40 599

原创 python实现svm

首先,声明一下,这篇文章的目的是分享对svm工具箱的使用心得,希望能对小白、新手快速上手svm分类器,并对它有个初步的了解,有助于以后深入的了解。所以,本文使用的svm分类器并不是我自己编写的,使用的也是网上找来的工具。svm下载地址:https://pan.baidu.com/s/189Bc2Kz3-nhJbG1hjFkp5w提取码:6xtp里面包含了几个文件heart_scale是...

2019-12-16 09:56:49 4162 1

原创 VS2017下安装pygame包

在工具->Python环境里:选择概述,打开powershell:将下载好的pygame包安装即可。下载地址:https://www.lfd.uci.edu/~gohlke/pythonlibs/#pygamecp3.7即是python3.7版本,选择对应版本,不然等会安装会出错。安装命令:pip install --user D://文件名称安装完重启vs...

2019-11-14 20:37:51 1560

原创 Hadoop多节点集群安装配置

Hadoop分布式操作系统的安装与配置本次安装的软件版本如下表:用户 IP地址 Linux操作系统 Hadoop版本 Java版本Master 10.1.169.37 CentOS6.7 2.7 1.8.0_211Slave1 10.1.169.38 CentOS6.7 2.7 1.8.0_211Slave2 10.1.169.39 CentOS6.7 2.7 1.8.0_211Sl...

2019-11-13 21:40:15 797

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除