自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Asia-Lee

交流学习资料共享欢迎入群:955817470(群一),801295159(群二)

  • 博客(133)
  • 资源 (27)
  • 收藏
  • 关注

原创 FFmpeg视频处理

FFmpeg视频处理,包括视频抽帧、视频转码、视频裁剪和格式转换等操作

2023-02-13 19:47:08 1813 1

原创 Docker常用命令使用总结

Docker常用命令使用总结

2022-09-14 16:22:30 2375

原创 产品经理基础

一、产品经理行业认知产品是企业的核心,而产品经理则是一个产品的灵魂,一个团队的核心。随着互联网时代的发展,产品能力正变得越来越重要,它不再是某一个岗位的专有技能,而是每个互联网人都应该掌握的底层能力。如何树立清晰的产品思维,建立产品大局观,如何正确理解用户需求,打造用户喜爱的产品,是每个产品经理、技术、运营都应该重视且需要提升的要点。二、市场与竞品的机会分析1、市场调研及分析精细化的市场调研的四个步骤:市场预调研及反馈、...

2021-09-06 16:00:10 3251

原创 网络视频存储

目录一、视频存储容量计算方法二、存储设备采用的RAID技术三、硬盘及接口类型四、存储阵列类型一、视频存储容量计算方法NVR根据规格的不同,有2盘位、4盘位、8盘位、16盘位及24盘位的产品,一个盘位可以安装一块硬盘,目前硬盘的容量在6TB左右,24盘位总容量达到了144T的空间。单块硬盘容量:10TB、12TB、16TB。数据单位之间的关系:1MB=1024KB;1GB=1024MB;1TB=1024GB;1PB=1024GB;1EB=1024PB;1ZB=1024EB .

2021-05-23 20:34:24 1000 4

原创 视频监控对接GB/T28181国标平台

目录一、NVR对接GB/T28181国标平台1、判断监控设备(NVR)是否支持接入国标平台2、监控设备通过国标协议接入视频融合平台流程3、通过视频专网接入平台的网络拓扑4、通过公网接入平台的网络拓扑5、监控设备接入国标平台的配置6、监控设备接入国标平台案例二、国标ID生成规则介绍1、详细编码规则2、行业编码规范一、NVR对接GB/T28181国标平台平安城市工程、天网工程、雪亮工程、明厨亮灶、智慧工地、智慧园区、平安乡村等监控工程,会通过标准协议接口纳入各地的

2021-02-23 23:16:26 21839 1

原创 智能安防及视频监控系统

目录一、智能安防系统1、智能安防系统介绍2、安防系统相关工程二、视频监控系统1、视频监控系统分类2、视频监控系统组成3、视频监控系统的作用4、硬盘录像机NVR的基本功能5、硬盘录像机NVR设备结构6、视频监控设备主要厂商一、智能安防系统1、智能安防系统介绍安全防范系统成为了智慧城市与物联网行业应用中的一个非常重要的子系统。安防系统主要包括:视频监控系统、入侵报警系统、出入口控制系统、电子巡查系统以及智能停车场管理系统等5个子系统。AI人工智

2021-02-23 22:47:00 21875 4

原创 项目的容器化部署

目录一、项目的容器化部署过程二、使用Git将本地代码推送到远程仓库一、项目的容器化部署过程1、通过Docker Hub 查找项目所需镜像的相应版本,并拉取镜像Docker Hub,由于网络原因,我们在pull Image 的时候,从Docker Hub上下载会很慢,所以我们可以使用国内的镜像(mirror)仓库2、使用 docker run 命令运行镜像,生成容器3、使用 docker cp 命令将项目代码放入容器中4、进入容器配置项目代码的运行环境,如果项目代码是由pyth

2021-01-10 11:43:55 1725

原创 NLP中文句子类型判别和分类实现

目录一、中文句子类型主要类别1、陈述句(statement)2、特殊句(special)3、疑问句(question)二、中文句子类型简单分析三、将句法分析与正则结合标注句子类型四、句子类型调研及规则总结五、中文句子类型分类工具sentypes实现一、中文句子类型主要类别1、陈述句(statement)主语为首(subject_front),例:大家对这...

2020-12-16 09:04:51 14729 12

原创 图像处理基础操作三(图像直方图、傅里叶变换)

一、图像直方图1、直方图灰度直方图(histogram)是灰度级的函数,描述的是图像中每种灰度级像素的个数,反映图像中每种灰度出现的频率。横坐标是灰度级,纵坐标是灰度级出现的频率。直方图是对图像的中的像素点的值进行统计,一般情况下直方图都是灰度图像,直方图x轴是灰度值(一般0~255),y轴就是图像中每一个灰度级对应的像素点的个数,即横坐标表示图像中各个像素点的灰度级,纵坐标表示具有该灰度级的像素个数。matplotlib绘制直方图#encoding:utf-8import cv2

2020-11-10 11:26:19 3063 1

原创 图像处理基础操作二(边缘检测、轮廓检测、光流估计)

一、边缘检测边缘检测通常是在保留原有图像属性的情况下,对图像数据规模进行缩减,提取图像边缘轮廓的处理方式。边缘检测算法主要是基于图像强度的一阶和二阶导数,但导数通常对噪声很敏感,因此需要采用滤波器来过滤噪声,并调用图像增强或阈值化算法进行处理,最后再进行边缘检测。1、Roberts算子Roberts算子又称为交叉微分算法,它是基于交叉差分的梯度算法,通过局部差分计算检测边缘线条。常用来处理具有陡峭的低噪声图像,当图像边缘接近于正45度或负45度时,该算法处理效果更理想。其缺点是对边缘的定位不太准

2020-11-09 10:01:35 7227

原创 图像处理基础操作一(几何变换、平滑处理、形态学操作)

一、图像基础图像处理:对输入的图像做某种变换,输出仍然是图像,基本不涉及或者很少涉及图像内容的分析。比较典型的有图像变换,图像增强,图像去噪,图像压缩,图像恢复,二值图像处理等等。基于阈值的图像分割也属于图像处理的范畴。一般处理的是单幅图像。图像分析:对图像的内容进行分析,提取有意义的特征,以便于后续的处理。处理的仍然是单幅图像。计算机视觉:对图像分析得到的特征进行分析,提取场景的语义表示,让计算机具有人眼和人脑的能力。这时处理的是多幅图像或者序列图像,当然也包括部分单幅图像。图像都是由像素

2020-11-06 16:23:09 19114 3

原创 基于Flask进行接口开发及测试

一、环境准备1、FlaskFlask 是一个微型的 Python 开发的 Web 框架,基于WerkzeugWSGI工具箱和Jinja2模板引擎。 Flask使用BSD授权。 Flask也被称为“microframework”,因为它使用简单的核心,用extension增加其他功能。Flask没有默认使用的数据库、窗体验证工具。然而,Flask保留了扩增的弹性,可以用Flask-extension加入这些功能:ORM、窗体验证工具、文件上传、各种开放式身份验证技术。Flask学习参考:Fla..

2020-10-27 15:21:19 4012

原创 k8s常用命令使用总结

k8s常用命令使用总结及nvidia-smi命令

2020-10-26 17:23:49 6209 1

原创 基于Darknet的YOLOv4目标检测

一、基于Windows的YOLOv4目标检测1、环境配置环境准备:Win10、CUDA10.1、cuDNN7.65、Visual Studio 2019、OpenCV 3.4(1)Visual Studio2019企业版安装(2)NVIDIA驱动下载与安装(3)下载并安装CUDA10.1,下载安装cuDNN7.65对于cudnn直接将其解开压缩包,然后需要将bin,include,lib中的文件复制粘贴到cuda的文件夹下,比如:C:\Program Files\NVIDIA GPU

2020-09-14 21:43:03 9313 23

原创 NVD软件漏洞数据处理及分类方法总结

目录一、前言二、软件漏洞数据分析三、软件漏洞分类实验流程四、软件漏洞文本预处理五、软件漏洞文本表示方法六、软件漏洞分类模型构建七、软件漏洞分类实验结果与分析八、总结一、前言本人研究生期间的研究主方向为:网络空间安全方向,基于研究方向做过入侵检测实验、软件缺陷分类实验、软件安全漏洞分类管理实验等,网络安全方向相关数据集可参看个人总结:网络安全相关数据集介绍与下...

2020-07-16 20:53:13 5396 7

原创 2020算法笔试题总结

题目一:找出符合条件的字符串组合1、题目描述某公司经理希望在圣诞节期间通过出售组合装来提高公司商品的销售量。组合装里有不同种类的商品,以不同顺序排列。每个商品都有唯一的characterID。而每个组合装也有唯一的comboID,由组合装中各种商品的排列顺序表示。组合装的comboID是通过将组合装中商品的characterID按其在组合装中的排列顺序形成的。例如,如果购买了ID为a、a、...

2020-06-19 14:49:41 2719 3

原创 Python3读取和写入excel表格数据

目录一、python读取excel表格数据1、读取excel表格数据常用操作2、xlrd模块的主要操作3、读取单元格内容为日期时间的方式4、 读取合并单元格的数据二、python写入excel表格数据1、写入excel表格数据常用操作和格式设置2、字体颜色和背景颜色对应索引号python操作excel主要用到xlrd和 xlwt 这两个库,xlrd读取exc...

2020-04-13 21:04:15 34379 9

原创 PyTorch图像分类

目录一、torch和torchvision1、torchvision.datasets2、torchvision.models3、torchvision.transforms4、torchvision.utils二、MNIST手写数字识别1、获取MNIST训练集和测试集2、数据装载3、数据预览4、构建卷积神经网络模型5、对模型进行训练和参数优化6、对...

2020-01-15 11:50:58 11722 5

原创 PyTorch基础学习总结

目录一、PyTorch中的Tensor张量1、Tensor张量2、Tensor数据类型3、Tensor常用函数二、基于PyTorch搭建简易神经网络模型1、简易神经网络模型2、Pytorch自动梯度3、使用自动梯度和自定义函数搭建简易神经网络模型三、torch.nn和torch.optim1、使用torch.nn搭建神经网络模型2、使用torch.opt...

2020-01-14 21:38:12 3222 1

原创 Linux环境下的C++编程基础

目录一、工具准备二、程序的编译及调试1、程序的编译及常用命令2、gdb调试三、Makefile文件基础1、Makefile介绍2、Makefile编写3、make的运行和退出一、工具准备gcc是GNU的C编译器(GNU C Compiler)g++是GNU的C++编译器(GNU C++ Compiler)gdb是Linux下常用的调试工具,主要功能如...

2019-12-07 22:21:16 1659 1

原创 C++正则表达式regex库使用方法总结

目录一、regex库中常用组件介绍二、regex库中常用组件使用1、regex库组件使用准备2、regex_match使用3、regex_search使用4、regex_replace使用5、sregex_iterator使用三、基于regex库组件构建自己的正则接口类1、C++正则表达式接口类设计2、C++正则表达式接口类使用四、部分语法规则介绍正...

2019-12-07 22:09:44 32593 4

原创 Linux系统编程常用命令总结

目录一、Linux常用命令1、常用工具2、目录和文件命令3、安装和卸载软件命令4、压缩包管理5、文件属性、用户用户组及查找与检索命令6、网络管理命令7、其他命令二、Linux vi/vim常用命令三、Linux下软件源更新失败问题解决一、Linux常用命令1、常用工具(1)Xshell:XShell是一个模块化模拟器,因为它提供了许多下拉选项卡。...

2019-12-03 21:47:18 28004 30

原创 Python3网络爬虫——(5)Scrapy爬虫基础

目录1、Scrapy常用命令行2、Scrapy爬取内容3、Scrapy数据提取4、Scrapy爬取中国大陆明星5、12306火车站站名爬取1、Scrapy常用命令行 scrapy startproject QuotesSpider #创建项目 scrapy crawl XX #运行XX蜘蛛 sc...

2019-11-27 21:49:02 1623 3

原创 Bert文本分类(基于keras-bert实现)

目录一、Bert 预训练模型准备二、Bert 模型文本分类1、数据准备2、代码实现3、分类过程与结果一、Bert 预训练模型准备中文预训练模型下载 当Bert遇上Keras:这可能是Bert最简单的打开姿势 keras-bert不同模型的性能对比如下(可根据自己的数据选择合适的模型,模型越大需要训练的时间越长)模型 开发集 测试集...

2019-10-27 17:53:59 37170 66

原创 中文句法分析及LTP使用

目录一、中文句法分析内容概述二、基于Python的LTP句法分析1、LTP基础2、pyltp安装3、pyltp实现句法分析三、基于C++的LTP句法分析1、LTP源码和模型2、LTP的C++源码编译及测试3、在Linux下使用动态库生成可执行程序4、 构建基于LTP的句法分析类Parsing5、使用Parsing类实现句法分析四、LTP标注集参考...

2019-10-24 08:59:30 24116 4

原创 Linux环境下编译TensorFlow C++ API和测试方法总结(完美版)

目录前言1、软件下载2、不同平台版本对应要求3、环境配置4、配置TensorFlow安装选项5、使用bazel进行编译生成动态库6、编译其他依赖7、测试一:简单测试编译好的TensorFlow C++ API8、测试二:Tensorflow C++ API调用Python预训练模型前言TensorFlow C++ API的编译是线上使用TensorFlo...

2019-09-20 19:58:21 13684 11

原创 NLP词向量和句向量方法总结及实现

目录一、Word2Vec1、Word2Vec介绍2、Gensim实现Word2Vec3、基于Word2Vec的句向量4、基于加权Word2Vec的句向量5、基于Word2Vec的文本向量化实现二、GloVe1、GloVe介绍2、基于源码的GloVe词向量生成(Linux下实现)3、Gensim加载GloVe训练的词向量三、Doc2Vec1、Doc2V...

2019-08-29 22:33:02 29491 16

原创 基于树模型的lightGBM文本分类

目录1、基于TF的关键词提取2、根据词频将文本转化为向量3、基于树模型的重要特征选择5、完整代码实现6、分类结果1、基于TF的关键词提取使用TF词频对训练集clean_data_train进行关键词提取,选取topK个关键词作为特征词,即topK=10000。# 训练集中词频统计,并计算TF值def words_tf(): train_data = pd...

2019-08-28 21:42:42 4461 5

原创 算法岗面试知识点总结

目录一、机器学习知识点二、深度学习知识点一、机器学习知识点1、交叉熵公式,逻辑回归(LR)公式,逻辑回归损失函数,SVM的损失函数2、逻辑回归(LR)和线性回归的区别线性回归用来做预测,LR用来做分类;线性回归是来拟合函数,LR是来预测函数;线性回归用最小二乘法来计算参数,LR用最大似然估计来计算参数;线性回归更容易受到异常值的影响,而LR对异常值有较好的稳定性。3、支...

2019-08-05 21:10:10 3060 3

原创 字符串自动校对——2019字节跳动笔试题目

字符串自动校对(修正拼写错误字符串)题目描述:(1)三个同样的字母连在一起,一定是拼写错误,去掉一个就好了,比如:helllo->hello;(2)两对一样的字母(AABB型)连在一起,一定是拼写错误,去掉第二对的一个字母就好了:比如:helloo->hello;(3)上面的规则优先“从左到右匹配”,即如果是AABBCC,虽然AABB和BBCC都是错误拼写,应该优先考虑修复AABB...

2019-08-04 20:04:28 5257

原创 NLP句子相似性方法总结及实现

目录1、基于Word2Vec的余弦相似度2、TextRank算法中的句子相似性3、莱文斯坦距离(编辑距离)4、莱文斯坦比5、汉明距离6、Jaro距离(Jaro Distance)7、Jaro-Winkler距离(Jaro-WinklerDistance)8、基于Doc2Vec的句子相似度计算1、基于Word2Vec的余弦相似度首先对句子分词,使用Gensi...

2019-07-31 22:57:37 10637 5

原创 NLP关键词提取方法总结及实现

目录一、关键词提取概述二、TF-IDF关键词提取算法及实现三、TextRank关键词提取算法实现四、LDA主题模型关键词提取算法及实现五、Word2Vec词聚类的关键词提取算法及实现六、信息增益关键词提取算法及实现七、互信息关键词提取算法及实现八、卡方检验关键词提取算法及实现九、基于树模型的关键词提取算法及实现十、总结一、关键词提取概述关键词是能够表...

2019-07-23 21:09:41 91955 4

原创 TextRank算法介绍及实现

目录1、PageRank算法2、TextRank算法(1)关键词抽取(keyword extraction)(2)关键短语抽取(keyphrase extration)(3)关键句抽取(sentence extraction)3、TextRank算法实现(1)基于Textrank4zh的TextRank算法实现(2)基于jieba的TextRank算法实现(3)...

2019-07-22 21:57:51 62220 9

原创 NLP数据增强方法总结及实现

目录1、数据增强2、简单数据增强(Easy Data Augmentation,EDA)(1)EDA方法(2)EDA工具使用方法(3)EDA相关工具3、回译4、基于上下文的数据增强方法5、数据增强的作用1、数据增强数据增强是扩充数据样本规模的一种有效地方法,数据的规模越大、质量越高越好,模型才能够有着更好的泛化能力。2、简单数据增强(Easy Data ...

2019-07-16 21:19:00 12825 1

原创 XGBoost与LightGBM文本分类

目录用户评论情感极性判别一、数据准备二、数据预处理三、文本特征提取四、将数据转换为DMatrix类型五、构建XGBoost模型1、XGBoost模型主要参数(1)通用参数(2)Booster参数(3)学习目标参数2、XGBoost模型(1)基于XGBoost原生接口的分类(2)基于Scikit-learn接口的分类六、使用XGBoost做预测...

2019-07-06 13:00:56 10359 9

原创 中文自然语言预处理总结

目录中文文本预处理总结1、文本数据准备2、全角与半角的转化3、文本中大写数字转化为小写数字4、文本中大写字母转化为小写字母5、文本中的表情符号去除(只保留中英文和数字)6、去除文本中所有的字符(只保留中文)7、中文文本分词8、繁体中文与简体中文转换9、中文文本停用词过滤10、将清洗后的数据写入CSV文件中文文本预处理总结1、文本数据准备(1)...

2019-06-29 22:26:15 9372 1

原创 Python3对多股票的投资组合进行分析

目录概述:一、股票数据准备1、股票选择2、获取每支股票的收盘价3、计算股票的日收益率二、投资组合的收益计算1、给定权重的投资组合2、等权重的投资组合3、市值加权的投资组合三、投资组合的相关性分析1、投资组合的相关矩阵2、投资组合的协方差矩阵3、投资组合的标准差四、探索股票的最优投资组合1、使用蒙特卡洛模拟Markowitz模型2、投资...

2019-04-21 10:45:27 57152 32

原创 LSTM对股票的收益进行预测(Keras实现)

目录一、概述:二、股票数据准备三、股票数据预处理1、数据特征归一化(标准化)2、将数据集转化为有监督学习问题四、股票数据划分为训练集和测试集五、模型构建及其预测1、搭建LSTM模型并绘制损失图2、预测并反转数据(反归一化)3、绘制模型预测结果图六、模型评估一、概述:传统的线性模型难以解决多变量或多输入问题,而神经网络如LSTM则擅长于处理多个变量...

2019-04-19 10:45:22 62339 47

原创 Python3对股票的收益和风险进行分析

目录一、股票收益率1、股票的日收益率(1)计算股票的日收益率(2)绘制股票的日收益率的时间序列图(3)日收益率均值计算(4)日收益率的数据分布(5)累计日收益率计算2、股票的平均年化收益率二、股票的风险性衡量1、极差、四分位差、平均差、方差、标准差和离散系数计算2、偏度3、峰度(1)峰度的计算(2)峰度与正态分布的绘图比较4、日收益率分布...

2019-04-19 10:41:55 23007 6

原创 Python3对股票数据进行分析

目录一、量化交易概述1、量化交易(投资方法)2、算法交易(自动交易、黑盒交易或机器交易)3、量化策略4、量化选股5、股票回测二、股票数据三、股票数据分析1、导入股票时间序列数据2、绘制股票成交量的时间序列图3、绘制股票收盘价和成交量的时间序列图3、绘制K线图(蜡烛图)(1)K线图理论(2)K线图绘制4、股票指标相关性分析(1)相关关系...

2019-04-19 10:40:17 108483 35

ClassProjectCity-C++实现课程设计源码资源.zip

1、内容概要:本资源主要是使用C++实现课程设计作业,City.cpp源码实现了课程作业的所有要求,供学生学习使用。 2、源码主要实现内容:(1)用名称、人口、海拔高度、天气、年份等数据成员建立一个名为City的类。建立一个产生City对象的类。(2)将产生的City对象(数量大于200个)填充至一个容器,容器的类型自选。(3)对于City对象的具体属性值通过创建发生器来生成。生成规则如下:年份为2006年;名称由4-8个英文小写字符随机构成;人口在范围[100000,10000000)内随机选取;海拔高度在范围[0,4000)米内随机选取;上述三值均不可重复;天气在枚举常量表中{Rainy,Snowy,Cloudy,Sunny}随机选取(1年天气取12个值,即每月一个值)。(4)容器填充完毕后,将其内容写入一个名为City.txt的文件。

2022-04-20

项目实战-朴素贝叶斯算法实现新闻分类源码及数据集.zip

1、内容概要:本资源主要基朴素贝叶斯算法实现新闻分类,适用于初学者学习文本分类使用。 2、新闻分类源码实现过程:将数据集划分为训练集和测试集;使用jieba模块进行分词,词频统计,停用词过滤,文本特征提取,将文本数据向量化,使用朴素贝叶斯算法进行分类。 3、主要内容:搜狗新闻数据集SogouC,标签包括财经、IT、健康、体育、旅游、教育、招聘、文化和军事;停用词文件stopwords_cn.txt;Naive_Bay.py 朴素贝叶斯算法实现源码;News_NB.py新闻分类实现源码。

2022-04-17

项目实战-朴素贝叶斯算法实现垃圾邮件过滤源码及数据集.zip

1、内容概要:本资源主要基朴素贝叶斯算法实现垃圾邮件过滤分类,适用于初学者学习文本分类使用。 2、主要内容:邮件数据集email,email文件夹下有两个文件夹ham和spam,其中ham文件夹下的txt文件为正常邮件,spam文件下的txt文件为垃圾邮件;停用词文件stopwords_cn.txt;Naive_Bay.py 朴素贝叶斯算法实现源码;Email_NB.py垃圾邮件分类实现源码。

2022-04-17

项目实战-KNN算法实现手写数字识别源码及数据集.zip

1、内容概要:本资源主要基于KNN算法实现手写数字识别,适用于初学者学习机器学习KNN算法使用。 2、主要内容:训练集trainingDigits;手写数字识别测试集testDigits;KNN算法实现手写数字识别源代码KNN_digits.py。

2022-04-17

项目实战-KNN算法改进约会网站的配对效果源码及数据集.zip

1、内容概要:本资源主要基于KNN算法改进约会网站的配对效果,适用于初学者学习机器学习KNN算法使用。 2、主要内容:训练集datingTestSet.txt;测试集datingTestSet2.txt;源代码KNN.py

2022-04-17

Linux环境下编译的TensorFlow C++ API动态库文件.7z

1、TensorFlow C++ API的编译是线上使用TensorFlow C++ API调用预先训练好的模型完成预测项目的必经之路,但是TensorFlow C++ API的编译并不是这么顺利,期间遇到了很多错误,它对版本要求非常严格,版本不对应会出现很多问题,尤其protobuf是最重要的一个。本资源是TensorFlow C++ API顺利编译和测试的过程,为线上使用TensorFlow C++ API的使用打下基础 2、Linux环境下编译TensorFlow C++ API生成的动态链接库:libtensorflow_cc.so,libtensorflow_framework.so。

2022-04-16

CNNVD 软件安全漏洞数据集.zip

1、CNNVD是中国国家信息安全漏洞数据库。 2、软件漏洞数据包括1999年以前的漏洞数据-2018年的漏洞数据。 3、漏洞数据存储格式为xml,供软件安全研究人员研究使用。

2022-04-16

NVD 软件安全漏洞数据集.zip

1、NVD是美国国家计算机通用漏洞数据库(National Vulnerability Database,NVD)。 2、漏洞数据包括2002年-2019年的漏洞数据(总共5万多条漏洞,23个漏洞类型)。 3、漏洞数据存储格式为xml,供软件安全研究人员基于该数据集分析研究使用。

2022-04-16

NASA MDP 软件缺陷数据集.zip

1、NASA MDP 软件缺陷数据集介绍:软件缺陷预测研究中心广泛应用NASA公布的NASA IV&V Facility Metrics Data Program(MDP)数据集。 MDP包括 13个不同的数据集,这些数据均来自NASA 的13个实际软件项目,由最常见的开发语言编写。每个数据集包含来自不同软件项目的若干模块,规模从 125个模块到 17186 个模块不等。各个数据集由LOC、McCabe、Halstead等几类度量元属性和是否包含缺陷的类别标记(defective)组成。MDP数据集所提供的记录,一行代表一个模块,每个字段对应一个属性。 2、NASA MDP 数据集是软件缺陷预测使用的数据集; 3、该数据集是向官方索取的,包含13个数据集文件,用于实验研究; 4、数据集文件格式是arff格式。

2022-04-16

UNSW-NB15 入侵检测数据集.zip

UNSW_NB15入侵检测数据集,相比于KDD99和NSL KDD数据集更适合相关研究人员用于入侵检测系统的研究。

2022-04-16

NSL-KDD 入侵检测数据集.zip

NSL-KDD数据集是KDD99数据集的改进,可以作为有效地基准数据集,各机器学习算法可以在NSL-KDD数据集上进行入侵检测实验。 NSL-KDD数据集是KDD 99数据集的改进: 1、NSL-KDD数据集的训练集中不包含冗余记录,所以分类器不会偏向更频繁的记录; 2、NSL-KDD数据集的测试集中没有重复的记录,使得检测率更为准确。 3、来自每个难度级别组的所选记录的数量与原始KDD数据集中的记录的百分比成反比。结果,不同机器学习方法的分类率在更宽的范围内变化,这使得对不同学习技术的准确评估更有效。 4、训练和测试中的记录数量设置是合理的,这使得在整套实验上运行实验成本低廉而无需随机选择一小部分。因此,不同研究工作的评估结果将是一致的和可比较的。

2022-04-16

KDD99入侵检测数据预处理和分类源代码及数据集.zip

1、内容概要:本资源主要基于Python实现kdd99入侵检测数据集预处理,搭建DNN和CNN神经网络实现kdd99入侵检测分类,适用于初学者学习入侵检测分类使用。 2、入侵检测数据集: 该数据集是从一个模拟的美国空军局域网上采集来的9个星期的网络连接数据,分成具有标识的训练数据和未加标识的测试数据。KDD99数据集总共由500万条记录构成,它还提供一个10%的训练子集kddcup.data_10_percent_corrected和测试子集corrected。 3、源代码Handle_data.py是kdd99数据集预处理源代码,kddcup.data_10_percent_corrected.xls是预处理后的数据集。 4、源代码:Kdd_dnn.py是基于DNN神经网络对入侵检测数据集进行分类;kdd_cnn.py是基于CNN神经网络对入侵检测数据集进行分类。

2022-04-16

XGBoost与LightGBM文本分类源代码及数据集.zip

1、内容概要:本资源主要基于XGBoost与LightGBM实现文本分类,适用于初学者学习文本分类使用。 2、数据集为电商真实商品评论数据,主要包括训练集data_train,测试集data_test ,经过预处理的训练集clean_data_train,训练好的word2vec词向量模型w2v_model.pkl和中文停用词表stopwords.txt,可用于模型训练和测试,详细数据集介绍见商品评论情感数据说明文档。 3、源代码:word2vec_analysis.py 是基于Word2Vec进行词向量的生成,采用向量平均求得句向量,然后分别构建RandomForest和GBDT分类模型进行文本分类。 4、源代码:xgboost_model.py是基于xgboost模型对文本进行分类。 5、源代码:lightGBM_model.py是基于lightGBM模型对文本进行分类。

2022-04-16

中文句子类型分类工具及数据集.zip

1、内容概要:本资源主要包括中文句子类型分类工具sentypes_v1.2及数据集 2、句子类型判别工具sentypes_v1.2的句子优先级为:正反问句,反问句,选择问句,疑问词问句,是非问句;祈使句,把字句,被子句,比较句,存在句,是字句,连字句;陈述句;其他句子。 3、sentypes_v1.2 工具包含五个命令参数,分别是输入文件、输出文件、分词模型(cws.model)、词性标注模型(pos.model)和句法分析模型(parser.model)。

2022-04-09

项目实战-Bert文本分类(keras-bert实现)源代码及数据集.zip

1、内容概要:本资源主要基于bert(keras)实现文本分类,适用于初学者学习文本分类使用。 2、数据集为电商真实商品评论数据,主要包括训练集data_train,测试集data_test ,经过预处理的训练集clean_data_train和中文停用词表stopwords.txt,可用于模型训练和测试,详细数据集介绍见商品评论情感数据说明文档。 3、源代码:word2vec_analysis.py 是基于Word2Vec进行词向量的生成,采用向量平均求得句向量,然后分别构建RandomForest和GBDT分类模型进行文本分类。 4、源代码:bert_model.py是基于keras-bert构建Bert模型对文本进行分类。

2022-04-09

项目实战-TextCNN文本分类(keras实现)源代码及数据集.zip

1、内容概要:本资源主要基于TextCNN(keras)实现文本分类,适用于初学者学习文本分类使用。 2、数据集为电商真实商品评论数据,主要包括训练集data_train,测试集data_test ,经过预处理的训练集clean_data_train和中文停用词表stopwords.txt,可用于模型训练和测试,详细数据集介绍见商品评论情感数据说明文档。 3、源代码:word2vec_analysis.py 是基于Word2Vec进行词向量的生成,采用向量平均求得句向量,然后分别构建RandomForest和GBDT分类模型进行文本分类。 4、源代码:textcnn_model.py是基于Keras构建CNN、TextCNN卷积神经网络模型对文本进行分类。

2022-04-09

项目实战-中文商品评论情感分析源代码及数据集.zip

1、内容概要:资源主要包括:中文商品评论情感判别源代码和数据集。中文情感分析 商品(书籍、酒店、计算机、牛奶、手机、热水器)评论数据包括pos积极评论数据和neg消极评论数据。源代码svm_w2v_model.py 是基于Word2vec生成词向量,求平均获得句向量,构建SVM模型完成文本评论情感预测。 2、本资源适用于初学者学习文本分类使用,主要包括数据预处理、机器学习、文件的读取和写入等。

2022-04-09

项目实战-英文文本分类电影评论情感判别源码及数据集

1、内容概要:资源主要包括:英文文本分类电影评论情感判别源码及数据集等文件。 标注的训练集:labeledTrainData.tsv;测试集:testData.tsv;没有标签的额外训练集:unlabeledTrainData.tsv;停用词过滤表:stopwords.txt;源代码:movie_reviews_analysis.py 2、本资源适用于初学者学习文本分类使用,主要包括数据预处理、机器学习、文件的读取和写入等。

2022-04-09

LSTM实现对股票数据进行预测(Keras实现)源代码及数据集

1、内容概要:本资源将初步探究 LSTM 在股票市场的应用。通过使用LSTM对股票收益的预测,可以了解到:(1)如何将原始数据集转换为可用于时间序列预测的数据。(2)如何准备数据并使LSTM适合多变量时间序列预测问题。(3)如何进行预测并将结果重新调整回原始数据。 2、本资源适用于对量化交易感兴趣的学生学习实验参考使用。 3、资源内容主要包括:股票数据(20支).rar,LSTM实现对股票数据进行预测(Keras实现)源代码lstm_model.py(源码以600000.SH股票数据为基准进行分析,以2016年3月1日至2017年12月31日为回测期,进行收益率的预测模拟),2016年3月至2017年12月的股票回测模型损失和RMSE计算数据excel。

2022-04-09

Python3对股票数据进行分析源代码和股票数据集

1、内容概要:本资源主要包括Python3对股票数据进行分析源代码、Python3对股票的收益和风险分析源代码、Python3对多股票的投资组合进行分析源代码、北京某投资管理有限公司20支真实股票数据、20支股票整体绘图分析结果展示等。 2、本资源适用于对量化交易感兴趣的学生学习实验参考使用。 3、量化交易是以先进的数学模型替代人为的主观判断,利用计算机技术从庞大的历史数据中海选能带来超额收益的多种“大概率”事件以制定策略,极大地减少了投资者情绪波动的影响,避免在市场极度狂热或悲观的情况下作出非理性的投资决策。本资源仅供学习使用,不可作为真实场景模拟操作。 4、源代码主要包括:股票的开盘价、最高价、最低价、收盘价、成交量、市值、换手率、pe、pb等指标分析,绘制K线图、股票指标相关性分析、移动平均线、股票收益率分析、风险性衡量、投资组合等。

2022-04-09

社交网络影响力最大化(Python实现)及Wiki-Vote数据集

1、内容概要:社交网络影响力最大化(Python实现)及Wiki-Vote数据集。(1)线性阈值模型(LT模型)代码实现(代码有详细注释);(2)LT模型改进算法-贪心算法代码实现(代码有详细注释); 2、源代码适用于学生或研究者等人,该研究方向的学生可以对源代码及相关论文进行学习实验。 3、影响力最大化的应用场景十分丰富,包括病毒营销,推荐系统,信息扩散,时间探测,专家发现,链接预测等。 4、主要文件有:BAcreate.py,linear_threshold.py,linear_threshold_clime.py,LT_improve.py,test_linear_threshold.py,test_linear_threshold_clime.py,Wiki-Vote.txt。

2022-04-08

截止到2020全国飞机场名字和火车站名字汇总.7z

截止到2020全国飞机场名字和火车站名字汇总

2020-01-10

pyltp_wheel安装包.7z

哈工大自然语言处理ltp在windows10下的安装使用,两个文件针对不同的python版本下载一个即可pyltp-0.2.1-cp35-cp35m-win_amd64.whl和pyltp-0.2.1-cp36-cp36m-win_amd64.whl

2019-11-27

IEEE Access 论文模板下载

IEEE Access 论文模板下载 IEEE Access 论文模板包括word模板和Latex模板下载

2019-01-09

CNN卷积神经网络实现Mnist手写数字识别数据集

1、Mnist_cnn.py 该脚本文件 用TensorFlow框架 实现CNN卷积神经网络处理Mnist手写数字识别数据集,准确率达到99.21%; 2、Mnist_cnn_tensorboard.py 该脚本文件在Mnist_cnn.py的基础上实现可视化。

2018-05-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除