自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(43)
  • 收藏
  • 关注

转载 2019.7.16 matlab绘制折线图

转自:https://blog.csdn.net/u012318074/article/details/79894443

2019-07-16 08:54:43 609

原创 2019.6.10 验证码识别

参考:https://github.com/lonnyzhang423/zhihu-captchahttps://github.com/lonnyzhang423/zhihu-captcha

2019-06-10 19:31:25 187

转载 2019.6.6 win10下安装centos双系统

转自:https://blog.csdn.net/qq_36503581/article/details/82286419

2019-06-06 21:51:42 609

原创 2019.6.4 centos下配置hadoop3.1.2教程

转自:https://blog.csdn.net/nenguou04/article/details/88770031

2019-06-04 18:12:45 276

转载 2019.6.3机器学习性能评价指标,混淆矩阵

转自: https://blog.csdn.net/songhao22/article/details/75207707欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。新的改变我们对Markdown编辑器进行了一些功能拓展...

2019-06-03 11:17:37 306

转载 2019.5.1 KNN算法里面的两种求距离的优化结构。

参考自:https://www.zhihu.com/question/30957691?sort=created

2019-06-01 01:55:16 328

转载 2019.5.31 smote插值代码

参考:https://blog.csdn.net/CHIERYU/article/details/86565464

2019-06-01 00:55:17 160

转载 2019.5,31linux系统之启动盘安装centos

转自:https://blog.csdn.net/wang903039690/article/details/81191688

2019-05-31 21:55:00 120

转载 2019.5.28 关于国内sci\ei收录的各大期刊

转载自:http://www.360doc.com/content/08/0305/22/23378_1094857.shtml

2019-05-28 21:56:12 2684

转载 2019.5.28 hadoop分布式集群配置

转载自:https://blog.csdn.net/dream_an/article/details/80258283linux下压缩文件解压(附全格式):https://www.cnblogs.com/wangluochong/p/7194037.html

2019-05-28 14:11:48 91

转载 2019.5.17 关于使用anaconda安装新的python环境

转载至:https://blog.csdn.net/qq_37025885/article/details/79158153

2019-05-17 13:16:23 1262

转载 2019.5.6 分类问题中的各种判别指标

转载自:https://blog.csdn.net/Monk_donot_know/article/details/86614558

2019-05-06 20:04:49 122

原创 关于研究生开题报告的问题

毕业论文的选题以一般遵循小选题、大视野、深挖掘的原则。选题应微观、具体、涉及 的问题应单一。具体参照下面的链接。https://wenku.baidu.com/view/3b2eef7425c52cc58bd6be74.html...

2019-04-20 10:44:30 853

原创 Centos安装JDK和hadoop

centos上面一般会自带jdk,是开源的,我们在安装配置hadoop环境时,需要将自带的jdk删掉。对于hadoop的具体配置,分为集群安装配置与单机模式配置,单机模式配置较集群模式配置有稍许不同,大家在安装配置的过程中可以参考以下链接,写的比较全面,在配置过程中如果遇到问题,可结合单机模式的配置进行校正。(ps:https://www.cnblogs.com/sxdcgaq8080/p/749...

2019-03-25 17:24:37 412

转载 文本挖掘中的文本预处理

转载:https://www.cnblogs.com/pinard/

2019-03-24 15:55:35 322

原创 关于文本分类的应用

转载自:https://zhuanlan.zhihu.com/p/47761862

2019-03-15 17:19:08 2054

原创 卡方分布与卡方检测

转载自:https://blog.csdn.net/dta0502/article/details/82317969上图到底哪个错了?

2019-03-15 16:54:35 314

原创 文本分类中表征特征和选择方法的框架

该框架用来表示特征加权方法和选定的特征集,并探究这些特征如何i影响分类器的性能。该框架选用两个特征集的表征特性来分析对分类器性能的影响程度。它们分别是特征的累积信息增益和所选特征集向量的稀疏表示。需要弄清的两个问题(即如何分析使用该框架对分类器性能的影响):1.满足特征函数N--F(N)的随机生成的特征排序有多接近有给定的加权方案产生的原始特征排列2.与原始排列等级的偏差在何种程度上影...

2019-03-12 17:26:21 627

原创 UDP校验和计算方法

2019-03-06 16:32:00 3331

原创 自然语言处理1

今天遇到一个小问题:我用定义了一个词汇链表,直接用链表进行分片可以,但调用set()函数后返回给你个变量,用这个变量进行分片时就会报错,但我书上的实例却可以输出结果。看到的小伙伴可以解答一下。...

2019-03-06 11:10:18 104

原创 知乎是如何个用户推荐问题的?底层用到的算法是什么?

也是初次学习,以后还会继续增补推荐系统是一种在电商、广告、内容等互联网平台发挥着巨大价值的数据挖掘产品形态。它可以提高用户粘性、提高用户商业转化行为,一款好的推荐系统乐意明显有效的提升平台的经济效益。协同过滤算法:协同过滤算法是一款经典的推荐算法,也是推荐系统入门最好的机器学习算法。协同过滤算法主要可以分为两类:基于用户相似性的UserCF算法以及基于物品相似性的ItemC算法。这两类算法的...

2019-03-04 11:08:45 2516 1

原创 2019.3.2Training Classifiers with Natural Lauguage Explations

看了两天才看完,途中自己做了点笔记,先记录下来,当然还会看第二遍,不足的地方或理解不对的地方再进行填补。一、背景训练精确的分类器需要大量的标签,但单个的标签智能提供有限的信息。二、本文提出的观点:1.一种新的训练分类器框架(模型),该框架中解析器为每一个标签提供自然语言解释。2.提供解释的标签在训练分类器的时候更快。这里提供解释的标签可以与标签函数相联系。3.由于标签函数固有的缺陷。简...

2019-03-03 00:06:05 113

转载 NLP综述

转载自:http://www.360doc.com/content/17/1114/13/5315_703729214.shtml内容较为详细,仅供参考。

2019-03-02 23:41:53 459

原创 论文里面的坑

单纯吐槽一下,现在IEEE上面的论文都灌水莫,今天看了篇文本分类的论文出自 IEEE Seventh International Conference on Intelligent Computing and Information Systems (ICICIS’15) ,(据说还是个国际会议)阅读之前大致看了下论文题目、摘要和结论,感觉还不错,应该具有充实的信息量与科参考价值,结果通篇看了一遍...

2019-02-27 17:22:40 151

原创 计算机视觉与图像处理相关资料

from:https://blog.csdn.net/qq_16481211/article/details/79494660

2019-02-22 09:37:06 120

原创 文本分类github开源项目资源,可以用来练手

https://github.com/gaussic/text-classification-cnn-rnn

2019-02-22 09:36:00 1351

原创 NLP相关文献平台

中国中文信息学会计算语言专业委员会:http://www.cips-cl.org/static/anthology/CCL-2016/CCL2016.html

2019-02-21 14:38:07 234

原创 关于安装tensorflow cpu版

好事多磨,痛并快乐着转载自:https://www.cnblogs.com/lvsling/p/8672404.html

2019-02-20 19:37:58 269

原创 如何在linux下打开pycharm

(1)haitao@ubuntu:~$ cd pycharm-community-2018.3.1/bin(2)haitao@ubuntu:~/pycharm-community-2018.3.1/bin$ sh pycharm.sh &

2018-12-16 20:01:11 8263

原创 四种数据预处理方式的区别?

数据预处理可以提高模型的准确率首先导入numy模块,和画图模块matplotlib使用sklearn模块中的make_blobs手工生成一些数据集本列数据集中的两个特征分别对应于x轴和y轴示例代码以及不同的数据预处理结果如下:import numpy as npimport matplotlib.pyplot as plt#导入数据集生成工具from sklearn.dataset...

2018-12-05 14:16:29 1359

原创 怎么查看隐藏的文件夹

我的电脑——工具——文件夹选项——查看——隐藏文件夹

2018-12-05 11:39:23 905 1

原创 关于图像二值化处理

设原图F,结构元素S:一、腐蚀:用来消除边界点,使边界点向内部收索的过程。可以用来消除小且无意的目标物。F-S(减号写在圈内)步骤:(1)扫描原图,找到第一个像素值为1的点(2)将预先设定好形状以及原点位置的结构元素的原点移动到该点(3)判断给结构元素所覆盖的范围(即S中为1的元素的位置)内的元素值是否全为1,如果是,那么腐蚀后图像相同位置上的像素值置为1,如果至少有一个像素的值为0,...

2018-12-04 21:34:49 989

原创 如何在word文档中的方形框中加入√

插入——符号——其他符号——winding2

2018-12-04 20:41:32 590

原创 IP

IP地址子网掩码都是32位的2进制,通过子网掩码来区分网络位和主机位,子网掩码跟IP地址对应,则子网掩码为1的是网络位,为0的是主机位。例如:192.168.1.123 掩码255.255.255.0 。网络位是192.168.1,主机位是123。需要注意的是ip地址最大数值为255。参考:https://zhidao.baidu.com/question/277650423.html...

2018-11-28 21:25:00 78

转载 2018.11.25损失函数和K-Means聚类算法

from:https://blog.csdn.net/jieming2002/article/details/79226192from:https://blog.csdn.net/itJed/article/details/77916879损失函数:用来度量预测值和真实值之间误差大小的函数K-Means聚类算法:聚类是一种无监督的机器学习任务,它可以自动将数据划分成类cluster。因此聚类...

2018-11-25 12:57:56 3553

原创 移动边缘计算(MEC)

一、MEC概念欧洲电信标准化协会(ETSI)对MEC的定义是:在移动网络的边缘提供IT服务环境和云计算能力。移动边缘计算(MEC)是边缘计算的一种,MEC运行与网络的边缘,逻辑上不依赖于网络的其他部分MEC服务器常具有较高的计算能力,因此特别适合于分析处理大量数据。MEC距离用户或信息源在地里上非常接近,使得网络响应用户的请求的时延大大减小,同时也降低了传输网和核心网部分部分发生网络拥塞的可能...

2018-11-24 19:05:19 9021

原创 如何添加引文标注

在要插入引文标注的地方按ctrl sfift+ +号,或者写好标注序号后选中标注序号按ctrl shift + +号

2018-11-24 19:00:16 3363

原创 2018.11.23神经网络模型复杂度的调节

(1)调整隐藏层的节点数(2)调整应隐藏层的层数(3)调整隐藏单元非线性方法(4)调整alpha值神经=网络模型的调节,尤其是隐藏层的数量和隐藏层中的节点数量,对于初学者来说,一般遵循下面的原则:神经网络中的隐藏层的节点数约等于训练数据集的特征数量,但是一般不要超过500在开训练模型的时候,可以让模型尽可能的复杂,然后再对正则化参数alpha进行调节来提高模型的准确率。...

2018-11-24 18:59:56 826

原创 2018.11.24如何使用python爬取网页内容

1.确定目标网站的user_agent,和需要爬取页面内容的网址,user-agent可以在百度上收索UA查询,即可得到你的用户代理。2.我们爬取下来的页面内容可能含有很多html语言标记,为了让页面更加清晰可读,我们需要将这标记除去,只保留我们需要的文本内容。通常有两种方法:(1)将爬取下来的页面保存为html文件,使用浏览器打开就可以进行阅读(2)使用htm解析器,将页面中的内容抽取出来...

2018-11-24 18:59:44 582

原创 如何在eclipse上安装Tomcat以及如何配置Tomcat运行安卓项目

前提:需要提前将安卓开发环境搭好,即JDK等需要配置好。一、如何在eclipse上安装Tomcat打开eclipse—Window—>pereference-----server----runtimeE nvironment------->点击add选择对应版本的已经安装好的tomcat----next-----设置你的tomcat的安装目录,即你toamcat的存放目录----...

2018-10-14 21:54:05 860

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除