自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(55)
  • 资源 (1)
  • 收藏
  • 关注

原创 Excel文件双击两次才能显示内容的解决方案

1、打开注册表编辑器“regedit”;2、定位到如下项目“HKEY_CLASSES_ROOT\Excel.Sheet.12\shell\Open\command”;3、编辑原有的内zhi容,在最后添加"%1"。注意:双引号为其内容,直接复制无需处理如:原为 “C:\Program Files\Microsoft Office\Root\Office16\EXCEL.EXE” /dde则:新为 “C:\Program Files\Microsoft Office\Root\Office16\EXC

2021-08-08 11:15:12 2403

转载 Spring MVC 默认启动页面方式

一.web.xml配置文件(jsp页面可直接被访问)1.在web.xml文件中配置 <welcome-file-list> <welcome-file>login.jsp</welcome-file> </welcome-file-list>二.controller控制器(jsp页面只能被controller访问)1...

2019-10-06 10:45:00 1117

原创 pandas报"The truth value of a Series is ambiguous"错,解决方法

在使用pandas进行数据过滤时报错本实例表中有label一列错误的写法:data[data['label']>18 and data['label']<20]data[data.label>18 and data.label<20]解决方法:data[(data.label>18) & (data.label<20)]...

2019-09-27 16:13:34 2781

原创 ImportError: No module named 'sklearn.cross_validation'问题

(1)from sklearn.cross_validation import train_test_split(2)from sklearn.model_selection import cross_val_score from sklearn.model_selection import train_test_split通常我们会使用方法(1)的方式进行导入sklearn....

2019-09-24 15:05:09 1621

转载 信息(information)、熵(entropy)、信息增益(information gain)、基尼指数(Gini index)的概念

关于对信息、熵、信息增益是信息论里的概念,是对数据处理的量化,这几个概念主要是在决策树里用到的概念,因为在利用特征来分类的时候会对特征选取顺序的选择,这几个概念比较抽象,我也花了好长时间去理解(自己认为的理解),废话不多说,接下来开始对这几个概念解释,防止自己忘记的同时,望对其他人有个借鉴的作用,如有错误还请指出。1、信息这个是熵和信息增益的基础概念,我觉得对于这个概念的理解更应该把他认为...

2019-06-25 21:08:00 5408

转载 TensorFlow遇到的问题汇总(持续更新中......)

1、调用tf.softmax_cross_entropy_with_logits函数出错。#原因是这个函数,不能按以前的方式进行调用了,只能使用命名参数的方式来调用。#原来是这样的: tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(y, y_)) #修改成这样的: tf.reduce_sum(tf.nn.softmax_c...

2019-05-16 17:02:23 366

原创 Python四种读取数据文件的方法

下面介绍读取数据文件的方法:首先说明下数据文件的格式第一行为列名,第一列为编号第一种:手写读取数据 f = file(路径名) x = [] y = [] for i, d in enumerate(f): if i == 0: #跳过第0行的标题 continue d = ...

2019-03-12 16:04:48 24238

原创 Python使用国内豆瓣源安装第三方包

豆瓣源:https://pypi.doubanio.com/simple/例子:         pip3 install -i https://pypi.doubanio.com/simple/ gensim         easy_install -i https://pypi.doubanio.com/simple/ gensim         python3 -m pi...

2019-02-21 18:05:39 2799

原创 pandas——可视化

相关知识绘图方法允许除了默认的线图之外的一些绘图样式,这些方法可以通过plot()的关键字参数kind提供。这些包括:bar 、barh:绘制条形图hist:绘制直方图box:绘制箱型图kde、density:绘制密度图area:面积图scatter:绘制散点图hexbin:棱形图pie:绘制饼图实操1.打开PyCharm,选择Create New Pr...

2019-01-23 10:01:41 274

原创 pandas——字符串处理

相关知识在使用pandas框架的DataFrame的过程中,如果需要处理一些字符串的特性,例如判断某列是否包含一些关键字,某列的字符长度是否小于3等等这种需求,如果掌握str列内置的方法,处理起来会方便很多。实操1.打开终端模拟器,在命令行输入ipython notebook --ip='127.0.0.1',在浏览器中会打开界面,点击New,在其下拉框中选择Pytho...

2019-01-23 09:56:20 1521

原创 pandas——groupby操作

相关知识groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=False)参数说明:by是指分组依据(列表、字典、函数,元组,Series)axis:是作用维度(0为行,1为列)level:根据索引级别分组sort:对groupby分组后新的datafr...

2019-01-23 09:48:43 2011

原创 numpy——linalg线性代数

相关知识numpy.linalg模块包含线性代数的函数。使用这个模块,可以计算逆矩阵、求特征值、解线性方程组以及求解行列式等。NumPy.linalg函数和属性: 实操1.打开终端模拟器,在命令行输入ipython notebook --ip='127.0.0.1',在浏览器中会打开界面,点击New,在其下拉框中选择Python3.2.新建一个ipynb文件,用于编写并...

2019-01-23 09:37:58 1079

原创 numpy——random类

相关知识random中常用函数及其说明:numpy.random.rand(d0, d1, ..., dn):创建一个给定形状的,值从0-1均匀分布中随机抽取的浮点数组,其中d0, d1, ..., dn为数组的维数,若参数为空时,返回一个0到1之间的浮点数。numpy.random.randn(d0, d1, ..., dn):创建一个给定形状的,值从标准正态分布(μ=0,σ=1)中...

2019-01-23 09:34:27 473

转载 Tesseract-OCR安装

1. 安装tesseractOCR,即Optical Character Recognition,光学字符识别,是指通过扫描字符,然后通过其形状将其翻译成电子文本的过程。对于图形验证码来说,它们都是一些不规则的字符,这些字符确实是由字符稍加扭曲变换得到的内容。tesseract下载地址:https://digi.bib.uni-mannheim.de/tess...

2019-01-18 10:39:51 833

原创 pandas-----基本函数

相关知识列转行方法stack函数:pandas.DataFrame.stack(self, level=-1, dropna=True),对于普通的DataFrame而言,直接列索引转换到最内层行索引,生一个Series对象。对于层次化索引的DataFrame而言,可以将指定的索引层转换到行上,默认是将最内层的列索引转换到最内层行。 unstack函数:pandas.DataFrame....

2019-01-14 15:19:28 616

原创 pandas---DataFrame基本操作(二)

相关知识concat合并:pd.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False)  objs: series,dataframe或...

2019-01-14 14:46:24 1698

原创 pandas---DataFrame基本操作(一)

相关知识DataFrame提供的是一个类似表的结构,由多个Series组成,而Series在DataFrame中叫columns。一、查看数据(查看对象的方法对于Series来说同样适用)1.查看DataFrame前xx行或后xx行a=DataFrame(data);a.head(6)表示显示前6行数据,若head()中不带参数则会显示全部数据。a.tail(6)表示显...

2019-01-14 14:27:46 6251

原创 NumPy基本操作(二)

相关知识numpy中的常用函数 1.打开终端模拟器,在命令行输入ipython notebook --ip='127.0.0.1',在浏览器中会打开jupyter notebook界面,点击New,在其下拉框中选择Python3.2.新建一个ipyt文件,用于编写并执行代码。切片与索引numpy提供比常规Python序列更多的索引方法,除了整合和分片,数组可以被...

2019-01-09 17:02:11 350

原创 NumPy基本操作(一)

相关知识NumPy简介NumPy是用Python进行科学计算的基本软件包。它包含以下内容:一个强大的N维数组对象 复杂的(广播)功能 用于集成C/C++和Fortran代码的工具 有用的线性代数,傅里叶变换和随机数能力 用于读写磁盘数据以及操作内存映射文件的工具NumPy是一个用python实现的科学计算包。包括:1、一个强大的N维数组对象Array;2、比较成熟的(广播)函...

2019-01-09 16:46:37 359

原创 Jupyter notebook修改默认启动目录

本文讲述windows下修改Jupyter notebook默认启动目录前提:已经安装jupyter notebook1.在cmd下使用命令jupyter notebook --generate-config来查看你的notebook配置文件在哪里jupyter notebook --generate-config2.根据自己的实际路径进入.jupyter目录3.提前创建...

2018-12-19 21:33:23 333

原创 Python文件操作

1、掌握Python文件操作系统环境Linux Ubuntu 14.04 Python 3.6 Ipython PyCharm本实验共包含open()函数、文件对象操作、文件对象增删改查、fileinput模块、shutil模块实验步骤open()函数:打开文件,返回一个文件对象用法格式:open(name[, mode[, buffering[,encoding]...

2018-12-19 20:03:48 1002

原创 Python常用标准库(二)

系统环境Linux Ubuntu 14.04 Python 3.6 Ipython PyCharm本实验共包含Queue、StringIO、logging、ConfigParser、urllib与urllib2、json、time、datetime等8个标准库实验步骤1.Queue模块:队列,数据存放在内存中,一般用于交换数据。其中常用类为Queue.Queue,它...

2018-12-19 19:39:44 386

原创 Python常用标准库(一)

知识点介绍Python拥有一个强大的标准库。Python语言的核心只包含数字、字符串、列表、字典、文件等常见类型和函数,而由Python标准库提供了系统管理、网络通信、文本处理、数据库接口、图形系统、XML处理等额外的功能。Python标准库的主要功能有:文本处理,包含文本格式化、正则表达式匹配、文本差异计算与合并、Unicode支持,二进制数据处理等功能 文件处理,包含文件操作、创...

2018-12-19 19:07:02 2709

原创 Python将字典中的键值对反转方法

Python将字典中的键值对反转方法有三种:第一种:dict={"a":1,"b":2,"c":3}inverse_dic={}for key,val in dict.items(): inverse_dic[val]=key第二种:dict_list={"a":1,"b":2,"c":3}inverse_dict=dict([val,key] for k

2018-12-19 15:51:36 14524 5

转载 Tensorflow之Summary()用法总结

Tensorboard 作为一款可视化工具,可以说是学习tensorflow时模型训练以及参数可视化的法宝。而在训练过程中,主要用到了tf.summary()的各类方法,能够保存训练过程以及参数分布图并在tensorboard显示。tf.summary有诸多函数:1、tf.summary.scalar用来显示标量信息,其格式为:tf.summary.scalar(tags, ...

2018-12-13 20:13:33 3884

原创 Tensorflow-----常量、占位符、Session

由于刚刚学习Tensorflow,所以对常量、占位符、Session进行讲解#先导入TensorFlow import tensorflow as tf hello_constant = tf.constant('Hello World!') with tf.Session() as sess: output = sess.run(hello_constant) print(...

2018-12-13 16:28:51 170

转载 pycharm设置背景变黑和字体大小

设置背景变黑file-&gt;setting-&gt;appearance&amp;behavior-&gt;appearance-&gt;在theme处选择darcula设置字体大小还是看百度的比较清晰    http://jingyan.baidu.com/article/76a7e409de785efc3a6e1557.html  打开pycharm,点击file-&...

2018-12-11 19:47:52 3096

原创 写入文件中遇到 UnicodeEncodeError: ‘gbk’ codec can’t encode character 错误的解决办法

python将内容写入txt文件时报错UnicodeEncodeError: ‘gbk’ codec can’t encode character错误原因:           网页及python的编码都是utf-8,在写进txt时Windows默认转码成gbk,遇到某些gbk不支持的字符就会报错。在打开文件时就声明编码方式为utf-8就能避免这个错误。解决方法:         ...

2018-12-09 16:27:13 1356

转载 正则表达式讲解

正则表达式入门  正则表达式一直都是我畏惧的知识点,之前也尝试着学习,但最终还是放弃了。由于正则在项目中经常能用的到,所以最近强迫自己花空闲时间学习了些简单的正则知识,并将了解到的知识总结在本文中,希望对大家有所帮助。大家在学习正则的时候不要有畏惧的心理,其实正则入门还是比较容易的。一、简介 正则表达式是由原意文本字符(a,b,c,1,2,3等)和元字符( . * ? 等)组成来匹配指定内容...

2018-11-17 09:59:59 404

原创 Selenium安装+Python测试

本次进行selenium安装并使用python进行测试相关知识Selenium 是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE(7, 8, 9, 10, 11),Mozilla Firefox,Safari,Google Chrome,Opera等。这个工具的主要功能包括:测试与浏览器的兼容性——测试你的应用程序看...

2018-11-16 10:33:40 903

转载 python中lambda讲解

lambda是Python编程语言中使用频率较高的一个关键字。那么,什么是lambda?它有哪些用法?这里,我们通过阅读各方资料,总结了关于Python中的lambda的“一个语法,三个特性,四个用法,一个争论”。一个语法在Python中,lambda的语法是唯一的。其形式如下: lambda argument_list: expression其中,lambda是Pytho...

2018-11-15 20:28:31 563

原创 HBase Shell基本操作

相关知识HBase Shell基本操作命令如表所示:DDL、DML、DCL介绍(这里不全部适用于HBase):DML(data manipulation language):它们是SELECT、UPDATE、INSERT、DELETE,就象它的名字一样,这4条命令是用来对数据库里的数据进行操作的语言DDL(data definition language):DDL比DM...

2018-11-15 16:13:03 286

原创 HBase安装

相关知识HBase是一个分布式的,面向列的开源数据库,该技术来源于Fay Chang所撰写的Google论文”Bigtable:一个结构化数据的分布式存储系统“。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列而不是基于行模式。在需要实时读写、随机访问超大规模数据集时,可以使用HBase。上图描述Hadoop Ecosystem中...

2018-11-15 15:55:21 397

原创 Flume安装部署

相关知识Flume是Cloudera公司的一款高性能、高可用的分布式日志收集系统。Flume的核心是把数据从数据源收集过来再送到目的地。为了保证输送一定成功,在送到目的地之前,会先缓存数据,待数据真正到达目的地后,再删除缓存的数据。Flume传输数据的基本单位是event,如果是文本文件,通常是一行记录,这也是事务的基本单位。Flume运行的核心是Agent。它是一个完整的数据收集...

2018-11-14 20:03:35 460

原创 Sqoop安装

相关知识Sqoop是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(Mysql、Oracle...)间进行数据的传递,可以将一个关系型数据库中的数据导入到Hadoop的HDFS中,也可以将HDFS的数据导入到关系型数据库中。Sqoop可以在HDFS/Hive和关系型数据库之间进行数据的导入导出,其中主要使用了Import和Export这两个工具。Sqoop imp...

2018-11-14 16:38:49 230

转载 Hive基本操作与案例

1. 创建数据库,切换数据库create database testdb2; use testdb2; 技巧:一般将其优化,如果数据库存在,在创建时会报错,所以加上if no exists.create database if not exists testdb2;2. 创建管理表create table emp(empno int,empname string,...

2018-11-14 15:30:28 229

原创 Hive安装部署

相关知识Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的SQL查询功能,可以将SQL语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。Hive构建在基于静态批处理的Hadoop之上,由于Hadoop通常...

2018-11-13 21:50:55 208

原创 Hadoop Shell基本操作

打开终端模拟器,切换到/hadoop/sbin目录下,启动Hadoopcd /hadoop/sbin ./start-all.sh 注:目录根据自己情况在/目录下创建一个test1文件夹hadoop fs -mkdir /test1 在Hadoop中的test1文件夹中创建一个file.txt文件hadoop fs -touchz /test1/file.tx...

2018-11-13 08:38:23 561

原创 Hadoop开发插件安装

相关知识Eclipse 是一个开放源代码的、基于 Java 的可扩展开发平台。就其本身而言,它只是一个框架和一组服务,用于通过插件组件构建开发环境。幸运的是Eclipse 附带了一个标准的插件集,包括 Java 开发工具(Java Development Tools,JDT)。Eclipse的插件机制是轻型软件组件化架构。在客户机平台上,Eclipse使用插件来提供所有的附加功能,例如支持...

2018-11-12 19:20:09 854

原创 Hadoop伪分布模式安装

相关知识Hadoop由Apache基金会开发的分布式系统基础架构,是利用集群对大量数据进行分布式处理和存储的软件框架。用户可以轻松地在Hadoop集群上开发和运行处理海量数据的应用程序。Hadoop有高可靠,高扩展,高效性,高容错等优点。Hadoop 框架最核心的设计就是HDFS和MapReduce。HDFS为海量的数据提供了存储,MapReduce为海量的数据提供了计算。此外,Hadoop还...

2018-11-06 20:08:07 317

C++程序练习

C++程序练习,可以通过练习题目,来加强对C++编程的理解

2018-04-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除