自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 资源 (1)
  • 收藏
  • 关注

原创 pandas某一列中每一行拆分成多行的方法

在处理数据过程中,常会遇到将一条数据拆分成多条,比如一个人的地址信息中,可能有多条地址,既有家庭地址也有工作地址,还有电话信息等等类似的情况,实际使用数据的时候又需要分开处理,这个时候就需要将这一条数据进行拆分成多条,以方便使用。在pandas中如何对DataFrame进行相关操作呢,经查阅相关资料,发现了一个简单的办法,info.drop([‘city’], axis=1).join(inf...

2018-11-29 12:24:11 19604 6

原创 ORACLE数据库两个字段之间进行字符串运算 自定义函数 求交集、并集、差集

问题张三需要给商品打标签,遇到几个问题。每个商品在原来的数据库中已有一部分标签,并且标签都已经汇总成一个字段,需要将新的标签添加到原有的标签。此外,还有一张表,需要每天更新标签,在更新数据库的时候,需要将旧标签剔除,保证这个标签都是新增的。问题分析新旧标签都是字符串,解决上述问题本质上是现在要对新旧标签进行集合运算,问题 1 使用并集,问题 2 使用差集。解决方法现在新旧标签都是字符串无法直接进行集合运算,需要进行一个转化,首先对标签进行拆分,进行一行转多行的操作,之前在Pytho

2021-04-25 17:59:05 1074

原创 Windows下配置 jupyter notebook server服务

在使用jupyter的时候通常需要需要打开一个终端,输入jupyter notebook,才可以运行,稍不注意终端还可能被误关闭,之前执行的结果全部丢失,很不方便,为此想将jupyter注册成一个服务,开机自启动,随时想用打开网址就可以了,不用担心终端被其他人误关了,使用起来非常方便。具体配置过程如下:配置密码在Python中执行,输入密码,生成一个sha开头的加密字符串from no...

2019-01-15 11:44:13 3751

原创 dump、dumps、load、loads的区别

在爬虫或者处理数据的时候经常会遇到json格式的字符串或者是json格式的文件,使用json包来处理相当方便。dump、dumps、load、loads的区别dumps、loads区别dumps和loads它们是一对相反的操作,dumps是一个编码(encoding)的过程,loads是一个解码(decoding)的过程,他们有一个共同点,都是字符串的处理。其中dumps是将json格式的...

2018-11-16 18:20:47 2231

原创 python正则表达式优先级执行顺序

正则表达式计算方式和我们从小学习的算数运算一样,有优先级的概念,如果不知道优先级顺序,很可能出行不是想要的匹配结果,掌握优先级顺序能够避免不必要的错误发生,下面将介绍正则表达式中的优先级顺序: 优先级顺序从上到下 、从左到右依次降低 运算符 功能 \ 转义符 (), (?:), (?=), [] ...

2018-11-15 13:23:57 2598

原创 python 虚拟环境的创建配置使用技巧

安装Python在官网下载Python2.7和Python3都安装到本地,并将Python3加入环境变量,方便后面创建虚拟环境使用Python2,所以一并安装。virtualenv安装pip install virtualenvvirtualenv使用# py2为虚拟环境名virtualenv py2# 为环境指定Python解释器virtualenv -p d:\Anacon...

2018-11-15 11:08:27 258

原创 pandas 中排除某列、某些列的方法

pandas排除某列选择其他列使用pandas处理数据的过程中,时常会遇到这样的需求,不想要某列或者某些列,选择其他列,如果列比较少的情况可以直接选择想要的列如果想要取ABCD四列数据第一种办法直接罗列出需要的列# 导入相关包import numpy as npimport pandas as pd# 创建dataframedf = pd.DataFrame(np.random.r...

2018-09-29 18:10:15 45425 2

原创 python格式化输出

格式化输出方式在Python中主要有2种实现方式:"%"以及format,前者是从C借鉴过来的语法,但是这对于拥有很多先进数据结构的Python来说有点力不从心,Python中的元组、列表、字典等不适合这种结构表示,所以需要更合适的format,它是借鉴C#的语法。以%形式格式化输出格式描述%%百分号标记%c字符及其ASCII码%s字符串%d有符...

2018-09-28 09:18:16 3786 2

2011年美赛优秀论文

优秀数学建模论文2011年美赛,单板滑雪u型池设计论文

2011-08-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除