2 MHyourh

尚未进行身份认证

人生苦短

等级
TA的排名 1k+

Python数据分析 清洗常用4板斧

这是Python数据分析实战基础的第三篇内容,主要对前两篇进行补充,把实际数据清洗场景下常用但零散的方法,按增、删、查、分四板斧的逻辑进行归类,以减少记忆成本,提升学习和使用效率。首先,导入案例数据集。因为案例数据存放在同一个Excel表的不同Sheet下,我们需要指定sheetname分别读取:下面开始清洗的正餐。01增——拓展数据维度1.1纵向合并这三个sheet的数据,维度完...

2019-10-15 15:30:53

Python爬虫|你真的会写爬虫吗?

1写在前面的话咱们直接进入今天的主题—你真的会写爬虫吗?为啥标题是这样,因为我们日常写小爬虫都是一个py文件加上几个请求,但是如果你去写一个正式的项目时,你必须考虑到很多种情况,所以我们需要把这些功能全部模块化,这样也使我们的爬虫更加的健全。2基础爬虫的架构以及运行流程首先,给大家来讲讲基础爬虫的架构到底是啥样子的?JAP君给大家画了张粗糙的图:从图上可以看到,整个基础爬虫架构分为5...

2019-10-15 15:07:48

Python: "压平"多重嵌套的list

问题描述对于一个多重嵌套的list,如:a=['this','is',['a',['sample','of',['nested','lists'],','],'enjoy',['it','and'],'have'],'fun']如何将其中的嵌套去除,变成一个普通的list?如:a=['this','is','a'...

2019-10-15 15:01:30

Python连接数据库不会?这几行代码帮你轻松搞定!

前言大家好我是凡猫学院的一名学员,之前在23期基础就业班,现在已经工作一年了,最近一个月才开始学习、摸索高阶自动化测试,所以如果有错误还请大家多多的批评指正。有的同学刚到新公司可能不太熟悉数据库的使用,我在这边举一个银行项目实例。首先要等业务逻辑熟悉后,验证银行项目的数据正不正确,就需要连接数据库去查看,从数据库中获取相应的用户信息,才能查到银行账户的流水,才能去对比数据同事提供的客户信息。其...

2019-10-15 14:54:25

Python GUI开发,效率提升10倍的方法!

1框架简介这个框架的名字叫PySimpleGUI,它完全基于Python语言,能非常方便地开发GUI界面,代码量相比现有框架减少50%到90%。并且,它提供了极为友好的Python风格的接口,大大提升开发效率。PySimpleGUI主要特点包括:创建的界面窗口和使用的控件同之前的tkinter,Qt,WxPython和Remi一致.所写代码相比之前减少50%到90%...

2019-10-15 14:43:28

python特性几则

近日闲暇翻看十一前购得的一本Python书籍----《深入理解Python特性》,或有几处平日常用但是并没有真正审视过类似于语法糖的Python操作,读者诸君读来也会心一笑,有豁然开朗之感,故摘取几处放上来共享。1.assert断言函数很好理解,商品价格*折扣,返回实际支付,通过assert的方式来检测折扣是否有效,当实际支付价格小于0或者大于商品原价的时候,程序引发异常。断言需要与异常处...

2019-10-14 16:42:55

Python基础入门的9个语法,新人必学!

1运算符运算符的作用是根据已有的变量生成新的变量,主要有以下几种:算术运算符:+,-,*,/,%,即加、减、乘、除、取余比较运算符:==,!=,>,<,>=,<=,即等于、不等于、大于、小于、大于等于、小于等于赋值运算符:=,+=,-=,*=,/=,%=,即赋值、加赋值、减赋值、乘赋值、除赋值、取余赋值逻辑运算符:and,or,not,即与、或、...

2019-10-14 16:30:52

Python线程5分钟完全解读

线程,有时被称为轻量进程,是程序执行流的最小单元。一个标准的线程由线程ID,当前指令指针(PC),寄存器集合和堆栈组成。线程是进程中的一个实体,是被系统独立调度和分派的基本单位,线程不拥有私有的系统资源,但它可与同属一个进程的其它线程共享进程所拥有的全部资源。一个线程可以创建和撤消另一个线程,同一进程中的多个线程之间可以并发执行。线程是程序中一个单一的顺序控制流程。进程内有一个相对独立的、可调度...

2019-10-14 16:20:05

这些有趣的Python库一定会亮到你

图片处理pipinstallpillowfromPILimportImageimportnumpyasnpa=np.array(Image.open('test.jpg'))b=[255,255,255]-aim=Image.fromarray(b.astype('uint8'))im.save('new.jpg')ParseRedisdump...

2019-10-14 16:04:20

Python 中更优雅的日志记录方案

在Python中,一般情况下我们可能直接用自带的logging模块来记录日志,包括我之前的时候也是一样。在使用时我们需要配置一些Handler、Formatter来进行一些处理,比如把日志输出到不同的位置,或者设置一个不同的输出格式,或者设置日志分块和备份。但其实个人感觉logging用起来其实并不是那么好用,其实主要还是配置较为繁琐。常见使用首先看看logging常见的解...

2019-10-14 14:39:53

会了这几招,可以让你的 Python 代码可以更“瘦”

在执行程序时,如果内存中有大量活动的对象,就可能出现内存问题,尤其是在可用内存总量有限的情况下。在本文中,我们将讨论缩小对象的方法,大幅减少Python所需的内存。为了简便起见,我们以一个表示点的Python结构为例,它包括x、y、z坐标值,坐标值可以通过名称访问。Dict在小型程序中,特别是在脚本中,使用Python自带的dict来表示结构信息非常简单方便:>...

2019-10-12 14:24:12

你见过的最全面的 Python 重点

由于总结了太多的东西,所以篇幅有点长,这也是我"缝缝补补"总结了好久的东西。Py2VSPy3print成为了函数,python2是关键字不再有unicode对象,默认str就是unicodepython3除号返回浮点数没有了long类型xrange不存在,range替代了xrange可以使用中文定义函数名变量名高级解包和*解包限定关键字参数...

2019-10-12 15:03:24

会用 Python 把 Linux 命令写一遍的人,进 “大厂” 到底有多容易?

文章中我就提到如何提升自己的python能力呢?直接找项目写,但是作为零基础/小白/入门的你来说做一个博客还要学web框架、html、css、js,又成为了阻碍你写实际项目的阻碍。所以我就推荐了这个命令:ls。写一个ls非常简单,你只需要会一点linux的基础知识,知道ls能做什么就好了。那今天小金就给大家码了一个哪哪能用的ls.py,没错,windows也...

2019-10-12 14:59:19

学Python,从列表推导到zip()函数,这五种技巧应知应会

在本文中,作者介绍了5种方法,也许在入门阶段时,我们还不太了解它们,但在实战中这5个技巧非常实用。以下即五种实用的小技巧:字符串运算列表推导式lambda和map()单行条件语句zip()字符串运算字符串本质上也是一种元组,但是字符串有很多「运算」方式。最直观的是字符串的+和*运算,它们分别表示重复和连接。>>>my_string=...

2019-10-12 14:56:08

python中global 和 nonlocal 的作用域

python引用变量的顺序:当前作用域局部变量->外层作用域变量->当前模块中的全局变量->python内置变量。一globalglobal关键字用来在函数或其他局部作用域中使用全局变量。但是如果不修改全局变量也可以不使用global关键字。gcount=0defglobal_test():gcount+=1print(gco...

2019-10-12 14:15:14

python 私有和保护成员变量如何实现?

默认情况下,Python中的成员函数和成员变量都是公开的(public),在python中没有类似public,private等关键词来修饰成员函数和成员变量。在python中定义私有变量只需要在变量名或函数名前加上”__“两个下划线,那么这个函数或变量就是私有的了。在内部,python使用一种namemangling技术,将__membername替换成_classname__...

2019-10-11 15:35:18

Python函数式编程——做到并发,不可变数据修改就只能复制后修改返回

当我们说起函数式编程来说,我们会看到如下函数式编程的长相:函数式编程的三大特性:immutabledata不可变数据:像Clojure一样,默认上变量是不可变的,如果你要改变变量,你需要把变量copy出去修改。这样一来,可以让你的程序少很多Bug。因为,程序中的状态不好维护,在并发的时候更不好维护。(你可以试想一下如果你的程序有个复杂的状态,当以后别人改你代码的时候,是很容易出bug的,...

2019-10-11 15:10:59

Python函数式编程之pipeline——很酷有没有

Pipelinepipeline管道借鉴于UnixShell的管道操作——把若干个命令串起来,前面命令的输出成为后面命令的输入,如此完成一个流式计算。(注:管道绝对是一个伟大的发明,他的设哲学就是KISS–让每个功能就做一件事,并把这件事做到极致,软件或程序的拼装会变得更为简单和直观。这个设计理念影响非常深远,包括今天的WebService,云计算,以及大数据的流式计算等等)比如,我...

2019-10-11 14:35:37

python代码规范 自动优化工具Black

自动优化工具Black在众多代码格式化工具中,Black算是比较新的一个,它***的特点是可配置项比较少,个人认为这对于新手来说是件好事,因为我们不必过多考虑如何设置Black,让Black自己做决定就好。1).安装与使用与pylint类似,直接pipinstallblack即可完成该模块的安装,不过black依赖于Python3.6+,但它仍然可以格式化Python2的代码。在...

2019-10-11 14:27:10

python 列表转为字典的两个小方法

1、现在有两个列表,list1=[‘key1’,‘key2’,‘key3’]和list2=[‘1’,‘2’,‘3’],把他们转为这样的字典:{'key1':'1','key2':'2','key3':'3'}list1=['key1','key2','key3']list2=['1','2','3']dict(zip(list1,list2)){'key1':'1','k...

2019-10-11 14:23:44

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 1024勋章
    1024勋章
    #1024程序员节#活动勋章,当日发布原创博客即可获得
  • 勤写标兵Lv4
    勤写标兵Lv4
    授予每个自然周发布9篇以上(包括9篇)原创IT博文的用户。本勋章将于次周上午根据用户上周周三的博文发布情况由系统自动颁发。