3 邓旭东HIT

尚未进行身份认证

我要认证

python大法好

等级
TA的排名 16w+

未来2年,会Python的人将会非常抢手

最近一段时间,我经常在留言区看到很“丧气”的评论,被问得最多的就是“我到底该怎么做”。可能你从来没有想过这个问题:如果现在失业,你的存款够你维持多久的日常生活,它能应付哪种级别的风险,例...

2020-06-02 12:21:32

从记者的Twitter关注看他们稿件的党派倾向?

这篇论文属于社会计算方向,一般会用到社交媒体数据做研究,分析方法一般会用到文本分析。这篇文章文本数据处理感觉还是挺技术的,可以借鉴一下构建词典-使用词频比构建党派倾向(共和or民主)词典...

2020-06-02 12:21:32

读完本文你就了解什么是文本分析

文章较长,建议先收藏有时间再阅读~插播一个广告《Python网络爬虫与文本数据分析》视频课程中对本文中的绝大部分技术都有讲解~一、文本的作用文本涉及两个主体,即文本生产者和文本消费者:...

2020-05-26 19:21:53

实战 | 北京高档酒店价格因素分析

数据分析实战又来啦,今天我们进行的是北京高档酒店的价格因素分析,话不多说,直接上代码。1. 导入所需要的包import pandas as pdimport matplotlib.py...

2020-05-24 09:42:31

实战|淘宝用户行为分析案例

一、项目背景本数据报告以淘宝app平台为数据集,通过行业的指标对淘宝用户行为进行分析,从而探索淘宝用户的行为模式,具体指标包括:日PV和日UV分析,付费率分析,复购行为分析,漏斗流失分析...

2020-05-23 09:00:00

手把手|共享单车数据特征工程

数据来源Kaggle上有这样一个比赛:城市自行车共享系统使用状况。提供的数据为2年内按小时做的自行车租赁数据,其中训练集由每个月的前19天组成,测试集由20号之后的时间组成。本项目一此数...

2020-05-21 10:00:00

readability: 英文文本数据可读性库

readability文本可读性的公式最初都是为英语开发而来,所以目前仅支持英文文本数据。文档 https://pypi.org/project/readability/安装pipin...

2020-05-20 09:00:00

躺平了,给你10个关于AI学习的宝贵资料!

目前有越来越多的同学在学习人工智能,也有越来越多的开发者学习人工智能。毕竟,现在人工智能辣么火!然鹅,目前大家面临的问题是,时间有限,资料繁多。老祖宗早就告诉过我们,读书贵在精,不在多。...

2020-05-19 09:00:00

Python实现排序算法

前言冒泡排序快速排序插入排序希尔排序选择排序堆排序归并排序计数排序桶排序基数排序前言 本章介绍使用Python实现场景的几种排序算法。分别有冒泡算法、快速排序、插入排序、希尔排序、选择排...

2020-05-18 09:00:00

玩转数据处理120题|Pandas版本

Pandas进阶修炼120题系列一共涵盖了数据处理、计算、可视化等常用操作,希望通过120道精心挑选的习题吃透pandas。并且针对部分习题给出了多种解法与注解,动手敲一遍代码一定会让你...

2020-05-14 14:04:50

对Titanic进行数据分析,我们发现了一些线索送给谈恋爱的你们

titanic数据集字段字段释意值survival幸存0 = No, 1 = Yespclass客舱等级1 = 1st, 2 = 2nd, 3 = 3rdsex性别Age年龄If the...

2020-05-13 08:30:00

Selenium自动化|爬取公众号全部文章,就是这么简单

点击上方『早起Python』关注并星标公众号第一时间接收最新Python干货!大家好,今天我们来讲点Selenium自动化,你是否有特别喜欢的公众号?你有思考过如何将一个公众号历史文章全...

2020-05-12 08:30:00

清洗数据,我习惯用这 7 步!

数据清洗 (data cleaning) 是机器学习和深度学习进入算法步前的一项重要任务,我平时比较习惯使用的 7 个步骤,总结如下:Step1 : read csvStep2 : pr...

2020-05-11 09:32:43

Python两招轻松爬取美团评论

大家好,最近分别从商家选址和顾客挑店的角度写了两篇有关美团数据的分析:Python告诉你想开一家美食店该怎么做重庆火锅哪家强,Python帮你探探店结果很多读者对爬数据的过程比较感兴趣,...

2020-05-10 09:05:00

浅度测评:requests、aiohttp、httpx 我应该用哪一个?

摄影:产品经理与产品经理环游世界在 Python 众多的 HTTP 客户端中,最有名的莫过于requests、aiohttp和httpx。在不借助其他第三方库的情况下,requests只...

2020-05-09 17:50:30

Callback ——从同步思维切换到异步思维

摄影:产品经理薄如蝉翼我们平时使用Requests的时候,一般是这样写代码的:importrequestsdefparse(html):print('对htm...

2020-05-08 12:32:12

超好看!手把手教你用Matplotlib画一张好看的图

Matplotlib进阶图表绘图第一篇,手把手教你如何从0到1画出一张好看的图。本文用的数据如图所示,Dataframe中显示的是相关职位对应的地区和相应的薪水状况,单位是千,要统计各个...

2020-05-07 09:10:00

建议收藏!Matplotlib常见组件设置整理

继上一篇文章Matplotlib中的plt和ax都是啥?为大家介绍了plt和ax绘图的区别后,这篇文章结合我自己的一些使用经历,为大家整理了Matplotlib中比较常用的一些组件设置。...

2020-05-06 09:00:00

Matplotlib中的plt和ax都是啥?

Pandas教程写的差不多了,来写一写与数据可视化相关的Matplotlib系列教程吧。读过Pandas系列文章的读者应该都知道,我写文章更多的会融入我对这个东西的理解,Matplotl...

2020-05-05 09:38:06

StockInsider: A股交易指标可视化包

一、StockInsiderStockInsider可以获取中国上市股票价格相关的信息,计算交易指标,可视化指标。1.1 安装命令行输入!pip3installStockInside...

2020-05-04 12:31:08

查看更多

勋章 我的勋章
  • 勤写标兵Lv4
    勤写标兵Lv4
    授予每个自然周发布9篇以上(包括9篇)原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。