卓小曙-CSDN博客

原创如何在jupyter中添加目录

文章目录1 安装模块2 启用用户配置3 启用目录4 显示目录jupyter在工作中使用很方便，可是一旦单个文件的内容多了，即使有markdown文本提醒，上下翻找依旧很费精力。这时，有个目录就显得至关重要了。1 安装模块打开anaconda的PowerShell（带有Prompt的），直接输入pip install jupyter_contrib_nbextensions，回车开始安装。此为安装成功图：2 启用用户配置安装成功后，再次输入jupyter contrib nbextens

2020-10-11 18:23:51 9396 7

原创 pandas中的几个时间序列生成函数

文章目录pd.date_range函数pd.period_range函数pd.timedelta_range函数pd.interval_range函数最近在处理跟时间相关的数据，用到了pandas中的datetime的几个函数，本篇来说一下pandas中几个常见的时间序列生成函数。pd.date_range函数pd.date_range(start=None, end=None, periods=None, freq=None, tz=None, normalize=False, name=N

2020-10-02 17:16:21 1320

原创 xlwings的基本操作

文章目录新建工作簿及、插入值并关闭打开已有文件、查看/删除单元格值更改单元格颜色、行高列宽、插入公式新建工作簿及、插入值并关闭首先先导入需要的模块。import pandas as pdimport xlwings as xwimport numpy as np接着新建一个test.xlsxexcel文件。# visible-是否打开相应excel文件，即是否可视化当前工作簿；# add_book=True，此时立即创建一个有sheet表的工作簿# add_book=False，

2020-09-29 17:50:47 4822

原创 pyecharts中堆叠柱形图的绘制及颜色更改

文章目录导入模块构建数据并绘制基本柱形图绘制堆叠图堆叠柱形图的绘制相比普通柱形图，只需要多添加几个.add_yaxis()—y轴即可。导入模块import pandas as pdfrom pyecharts.charts import Barfrom pyecharts import options as opts构建数据并绘制基本柱形图此处我直接重新构建了一组数据来绘制，方便的小伙伴可以直接拿自己的数据练习。data = pd.DataFrame({ "区域

2020-09-27 21:38:18 9895 3

原创 pandas如何在同一工作簿中保存多个sheet-----pd.ExcelWriter()

pandas中的to_excel函数能够将数据导出为excel文件，但有一个问题是每次保存只能保存一个sheet，即时sheet名称不一样，最后一行的保存代码总会把之前保存的全部替换掉。想要保存多个sheet在同一工作簿中，需要用到一个函数------pd.ExcelWriter()。文章目录函数介绍使用方法函数介绍pd.ExcelWriter(path, engine=None, date_format=None, datetime_format=None, mode="w")参数介.

2020-09-23 21:28:25 15616 4

原创 python学习笔记(6) - 如何对导入文件按时间排序

文章目录os.path.join(path1[, path2[, ...]])os.path.getmtime(path)os.path.getctime(path)对某一目录中文件按时间排序在进行时间排序前，我们先来了解一下下面3个函数。os.path.join(path1[, path2[, …]])把目录和文件名合成一个路径path = "f:\\proj"file = "...

2020-09-22 17:12:52 800

原创 pip安装shutil出现Could not find a version that satisfies the requirement shutil (from versions: n)

安装过好几次，可每次再安装总会忘记，又要一顿度娘，所以直接写下来，方便查找，也希望能对需要的小伙伴有所帮助。文章目录1. 问题所在：直接pip安装2. 解决方法3. 导入1. 问题所在：直接pip安装pip install shutil这时就会弹出错误：2. 解决方法安装时应该输入如下代码pip install pytest-shutil此时就会安装成功。3. 导入导入模块时，直接按下述代码操作即可：import shutil...

2020-09-09 16:36:04 3307

原创 pyecharts的学习之旅--柱形图篇2--为标签添加千位符

文章目录导入模块绘制好图像设置千位分隔符本篇的柱形图只讲一个内容，那就是：将之前绘制的图形中的数字标签加上千位分隔符（如下两幅图对比）；这个真的只能说“会者不难，难者不会“（测试途中陷入了一次死循环。。。）可以看到，有了千位分隔符之后数据变得更加清晰。接下来就开始吧！导入模块from pyecharts.charts import Barfrom pyecharts import options as optsfrom pyechsrts.commons.utils imp

2020-08-28 22:30:43 1177 1

原创 pyecharts的学习之旅---柱形图篇1

文章目录绘制最基本的柱形图为图表添加标题更改图形主题 / 改变柱形图宽度将绘制图形导出绘制最基本的柱形图数据使用的是自制的脱敏数据，通过pandas导入，通过对“品种”字段分组后，得到以下数据：接下来则通过pyecharts绘制最基本的柱形图：# 导入柱形图模块from pyecharts.charts import Bar# 建立实例，使用链式调用方式# type_price为表名bar = ( Bar() .add_xaxis(type_price["品种"]

2020-08-25 23:25:22 972

原创 selenium在ananconda环境下的安装与浏览器配置

1. selenium的安装可以在打开anaconda powershell prompt之后直接pip安装pip install selenium如图：安装成功：注：可以直接在开始界面选择anaconda powershell prompt，如下图：2. 谷歌浏览器的设置selenium在调用浏览器前需要先配置对应的驱动，此处以Chrome为例。在Chrome中输入“Chrome://version”，查看浏览器的版本进入网页（http://chromedriver

2020-07-24 12:02:28 2289

原创解决pandas中字段过多导致df.info()不显示详细字段信息的问题

今天在操作时遇到一个数据显示方面的问题，在下方附上问题描述和解决方法。问题描述当我们的数据表中的字段过多，超过pandas的默认显示数量时，就会出现下列显示方式：查看pandas中数据默认显示信息我们可以通过以下命令来查看相应的默认显示数量信息。pd.get_option("max_info_columns")最终得到结果：可以了解到，pandas默认info显示大小为100个字段，当超过100时会不显示所有字段，而是以汇总的方式显示基本信息（字段数量，数据类型的分布等）。就还是这个.

2020-07-10 11:54:19 9719 1

原创 python学习笔记(7) - 对文本数据排序？可能吗?pd.Category函数的自述。

前段时间在处理一个项目时，遇到了这样一个问题，中文月份（像一月、二月）在作为x轴绘制图形时，没有办法按照月份的顺序排列，绘制出来的图形让人看得很糟心！！不过，通过在网上的一番奋战（还是网上大佬多），终于找出了解决方法——对文本排序，自己重新总结了以下，分享出来，一起学习进步！1. pd.Categorical小伙伴们可能会好奇，你那标题是啥？？不是要讲解决文本排序的方法嘛！！莫着急，它可是我们今天的主角儿呀！让我来给大家介绍一下吧！这个函数能够通过我们事先设定好的文本数据应用到Series.

2020-06-01 23:21:32 863

原创某酒店预定需求分析

分析流程了解数据信息分析问题作出假设数据清洗-缺失值/异常值处理探索性分析-结合可视化做出结论1. 了解数据信息使用pandas_profiling中的profilereport能够得到关于数据的概览；import pandas_profilingfile_path = "F:/jupyter/kaggle/数据集/1、Hotel booking demand酒店预订需求\hotel_...

2020-04-10 23:20:10 2890

原创在anaconda环境下安装xgboost

通常安装模块直接在anaconda命令控制台下输入pip install 包名即可，可是今天在安装时总是出错，我把错误及最终解决方法都写出来，希望能对大家有所帮助。问题一初次安装时，直接pip install xgboost出现如下提示：之后通过把上面包的下载链接直接贴到浏览器中下载，https://files.pythonhosted.org/packages/36/a5/703...

2020-03-12 22:02:29 1560

原创 python学习笔记(5) - sorted和sort

本篇来对sorted和sort进行区分。文章目录sorted(iterable, key=None, reverse=False)sort(key=None, reverse=False)sorted(iterable, key=None, reverse=False)iterable – 可迭代对象（列表、元组、字典、字符串）。key – 指定可迭代对象中的一个元素来进行排序(通...

2020-02-17 20:38:30 88

原创 python学习笔记(4) - break/return/continue

本文对break/return/contiue进行了整理区分。文章目录return作用break作用使用条件continue作用使用条件return作用用于函数中，将结果返回到调用的地方（程序的控制权同时返回）程序在遇到第一个return就会返回（退出当前def），不会再运行第二个return如果return存在于函数的一个循环中，只会返回第一次循环结果；如果要每次循环结果都返回...

2020-02-15 11:22:38 182

原创 python学习笔记(3) - jieba分词与词云图

本文介绍了win10环境下如何安装jieba和wordcloud的方法。文章目录直接安装pycharm中安装jupyter中使用（anaconda）直接安装直接在cmd控制台中输入pip install jieba即可安装成功；在安装wordcloud的总是报错，于是便直接在网页中下载了相应版本的wordcloud的whl文件（whl文件本质上算作压缩包，可以在本地文件中直接通...

2020-02-07 22:38:25 359

原创 python爬虫 - 起点女生榜单爬取 - 1

python爬虫 - 起点女生榜单爬取最近一直在追庆余年，顺带瞄了一眼小说，真真是精彩（虽然因为范闲多妻的设定接受不了就放弃了）。说来说去，还是钟爱女频的修仙小说，所以就想爬一下起点女生网的仙侠奇缘的作品，结果。。。也不知怎么起点竟然只显示5页，一万多部作品，怎么都是5页，所以就偷懒地只爬了三个榜单（藏榜、推荐榜、热销榜，也能说是六个，推荐榜的周榜、月榜、总榜都爬了）。爬取的都是...

2020-01-14 21:35:58 1707

原创 python学习笔记(2) -- pyquery的基本操作

python学习笔记(2) – pyquery的基本操作虽然pyquery中有关于对html文件增加属性、类、删除类等各类操作，但因为我主要是用来爬网页的，目前也用不到，所以就总结了爬取时非常有用的各类方法。不过pyquery中好像没有将文本转为字节字符串的函数（或许是我还没找到，若如此，希望知道的朋友告知一下，多谢），所以用的还是requests中的content。首先...

2020-01-07 16:37:49 197

原创 python学习笔记(1) -- 字典key的一些事儿

python学习笔记(1) – 字典key的一些事儿最近写编程开始接触到代理这部分了，中间偶有需要字典的各项操作，突然发现，知识不用是真的会完全忘记的，所以决定在博客上把每次遇到的问题都拿出来，方便自己记忆，也希望能够帮助到其他人。查看字典中的key直接字典名.keys()就可以了，返回dict_keys(['name', 'age', 'color'])，要想转为list直接list(...

2020-01-03 22:28:08 136

原创 Python数据分析之证券之星沪深A股基本信息爬取与分析

Python数据分析之证券之星沪深A股基本信息爬取与分析上周爬取了证券之星上沪深A股的信息，我对股票完全是小白，对流通市值这些完全不了解，是上网先了解了一下，老实说虽然有了基本概念，但在数据分析时还是一头雾水，所以今天只说一下我在爬取和分析时遇到的问题，希望能对大家有帮助，也希望得到大家的意见！爬取数据获取网页内容爬取方面依旧是我常用的结构，使用的pyquery，因为要爬取的内容直接...

2019-12-26 23:21:11 1383 2

原创 Python数据分析之豆瓣影片TOP250爬取与分析

豆瓣影片TOP250爬取与分析我会把每次在网络上做的爬虫和数据分析都发上来，至少每周一次，这既是为了督促自己，也是希望能把自己遇到的问题及解决方法和大家分享。爬取网页这次爬虫使用的是pyquery和requests，requests主要是用来获取图片的字节信息的，没在pyquery中找到，知道的朋友也可以说一下，大家一起进步~！因为豆瓣电影中比较友好，所以我只设置了一个伪装浏览器的head...

2019-12-17 17:14:11 6096 3

molaum的博客