菜鸟不太菜-CSDN博客

原创血泪！pyinstaller打包文件过大的解决方法

血泪！pyinstaller打包文件过大的解决方法记录一下踩的坑吧，都是血泪!文章虽然水平不高，但是还是希望能够对大家有帮助文章目录血泪！pyinstaller打包文件过大的解决方法0x01:源头0x02:题目描述0x03:效果描述0x04:Pyinstaller打包0x05:打包过程0x06:重新打包（ pipenv ）方法0x07:在Pycharm中使用( pipenv )环境0x08:查看最后重新打包的文件大小0x09:参考目录0x01:源头最近因为课程原因简单做了一个GUI界面，因为

2021-04-05 22:52:12 5043 5

原创 Java连接Sqlserver数据库小白包会

Sqlserver设置账号密码登陆为了再java中连接sqlserver数据库，我们需要利用账号密码进行数据库的登陆。操作如下：0x01:我们第一次登陆是通过windons身份验证直接可以连接数据库。0x02:进入安全性，设置SQL server和windows身份验证模式。点击确定即可。0x03:设置完密码之后我们需要重新启动数据库：测试连接:通上步操作：右键 -> 连接 -> 使用sql server身份进行验证JAVA配置部分操作如下0x01:

2020-06-01 00:29:14 13793 6

原创 Javac编译出现乱码如何解？

问题：我们在利用javac编译java代码的时候如果文件中出现中文，有的时候会直接编译不通过，或者编译通过之后显示出来的中文是乱码，如下：解决：重新指定按照指定编码的方式编译java代码。结果:...

2020-05-12 10:37:15 1412

原创夭寿啦！pandas还能这么用!

前言：最近在公众号看到一篇文章说pandas也可以写爬虫，并且对与表格型的数据，非常友好强大，可以直接保存成dataframe格式，是不是很强大，下面我们来介绍一下他的用法，非常的简单。试用情况:这种这样子的如果查看一下网页的HTML结构（Chrome浏览器F12），会发现它们有个共同的特点，不仅是表格，还是以Table结构展示的表格数据，大致的网页结构如下：<table c...

2020-04-24 17:38:32 200

原创超级简单！字符串转datetime类型

前言：我们在进行数据清洗得时候，尤其是针对跟时间类型挂钩得数据得时候，总会想让他变成datetime类型方便我们得应用，但是数据又是字符串类型，在此我分享两种方法给大家！第一种：直接利用pd.todatetimeimport pandas as pd# 先创建一个dataframe例子里面1.1 就是1月1号 df2= pd.DataFrame({'a':['1.1','1.2',...

2020-04-12 00:08:16 2125

原创抖音字体加密

抖音==起因==:==分析==:字体文件：==获取字体文件==:==获取字体映射规则:====安装:====使用:====分析映射规则==:==代码部分==:==效果:==起因:前天本来接的一个小单子，一开始客户上来问抖音粉丝能获取吗？我寻思这玩意看起来是字体加密，但是我并不知道这个字体文件时多久更新一次，要是像猫眼字体反爬那样，刷新一下就变，那我就太孤儿了，所以就延长了工期，结果，人客户走了...

2020-03-28 11:15:07 1103

原创 Pyecharts修炼之路(2)

文章目录Pyecharts基本图表实例:饼图:仪表盘：箱线图:层叠多图:折线图与柱状图叠加柱状图上下叠加:Pyecharts基本图表实例:饼图:简要介绍:饼图显示一个数据系列的百分比。导入库:from pyecharts import options as optsfrom pyecharts.charts import Pie实例化Pie():p=Pie()设置...

2020-03-26 00:39:27 403

原创 Pyecharts修炼之路(1)

文章目录Pyecharts安装:官方文档介绍:基本图表示例:柱状图/条形图:横向条形图:折线图:散点图(根据数值的大小变化散点大小):散点图(在地图中的应用，点根据数值大小改变)词云图:Pyecharts安装:pip install pyecharts即可,非常的简单方便。官方文档介绍:pyecharts官方文档:通过官方文档，我们可以更加方便的学习其中各个图的绘制，官方文档中提供实例演...

2020-03-24 00:23:09 1013 1

原创在进行爬取信息时，遇到json格式的数据前面有jQuery3410675305319383495_1584774746492的处理

在进行爬取信息时，遇到json格式的数据前面有jQuery3410675305319383495_1584774746492的处理很简单的处理方法我们可以用空字符串把其替换掉:resp_sub = re.sub('^jQuery3410675305319383495_1584774746492$', '', resp)resp_sub_2 = re.sub('$$', '', resp_...

2020-03-21 18:14:07 772 1

原创数据分析学习之时间序列(2)-数据的重采样

重采样重采样：指的是将时间序列从一个频率转化为另一个频率进行处理的过程，将高频率数据转化为低频率数据为降采样，低频率转化为高频率为升采样。降采样t = pd.DataFrame(np.random.uniform(10,50,(100,1)),index=pd.date_range('20170101',periods=100))t 02017-01-01 42.009320...

2020-03-17 17:36:57 1888

原创数据分析学习之时间序列(1)

时间序列日常生活中我们的大多数诗句都是跟时间相关的，比如股票数据，每一个时间段的盈亏，因此，我了解了时间序列这个方便我们分析与时间相关的数据。时间戳import timetime.time() # 查看当前的时间戳# 输出1584431953.366432# 将时间戳转换成本地时间类型t = time.time()loc_t = time.localtime(t)loc_t...

2020-03-17 17:30:08 353 1

原创数据的分组和聚合

数据的分组和聚合在数据分析中，我们时常会遇到把数据进行分组或者把数据进行聚合的操作，比如我说：我有一组瓜子二手车的数据里面包括了品牌名，所在城市，排放量，自动挡非自动挡等等，我想要分出自动挡和非自动挡两个类别应该怎么做，这就涉及到数据的分组操作。import numpy as npimport pandas as pddf1 = pd.DataFrame({'fruit':['apple...

2020-03-16 18:06:09 1330

原创批量爬取app小视频

批量爬取app小视频全名小视频app视频爬取fiddler的安装与使用。抓包分析，请求网址与post请求表单信息，为构建抓取某个up主下的全部视频信息做准备。分析加密信息。效果示意图:将复制链接替换url即可实现不同up主的视频批量爬取。使用方法复制连接替换urlGitHub代码地址:https://github.com/Key-lei/AppSpider...

2020-03-14 20:01:55 3254

原创数据分析学习之数据规整(2)

数据合并承接数据分析学习之数据规整(1)：**代码演示:**在实际我们可能会遇到语文老师手上有一个语文成绩表数学老师有数学成绩表，英语老师有英语成绩表，综合老师有综合成绩表，但是作为班主任，想要的是每一个学生的每一科成绩全部在一张表上，如下是代码示例left2 = pd.DataFrame([[1., 2.], [3., 4.], [5., 6.]], ...

2020-03-14 16:37:12 254

原创数据分析学习之数据规整(1)

数据合并数据连接根据单个或者多个键(列)将不同的DataFrame的行进行连接类似数据的连接操作pd.merge:(left, right, how=‘inner’,on=None,left_on=None, right_on=None )left:合并时左边的DataFrameright:合并时右边的DataFramehow:合并的方式,默认’inner’, ‘oute...

2020-03-14 16:18:17 890

原创对数据进行分组之数据的面元化~

面元化通常就是我们说的分组，比如我有一组数据，我给定一个区间我想知道每个区间有多少的值。我们可以通过如下代码演示:# 我们创建一个列表里面包含一些年龄数据import pandas as pdimport numpy as npages = [20,22,44,33,56,34,23,76,21,45]# 现在我们给定分成的区间bins = [18,25,45,60,75]ca...

2020-03-12 23:48:32 375

原创 DataFrame重新命名轴索引

DataFrame重新命名轴索引在实际的应用当中，我们经常会需要将读取成datafram的数据中列索引或者行索引变成我们想要的索引。这里我将给大家演示如何重新命名行、列索引。# 创建dataframedata = pd.DataFrame(np.arange(12).reshape((3, 4)), index=['BeiJing', 'Tokyo...

2020-03-12 23:06:45 2684

原创分享一个如何修改github上的代码语言类型

问题：在把项目上传到github仓库上时语言会显示错误语言比如我刚写的python程序显示的语言是html原理：github 是采用 Linguist来自动识别你的代码判断归为哪一类解决办法：我们在仓库的根目录下添加.gitattributes文件:并写入*.js linguist-language=java*.css linguist-language=java*.html l...

2020-03-12 17:41:28 470

原创 Pandas中利用函数或者映射进行数据转换---你想要的都在这~

Pandas中利用函数或者映射进行数据转换我们先创建一个dataframedata = pd.DataFrame({'food': ['Apple', 'banana', 'orange','apple','Mango', 'tomato'], 'price': [4, 3, 3.5, 6, 12,3]})data food price0 ...

2020-03-12 16:48:45 541

原创猫眼电影字体反爬-自动处理字体加密

猫眼电影字体反爬我们再爬取猫眼电影的时候，回到如下情况：我们想要其中想看人数的数据，但是在网页源代码中并不是直接显示数字而是这一串东西。这一串，其实是猫眼本身的一种字体，目的是不想每个人都获取到数据。针对这个情况我们可以先找到他的字体文件，然后再根据字体文件当中的映射，会得到一个与其一一对应的文字，数字。所以最关键的是，我们需要找到对应的字体文件。这个就是我们要的字体文件。现在我...

2020-03-12 16:28:55 1635 1

原创 Pandas中的appy和applymap

apply我们经常会遇到对某一行的数据进行处理或者某一列进行处理这时候我们就可用到pandas中apply函数示例代码:import pandas as pdimport numpy as np# 创建一个dataframe df = pd.DataFrame(np.random.randn(3,4),columns=['a','b','c','d'])df# 生成均值(μ)为0，...

2020-03-11 13:51:38 206

原创拉钩招聘信息爬取-能自行进行职位选择与页数选择

拉钩招聘信息爬虫分析：难点是其cookie会一直改变并且具有时效性,并且我们在职位的网站查看源代码是查找不到想要的职位数据的，要进行抓包分析。找出真正的原始网址。需求：保存的数据为csv文件直接上代码：# -*- coding: utf-8 -*-import requestsimport re""""""""" 需求1：获取一下信息 'city'...

2020-03-10 22:36:49 259

原创 Pandas文件操作之与mysql数据库的交互

Pandas文件操作之与mysql数据库的交互先导入必要的模块panadspymysqlsqlalchemy如果没有安装的pymysql和sqlalchemy可以直接 pip install pymysql即可。然后你必须有自己的数据库并且要运行起来才能链接成功。windows下载mysql的安装：https://blog.csdn.net/qq_20788055/article/...

2020-03-10 22:29:23 286

原创 Java一个源文件中可以有多个主类

Java一个源文件中可以有多个主类一个Java源文件中可以有多个主类，但是只能有一个公共类或者没有公共类，所谓主类就是函数运行的一个入口，public static void main。我们可以通过如下例子说明：public class E{ public static void main(String[] args){ System.out.println("ok"); System....

2020-03-10 01:17:54 12643 10

原创爬取豆瓣电影TOP250

# 利用css选择器对电影的信息进行爬取import requestsimport parselimport csvimport timeimport reclass CssSpider: def __init__(self): self.headers = { 'User-Agent': 'Mozilla/5.0 (Windows...

2020-03-10 00:46:27 584 1

原创 Pandas之层级索引

Pandas层级索引下面通过Serise创建,并在输入索引 index 时，输入了两个子list组成的list，第一个list时外层索引，第二个list时内层索引。import numpy as npimport pandas as pds1 = pd.Series(np.random.randn(12),index=[['a','a','a','b','b','b','c','c','...

2020-03-10 00:39:09 552

原创 Pandas高级数据结构-创建方式

Series的介绍series的创建1.通过列表创建import numpy as numpyimport pandas as pds1 = pd.Series([1,2,3,4])s10 11 22 33 44 5dtype: int642.通过数组创建s2 = pd.Series(np.arange(1,6))s20...

2020-03-09 09:56:30 130

原创 pip使用豆瓣源镜像

pip的使用安装软件包：pip install 包名注：这里的包名，也可以是已经下载好的whl文件或者tar.gz压缩包文件路径或者包所在的url地址升级pip自身：```pip install --upgrade pip 查看已经通过pip安装的包:pip list 现实当前已经通过pip安装的包及版本号:pip freeze 安装本地的安装包:pip install...

2020-03-08 11:12:39 2854

Thor的博客