3 喝粥也会胖的唐僧

尚未进行身份认证

我要认证

暂无相关简介

等级
TA的排名 5k+

pandas使用.astype()修改数据类型

使用带字典的方式批量修改数据类型dtype_dict = {'A': 'int32', 'B': 'int8', 'C': 'int16', 'D': 'int8', 'E': 'int8', 'F': 'int8' }df.astype(dtype_dict)结果出现问题:KeyError

2020-08-05 16:44:20

python的platform模块的使用

platform是用来获取操作系统的信息的模块,具体见文档[root@VM_0_9_centos ~]# pythonPython 3.7.0 (default, Jun 28 2018, 13:15:42) [GCC 7.2.0] :: Anaconda, Inc. on linuxType "help", "copyright", "credits" or "license" for more information.>>> import platform>&gt

2020-07-29 11:05:36

pandas.errors.ParserError: Error tokenizing data. C error: Expected 31 fields in line 107943, saw 32

利用pandas读取数据数据报错: File "pandas/_libs/parsers.pyx", line 876, in pandas._libs.parsers.TextReader.read File "pandas/_libs/parsers.pyx", line 891, in pandas._libs.parsers.TextReader._read_low_memory File "pandas/_libs/parsers.pyx", line 945, in pandas.

2020-07-27 15:29:43

快速有趣理解极限定义(ε-δ语言)

场景:中秋节,大A带着小A爬青城后山,从山下的客栈出发小A:表哥,青城山是不是修仙的地方哇大A:修仙游戏小说看多了吧,别磨磨唧唧了,赶紧出发吧小A:表哥等等我半个小时后小A:表哥,这山到底多高呀,我们爬了山百分之多少了哇?需要爬几个小时呀大A:还早吧,反正是来玩的,看看风景吧一个小时后小A:表哥你走慢点行不行,好累啊,我们是不是快到了大A:行吧,我们走到前面的亭子歇一会儿,叫你平时锻炼身体不信,这么一会儿就不行了!我也没有来过,不知道我们的进度多少了,看前面的小朋友都比你

2020-07-27 11:44:46

Python glob.glob始终返回空列表

常常都会使用glob.glob批量获取路径,顺便分批选取多份数据np.random.choice(glob.glob('/opt/data/'), size=50)之前用的好好的,但是这次却失败了,显示为空值还出现了ValueError: 'a' cannot be empty unless no samples are taken最后发现在修改在代码的时候把路径拼错了,真的笨的可爱...

2020-07-17 14:44:37

xgboost进行多输出回归预测

如果我们需要用到多个维度的预测,也就是需要预测 很多个变量的时候,我们可以使用sklearn来 完成。sklearn提供了一个包装类MultiOutputRegressor,这里我使用的xgboost进行预测。思路很简单,其实就是根据标签依次进行预测。代码如下:from sklearn.multioutput import MultiOutputRegressorimport xgboost as xgbimport pandas as pdfrom sklearn.metr

2020-07-08 15:56:18

linux防误删工具trash-cli

平时删去文件都是使用的rm-rf这个存在一个致命的问题,删去了就没法恢复了,虽然时刻保持谨慎,但也不能保证不会误删因此,trash-cli诞生了trash-cli理解成平时我们在window 里面使用的回收站就行,安装使用都很简单。1)首先我们需要去下载安装包[root@VM_0_9_centos trash-cli]# git clone https://github.com/andreafrancia/trash-cli2)设置环境变量在/etc/profile最后一行添.

2020-07-03 15:42:15

获取python运行输出的数据并解析存为dataFrame

在学习xg的 时候,想画学习曲线,但无奈没有没有这个evals_result_AttributeError: 'Booster' object has no attribute 'evals_result_'因为不是用的分类器或者回归器,导致训练后没有这个,但是又想获取学习曲线运行的结果 上面有数据,于是就想自己解析屏幕的数据试一下1)获取屏幕数据import subprocessimport pandas as pdimport datetimetop_info = .

2020-07-01 10:57:27

gzip: stdin: not in gzip format

在使用tar命令的时候报错了[root@localhost ~]# tar zxvf thc-ssl-dos-1.4.tar.gz gzip: stdin: not in gzip formattar: Child returned status 1tar: Error is not recoverable: exiting now问题是因为这个下载的文件 根本不是压缩文件,而是 网页可以看一下[root@localhost ~]# file thc-ssl-dos-1.4..

2020-06-11 11:14:05

字典生成工具crunch的安装以及使用

python生成字典真的太慢了kali自带的crunch超级快虽然kali自带了crunch但是这里我好像想使用centos下使用于是首先需要去下载crunch安装包(https://sourceforge.net/projects/crunch-wordlist/)然后下载到的安装包拷贝进linux-rw-r--r-- 1 root root 38635 Jun 7 07:53 crunch-3.6.tgz解压它:tar -xvf crunch-3.6.tgz

2020-06-07 16:20:47

jupyter总是让谷歌浏览器显示内存不足,直接崩了

明明内存还很多,但是就是浏览器会崩掉,查了很多资料,设置了浏览器的问题,还是 没有解决,后来仔细发现,是只有这一个jupyter文件打开会卡死,会崩,其他的jupyter文件打开正常,然后对比了发现,这个jupyter文件大小不正常。正常的jupyter文件大小不可能几十兆这个是因为自己打印了很多内容在页面,那些内容全部追加到了该文件解决方法就是 重新建jupyter文件,拷贝代码重新运行,不要print内容很大的数据了主要还在太菜不清楚jupyter加载文件的原理,几十兆的文件也.

2020-06-05 10:05:30

if f type(df) lass pandas.core.frame.SparseDataFrame

安装mlxtend后使用出错原因是版本的问题解决方法:pip install mlxtend==0.15.0默认安装的最新版存在bug

2020-05-22 17:14:47

pandas日期处理集锦

在使用pandas的时候,经常需要处理日期格式,这里总结了一下平时经常用到的场景(1)将字符串转成日期df["date"]=pd.to_datetime(df["date"], format='%Y%m%d', errors='ignore')比如:pd.to_datetime(20190129, format='%Y%m%d', errors='ignore')运行结果:...

2020-05-02 15:36:51

利用pandas读取mysql的数据

经常我们的数据在mysql里面,我们需要用的时候,肯定就要想着怎么去获取里面都是的数据这里用到的是pymysql首先需要安装pymysql:pip install pymysql接下来就是如何读取数据了:#导入需要的库import pymysqlimport pandas as pd#获取mysql的连接conn = pymysql.connect( ho...

2020-05-02 15:00:16

记录aliyun.one挖矿病毒

莫名其妙就中了挖矿病毒:WARNING! The remote SSH server rejected X11 forwarding request.Last login: Sun Apr 26 09:43:15 2020 from 182.148.48.144[root@VM_0_9_centos ~]# curl: (6) Could not resolve host: aliyun...

2020-04-26 10:35:32

对坑生成网络系列——Gan简介

Gan目前用于图像领域比较多一些,各式各样的gan都围绕着图像生成。Gan包括两个网络,一个是生成网络(G_net),一个是判别网络(D_net)。由于目前主要是用于图像生成,因此G_net和D_net都是cnn,只是G_net输出的层是图片,而D_net输出的是判别结果(分类)。既然涉及到两个网络,那么两个网络都需要同时训练,有两个网络当然就会有两个loss,我们当然不能只优化G_n...

2020-04-18 12:40:31

资料汇总

2020-4-15 简历:链接(ryiy)

2020-04-15 15:49:59

unorderable types: str() int(), sort order is undefined for incomparable objects

利用pandas进行归一化 时,出现这个:D:\AN\lib\site-packages\pandas\indexes\base.py:2482: RuntimeWarning: unorderable types: int() < str(), sort order is undefined for incomparable objects return this.join(ot...

2020-04-15 15:14:38

python如何将音频进行变速

有的时候需要手里的音频文件变速听,或可能变慢或可能变快这里使用的python进行操作,我的目标是将文件转成2倍速首先需要安装插件pip install ffmpeg然后再执行:from ffmpeg import audioaudio.a_speed("D:\\1505.mp3", "2", "D:\\1505_2x.mp3")如果执行不出错,会返回一个true运...

2020-04-07 14:41:23

高等数学之美——前言

谈到高数可能是很多人的噩梦,高数真的有那么可怕吗?客官们请看我一一道来。数学课给大多数感觉是魔鬼课的是第一印象就是抽象吧,数学是抽象没错,但是这是给我们普通人接受的教育,真的会那么抽象吗?对于非数学专业的同学来说,我们正常人接受的数学课实际上不可能那么遥不可及,我们基本上只是当做一门工具而已,工具是不是我们只要会用就行了呢,只要大致知道原理不就可以正常使用了吧,我们又不是专业制造工具的人,...

2020-04-05 14:23:25

查看更多

勋章 我的勋章
  • 签到新秀
    签到新秀
    累计签到获取,不积跬步,无以至千里,继续坚持!
  • 新人勋章
    新人勋章
    用户发布第一条blink获赞超过3个即可获得
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 1024勋章
    1024勋章
    #1024程序员节#活动勋章,当日发布原创博客即可获得
  • 勤写标兵Lv4
    勤写标兵Lv4
    授予每个自然周发布9篇以上(包括9篇)原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。
  • 分享小兵
    分享小兵
    成功上传3个资源即可获取