自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(222)
  • 收藏
  • 关注

转载 pandas中Dataframe索引.ix,.iloc,.loc的使用以及区别

pandas中Dataframe索引.ix,.iloc,.loc的使用以及区别https://blog.csdn.net/qq1483661204/article/details/77587881Pandas——loc、iloc、ix 函数区别https://blog.csdn.net/u012736685/article/details/86610946

2020-08-04 21:48:35 336

转载 【MySQL】如何将csv文件导入到mysql数据库

【MySQL】如何将csv文件导入到mysql数据库转自:https://blog.csdn.net/unsicherheit/article/details/89712797

2020-08-02 15:59:04 905

转载 python-将多个空列添加到pandas DataFrame

python-将多个空列添加到pandas DataFrame转自:https://www.itranslater.com/qa/details/2582599586510537728

2020-07-31 20:58:03 1830

转载 python-将多个空列添加到pandas DataFrame

转自:https://www.itranslater.com/qa/details/2582599586510537728python-将多个空列添加到pandas DataFrame这可能是一个愚蠢的问题,但是如何将多个空列从列表添加到DataFrame?我可以:df[“B”] = Nonedf[“C”] = Nonedf[“D”] = None但是我不能:df[[“B”, “C”, “D”]] = NoneKeyError: “[‘B’ ‘C’ ‘D’] not in index”p

2020-07-29 14:15:16 6059

转载 pandas.read_csv() 报错 OSError: Initializing from file failed,报错原因分析和解决方法

Python版本:Python 3.6pandas.read_csv() 报错 OSError: Initializing from file failed,一般由两种情况引起:一种是函数参数为路径而非文件名称,另一种是函数参数带有中文。# -*- coding: utf-8 -*-"""Created on Mon Jun 4 09:44:36 2018@author: wfxu"""import pandas as pdda1=pd.read_csv('F:\\数据源')da2=pd

2020-07-28 21:04:59 179

转载 Sklearn Impute SimpleImputer 处理缺失值

Sklearn 有专门处理缺失值的模块 sklearn.impute.SimpleImputer,本文将探究如何用 Sklearn 中的预处理模块中的 Impute.SimpleImputer 处理缺失值。一、模块介绍官网详解在 part 6.4 Imputation of missing values:https://scikit-learn.org/stable/modules/impute.html它包含四个重要参数:二、示例应用接下来将用实例来讲解如何使用填补缺失值:1)数据来源及数据

2020-07-28 16:39:47 4015 2

转载 Pandas中loc和iloc函数用法详解

loc函数:通过行索引 “Index” 中的具体值来取行数据(如取"Index"为"A"的行)iloc函数:通过行号来取行数据(如取第二行的数据)本文给出loc、iloc常见的五种用法,并附上详细代码。1. 利用loc、iloc提取行数据import numpy as npimport pandas as pd#创建一个Dataframedata=pd.DataFrame(np.arange(16).reshape(4,4),index=list('abcd'),columns=list('A

2020-07-25 19:49:18 3085 1

转载 AttributeError;‘Series‘ object has no attribute ‘split‘解决

AttributeError;‘Series’ object has no attribute 'split’解决pandas对字符串做处理>>> s = pd.Series(["this is good text", "but this is even better"]) >>> [x for x in s.split()]如果我们直接对Series中的字符串做切分,就会报错 AttributeError: ‘Series’ object has no a

2020-07-24 17:27:08 11400

原创 tableau 链接MySQL8.0报错[MySQL][ODBC 8.0(w) Driver]Can‘t connect to MySQL server on ‘192.168.1.3‘ (10061

tableau 链接MySQL8.0报错[MySQL][ODBC 8.0(w) Driver]Can’t connect to MySQL server on ‘192.168.1.3’ (10061)的解决办法打开控制面板,右上角的查看方式选择大图标,选择里面的管理工具打开;在管理工具里面,选择ODBC数据源选项,打开;在数据源管理程序里,选择用户DNS选项,之后点击右边的添加选项,添加配置驱动程序在弹出的以下窗口中填入相关的内容,之后点击右下方的test按钮测试,若显示connect

2020-07-23 21:46:24 8140

原创 DataFrame写入 MySQL(create_engine)

参考:Python连接MySQL数据库(pymysql),DataFrame写入 MySQL(create_engine)- Python代码https://blog.csdn.net/weixin_40683253/article/details/86741134Pandas DataFrame数据写入文件和数据库https://blog.csdn.net/dta0502/article/details/81876224?utm_source=blogxgwz6...

2020-07-22 15:50:36 901

转载 巴西百货商店olist客户购买商品分析

#https://zhuanlan.zhihu.com/p/53271588import pandas as pdfilenamestr=r'C:\Users\Administrator\Desktop\olist_products_dataset.xlsx'olist=pd.ExcelFile(filenamestr,dtype='str')olist_product=olist.parse('olist_products_dataset',dtype='str')olist_product

2020-07-15 20:33:15 529

原创 利用python分析泰坦尼克号数据集

利用python分析泰坦尼克号数据集参考:https://www.cnblogs.com/mxwbq/p/7106123.html?utm_source=itdadao&utm_medium=referralOlist巴西电子商务数据分析参考:https://blog.csdn.net/xiaocai1python/article/details/104781511https://www.jianshu.com/p/b5b8be56dfba?utm_campaign=haruki&u

2020-07-15 17:49:55 803

原创 jupyter notebook 提示no moudle pymysql的解决办法

参考:https://blog.csdn.net/weixin_41004763/article/details/88073528https://www.cnblogs.com/jisongxie/p/9892660.html

2020-07-14 14:43:01 1179

转载 概率问题的解决办法

概率问题,是面试数据分析师,算法工程师必考之一。【以下是一些网页截图】培训了那么多数据求职同学,发现大家普遍薄弱的是概率问题。由于大多数的概率问题可以由几种不同的思路来解题,所以导致很多同学理解了这题,再思考另一题的时候又卡住了。而且概率问题,不像曾经做过的project,可以提前做充分的准备。概率问题,就像高考题目,你永远不知道面试官会问什么,但是基本思路就这几种,只要融会贯通了,任何题目能可以迎刃而解。这篇文章总结了几种概率面试问题,重点是,我们从头到尾就只用同一种方法来解所有的问题!这

2020-06-15 14:36:03 1625

转载 R code execution error处理

R code execution error处理R code execution error解决方法:Ctrl + Shift + F10 to restart your R session原文链接:https://blog.csdn.net/u012111465/article/details/89681685

2020-06-14 23:27:29 6171

原创 利用python进行数据分析 数据聚合与分组运算groupby 和时间序列操作

>>> from pandas import DataFrame,Series>>> import numpy as np>>> df=DataFrame({'key1':['a','a','b','b','a'],'key2':['one','two','one','two','one'],'data1':np.random.randn(5),'data2':np.random.randn(5)})>>> df key.

2020-05-15 13:11:54 756

转载 pandas: pd.concat 用法

Python 3.6.5 (v3.6.5:f59c0932b4, Mar 28 2018, 17:00:18) [MSC v.1900 64 bit (AMD64)] on win32Type "copyright", "credits" or "license()" for more information.>>> import pandas as pd>>> from pandas import Series>>> import numpy

2020-05-11 22:20:09 1949

转载 数据分析师的技能要求是什么?

转自:https://zhidao.baidu.com/question/1953122565379821108.html数据分析师的技能要求是什么?1、懂业务。从事数据分析工作的前提就会需要懂业务,即熟悉行业知识、公司业务及流程,很好有自己独到的见解,若脱离行业认知和公司业务背景,分析的结果只会是脱了线的风筝,没有太大的使用价值。2、懂管理。一方面是搭建数据分析框架的要求,比如确定分析思路就需要用到营销、管理等理论知识来指导,如果不熟悉管理理论,就很难搭建数据分析的框架,后续的数据分析也很难进行。另

2020-05-10 23:37:36 569

转载 Python操作mongodb的9个步骤

一 导入 pymongofrom pymongo import MongoClient二 连接服务器 端口号 27017连接MongoDB连接MongoDB我们需要使用PyMongo库里面的MongoClient,一般来说传入MongoDB的IP及端口即可,第一个参数为地址host,第二个参数为端口port,端口如果不传默认是27017。conn = MongoClient(“localhost”)MongoClient(host=‘127.0.0.1’,port=27017)三 连接数据库

2020-05-10 14:04:06 415

转载 Python匿名函数lambda、filter函数、map函数、reduce函数用法详解

>>> range(1,100)range(1, 100)>>> x=range(1,100)>>> for i in range(1,100): print (i) 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748...

2020-05-10 12:36:36 259

原创 在学习中.........Python数据扩展包 Matplotlib

简单绘图:在同一个图片中绘制正弦和余弦函数>>> from pylab import *>>> X = np.linspace(-np.pi, np.pi, 256,endpoint=True)>>> C,S = np.cos(X), np.sin(X)>>> plot(X,C)[<matplotlib.lines.Line2D object at 0x00000000106CE6A0>]>>>

2020-05-09 21:52:01 193

转载 python float()函数用法,python int()、hex()、oct()、bin()、float()数值类型转换函数

float()函数是python中一个比较常用的内建函数,我们要详细掌握它的使用方法,避免在编写代码的过程中错误使用。float()函数返回一个十进制浮点型数值(小数)。float()括号内只能是三种类型的数据:1.二进制、八进制、十进制、十六进制的整数。2.bool(布尔值True和False)。3.表示十进制数字的字符串(如 ‘32’ )。三种类型的例子分别对应下面三个代码:在这里...

2020-05-07 20:28:05 5357

转载 python习题——随机整数生成类

随机整数生成类可以先设定一批生成数字的个数,可设定指定生成的数值的范围1.普通类实现import randomimport randomclass RandomGen: def __init__(self, start=1, stop=100, count=100): self.start = start self.stop = stop ...

2020-05-07 13:32:52 689

转载 MYSIAM和INNODB引擎区别

MYSIAM和INNODB引擎区别主要有以下几点:1.MyISAM查询性能比InnoDB更快,但不支持事务处理,InnoDB支持事务处理和外键等高级功能2.InnoDB不支持全文检索3.InnoDB中不保存表的具体行数,也就是说,执行select count() from table时,InnoDB要扫描一遍整个表来计算有多少行,但是MyISAM只要简单的读出保存好的行数即可。注意的是,当c...

2020-05-07 11:54:43 162

转载 Python3 数据合并函数 pandas.merge用法详解

摘要数据分析与建模的时候大部分时间在数据准备上,包括对数据的加载、清理、转换以及重塑。pandas提供了一组高级的、灵活的、高效的核心函数,能够轻松的将数据规整化。这节主要对pandas合并数据集的merge函数进行详解。(用过SQL或其他关系型数据库的可能会对这个方法比较熟悉。)码字不易,喜欢请点赞!!!1.merge函数的参数一览表2.创建两个DataFrame>>&gt...

2020-05-06 22:09:02 1714

转载 scrapy 下的 selector 练习

网页结构为:<html> <head> <base href='http://example.com/' /> <title>Example website</title> </head> <body> <div id='images'> <a href='image1....

2020-05-06 19:11:09 134

转载 数据分析需要学习哪些课程?

首先你需要看下这张图,这是一张数据分析师能力体系图:1、数学知识在这里小编给大家推荐编程学习圈,有免费课程分享,开发工具大数据学习qq群:458345782python学习qq群:250933691数学知识是数据分析师的基础知识。对于初级数据分析师,了解一些描述统计相关的基础内容,有一定的公式计算能力即可,了解常用统计模型算法则是加分。对于高级数据分析师,统计模型相关知识是必备能力,...

2020-05-05 23:21:49 569

转载 七周成为数据分析师学习笔记(第七周)

一、Python连接数据库1、安装pymysqlpip install pymysql注意安装路径,注意环境切换pip3 install pymysql(安装在python3下)2、连接数据库import pymysqlconn = pymysql.connect( host = 'localhost', # 127.0.0.1 user = 'root', passwo...

2020-05-04 20:40:45 192

原创 python 创建虚拟环境时报错OSError, setuptools下载失败

以前虚拟环境一下子就装好了, 今天多次尝试,发现错误信息总是如下D:\vir_env\supetset>virtualenv envUsing base prefix 'c:\\python36'New python executable in D:\vir_env\supetset\env\Scripts\python3.exeAlso creating executable in...

2020-04-29 14:16:37 1059

原创 七周成为数据分析 python可视化7.127-7.130

>>> import pandas as pd>>> df=pd.read_csv(r"C:\Users\Administrator\Desktop\position_gbk.csv",encoding='gbk')>>> df.avg0 8.01 12.52 5.03 7.0...

2020-04-27 17:24:58 194

转载 《靠谱》里提到的书目

《靠谱》里提到的书目卡卡托 评论 靠谱 2018-01-06 10:29:571,《问题解决专业法——思维和技能》(斋藤嘉则著)2,《企业参谋》(大前研一著)3,《世界最简单的问题解决方法》(渡边健介著)4,《三分钟搞懂问题解决的基本》(大石哲之著)5,《麦肯锡教我的思考武器》(安宅和人著)6,《用头脑思考》(伊贺泰代著)7,《观想力·为何空气是透明的》(三谷宏治著)8,《幸...

2020-04-23 13:26:08 789

转载 麦肯锡逻辑树——快速分析和解决问题的有效方法

这是阅读《靠谱——顶尖咨询师教你的工作基本功》的第二篇笔记。作者在第二章“逻辑思考技巧”当中,介绍了一种分析和解决问题的技巧——逻辑树。但是书中所述并不详细,我又阅读了网络上大量介绍逻辑树的文章,于是有了这一篇介绍逻辑树的文章,希望你喜欢。1.什么是逻辑树逻辑树又称为演绎树或分解树,英文叫做Issue Tree,是一种以树状图形来分析存在的问题及其相互关系的方法。首先将一个已知问题当成树干,...

2020-04-15 21:53:32 4453

转载 百家号在电脑上如何查看作者的其它文章

参考:https://jingyan.baidu.com/article/295430f196dd400c7e00508e.html

2020-04-15 21:19:20 2634

原创 python使用scipy模块from scipy.misc import imread时报错:ImportError: cannot import name 'imread' 的解决办法

在py3中出错如下:>>> import scipy>>> from scipy.misc import imreadTraceback (most recent call last): File "<pyshell#1>", line 1, in <module> from scipy.misc import imre...

2020-04-12 21:31:53 4783 1

转载 使用Python画一朵玫瑰花

from turtle import *import timesetup(600, 800, 0, 0)speed(0)penup()seth(90)fd(340)seth(0)pendown()#speed(5)begin_fill()fillcolor('red')circle(50, 30)for i in range(10): fd(1) l...

2020-04-04 23:13:50 1203

原创 Python使用plotly绘制数据图表的方法

本文介绍了利用python-plotly绘制数据图的方法,实例中 线图(line plots)、散点图(scatter plots)、柱状图(bar charts)、饼图(pie charts)以及填充堆叠线图(filled area plots)这五种典型的图表基本上涵盖了大部分类型的测试数据,# 生成折线图import plotlyimport chart_studio.plotly a...

2020-04-04 23:10:16 503

原创 Python plotly安装出现的问题计解决办法

从官网下载plotly4.6.0 在window7下安装 C:\Users\Administrator\Desktop>pip3 install plotly-4.6.0-py2.py3-none-any.whl安装成功后import plotpy,提示ModuleNotFoundError: No module named ‘plotpy’from plotly.plotly as ...

2020-04-04 21:23:08 4975

转载 Python 正则表达式匹配小数

import refind_float = lambda x: re.search("\d+(\.\d+)?",x) .group()find_float("有1.3元")输出为:'1.3'参考:https://www.cnblogs.com/cymwill/p/7577302.html

2020-04-03 21:58:59 4912

原创 pandas中的map()、apply()、applymap()函数的区别

它们的区别就在于应用对象的不同>>> df1= pd.DataFrame({"id":[1001,1002,1003,1004,1005,1006], "age":[23,44,54,32,34,32], "price":[1200,np.nan,2133,5433,np.nan,4432]}, ...

2020-04-03 21:14:07 204 1

转载 对比excel,轻松学习python数据分析

对比excel,轻松学习python数据分析一直想把excel和python关联起来,加深学习pandas的印象,正好在知乎上找到@天天 提到的的《对比excel,轻松学习python数据分析》这本书,紧接着又搜到了苏克1900:像 Excel 一样使用 python 进行数据分析 这篇专栏文章,文章写得很全,遂在jupyte notebook上重写了一遍里面的代码,以供对照学习。按照书中目录,...

2020-04-02 20:42:19 2411 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除