自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

wuzlun的专栏

路漫漫其修远兮,吾将上下而求索

  • 博客(28)
  • 资源 (2)
  • 收藏
  • 关注

转载 matplotlib 与 seaborn 中出现中文乱码的解决方法(ubuntu下亲测有用)

原文:https://www.cnblogs.com/ToDoToTry/p/7793137.htmlLinux、Mac osx 系统中,出现 matplotlib 或 seaborn 绘图中有中文乱码的情形,可以考虑使用以下方式处理: 到 anaconda 的 matplotlib 中查看是否有 simhei.ttf 字体: cd ~/anaconda3/lib/python3.5...

2018-05-24 17:07:36 3151

原创 Python绘图总结(seaborn篇)之线性关系

学习https://seaborn.pydata.org 记录,描述不一定准确,具体请参考官网%matplotlib inlineimport numpy as npimport pandas as pdfrom scipy import stats, integrateimport seaborn as snsimport matplotlib.pyplot as plt# s...

2018-05-15 16:30:19 9285 1

原创 Python绘图总结(seaborn篇)之数据分类

学习https://seaborn.pydata.org 记录,描述不一定准确,具体请参考官网%matplotlib inlineimport numpy as npimport pandas as pdfrom scipy import stats, integrateimport seaborn as snsimport matplotlib.pyplot as plt# s...

2018-05-15 15:07:37 13991

原创 Python绘图总结(seaborn篇)之数据分布

%matplotlib inlineimport numpy as npimport pandas as pdfrom scipy import stats, integrateimport seaborn as snsimport matplotlib.pyplot as plt# plt.rcParams['font.sans-serif']=['SimHei'] # 用来正常显示...

2018-05-15 13:19:48 5940 2

原创 Python绘图总结(seaborn篇)之数据分布

学习https://seaborn.pydata.org/index.html记录,描述不一定准确,具体请参考官网%matplotlib inlineimport numpy as npimport pandas as pdfrom scipy import stats, integrateimport seaborn as snsimport matplotlib.pyplot a...

2018-05-15 10:30:48 60013 3

原创 利用Python进行数据分析笔记-pandas建模(scikit-learn篇)

跟着教程学习了一段时间数据分析,越学感觉坑越多。于是花了一个星期仔细看了下《利用Python进行数据分析》。写在这里主要是记录下,方便自己查看。scikit-learn简介scikit-learn是一个被广泛使用的python机器学习工具包。里面包含了很多监督式学习和非监督式学习的模型,可以实现分类,聚类,预测等任务。虽然scikit-learn并没有和pandas深度整合,但在训练模...

2018-05-14 08:51:20 3637

原创 利用Python进行数据分析笔记-pandas建模(statsmodels篇)

跟着教程学习了一段时间数据分析,越学感觉坑越多。于是花了一个星期仔细看了下《利用Python进行数据分析》。写在这里主要是记录下,方便自己查看。statsmodels简介statsmodels是一个有很多统计模型的python库,能完成很多统计测试,数据探索以及可视化。它也包含一些经典的统计方法,比如贝叶斯方法和一个机器学习的模型。statsmodels中的模型包括:...

2018-05-14 08:49:39 48207 5

原创 利用Python进行数据分析笔记-pandas建模(Patsy篇)

跟着教程学习了一段时间数据分析,越学感觉坑越多。于是花了一个星期仔细看了下《利用Python进行数据分析》。写在这里主要是记录下,方便自己查看。import numpy as npimport pandas as pdimport patsy# 利用Patsy创建模型描述Patsy是一个python库,用于描述统计模型(尤其是线性模型),方法是通过一个叫做公式语法(...

2018-05-11 23:01:17 12689 8

原创 利用Python进行数据分析笔记-时间序列(移动窗口函数)

Moving Window Functions(移动窗口函数)一种用于时间序列操作的重要用法,是使用滑窗(sliding windown)或呈指数降低的权重(exponentially decaying weights),来对时间序列进行统计值计算和其他一些函数计算。 这个对于消除噪声或有缺陷的数据是很有用的。这里我们称之为Moving Window Functions(移动窗口函数),不过其...

2018-05-11 22:57:36 16478 2

原创 利用Python进行数据分析笔记-时间序列(时区、周期、频率)

时区处理时区可以理解为UTC的偏移(offset),例如,在夏令时,纽约时间落后于UTC时间四个小时,而在一年的其他时间里,纽约时间落后于UTC时间五个小时。在python中,时区信息来自第三方的pytz库,这个库利用的是奥尔森数据库,这个数据库汇集了世界时区信息。这个信息对于历史数据很重要,因为夏令时(daylight saving time,DST)的交接日(transition da...

2018-05-11 22:52:33 7633

原创 利用Python进行数据分析笔记-时间序列(转换、索引、偏移)

时间序列指能在任何能在时间上观测到的数据。很多时间序列是有固定频率(fixed frequency)的,意思是数据点会遵照某种规律定期出现,比如每15秒,每5分钟,或每个月。时间序列也可能是不规律的(irregular),没有一个固定的时间规律。如何参照时间序列数据取决于我们要做什么样的应用,我们可能会遇到下面这些:Timestamps(时间戳),具体的某一个时刻Fixed periods...

2018-05-11 22:42:09 3346

原创 利用Python进行数据分析笔记-数据加工(分组、聚合及分组应用)

%matplotlib inlineimport matplotlib.pyplot as pltimport numpy as npimport pandas as pd# 数据汇总和组操作### 1、GroupBy Mechanics(分组机制)Hadley Wickham,是很多R语言有名库的作者,他描述group operation(组操作)为s...

2018-05-11 17:17:35 3265

原创 利用Python进行数据分析笔记-数据加工(合并、整形、旋转及分层索引)

在很多应用中,数据通常散落在不同的文件或数据库中,并不方便进行分析。数据加工就是对这些数据的统一。join:连接combine:合并reshape:整形merge:归并concatenate:串联pivot:旋转stack:堆叠import pandas as pdimport numpy as np合并数据集pandas里有几种方法可以合并数据:...

2018-05-11 16:58:32 1399

原创 利用Python进行数据分析笔记-数据清洗

在pandas中,missing data呈现的方式有些缺点的,但对大部分用户能起到足够的效果。对于数值型数据,pandas用浮点值Nan(Not a Number)来表示缺失值。我们称之为识别符(sentinel value),这种值能被轻易检测到数据缺失在pandas中,我们使用了R语言中的一些传统,把缺失值表示为NA(not available)。在统计应用里,NA数据...

2018-05-11 16:49:38 2369

原创 利用Python进行数据分析笔记-读写数据

Pandas方法1、读取文件pandas有很多用来读取表格式数据作为dataframe的函数,下面列出来一些。其中read_csv和read_tabel是最经常用到的:import pandas as pdimport numpy as np# read_csv方法df = pd.read_csv('../examples/ex1.csv')df...

2018-05-11 16:39:45 2984 1

原创 利用Python进行数据分析笔记-pandas基础

import pandas as pdfrom pandas import Series, DataFrameimport numpy as npSeries基础obj = pd.Series([4, 7, -5, 3], index=['d', 'b', 'a', 'c'])obj d 4 b 7 a -5 c...

2018-05-11 16:32:03 799

原创 利用Python进行数据分析笔记-Numpy基础

跟着教程学习了一段时间数据分析,越学感觉坑越多。于是花了一个星期仔细看了下《利用Python进行数据分析》。写在这里主要是记录下,方便自己查看。import matplotlib.pyplot as pltimport numpy as np创建n维数组1、使用array函数最简单的方法使用array函数,输入一个序列即可,比如list# 随机生成数据data = ...

2018-05-11 16:11:29 693

原创 Python绘图总结(Matplotlib篇)之pandas内建可视化工具

matplotlib是一个相对底层的工具。pandas自身有内建的可视化工具。1、Line Plots(线图)Series和DataFrame各自都有plot属性,用来做一些比较基本的绘图类型。默认,plot()会绘制线图:# 使用该魔法,不用写plt.show()# %matplotlib notebookimport matplotlib.pyplot as plt...

2018-05-08 17:29:57 1918

原创 Kaggle初体验-机器学习之泰坦尼克号乘客生存预测(下)

上篇中我们用常规方法分析了泰坦尼克号事件中乘客的生存情况,最后得出结论,已知某人的资料并不能判断他或她是生存或死亡。上篇链接:https://blog.csdn.net/wuzlun/article/details/80189766那么接下来我们用机器学习的方法来分析。# 再次导入本次用到的工具# 使用该魔法,不用写plt.show()%matplotlib inline ...

2018-05-04 09:24:20 1763

原创 Kaggle初体验-机器学习之泰坦尼克号乘客生存预测(上)

学习数据分析也有段时间了,都只是使用一些简单图表来分析数据,本周将开启全新的学习旅程:机器学习(^_^偷笑)。本次通过Kaggle所举办的泰坦尼克挑战赛 来机器学习分析并预测某一乘客的生存或死亡。Kaggle提供两部分数据,训练数据(train.csv)和测试数据(test.csv),我们通过对训练数据分析,构建一个模型,并用这个模型来加载预测数据,分析test.csv表中乘客生存或死亡。最后...

2018-05-04 08:29:56 3041

原创 Python绘图总结(Matplotlib篇)之画布、颜色、及样式

学习https://matplotlib.org/gallery/index.html 记录,描述不一定准确,具体请参考官网import matplotlib.pyplot as pltplt.rcParams['font.sans-serif']=['SimHei'] # 用来正常显示中文标签plt.rcParams['axes.unicode_minus']=False # 用来正常显...

2018-04-24 08:43:17 114663 10

原创 Python绘图总结(Matplotlib篇)之字体、文本及注释

学习https://matplotlib.org/gallery/index.html 记录,描述不一定准确,具体请参考官网%matplotlib inlineimport matplotlib.pyplot as pltplt.rcParams['font.sans-serif']=['SimHei'] # 用来正常显示中文标签plt.rcParams['axes.unicode_mi...

2018-04-24 08:36:00 97389

原创 Python绘图总结(Matplotlib篇)之坐标轴及刻度

学习https://matplotlib.org/gallery/index.html 记录,描述不一定准确,具体请参考官网import matplotlib.pyplot as pltplt.rcParams['font.sans-serif']=['SimHei'] # 用来正常显示中文标签plt.rcParams['axes.unicode_minus']=False # 用来正常显...

2018-04-23 17:12:13 296472 16

原创 Python绘图总结(Matplotlib篇)之图形分类及保存

学习https://matplotlib.org/gallery/index.html 记录,描述不一定准确,具体请参考官网import matplotlib.pyplot as pltplt.rcParams['font.sans-serif']=['SimHei'] # 用来正常显示中文标签plt.rcParams['axes.unicode_minus']=False # 用来正常显...

2018-04-23 17:05:18 27440 2

原创 用python预测高考成绩

感谢ButtersPC提供的数据集。本文旨在学习数据分析的基本过程,文中敏感数据均已隐藏。本文通过一些基本描述统计,如考生人数、科目分数及平均分、考试排名,文科理科等因素,尽可能地探求数据集中包含的有价值的信息,来预测高考成绩。导读:>1、数据集选用“某年上海某区高考二模成绩”2、上海过去几年的高考制度采用“3+1+1”的模式,语数英 + 加一学科 + 综合,加一学科指在物理、化学...

2018-04-19 10:54:10 8117 7

原创 python分析掷骰子游戏

最近学习了点统计学及python知识,试着分析下掷骰子游戏。骰子按标准6面,分析一次投1颗、2颗、3颗、4颗,投掷10、100、1000、10000次时的结果。 使用工具 Jupyter Notebook 分析利器 matplotlib、pygal 可视化包1、猜次数1-6中每个数字出现的次数# 导入包import pygalimport numpy a...

2018-04-13 08:35:17 13720

原创 利用Pygame开发游戏学习Python(入门)

为什么学习python游戏开发?以游戏为突破口,学习python。使用工具: 1、Anaconda:管理各种库,如果其中找不到再利用pip安装。自带的Jupyter Notebook更是数据分析,简单调试的不二首道。 2、pycharm:复杂项目、大型项目开发利器。 3、sublime:看别人源码时用,支持N多格式。学习基础:1、因为有一定的基础,所以简单...

2018-04-10 16:02:28 2199

原创 学习用Python分析股票数据(入门)

学习使用python来分析股票,主要事涉及数据获取、数据可视化,以及探究数据中各项指标的含义及和关系。使用工具 pandas、numpy、datatime pandas-datareader 在线获取股票数据 matplotlib 数据可视化 Jupyter Notebook 数据分析利器#一、数据获取# 导入包impo...

2018-04-10 15:52:38 36383 7

gameobjects-0.0.3 for python3

cmd 进入到gameobjects-0.0.3目录下输入以下命令,安装即可! python setup.py install 亲测,python3.6可以用

2018-03-30

ksoap2-android-demo-webService 完整代码

Android使用ksoap2-android调用WebService学习,代码来自:http://blog.csdn.net/eyu8874521/article/details/9125987 原代码中的数据源已失效,我只是修改了新数据源。 运行前先去 http://WebXml.com.cn/ 网站注册一个账号,并修改代码中的“theUserID”

2017-07-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除