1 郑锋淇

尚未进行身份认证

我要认证

暂无相关简介

等级
TA的排名 34w+

数据分析 第三章 模型搭建和评估

资料参考[1]这里提到了plt.rcParams,资料参考[2]里面提到“plt(matplotlib.pyplot)使用rc配置文件来自定义图形的各种默认属性,称之为“rc配置”或“rc参数”。通过rc参数可以修改默认的属性,包括窗体大小、每英寸的点数、线条宽度、颜色、样式、坐标轴、坐标和网络属性、文本、字体等。rc参数存储在字典变量中,通过字典的方式进行访问。”[1]https://nbviewer.jupyter.org/github/andongBlue/hands-on-data-ana

2020-08-28 01:18:41

数据分析 第二章 3.数据可视化

课程资料参考自[1]导入包和数据并且打印import numpy as npimport pandas as pdimport matplotlib.pyplot as plttext = pd.read_csv("E:/Python/python操作/Datawhale/datawhale数据分析/关于数据/第二章项目集合/result.csv")print(text.head())# Unnamed: 0 PassengerId Survived ... Fare Ca

2020-08-25 19:52:33

数据分析 第二章 2.重构数据

在第二章第一节的内容中,学习了数据的清洗。这一节,做的是数据重构,数据重构依旧属于数据理解(准备)的范围。import numpy as npimport pandas as pd'''载入data文件中的:train-left-up.csv'''text = pd.read_csv('E:\Python\python操作\Datawhale\datawhale数据分析\关于数据\第二章项目集合\data\\train-left-up.csv')print(text.head())# P

2020-08-21 20:15:01

数据分析 第二章 1.数据清洗及特征处理

先加载库和导入数据#加载所需的库import numpy as npimport pandas as pd#加载数据train.csvdf = pd.read_csv('train.csv')print(df.head(3))# PassengerId Survived Pclass ... Fare Cabin Embarked# 0 1 0 3 ... 7.2500 NaN S# 1

2020-08-21 20:14:49

03 探索数据

导入numpy、pandas包和数据import pandas as pdtext = pd.read_csv('train_chinese.csv')print(text.head())# 乘客ID 是否幸存 仓位等级 ... 票价 客舱 登船港口# 0 1 0 3 ... 7.2500 NaN S# 1 2 1 1 ... 71.2833 C85 C# 2 3

2020-08-19 20:33:57

数据分析 02 Pandas基础

2 Pandas基础我们学习pandas的基础操作,那么上一节通过pandas加载之后的数据,其数据类型是什么呢?Pandas中有两个数据类型DataFrame和Series。Series是一种类似于一维数组的对象。它由一组数据(各种Numpy数据类型)以及一组与之相关的数据标签(即索引)组成,它只有行索引。DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型值)。DataFrame既有行索引也有列索引,它可以被看做由Series组成的字典(共

2020-08-19 19:57:37

数据分析 01 数据载入及初步观察

1. 数据载入及初步观察1.1 载入数据此处略1.1.1 任务一:导入numpy和pandasimport numpy as npimport pandas as pd1.1.2 任务二:载入数据(1) 使用相对路径载入数据把数据文件安置在和.py同个文件夹下就可以'''使用相对路径以及打印前十行'''df1 = pd.read_csv("train.csv")df2 = pd.read_csv("test.csv")print(df1.head(10))# Passeng

2020-08-19 17:35:18

09 文件与文件系统(Datawhale)

1. 文件与文件系统open(file, mode='r', buffering=None, encoding=None, errors=None, newline=None, closefd=True) Open file and return a stream. Raise OSError upon failure.file: 必需,文件路径(相对或者绝对路径)。mode: 可选,文件打开模式buffering: 设置缓冲encoding: 一般使用utf8errors: 报错级别newl

2020-08-09 01:47:45

08 模块(Datawhale)

模块是一个包含所有自己定义的函数和变量的文件,其后缀名是.py。模块可以被别的程序引入,以使用该模块中的函数等功能。这也是使用 Python 标准库的方法。知识来源于[1]1. 什么是模块容器 -> 数据的封装函数 -> 语句的封装类 -> 方法和属性的封装模块 -> 程序文件2. 命名空间内置命名空间(Built-in Namespaces):Python 运行起来,它们就存在了。内置函数的命名空间都属于内置命名空间,所以,我们可以在任何程序中直接运行它们,比如id(

2020-08-07 22:21:12

07 类、对象、方法

1. 类和对象一个类通常可以实例化为多个对象,对象与对象之间是独立的。类:对一类事物的描述,是抽象的、概念上的定义。比如做猫可以作为动物的抽象类; 对象:实际存在的该类事物的每个个体,因而也称实例(instance)。比如不同的猫即为不同的对象; 二者的关系:对象是由类派生的、创建的。一个类可以创建无穷多个对象,每个对象都属于类。类的特性:每个类有且只有一个__init__方法,用于初始化属性。对象的特性:(1)每一个对象都有自己 独立的内存空间,保存各自不同的属性;(2)多个对象的方法**,**在

2020-08-05 22:47:00

06 函数(Datawhale)

资料参考于[1]1. 函数的定义Python 把函数也当成对象,可以从另一个函数中返回出来而去构建高阶函数,此时参数是函数,返回值是函数。(1)函数以def关键词开头,后接函数名和圆括号()。(2)函数执行的代码以冒号起始,并且缩进。(3)return [表达式] 结束函数,选择性地返回一个值给调用方。不带表达式的return相当于返回None。def functionname(parameters): "函数_文档字符串" function_suite return [

2020-08-02 21:51:33

06 Lambda 表达式(Datawhale)

资料参考于[1]1. 匿名函数的定义(1)在 Python 里有两类函数:第一类:用 def 关键词定义的正规函数第二类:用 lambda 关键词定义的匿名函数(2)匿名函数的创建语法结构如下:lambda argument_list: expressionlambda - 定义匿名函数的关键词。argument_list - 函数参数,它们可以是位置参数、默认参数、关键字参数,和正规函数里的参数类型一样。:- 冒号,在函数参数和表达式中间要加个冒号。expression - 只是一

2020-08-02 21:50:29

05 集合(源于Datawhale)

Python 中set与dict类似,也是一组key的集合,但不存储value。同样的都是key,所以没有重复的。并且和字典的key一样都是不可变类型。数值、字符串和元组是不可变类型。1. 集合的创建方法一: 先创建对象再加入元素,创建空集合的时候要注意只能使用对象=set(),因为对象={}是空字典的形式。basket = set()basket.add('apple')basket.add('banana')print(basket) # {'banana', 'apple'}方

2020-08-02 11:47:54

05 字典(源于Datawhale)

在此谢谢Datawhale提供的资料帮助学习,[1]为资料来源1. 可变类型和不可变类型注意区别序列和字典:(1)序列是以连续的整数为索引(2)字典是以"关键字"为索引,关键字可以是任意不可变类型,通常用字符串或数值。那么如何判断一个数据类型x是不是可变类型?下面两种方法:(1)麻烦方法:用 id(x) 函数,对x进行某种操作,比较操作前后的 id,如果不一样,则x不可变,如果一样,则x可变。下面进行举例子:i = 1print(id(i)) # 140732167000896i =

2020-07-31 20:56:48

关于False

为0的数字,包括0、0.0空字符串,包括’’,""表示空值的None空集合,包括(),[],{}这些都是False其他的值都认为是True。

2020-07-31 20:04:18

04 列表(源于Datawhale)

1. 数据类型的介绍简单数据类型整型<class 'int'>浮点型<class 'float'>布尔型<class 'bool'>容器数据类型列表<class 'list'>元组<class 'tuple'>字典<class 'dict'>集合<class 'set'>字符串<class 'str'>2. 列表列表的定义列表是有序集合,没有固定大小,能够保存任意数量任意类型的 P

2020-07-28 22:54:06

04 元组(源于Datawhale)

在[1]中提及到“python将不能修改的值称为不可变的,不可变的列表称为元组。使用圆括号来标识,可以用索引去访问元素"「元组」定义语法为:(元素1, 元素2, ..., 元素n)它有两个特征:(1)小括号把所有元素绑在一起(2)逗号将每个元素一一分开1 元组和创建元组和列表类似,不过就像前面所说,列表是可以修改可以变的,而元组不行;并且列表是用中括号进行标识的,元组是用小括号,或者不用(不过一般情况是会用小括号的,为了可读性),字典是用花括号;和列表一样也可以用整数来对它进行索引 (index

2020-07-28 22:53:36

04 字符串(源于Datawhale)

在此谢谢Datawhale提供的资料帮助学习,[1]为资料来源1 字符串的定义(1)Python 中字符串被定义为引号之间的字符集合,引号使用成对的单引号或双引号。t1 = 'i love Python!' # 单引号print(t1, type(t1))# i love Python! <class 'str'>t2 = "I love Python!" # 双引号print(t2, type(t2))# I love Python! <class 'str'>

2020-07-28 22:51:58

关于运算符的简写

有的时候会用到运算符的简写,公式如下:x op= expressionx = x op expression这里有一点要注意,在第一行的代码中op和=是要连在一起的[1]http://www.360doc.com/content/19/0702/15/54508727_846264302.shtml

2020-07-28 11:03:38

break和continue的知识点补充

1 break在[1]中提及到break语句用来终止循环语句,即循环条件没有False条件或者序列还没被完全递归完,也会停止执行循环语句。break语句用在while和for循环中。如果使用嵌套循环,break语句将停止执行最深层的循环,并开始执行下一行代码。i = 0while i<10: i+=1 if i==5: #当i=5时,结束整个循环 break print("i=%d"%i)# i=1# i=2# i=3# i=4i =

2020-07-27 17:15:24

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv3
    勤写标兵Lv3
    授予每个自然周发布7篇到8篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。