Vxxxx_-CSDN博客

原创 pandas 数据透视

目录数据透视数据透视Excel中数据透视表的使用非常广泛了，其实Pandas也提供了一个类似的功能，名为pivot_table.。使用padas的pivot_table的一个挑战是，需要确保理解你的数据，并清楚的知道想通过透视表解决什么问题，虽然pivot_table看起来只是一个简单的函数，但它能够快速地对数据进行强大的分析。基础形式pd.pivot_table(df,index=['名字']) #根据名字做索引多个索引pd.pivot_table(df,index=['名字','产地']

2020-09-30 15:25:49 313

原创 pandas 数据格式转换

目录数据格式转换查看格式格式转换排序基础统计分析描述性统计分析最值、均值、方差等数据格式转换在做数据分析的时候，原始数据往往会因为各种各样的原因产生各种数据格式的问题。数据格式是我们非常注意的一点，数据格式错误往往会造成严重的后果。并且，很多异常值也是我们经过格式转换之后才会发现，对我们规整数据、清洗数据有者重要的作用。读取数据import pandas as pdimport numpy as npdf=pd.read_excel('C:/Users/HP/Desktop/tf/电影.xls

2020-09-29 15:01:00 1953

原创 pandas 异常值处理

目录缺失值及异常值处理缺失值处理方法判断缺失值填充缺失值缺失值及异常值处理缺失值处理方法判断缺失值df.isnull() #是否是缺失的判断df['名字'].isnull() #确定列进行判断填充缺失值

2020-09-29 13:15:28 1426

原创 pandas 数据处理

目录pandas读取数据及数据处理行操作添加一行删除一行列操作添加一列删除一列通过标签选择数据条件选择pandas读取数据及数据处理这里以电影评分为例：（随机摘取）：df=pd.read_excel('C:/Users/HP/Desktop/tf/电影.xlsx') #读取数据df.head() #查看数据前5行行操作df.iloc[0] #查看第一行名字肖申克的救赎投票人数 692795类型剧情/犯罪产地美国上映

2020-09-28 20:40:01 227

原创 pandas数据类型介绍

目录pandas 基本介绍pandas 基本数据结构series 类型Data Frame 类型查看数据pandas 基本介绍pandas是基于Numpy的一种工具，该工具是为了解决数据分析任务而创建的。Pandas纳入了大量库和一些标准的数据模型，提供了高效地操作大型数据集所需的工具，同时也提供大量能使我们快速便捷的处理数据的函数和方法。import pandas as pdpandas 基本数据结构pandas 有两种常用的基本结构：Series一维数组，与Numpy中的一维array类

2020-09-27 22:38:18 3018 1

原创 python Numpy学习（五）

目录多维数组操作数组形状多维数组操作数组形状a=np.array(6)aarray([0, 1, 2, 3, 4, 5])a.shape=2,3 #设置成2行3列的矩阵aarray([[0, 1, 2] [3, 4, 5]])a.shape(2,3)

2020-09-27 19:13:05 426

原创 python Numpy学习（四）

目录类型转换asarray函数astype方法数组操作数组排序sort函数argsort函数求和最大值最小值均值标准差相关系数矩阵类型转换a.nparray([1.5,-3],dtype=float)#转换数字类型为浮点数aarray([ 1.5, -3.])asarray函数np.array([1,2,3])np.asarray(a,dtype=float)array([ 1., 2., 3.])astype方法astype方法是返回一个新数组：a=np.array([1,2,

2020-09-25 18:54:04 135

原创 python Numpy学习（三）

目录python numpy学习（三）花式索引一维花式索引二维花式索引python numpy学习（三）花式索引切片只能支持连续或者等间隔的切片操作，要想实现任意位置的操作，需要使用花式索引fancy slicing.一维花式索引与range函数类似，我们可以使用arange函数来生成等差数列。a=np.arange(0,100,10)aarray([0, 10, 20, 30, 40, 50, 60, 70, 80, 90])花式索引需要指定索引位置：index=[1,2,-3]y

2020-09-25 18:08:42 134

原创 python Numpy学习（二）

目录python Numpy学习索引与切片多维数组及其属性多维数组索引多维数组切片python Numpy学习索引与切片和列表相似，数组也支持索引和切片操作。索引第一个元素：a=np.array([0,1,2,3])a[0]0修改第一个元素的值：a[0]=10aarray([10 ,1, 2, 3])切片，支持负索引：a=np.array([11,12,13,14,15])a[1:3]array([12, 13])a[1:-2]array([12, 13])a[-

2020-09-22 15:53:59 148

原创 python自定义函数

自定义函数函数function，通常接受输入参数，并有返回值。它负责完成某项特定任务，而且相较于其他代码，具备相对的独立性。函数通常有以下特征：使用def关键词来定义函数.def后面是函数的名称，括号中是函数的参数，不同参数用“，”隔开.def func()：的形式是必须要有的，参数可以为空.使用缩进来划分函数的内容.return返回特定的值，如果省略，返回None.def add(x,y): #定义函数 a=x+y return aprint(add(2,3))

2020-09-22 14:28:40 272

原创 python Numpy学习（一）

目录python Numpy学习Numpy的数组对象及其索引产生数组数组属性python Numpy学习Numpy是Python的一种开源的数值计算扩展器。这种工具可用来存储和处理大型矩阵，比Python自身的嵌套列表结构要高效的多。 Numpy提供了许多高级的数值编程工具。 Numpy的一个重要特性是它的数组计算。是我们做数据分析必不可少的一个包。导入python库使用关键字import，后面可以自定义库的简称，但是一般都是将 Numpy命名为np，pandas命名为pd.使用前一定要先导入

2020-09-22 14:19:37 124

原创 python数据结构

目录数据类型列表List元组tuple字典dict集合set类型转换可变对象和不可变对象数据类型以上是简单的常用数据类型列表Lista = [1,2,3,4,5]a[1, 2, 3, 4, 5]names=['张楚','蔡会文','郑语','王格斯','李湘','范例']names['张楚', '蔡会文', '郑语', '王格斯', '李湘', '范例']列表里面允许数字类型不一样：b=[1,2,3,'周迅','章子怡']b[1, 2, 3, '周迅', '章子怡']列表生成式

2020-09-18 00:06:28 114

原创 python条件循环语句

目录条件语句if 语句if - else语句if - elif - else 语句循环语句while循环语句while - else 循环语句for 循环语句for - else 循环语句for 循环中的 range 函数条件语句Python 中的条件控制语句 (Conditional control statement) 是通过一条或者多条语句的执行结果（True 或者 False），来决定执行的代码逻辑。它包含 if 、elif 、else 关键字， Python 中没有 else if 的

2020-09-16 13:56:39 2429

原创实参、形参、局部变量和全局变量

目录实参和形参实参数据传递函数调用过程形参实参和形参的关系局部变量和全局变量局部变量局部变量的作用域说明：全局变量全局变量说明：实参和形参实参实际参数简称“实参”。在调用有参函数时，函数名后面括号中的参数称为“实际参数”，实参可以是常量、变量或表达式。在调用有参函数时，主调函数和被调函数之间有数据传递关系。在主调函数中调用一个函数时，函数名后面括号中的参数称为“实际参数”（简称“实参”）。实参可以是常量、变量或表达式，无论实参是何种类型的量，在进行函数调用时，它们都必须具有确定的值，以便把这些

2020-09-15 16:53:39 8373

原创逻辑回归

目录逻辑回归估算概率训练和成本函数决策边界逻辑回归逻辑回归就是被广泛用于估算一个实例属于某个特定类别的概率。如果估算概率超过50%就是属于该类，反之则不是。估算概率逻辑回归模型概率估算:逻辑函数：预测模型：t = np.linspace(-10, 10, 100)sig = 1 / (1 + np.exp(-t))plt.figure(figsize=(9, 3))plt.plot([-10, 10], [0, 0], "k-")plt.plot([-10, 10], [0.5,

2020-09-14 12:23:22 107

原创正则线性模型

目录正则线性模型岭回归套索回归弹性网络早期停止法正则线性模型减少模型过拟合的一个好办法是对模型正则化。对于多项式模型，简单办法就是降低多项式的阶数，下面将会使用Ridge回归、Lasson回归、Elastic网络三种方法来对权重进行约束。岭回归岭回归是线性回归的正则化版，通过在成本函数中添加一个等于的正则项，需要注意的是，正则项只能在训练的时候添加到损失函数中，一旦训练完成，需要使用未经正则化的性能指标来评估模型性能。执行岭回归前，必须对数据做特征缩放，因为其对于输入特征的大小非常敏感。fr

2020-09-13 14:58:42 331

原创多项式回归学习曲线

目录多项式回归学习曲线多项式回归如果数据比简单的线性更加复杂，我们也可以用线性模型来拟合，只需要给每个特征添加一个新特征，然后用扩展后的新特征来训练。import numpy as npimport numpy.random as rndnp.random.seed(42)m = 100X = 6 * np.random.rand(m, 1) - 3y = 0.5 * X**2 + X + 2 + np.random.randn(m, 1)#设置方程plt.plot(X, y, "b.")

2020-09-12 18:46:24 688

原创机器学习笔记：梯度下降

目录梯度下降批量梯度下降随机梯度下降小批量梯度算法梯度下降梯度下降是非常常用的优化方法，能够为大范围的问题找到最优解，可以类比迷失在浓雾的山上想下山。具体而言，通过测量参数相关的误差函数的局部梯度，并不断沿着降低梯度的方向调整，直到梯度降为0，达到最小值。梯度下降每一个重要参数的每一步的步长，这取决于超参数学习率。并不是所有的成本函数都像碗，有的可能像洞，像其他各种不规则的地形，导致模型难以收敛。梯度下降算法的两个主要挑战，一个是局部最小值，另一个是高原地区需要很长时间才能越过。不过线性回归模型的M

2020-09-11 17:42:06 333

Vxxxx_的博客

原创 pandas 数据透视

原创 pandas 数据格式转换

原创 pandas 异常值处理

原创 pandas 数据处理

原创 pandas数据类型介绍

原创 python Numpy学习（五）

原创 python Numpy学习（四）

原创 python Numpy学习（三）

原创 python Numpy学习（二）

原创 python自定义函数

原创 python Numpy学习（一）

原创 python数据结构

原创 python条件循环语句

原创实参、形参、局部变量和全局变量

原创逻辑回归

原创正则线性模型

原创多项式回归学习曲线

原创机器学习笔记：梯度下降

原创机器学习笔记：线性回归

原创机器学习的主要挑战

原创机器学习笔记：概览

原创网络优化与超参数选择

原创优化函数、学习速率与反向传播算法介绍

原创笔记：softmax分类

原创逻辑回归于交叉熵

原创梯度下下降法

原创 tf.keras概述

空空如也

空空如也