柏林墙-CSDN博客

原创 Springer LaTeX论文写作指南详解--常用及踩坑点

学习历程完整详细学习指南：书籍推荐入门学习指南：博客笔记一力推，从入门到使用博客笔记二软件安装到基本语法介绍在线使用LaTeX 网址免去自己从安装到放弃的麻烦，很好使的字符字符大全省略号不要使用…来直接表示，使用\ldots插入表示省略号使用一些字符时需要加\转型，否则空白：\{, \}, \_字符~使用$\sim$表示公式单行显示公式，有公式序号\noindent Displayed equations are centered and

2021-09-06 10:52:15 2150 1

原创 Spring execution表达式详解大全

execution表达式的使用execution(访问修饰符（可省略）返回值类型包.包.类.方法名(参数) )如<aop:before method="printLog" pointcut="execution(public void com.huge.service.impl.AccountServiceImpl.save())"></aop:before>符号类型匹配模式*匹配任何数量字符；比如模式 (*,String) 匹配了一个接受两个参数的方法

2021-05-25 21:10:58 1021

原创 Java多态的向上转型和向下转型具体应用和意义以及instanceof使用

向上向下转型定义一个父类Animals包含eat()方法、age初始值为0然后再定义两个子类：Dog和Cat,都重写了eat()方法和age，然后再分别有自己的特有方法狗咆叫bark()，猫睡觉sleep()向上转型：Animals a = new Cat()向下转型：Cat cat = (Cat) a,必须要先经过向上转型的变量–再向下转型，此时cat就拥有子类自己定义的特有方法cat.sleep()instanceof用法：a instanceof Cat 这里a必须是经过向上转型后的父类对

2021-05-21 19:23:06 685 2

原创取出表1中A列的不在表2中A列的所有行

1. 数据t1 = pd.DataFrame( [[2,2], [3,3], [4,4], [2,2]], columns=list('AB') )t2 = pd.DataFrame( [[2,1], [5,2]],columns=list('AB') )2. 处理# 现在要取出t1表中A列的不在t2表中A列的所有行t1[ ~ t1..

2021-03-29 14:46:51 425

原创 np.reshape中-1详解

先生成一个倒序的数组a = np.arange(12,0,-1)array([12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 1])当对数组reshape时代表改变数组的形状为一维、二维、三维、n维1. 二维：一个为确定的数，另一个为-1a.reshape(2, -1)array([[12, 11, 10, 9, 8, 7], [ 6, 5, 4, 3, 2, 1]])a.reshape(-1, 3)array([[12, 11,

2021-01-28 17:14:17 1501

原创 pandas读取文件时有多个不同的分隔符

pandas读取文件时默认有一个分隔符，可是如果我的数据是这样的有多个分隔符如空格逗号分号等：此时使用：t1 = pd.read_table('test.txt', sep='\s|,|;', names=['c1', 'c2', 'c3', 'c4'])使用参数sep 或 delimiter分隔不同字符通过加上|如果有多个空格的话使用\s+使用参数names设置列名得到结果...

2020-11-24 22:15:01 11719

原创 6. 集成学习&随机森林

1. 集成学习思想：基于不同算法，算出不同的结果，对每一个值投票选择多数的那个作为结果，比如对一个值预测三种算法分别为：0,1,0，此时选择0作为预测结果1. hard voting: 少数服从多数，from sklearn.ensemble import VotingClassifierfrom sklearn.svm import SVCfrom sklearn.linear_model import LogisticRegressionfrom sklearn.tree import

2020-10-26 21:28:50 209

原创 5. SVM支撑向量机

1. SVM 支撑向量机Support Vector Machine寻找一个最优的决策边界 – 距离两个类别最近的样本最远最近的两类别样本叫做支撑向量2、Hard Margin求出d,在推导后得出正则化使用SVMc越大容错空间越小，偏于hard marginc越小容错空间越大，偏于soft margin首先要数据标准化处理，否则y在判断时会有相当大的偏差from sklearn.svm import LinearSVC # 在SVM中引入线性SVMsvc_hard =

2020-10-26 21:28:01 187

原创 4. 决策树

1. 决策树基本信息非参数学习解决分类问题天然就解决多分类问题也可以解决回归问题非常好的可解释性2. 信息熵熵：代表随机变量不确定度的度量熵越大：数据的不确定性越高熵越小：数据的不确定性越低表达式：3. 使用信息熵寻找最优划分from sklearn.tree import DecisionTreeClassifierdt_clf = DecisionTreeClassifier(max_depth=2, criterion='entropy', random_sta

2020-10-26 21:27:16 202

原创 2. PCA&多项式回归&CV&岭回归&LASSO& 弹性网

PCA作用：降维降低数据量，降低处理时间；降噪功能使用方法：from sklearn.decomposition import PCA # 引入PCApca = PCA(0.95) # 根据比例算出pca降维量pca.fit(x_train) # 进行计算出降维量pca.n_components_ # 降维后的量x_train_reduction = pca.transform(x_train) # 对数据降维处理x_test_reduction = pca.transform

2020-10-26 21:25:18 617

原创 1. 概述及k近邻算法

数据集：数据集？样本？特征值？标签？分类任务：二分类多分类：数字识别，图像识别回归任务：连续的值，而非一个类别监督学习：有了答案，有标签非监督学习对没有标记的数据进行分类-聚类分析意义：数据降维（方便可视化，异常检测）：特征提取：提取有意义的特征、特征压缩：PCA半监督学习：一部分数据有标记、答案，一部分没有通常先使用无监督分出标签，然后使用监督学习增强学习无人驾驶机器人批量学习优点：简单；问题：如何适应环境变化，解决：定时重写批量学.

2020-10-26 21:22:29 124

原创 3. 逻辑回归&分类准确度

逻辑回归 Logistic Regression解决分类问题通常做分类算法，只能作二分法sigmod(x) = 1 / (1+e^-t)# 直线型逻辑回归from sklearn.linear_model import LogisticRegressionlog_reg = LogisticRegression()log_reg.fit(x_train, y_train)log_reg.score(x_test, y_test)# 多项式逻辑回归from sklearn.p

2020-10-26 21:19:26 4598

原创 pandas修改列索引名称，删除前缀

提前定义好新的列名称，然后替换列名称 new_columns = [ x[24:] for x in data.columns ] data.columns = new_columnstransform = lambda x: x[:4].upper(), data.index = data.index.map(transform)对轴索引映射修改data.rename(index=str.title, columns=str.upper)直接通过rename修改.

2020-10-13 08:41:02 3032 1

原创 pandas的read_csv详解

sep设置为\s+时表示多个空格间隔作为分隔符,跟delimiter类似delimiter读取时根据分隔字符划分列header为设置第几行为列索引，传入行号int, list of intnames自定义一个列索引名称index_col设置某列为索引，比如将日期列设为索引parse_dates直接将某列或多列转化为日期[ [1,2,3] ]prefix添加前缀给所有的列索引...

2020-10-13 08:31:05 167

原创 pandas求两个日期之间有多少个年、月、周

计算两个日期之间有多少个年、月、周：df.resample('m').pad().shape[0]根据需求替换年y、月m、周w

2020-10-13 08:27:48 1067

原创 pandas求两个日期之差天数

两个日期之差天数：如果是datatime格式，两个日期索引直接相减(df.index[0] - df.index[-1]).days,如果是字符型先转换为datetime类型a = pd.to_datetime('2020-10-01')然后再相减

2020-10-13 08:26:39 4392

原创 pandas对时间序列求每年/月/周/日的统计值平均值

记录每个年y/月m/周w/日d的平均值：df.resample('m').mean()根据需求替换m即可年y/月m/周w/日d根据需求替换统计函数

2020-10-13 08:25:23 3996

原创 pandas索引为时间类型，找出所有一月的数据并计算

索引为时间类型，找出所有一月的数据并计算：df[ df.index.month == 1 ].mean()

2020-10-13 08:22:31 651

原创 pandas更改索引为日期类型

更改索引为日期类型：df.index = pd.to_datetime(df.index)

2020-10-13 08:21:15 6086

原创 pandas重置行索引从0开始

重置行索引从0开始：df.reset_index(drop=True)

2020-10-12 09:35:12 3816 1

原创 pandas替换多列空值，每列替换不同值

替换多列空值，每列替换不同值：df.lie1.fillna(10, inplace=True)df.lie2.fillna(100, inplace=True)

2020-10-12 09:34:40 1103

原创 pandas删除某列中值为空的行

删除某列中值为空的行先求出值为空所在的行索引然后根据行索引删除df.drop( df.age[df.age.isna()].index);或者直接df.dropna()

2020-10-12 09:32:54 3011

原创 pandas删除多列

删除多列：先定位多列位置df.iloc[:,[0,2,3]]或df.columns[ [0,2,4] ],然后drop时设置axis=1保证删除的列而不是默认的行，df.drop( df.iloc[:, [0,3,6,8,10,12,13]], axis=1 )

2020-10-12 09:31:49 6633

原创 pandas删除某行值为0

删除某行值为0先求出值为0所在行的索引然后根据索引行删除df.drop( index = df.age[df1.age == 0].index )

2020-10-12 09:31:06 15073

原创 pandas判断索引是否唯一

判断索引是否唯一：df.index.is_unique

2020-10-12 09:30:21 1041

原创 pandas统计有多个相同的最小值

统计有多个相同的最小值len(df[df.age.min() == df.age])

2020-10-12 09:29:37 438

原创 pandas算出每行或列的最大值或最小值所在的列索引或行索引

算出每行或列的最大值所在的列索引或行索引：默认为0，返回一列最大值所在行的行索引df.idxmax()设置为1，则为一行最大值所在列的列索引df.idxmax(1)（取最小值为df.idxmin()）

2020-10-12 09:29:03 15161

原创 pandas选中所有行除了某行

选中所有行除了某行：df[ df.age != 18 ], df[ ~(df.age == 18) ]

2020-10-12 09:27:27 711

原创 pandas根据行索引和列索引同时定位多行多列

给出行号和列号，根据行索引和列索引同时定位多行多列：df.loc[ ['hang1','hang2'], ['lie1', 'lie2'] ]

2020-10-12 09:00:09 1419

原创 pandas通过列索引名称连续选择多列

通过列索引名称连续选择多列通过loc：df.loc[:, 'school':'guardian']

2020-10-11 09:58:19 1911

原创 pandas根据行索引定位选择多行

根据行索引定位多行：df.loc[ ['a', 'b', 'c'] ]

2020-10-11 09:57:38 2822

原创 pandas找出某列中存在列表中字符串的行

选择匹配多行，找出某列中匹配多个字段的行通过isin()匹配多个参数是否存在，比如找出Team列中Italy,England,Russia的行：df.loc[df.Team.isin(['England','Italy', 'Russia'])]

2020-10-11 09:56:38 1150

原创 pandas判断一个列中以某字母为开头的所有行

自定义一个条件判断然后得到一个mask,根据mask判断.例如判断一个列中名称开头为'G'的所有行：mask = [ True if i[0] == 'G' else False for i in df.Team ]，然后df[mask]

2020-10-11 09:54:10 3292 1

原创 pandas同时对多列做条件判断并筛选出相应的行

同时对多列做条件判断并筛选出相应的行：df[ (df.gender == 'male') & (df.age > 10) ]

2020-10-11 09:52:07 4100

原创 pandas对某列字符判断是否符合条件并筛出相应的行

对某列字符判断是否符合条件并筛出相应的行比如选出性别为male的：df[ df.gender == 'male' ]

2020-10-11 09:51:23 1133

原创 pandas对所有行进行基本的统计求值

对所有行进行基本的统计求值：# 方式一：计算量过多data2.T.describe().T # 方式二：desripe()没有axis，但是min()这些统计函数有day_stats = pd.DataFrame() day_stats['min'] = data2.min(axis=1) day_stats['max'] = data2.max(axis=1)day_stats...

2020-10-11 09:50:14 472