自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(34)
  • 资源 (1)
  • 问答 (1)
  • 收藏
  • 关注

原创 pandas经典题

pandas经典题汇总

2022-10-07 09:58:40 189 1

原创 关于机器学习中的特征共程

在机器学习的模型训练中,特征工程是非常重要的环节,虽然很多机器学习的相关书籍都把重要的篇幅放在了算法上,但是在实际的应用中,特征工程是非常重要的环节,甚至可以说是决定模型结果的关键。关于特征工程有一下几个问题需要搞清楚:1,为什么要进行特征工程 2,进行特征工程的方法有哪些。1,为什么要进行特征工程以非常经典的房价预测为例,影响房价的因素有很多,原始的数据集大约有几十个特征,那么我们这些特征我...

2020-05-07 15:01:40 174 2

转载 转载一些好的文章

1,一篇关于支持向量机的文章:零基础学SVM—Support Vector Machine(一) - 耳东陈的文章 - 知乎https://zhuanlan.zhihu.com/p/24638007

2020-05-07 10:43:22 160

原创 pythongithub文档

https://github.com/fendouai/PyTorchDocs/blob/master/ThirdSection/LearningPyTorch.md

2020-04-21 18:08:11 153

原创 网址

http://localhost:8888/notebooks/Untitled5.ipynb?kernel_name=python3

2019-04-02 19:07:47 236

原创 excel导入堡垒机

1,excel要改为文本文件的形式2,右键要导入的库,import

2019-04-01 15:17:37 353

转载 dataframe改变列的顺序

内容方法一:最简洁的方法order = ['date', 'time', 'open', 'high', 'low', 'close', 'volumefrom', 'volumeto']df = df[order]12比如说,这里,就可以之保证列的顺序是按照这样的排序的。总之,就是给一个list。方法二:查询自下面的链接。https://blog.csdn.net/u012...

2019-03-20 15:51:12 8199 2

原创 pandas 的空值处理

1,如果用pandas读取了csv文件中的数据train = pd.read_csv(r'd:\user\01378237\桌面\件量预测\产品占比预测.csv',header=0,engine='python')其中会有一些缺失值,以NAN表示,可以作如下处理:if pd.isnull(train.iloc[i, j + 1]) is True: train.iloc[i, j +...

2019-03-15 12:40:19 853

原创 机器学习笔记

1,对应缺失数据较少的情况可以用插值法来处理,插值的方法可以是随机森林

2019-03-07 15:01:01 107

转载 怎么用CMD命令进入D盘

其实这不叫cmd命令,而是在运行中输入cmd进入DOS界面。输入的命令叫做DOS命令。DOS进入D盘是个很基本的操作。你可以运用DOS命令对磁盘进行访问,修改等一系列的操作。首先按win+R,可以让你很快地打开运行窗口;在运行窗口输入cmd进入DOS界面后;输入cd\ 然后按回车键 ,你会发现指示符变成了C:> 。然后在这行输入d: 再次按回车键确定,你就完美的进入D盘了,至于后面你想...

2019-01-17 09:33:16 17143 2

原创 python处理图片格式的数据

import pandas as pdimport numpy as npimport PILfrom PIL import Imagefile = (r'd:\user\01378237\桌面\river.jpg')img = Image.open(file,mode='r')box = (10,10,500,500)region = img.crop(box)region.sa...

2019-01-08 16:07:33 481

原创 Pycharm常用快捷键

快速查看库源码 Ctrl+B快速换行 Ctrl+enter切分窗口 Shift+A快速展开和合并函数 Ctrl+shift++和 Ctrl+shift±快速注释 Ctrl+/超级搜索 双击Shift最近访问过的文件 Ctrl+E历史粘贴板 Ctrl + Shift + V替换 Ctrl+R对已有的代码进行操作 Ctrl...

2018-12-24 09:43:25 102

转载 python编程总结

1,在python当中一切皆对象,每产生一个对象会对应三个属性:id、类型type和数值2,创建一个类就会创建一个类的名称空间,用来存储类中定义的所有名字,这些名字称为类的属性:而类中有两种属性:数据属性和函数属性,其中类的数据属性是共享给所有对象的,而类的函数属性是绑定到所有对象的。 3,在类的内部来说,__init__是类的函数属性,但是对于对象来说,就是绑定方法。4,命名空间的问题:先...

2018-12-18 18:17:58 507

转载 python print输出后面为什么会跟一个None

因为python中print函数需要返回值,如果你在print函数中所放的函数没有返回值,那么print将会return None

2018-12-15 11:25:17 3126

转载 转载文章

https://blog.csdn.net/ruoyunliufeng/article/details/79055319

2018-12-03 18:54:50 94

转载 python寻找list中最大值、最小值并返回其所在位置

c = [-10,-5,0,5,3,10,15,-20,25]print c.index(min©) # 返回最小值print c.index(max©) # 返回最大值

2018-11-27 10:28:03 6749

转载 方差为什么除以

设样本均值为,样本方差为,总体均值为,总体方差为,那么样本方差有如下公式:很多人可能都会有疑问,为什么要除以n-1,而不是n,但是翻阅资料,发现很多都是交代到,如果除以n,对样本方差的估计不是无偏估计,比总体方差要小,要想是无偏估计就要调小分母,所以除以n-1,那么问题来了,为什么不是除以n-2、n-3等等。所以在这里彻底总结一下,首先交代一下无偏估计。无偏估计以例子来说明,假如你想知道一所...

2018-11-19 17:50:33 696

原创 Python中一些非常好用的函数

1,Counter 函数from collections import Countera=Counter('jfdhuhweurhfsjknvfiauwrfhawfjawufh')print(a)Counter({'f': 6, 'h': 5, 'u': 4, 'w': 4, 'j': 3, 'a': 3, 'r': 2, 'd': 1, 'e': 1, 's': 1, 'k': 1, '...

2018-11-19 17:49:44 152

原创 ppt制作心得

1,每一页ppt都要有题目,简要概括本页ppt的内容,建议深青色(个性色1),黑体标题,加粗2,正文建议灰色(非常类似于黑色),黑体正文。3,另外,需要醒目标记的建议粉红色,淡色40%,例如,图标标题等...

2018-11-13 11:16:20 794

原创 python书写的一些技巧

1,with可以在写入文件后自动将文件关闭`with open ('text.txt.', 'w') as f: f.write('test')比f=open('text.txt','w') f.write('test')要好2,format 比 % 要好

2018-11-06 17:47:22 142

转载 xlwt写入excel数据

import xlwtworkbook = xlwt.Workbook()sheet1=workbook.add_sheet(‘test’,cell_overwrite_ok=True)#生成sheet:test,如下图1:data = {“1”:[u"张三",150,120,100],“2”:[“wang”,90,99,95],“3”:[“wu”,60,66,68]}num =...

2018-11-05 15:03:03 2262

原创 pandas处理csv格式的数据

import pandas as pdimport numpy as npfrom pylab import *mpl.rcParams['font.sans-serif'] = ['SimHei']mpl.rcParams['axes.unicode_minus'] = Falsefile_path='D:\算法比赛\件量数据试验.csv'data_csv=pd.read_csv...

2018-10-30 18:30:48 313

原创 python写入excel文件

关于python如何写入excel,网上的资料很多,一般会用xlwt模块,但该模块对于处理xls格式的文件很好,但对于xlsx的文件则会出问题。现在的excel大部分都是xlsx格式,所以我还是推荐大家用xlsxwriter模块。模块的安装很容易,不多讲,下面给出一段示例代码def data_write(file_path, datas): f = xlsxwriter.Workboo...

2018-10-29 19:22:55 903

转载 python写入其它格式的文件

def text_save(filename, data):#filename为写入CSV文件的路径,data为要写入数据列表. file = open(filename,'a') for i in range(len(data)): s = str(data[i]).replace('[','').replace(']','')#去除[],这两行按数据不同,可以...

2018-10-29 18:05:46 449

原创 关于map函数

今天遇到的一个问题是如何将一串列表中的字符串型数字转化成数值型,可以用map函数`y=['1','2','3']w=map(lambda x:int(x),y)w=[1,2,3]

2018-10-25 18:09:05 131

原创 R做kmeans聚类和画图

library(xlsx)library(kmeans)data<-read.xlsx2('D://数据//分时率.xlsx',1,header=TRUE)clur<-kmeans(x=data,centers = 6,nstart = 500)clur$size #每一类的数量clur$centers #浏览每个类的中心time<-c(1,2,3,4,5,6,...

2018-10-23 17:17:43 9604

原创 画图小技巧

y=[y1,y2,y3,y4,y5,y6,y7,y8,y9,y10]color=['blue','red','black','red','orange','skyblue','pink','yellow','peru','purple']label=['0,55','1,13','2,26','3,55','4,12','5,21','6,44','7,43','8,1','9,62']pr...

2018-10-23 14:48:38 117

原创 一些读excel和画图的技巧

import xlrdpath='D:\全国.xlsx'data=xlrd.open_workbook(path)sheet=data.sheet_by_name('Sheet1')i=1dict1={}dict2={}city=[]while True: try: c=sheet.cell_value(i,0) city.append(...

2018-10-22 16:38:24 303

转载 K-means经典代码

import pandas as pdfrom sklearn.cluster import KMeans #导入K均值聚类算法import matplotlib.pyplot as pltinputfile = '../zscoreddata.xlsx' #待聚类的数据文件outputfile = '../fenlei.xlsx'k = 5 ...

2018-10-22 15:52:20 184

原创 安装Scrapy库

最近研究爬虫需要装scrapy库,在anaconda环境下装总是报错,这时候要注意在anaconda命令行下用conda install scrapy 装就可以了,会自动的寻找安装环境,安装在指定目录下。...

2018-10-16 11:31:54 314

转载 *args和**kwargs

今天看源码的时候发现一个是*args和**kwargs,一看就能知道args是神马,就是所有参数的数组,kwargs就不知道了,google一下,一个人的blog写的比较简单明了,秒懂了~~kwargs就是当你传入key=value是存储的字典。补充一下:kwargs不影响参数位置例子:def test(a,*args,**kwargs):print a#print b#print c...

2018-10-15 15:09:09 68

转载 substring函数

SQL 中的 substring 函数是用来抓出一个栏位资料中的其中一部分。这个函数的名称在不同的资料库中不完全一样:MySQL: SUBSTR( ), SUBSTRING( )Oracle: SUBSTR( )SQL Server: SUBSTRING( )最常用到的方式如下 (在这里我们用 SUBSTR( ) 为例):SUBSTR (str, pos)由 中,选出所有从第 位置...

2018-10-15 10:48:30 1406 1

原创 滑动窗口

以leetcode里的一道题为例介绍滑动窗口方法209.长度最小的子数组给定一个含有 n 个正整数的数组和一个正整数 s ,找出该数组中满足其和≥ s的长度最小的子数组。如果不存在符合条件的子数组,返回 0。示例:[2, 3, 1, 2, 4, 3], s = 7结果2。[4, 3]是长度最小的问题分析:按照上题的思路进行如下分析,结合下面的代码部分,我将每一部分的名字都标注在代码...

2018-10-15 09:37:40 205

原创 gurobi安装和使用心得

最近领了一个任务是用一下gurobi,因为我们组以前只用cplex,最近在考虑要不要买gurobi的权限,所以要我先试用一下。 安装下载页确实费了一番功夫,因为公司网的原因,始终无法下载成功,最后还是找其他组的同事要了一个安装包才成功装上。装上之后需要有licence,因为在企业的网,不是校园网,所以网上申请的学术版Licence其实不能用。好在我联系了gurobi中国区的代理公司,他...

2018-09-21 11:38:50 14021 8

Practical and Efficient SAS® Programming The Insider's Guide.pdf

Practical and Efficient SAS® Programming The Insider's Guide

2020-06-02

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除