自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(43)
  • 收藏
  • 关注

原创 灰色预测模型R代码

附录:经典灰色预测模型代码:x<-c(4643,5853,6876,7847,8724,9425,11045)x1=NULLfor (i in1:length(x)){x1[i]= sum(x[1:i])}x2= NULLfor (i in1:(length(x)-1)){x2[i]=(x1[i]+x1[i+1])/2}y<-x[-1]...

2019-08-07 14:38:09 5510

原创 面板数据清理遇到的问题(全)

原始数据表,都是面板数据目标数据表:     setwd("c:/users/11565/Desktop/合并二/可以用数据")sentiment&lt;-read.csv("001.csv")names(sentiment)dim(sentiment)attach(sentiment)sentiment$date&lt;-as.character(s...

2018-10-24 16:22:53 3064

原创 R语言里的多层循环和嵌套的用法

可以先列出提纲,也就是大框架,列框架时,须注意。if(){}else{}  表示先执行if括号后面的条件语句,如果正确就执行第一个大括号里的程序,如果错误就执行else后面大括号里的语句。    但是如果出现下面的情况就会报错:if{}else{}   也就是else语句没有在大括号的后面,这是r会认为if语句已经执行完毕,但执行else发现前面无法执行,else必须紧挨着if语句...

2018-10-20 01:58:05 28580

原创 用R语言在同一副图里面画两个折线图的注意事项

setwd("C:/Users/11565/Desktop/合并二")shuju &lt;- read.csv("数据.csv",header = T)library(psych)head(shuju)attach(shuju)head(mtcars)aggregate(shuju,by= list(state),FUN = mean,na.rm = T)tapply(shuju[,...

2018-10-05 18:03:24 19868

原创 在R语言中怎样按照某一列分组求均值

主要介绍tapply函数:每次只能求一列aggregate函数:每次按组可以求多列tapply(shuju[shuju[,3],shuju$year,mean)#以年份为组,求shuju表第三列的均值aggregate(shuju[,3:4],list(shuju[,2]),mean)#以年份为均值,求数据表第三列,第四列的均值...

2018-10-03 01:53:34 52871

原创 R语言怎么将数据框数据导出csv格式

store_name <- c("A","B","C","A","B","C")ip <- c("ai","bi","ci","ai","bi","ci")date <- c(11,11,11,12,12,12)open <- c(5,5,5,5,5,5)pos <- c(23,34,34,56,78,79)store <- data.frame(st...

2018-07-04 20:50:02 70505 4

翻译 用R语言随机生成AR,MA,ARMA,ARIMA模型的命令,画出acf,pacf图

set.seed(10);x=rnorm(150)par(mfrow=c(1,2))#一行两列,两个图ts.plot(x);acf(x)set.seed(101);x=NULL;for(i in 1:200)x=c(x,0.5-0.3*i+rnorm(1))#随机产生数par(mfrow=c(2,2));ts.plot(x);#画时间序列图acf(x);ts.plot(diff(x));acf(d...

2018-05-29 01:34:14 35757 6

原创 linux怎样运行shell文件和py文件以及SQL的一些常用操作(未完待续)

LINUX中的一些命令:怎样在服务器上运行sh、py文件首先写shell文件时,不能直接在windows上直接编写,因为linux与windows的编码方式不一样,遇到这种情况,需要在服务器上创建shell文件创建新的shell文件:touch 123.sh #touch就是新建一个文件编辑文件 vim 123.sh #这是简化文件进行打开,就可以进行编辑了但是编辑之前需要按一下 i(insert) 表示插入数据,然后就可以编辑了(其中123.sh里面编辑...

2020-07-28 14:39:23 358

原创 网络编程——操作系统介绍

多道操作系统​ 所谓多道程序设计技术,就是指允许多个程序同时进入内存并运行,他们共享系统中的各种硬件,软件资源。当一道程序因IO请求儿暂停运行时,CPU便立即转去运行另一道程序​ 在A程序计算时,I/O空闲, A程序I/O操作时,CPU空闲(B程序也是同样);必须A工作完成后,B才能进入内存中开始工作,两者是串行的,全部完成共需时间=T1+T2。 将A、B两道程序同时存放在内存中...

2019-09-17 15:52:59 344

原创 python 中的socket模块——网络编程(一)

socket是甚麽?网络编程是编写程序使两台联网的计算机能够通信。两台计算机怎样传递数据,首先需要建立物理连接,即使不熟悉网络编程的,传输原理不太清楚的情况下,可以通过socket编程来实现网络编程socket原意是插座的意思,在计算机领域socket呗称为套接字,它是计算机之间进行通讯的一种形式和约定方式。通过socket这种约定方式,一台计算机可以接受其他计算机的数据,也可以向其他计算机发...

2019-09-16 00:27:29 1092

原创 什么使单播,广播,多播

当前的网络中有三种通讯模式:单播(Unicast)、组播(多播)(Multicast)、广播(Broadcast),其中的组播出现时间最晚但同时具备单播和广播的优点,最具有发展前景。一、单播: 主机之间“一对一”的通讯模式,网络中的交换机和路由器对数据只进行转发不进行复制。如果10个客户机需要相同的数据,则服务器需要逐一传送,重复10次相同的工作。但由于其能够针对每个客户的及时响应,所以现...

2019-09-10 00:30:44 145

原创 from sklearn.datasets import fetch_mldata fetch_mldata(""MNIST original"")有时候无法获取数据

from sklearn.datasets import fetch_mldatafetch_mldata("“MNIST original”")有时候无法获取数据此时需要先将数据下载好,放到指定的目录mldata里面mldata的目录可以通过命令获得from sklearn.datasets.base from get_data_homeprint(get_data_home())根...

2019-08-29 18:15:48 1055

原创 模块与包

模块的导入在D:\laonanhai0726目录下设置了一个bake的包,然后再该目录下设置了api、cmd、db三个包。同时再bake同级目录下,也就是在D:\laonanhai0726目录下设置一个test02.py的文件,test02就是一个项目的启动口,在test02里面去运行,然后调用bake包里面的函数。千万要记住,项目的启动口test02,必须与bake包在同一个目录下,千万要注...

2019-08-29 17:53:21 116

原创 软件开发规范

软件开发规范 当代码量很大的时候,几千行,几万行的时候,代码的可读性较差,也不便于管理,加载速度比较满,针对以上问题,引入了软件开发规范,软件开发规范其实是Django的雏形主要内容启动文件:公共文件配置文件主逻辑文件数据文件日志文件假如有一个项目是爬虫淘宝,则需要再pycharm中建立一个spider_tb的文件夹,然后在此文件夹下,去建立上述六个部分的文件夹启动文件...

2019-08-23 20:19:01 155

原创 python2与python3的区别(持续更新中)

python2与python3的区别除法的区别python3中:除法的时候返回的是小数python2中:除法的时候返回的是整数(向下取整)input()函数输入以后,输出的内容区别python3中:input函数输入时,获取的内容时字符串可以利用int()函数来将字符串转换成整型python2中:input函数输入时,获取的内容是数据本身...

2019-08-16 08:31:30 169

原创 从sklearn库中fetch_mldata("MNIST original"),无法获取数据集怎样办办

from sklearn.datasets import fetch_mldatafetch_mldata(""MNIST original"")有时候无法获取数据此时需要先将数据下载好,放到指定的目录mldata里面mldata的目录可以通过命令获得from sklearn.datasets.base from get_data_homeprint(get_data_home...

2019-07-09 18:46:01 1241

原创 python中itemgetter函数的用法

import operatoroperator.itemgetter()或者是from operator import itemgetter下面举了几个例子:a=[("d",2),("v",1),("a",0)]sorted(a,key=operator.itemgetter(0))#按照a列表中元祖的第一个数从小到大排列sorted(a,key=operator.itemge...

2019-06-26 12:27:38 4654

转载 将jieba分析的字典设置成utf-8格式,以便jieba导如自定义词典

ieba分词的词典一般是C:\Users\Administrator\AppData\Local\Programs\Python\Python36\Lib\site-packages\jieba的目录下的dict.txt文件,如果自己想添加词典,比如添加dict2.txt的词典,可以将此文件放入dict.txt的同一个目录下,然后在每一次使用时调用方法jieba.load_userdict来加载新...

2019-05-13 00:22:48 2428

转载 jieba的词性标注

附词性标注表如下:1. 名词 (1个一类,7个二类,5个三类)名词分为以下子类:n 名词nr 人名nr1 汉语姓氏nr2 汉语名字nrj 日语人名nrf 音译人名ns 地名nsf 音译地名nt 机构团体名nz 其它专名nl 名词性惯用语ng 名词性语素2. 时间词(1个一类,1个二类)t 时间词tg 时间词性语素3. 处所词(1个一类)s 处所词4. 方位...

2019-05-12 12:04:33 1027

原创 二分查找算法python实现

算法概述  当数据量很大时适宜采用二分法查找,其是一种效率较高的查找方法,但前提条件是要查找的集合必须是有序的,或是升序排列或是降序排列都可以。二分法又称折半查找,故名思意就是就是从中间开始比较查找,其基本思路是:假设数据是按升序排序的,对于给定值 x,从序列的中间位置开始比较,如果当前位置值等于 x,则查找成功;若 x 小于当前位置值,则在数列的前半段中查找;若 x 大于当前位置值则在数列的...

2018-11-19 23:27:12 405

原创 #将分组的数据进行加和

#将分组的数据进行加和sentiment&lt;-read.csv("C:/Users/11565/Desktop/合并二/可以用数据/sentiment_2.csv",na.strings="",stringsAsFactors = F)x10&lt;-table(sentiment$c_bianhao)write.table(x10,"x10.csv",sep=",",col.names...

2018-10-24 12:45:45 162

原创 数据表之间的合并,和分组求和加日期

表的结构如下:需要将4月4号,四月5号六号的数据分到6号,因为数据是三天一抓,用这三天的和作为一次抓取数据的记录,下段代码需要将日期进行分组加一列新标签:加好如下图所示: #接下来需要对特定区间段的日期加标签,例如4月7号,4月8号,4月9号都定义在4月9号的标签sentiment&lt;-read.csv("C:/Users/11565/Desktop/合并二/可以用数据/se...

2018-10-23 22:45:33 457

原创 做回归描述之前用到的数据

setwd("c:/users/11565/Desktop/合并二/可以用数据")taobao&lt;-read.csv("淘宝直接做回归用的数据_2.csv",na.strings=" ",stringsAsFactors = F)#na.strings主要是讲空格转变成na值n=length(taobao$inventory)for (i in 1:n){  if (" "%in%u...

2018-10-16 22:55:33 192

原创 如何去掉字符串之间的空格,和补增缺失值(补不连续的缺失值)

setwd("c:/users/11565/Desktop/合并二/可以用数据")taobao&lt;-read.csv("淘宝直接做回归用的数据_1.csv",na.strings=" ",stringsAsFactors = F)#na.strings主要是讲空格转变成na值str(taobao)dim(taobao);names(taobao)attach(taobao)detac...

2018-10-16 18:47:39 527

原创 怎样用python读取csv文件

一般人会觉得只要是路径对,就可以将csv文件读进去,其实对csv文件是有要求的,必须在保存为csv形式的时候,选择带有utf-8的形式才可以,wps中没有utf-8的形式,所以一定要用excel形式打开,然后保存为带有utf-8的形式csv。终于找到这个原因了   import pandas as pddf=pd.read_csv("C:\\Users\\11565\\Des...

2018-10-15 21:41:48 1096

原创 python中random的应用以及包含的函数,圆周率的计算

#random库的介绍#为随机数:采用梅森旋转算法生成的为随机序列中的元素,random主要用于产生随机数'''random包括8个函数:基本函数:seed(),random()扩展函数时:randint(),getrandbits(),uniform(),randrang(),choice(),shuffle()random如果不设定种子的情况,产生的随机数将是对应的系统时间ran...

2018-10-15 12:20:37 469

原创 轻松学习python中的控制循环结构,条件语句,异常处理,循环语句

# -*- coding: utf-8 -*-"""Created on Sun Oct 14 21:52:36 2018@author: 11565"""#第四次课程guess=eval(input("请输入你的数字:"))if guess == 99:    print("输入正确")else:    print("输入错误")#还有一种简单的编程:紧凑形式语

2018-10-15 01:27:15 247

原创 怎样解决You are using pip version 10.0.1, however version 18.0 is available的问题

点开电脑“开始”——“Anaconda3"-"Anaconda Prompt",然后点开这个对话框,输入这个命令即可python -m pip install --upgrade pipe pip

2018-09-21 19:44:15 1198

原创 怎样合并数据,用两个关键字合并数据

#在旗舰店商品表中的店铺ID转换成编号setwd("C:/Users/11565/Desktop/合并二")xqijian &lt;- read.csv("旗舰店商品正确合并.csv",header = T)#读取旗舰店数据x3 &lt;- read.csv("旗舰店店铺链接.csv",header = T)#读取店铺的id,即最后一天所有的旗舰店店铺IDx4 &lt;- read.csv...

2018-09-13 20:49:34 1232

原创 神经网络与R语言

'''神经网络需要的安装包是neuralnet包,RSNNS包在iris数据集里面随机抽取训练集和测试集'''data("iris")head(iris)library(neuralnet)ind &lt;- sample(2,nrow(iris),replace = T,prob = c(0.7,0.3))trainset &lt;- iris[ind == 1,]testse...

2018-08-17 12:59:21 3820

原创 c5.0决策树算法

library(C50)set.seed(12345)setwd("C:\\Users\\11565\\Desktop")credit &lt;- read.csv("credit.csv",header = T)credit$A16 &lt;- factor(credit$A16,levels = c("+","-"),labels = c("批准","不批准")

2018-08-11 02:38:43 7567 5

原创 用R怎样做词云

par(mfrow=c(1,2))setwd("C:/Users/11565/Desktop")se_raw &lt;- read.csv("垃圾邮件.csv",header = T,stringsAsFactors = FALSE)str(se_raw)se_raw$type &lt;- factor(se_raw$type,levels = c("ham","spam"),labels...

2018-08-07 21:55:27 1542

原创 knn算法介绍和整个代码:如果某一列是2或者是4改成如果是二就是B,是4就是M

1、更换标签的代码setwd("C:/Users/11565/Desktop")wbcd &lt;- read.csv("knn数据集.csv",head = T,stringsAsFactors = FALSE)head(wbcd)attach(wbcd)range(diagonsis)table(diagonsis)i = 1for (i in 1:length(diagon...

2018-08-06 10:06:10 299

翻译 使用KNN分类方法需要注意的问题

1、临近性用距离度量:比如欧几里得距离,两个点或者元组(,,,.......)和(,,,.......)d的距离是,换而言之,对于每个数值属性,取元祖,该属性对应值的差,取差的平方并累计,并取累计距离技术的平方根,通常在使用上述公式之前,要将每个属性进行规范化,这样有助于防止具有较大初始值域的属性(收入)比具有较小初始值域(如二元属性)的属性的权重过大。可以通过如下公式进行规范化,使用最小——...

2018-08-05 23:42:35 2902

原创 python 中try 和except的用法

#try表示去打开一个网页,看是否有错误,注意Exception的书写#觉得例子是爬豆瓣网5次import reimport urllib.requestfor i in range(1,5):    try:        file = urllib.request.urlopen("https://read.douban.com/provider/all",timeout = ...

2018-07-31 19:40:20 9598

原创 用urllib.request函数爬程序的需要decode一下,转换成utf-8

#从豆瓣网中爬出版社的程序https://read.douban.com/provider/all#最后并写入TXT文件当中import reimport urllib.request'''pat = "pyth[jsh]n"sting1 = "wodepythjn"relt = re.search(pat,sting1)print(relt)'''f = urllib.requ...

2018-07-31 19:38:11 3639

原创 Python百元买百鸡和乘法口诀表

假设公鸡5块,母鸡3块,小鸡3只1块for i in range(1,21):    for j in range(1,51):        if i*5 + j*3 + 1/3*(100-i-j) == 100:            print(i,j,100-i-j)九九乘法表for i in range(1,10):      for j in range(1,i+1...

2018-07-21 23:39:37 989

原创 用Python找出最大公约数

定义函数法:def hcf(a,b):    if a &lt; b:        small = a    else:        small = b    for i in range(1,small+1):        if (a%i == 0) and  (b%i == 0):            gongyue = i    return gongyu普通...

2018-07-21 08:40:17 3707

原创 合并一对多的数据

setwd("C:/Users/11565/Desktop/练习数据/数据预处理")#店铺淘宝店合并s1 &lt;- read.csv("s1.csv",header = T)s3 &lt;- read.csv("s3.csv",header = T)dim(s1);dim(s3)s13 &lt;- rbind(s1,s3)names(s3)st = merge(t13, s13, ...

2018-07-07 01:30:58 397

原创 R语言怎样检验单位根是否存在

vars包中ur.df(y, type = c("none", "drift", "trend"), lags = 1,selectlags = c("Fixed", "AIC", "BIC")) 函数可以解决type是要选择的类型,lags是要选择的滞后阶数,selectlags表示以哪个准则为主选择,y表示的是一个序列...

2018-07-06 19:53:41 8777 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除