orchidzouqr-CSDN博客

原创 R语言自动更新与常见错误

步骤：(在RGUI进行如下操作)install.packages("installr")library(installr)updateR()错误：> updateR()Error in file(con, "r") : 无法打开链结此外: Warning message:In file(con, "r") : InternetOpenUrl失败:’安全频道支持出错'...

2019-07-01 11:40:44 10170 2

原创 Spyder配置：背景色、注释等

基本的配置都在 tool->perference 里面。背景色设置：Tools->Preferences->Syntax coloring->右侧的scheme(选择想用的)若要调整注释等信息，(Tools->Preferences->Syntax coloring->Edit selected) 参考：文字大小、高亮显示等配置...

2018-11-30 20:54:42 5199

原创如何查看R语言package中自带哪些数据集以及各个数据集的描述

当有新方法时，找不到相应的数据时，可到R语言中package中自带的数据集中找一找。那么，怎么看某个特定的package中包含哪些数据集呢？可采用如下命令：print（data(package='具体的package名')）例如：print（data（package='fda'））通过上述命令，就可知道具体的package中包含的datasets。对于某个特定的数据集，我们可通过命令？数据集名称来...

2018-07-13 23:04:48 43571 2

原创 python学习练习提高网址

1. 点击打开链接 job伯乐在线讲解的很好2. 菜鸟教程 3. 廖雪峰4. 量化课堂

2018-02-27 18:40:44 4244

原创生成均匀分布次序统计量的伪随机数生成删失伪随机样本

2 生成均匀分布次序统计量的伪随机数记U(i)U_{(i)}是来自均匀分布U(0,1)U(0,1)的第ii个次序统计量。利用次序统计量的特征：给定U(i−1)U_{(i-1)}，U(i)U_{(i)}的条件分布是 P(U(i)≤u|U(i−1)=u(i−1))=1−[1−u1−u(i−1)](n−i+1),u≥ui−1P(U_{(i)}\leq u|U_{(i-1)}=u_{(i-1)})=1

2017-12-18 16:08:26 842

原创统计机器学习资料整理汇总

1. CMU2017春季课程 http://www.stat.cmu.edu/~ryantibs/statml/ ，有notes和video。2.吴恩达，斯坦福大学机器学习公开课， http://open.163.com/special/opencourse/machinelearning.html3 剑桥点击打开链接待继续补充

2017-10-31 09:58:15 555

原创 latex 模板下载开源网址

http://www.latextemplates.com/ 该网址上有各种latex模板，如presentation，article，book等，是免费的。

2017-10-24 20:30:49 9850

原创 Jupyter Notebook：no module named....的解决策略

如在tensorflow环境下，使用jupyter notebook时(通过Anaconda Navigator的launch启动jupyter notebook)，输入下面语句时报错: import matplotlib.pyplot as plt 时报错 ImportError Traceback (most recent

2017-09-20 14:24:53 48210 2

原创 R语言警告信息关闭

有时需要展示运行结果，可能会同时报出warning信息，我们知道warning信息是可忽略的，但是，若展示出来总归不好看，特别Rstudio还用红色字体显示，此时，关闭warning信息就很有必要。在matlab中，我们可用warning off 语句，那么，在Rstudio中，我们该用什么命令呢？最终摸索出可用以下命令将warning信息关闭warnings('off')

2017-07-25 15:47:44 21267 3

原创概率统计领域大牛主页网址

斯坦福大学统计系报告：https://statistics.stanford.edu/resources/technical-reports1.Stephen P. Boyd，优化领域大牛，著名Convex Optimization一书的作者，斯坦福大学教授，其个人主页：Boyd, 该主页上有其paper，books，teaching等。2.Trevor Hastie，生物医学领域，斯坦...

2017-07-20 14:32:15 2264

原创 R语言写入excel表遇到的问题及解决

若想将R语言中计算的结果写入excel表中，常用的是通过xlsx包中的write.xlsx()函数，但是这个包需要依赖rjava包和xlxsjars包。但是当我们安装上xlsx包时，经常会出现下面的错误：载入需要的程辑包：rJavaError : loadNamespace()里算'rJava'时.onLoad失败了，详细内容：调用: inDL(x, as.logical(loca

2017-07-12 10:19:10 8348

原创 R 语言调用自己写的其他函数(.R文档间调用)

若是将所有内容都放在一个.R文档里，代码可读性及逻辑清晰度远不如多个.R文档，但是用多个.R文档的话调用函数该怎么相互调用呢？matlab里，我们知道只需写成不同的函数.m文档，然后就可被其他主函数调用即可。在R语言里我们需要借助source()函数。例如，我们在main.R里需要调用operate.R文档中的add(x,y)函数时，我们需要在main.R里先用source()函数加载，然

2017-07-10 17:06:46 22300 1

原创 R语言键盘输入

当某些变量的值需要客户输入时，往往需要用键盘输入的形式，matlab里我们可用input函数，那么R语言里，相应的我们该用什么函数呢？我们可用readline()这个函数。如： print("请输入长度值：") length=readline()此时在Console处输入length的值即可。

2017-07-10 10:49:50 10018

原创 Windows系统基于anocanda安装tensorflow以及如何在notebook，spyder等中使用tensorflow

了解Anaconda的应该都知道可以用conda环境管理不同版本的python,比如我现在安装的是Anaconda3，默认python版本是3.6，但是我想用下Python3.5，这个时候可以用conda创建一个环境，在这个环境下可以安装运行你想要的版本，等用完了退出这个环境即可。系统默认的Python版本还是3.6。如之前所说，TensorFlow当前对python的支持仅对3.5版本比较友好，

2017-06-13 21:22:03 3335 1

原创 Anaconda Jupyter Notebook的使用

首先，介绍一下怎么将硬盘的数据和notebook里的程序放在同一个目录里。先打开jupyter Notebook，然后通过upload把数据上传到程序所在的文件夹。另外，要是想用notebook打开硬盘里的.ipynb文件(notebook编写的文件)继续编写等，也是通过upload先将其上传到jupyter notebook上，然后再按照notebook的方法操作即可。关于noteboo

2017-06-09 13:47:32 4237 1

原创 Python Anaconda

官网下载比较慢，下面给出的下载地址下载比较快，Anaconda下载地址：https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/ ,下载的exe文件，按照说明安装即可。安装成功可在开始部分看到：然后在Anaconda

2017-06-03 15:45:52 442

原创 Excel区间数据拆分

在用Excel处理数据时，可能会遇到形如0.1-5.0形式的数据，而我们分析数据时，常常是需要单独分析上界和下界的，当数据量很大时，我们该如何简单便捷的将该种形式的数据分列存储呢？下面介绍一种简单的操作步骤。对于如下的一组数据：0.14-0.280.16-0.310.14-0.810.14-0.340.13-0.32

2017-04-12 14:48:02 3319

原创 Navicat MySql本地数据库登录不上

当登录本地数据库出现下面问题时：此处补充出现的报错图片当出现上述报错时，可能的原因是MySQL服务关闭了。因此，需将MySQL服务打开，步骤如下：控制面板-->管理工具--->服务---->找到服务本地---->找到MySQL，状态设为启动。

2017-04-07 11:04:03 2463 1

原创 Numpy库

用列表list保存一组值，可当做数组使用，但由于列表的元素可是任何对象，因此，列表中保存的是对象的指针。因此，为保存一个简单的列表[1,2,3]，需要有三个指针和三个整数对象。对数值运算来说，这种结构比较浪费内存和CPU计算时间。 Python还提供了array模块，array与列表不同，能直接保存数值，和C语言的一维数组类似。但是它不支持多维数组，也无各种运算函数，因此，也不适合

2017-04-06 16:57:22 657

原创 Python 简介

1.众多开源的科学计算软件包提供了Python的调用接口，如计算机视觉库OpenCV、三维可视化库VTK、医学图像处理库ITK。2.Python专用的科学计算库很多。如经典的NumPy、SciPy和matplotlib，它们分别为Python提供了快速数组处理、数值运算及绘图功能。3.自动补全。输入一部分文字之后按Tab键，IPython将列出所有补全信息。用此功能可快速输入对象的属性名或

2017-04-05 21:43:41 806

原创 matlab连接Navicat出现的账户或密码错误问题重设密码

当运行完conn=database(....)后出现下面问题时，conn = Instance: 'match_data' UserName: 'zqr' Driver: [] URL: [] Constructor: [1x1 com.mathworks.toolbox.database.datab

2017-04-03 10:30:12 2853

原创 Markov Chains Monte Carlo（MCMC）proposal distribution（建议分布）选取的一个原则

在上篇博客中 MATLAB 抽取随机数 MCMC原理中已经介绍了在Metropolis和Metropolis-Hastings算法中选择proposal分布的三种建议，本文基于实践再给出一种选取proposal分布的一种建议。原理是抽取的样本相关系数大的话，有效样本的个数是减少的，因此近似的效果会变差。因此，我们在选取proposal分布时，也应注意抽样的相关性，选取相关性小的proposal。

2017-03-10 10:21:35 6038

原创 MATLAB 抽取随机数 MCMC原理

1、matlab自带抽取随机数的函数注：只列举各个函数名字，具体各个函数的用法可用help查看。 (1)正态分布随机数：randn()，normrnd(), mvnrnd(); 其中最后一个用于抽取联合正态分布的随机数。 (2)均匀分布随机数：rand() (3)beta分布随机数: betarnd() - Beta random numbers. (4)二项分布随机数：binor

2017-03-07 10:12:28 11747

原创 Navicat for mysql 将表从一个数据库转存到另一个数据库

Navicat for mysql 数据库表格复制

2017-01-19 13:05:01 24161 1

原创极大似然估计值的标准差

极大似然估计有很好的渐进性质，在一定正则条件下具有强相合性和渐进正态性。预备知识设X1,X2,...,XnX_1,X_2,...,X_n为独立同分布样本，X1∼f(x1,θ),l(θ,x1)=logf(x1,θ)X_1\sim f(x_1,\theta), \quad l(\theta,x_1)=logf(x_1,\theta)则有， S(x1,θ)=l˙(θ,x1)=∂logf(x

2017-01-09 19:28:40 9335

原创集成方法（ensemble method） Boosting Adaboost

使用集成方法时可有多种方式：不同算法的集成；同一算法在不同设置下的集成；数据集不同部分分配给不同分类器之后的集成；下面主要介绍同一类型分类器的集成。 1. bagging 基于数据随机重抽样的分类器构建方法思想：自举汇聚法(bootstrap aggregating), 采用bootstap从原始数据集重抽样，且样本大小与原来一样大，重复S次。在S个数据集建好之后，

2017-01-01 15:18:23 964

原创 R语言解决Lasso问题----glmnet包（广义线性模型）

根据Hastie， Tibshirani和Wainwright的Statistical Learning with Sparsity（The Lasso and Generalizations），如下五类模型的变量选择可归结为广义线性模型，且可采用R语言的glmnet包来解决。这五类模型分别是：1. 二分类logistic回归模型2. 多分类logistic回归模型3.Possion模

2016-12-12 14:59:13 126890 16

原创 R 读取Excel数据

最简单的是采用前两种方式。1. 将excel数据另存为csv格式，用read.csv("文件名")2. 将excel数据另存为TXT格式，用read.table("文件名")3. 在Windows系统中可以选择使用RODBC软件包中的相关函数来实现。>library("RODBC") #加载RODBC软件包>channel=odbcConectExcel(file.choose

2016-12-11 11:06:39 1516

原创 R语言第三方软件包的下载及安装

下载地址：https://cran.r-project.org/web/packages/包名/，如https://cran.r-project.org/web/packages/RODBC/，这个是RODBC软件包的下载地址。可从该网址上找到所有关于包的说明介绍，如reference manual(pdf格式的)等。安装：1.自动安装(在线安装)(1)install.packag

2016-12-11 09:25:42 43949 2

原创 R 语言编辑等的技巧

1. 清理屏幕 Ctrl+L；2. ls()查看当前所有对象，返回对象名，对每个对象，可通过object.size(对象名)查看其占用内存的大小；3.memory.size(T)查看已分配内存大小； memory.szie(F)查看已使用内存大小；memory.limit()查看内存上限；memory.limit(3000)即设置内存上限为3G，memory.limit(4000)即设

2016-12-10 09:34:14 2473

转载数据挖掘领域顶级会议期刊及其分析

JournalsACM TKDD http://tkdd.cs.uiuc.edu/DMKD http://www.springerlink.com/content/1573-756X/?p=859c3e83455d41679ef1be783e923d1d&pi=0IEEE TKDE http://www.ieee.org/organizations/pubs/transactions/

2016-11-12 13:01:49 794

原创伪随机生成算法（线性同余算法）

定义：伪随机数：通过某种数学公式或者算法产生的数值序列。虽然在数学意义上伪随机数是不随机的，但是如果能够通过统计检验，可以当成真随机数使用。算法：伪随机数产生最基础的思想是均匀分布(当然这不是唯一的思路)。一般来说，如今主流的编程语言中使用的随机数函数基本采用这种均匀分布思想，而其中最常用的算法就是”线性同余法”。 $x_{n}=(ax_{n-1}+b)mod(m)$

2016-11-12 12:19:14 5196

原创 Java eclipse的安装

1.首先到官网下载:www.eclipse.org--->选择右上角的download----->packages------->eclipse IDE for java EE developers 选择自己计算机对应的版本，如我的是win7 64位，选择的是Windows 64-bit。2.点击eclipse.exe, 若是没安装JDK，会显示缺少JDK的提醒。3.安装JDK。下载JDK

2016-10-26 14:15:36 353

原创如何将Excel表中一列数据的分子和分母分别存储

目前数据格式：想分别读取分子和分母怎么办呢？可先在excel里预处理。将数据复制到分子列和分母列，然后针对每列：如对分子列，通过Ctr+H调出查找和替换，然后在查找内容里填写/*，替换部分不填，选全部替换即可。对于分母列，查找内容里填写*/，替换部分不填。操作结果如下：

2016-10-24 16:56:13 3963

原创 matlab 连接Mysql数据库

采用JDBC方式：1、将MySql驱动的jar文件拷贝到Matlab安装目录下的java\jar\toolbox；2、到toolbox\local，找到classpath.txt文件，打开，并添加用来加载mysql的jdbc驱动$matlabroot/java/jar/toolbox/mysql-connector-java-5.1.7-bin.jar3、conn = databa

2016-10-19 19:45:48 983

原创 python的pandas库里的数据结构介绍

首先介绍第一类：Series （注意大小写）defination：Series is a one-dimensional labeled array capable of holding any data type(integers,strings,floating point numbers,python objects,etc.)定义：Series是一维带标签的数组，其可包含任意类型的

2016-10-13 19:53:59 476

原创 python 爬虫（1）

基础的爬行语句包括获取网页的html和解析，获取网页html内容主要用到urllib2库里的urlopen函数，返回值是个file-like object,记该对象为response，采用response.read()即可获得网页的html内容。然后利用BeautifulSoup函数解析网页即可。如下例：import urllib2from bs4 import BeautifulSou

2016-09-18 20:41:09 371

原创 mysql-5.7.15-winx64的下载及安装

1. 下载地址：http://dev.mysql.com/downloads/mysql/ ，选择第二个 (关于下载地址可参考http://bbs.125.la/thread-13855239-1-1.html)2. 下载下来的这个压缩文件是免安装的，将压缩文件拷到想“安装”到的位置，解压缩即可。3. 配置默认文件。将新建一个my.ini,将my-default.ini的内容拷贝到

2016-09-16 09:54:46 10446 4

原创 matlab .p文件

1. matlab里的.p文件只可调用，但不可查看其内部代码，因此.p文件起到加密的作用，将.m文件改为.p文件的命令是pcode .m,例如将main.m文件改为.p文件， pcode main.m（或者 pcode main）即可。2. 当一个.m文件里调用了很多其他.m文件，可将该m文件预解析（p文件是对应的m文件的预解析版本）,以节省时间。

2016-09-12 19:57:18 3270

原创 matlab修改m文件（如修改内部自带文件）调出m文件方法

采用edit函数，语法： edit（‘文件名’），如edit(‘profview’)，注意不用加.m。采用which函数，调出m文件所在位置。如 which profview.m, 结果显示profview.m的位置。

2016-08-13 10:52:50 4992

空空如也

空空如也