自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

yugao1986的专栏

SAS and R 学习记录

  • 博客(181)
  • 资源 (10)
  • 收藏
  • 关注

原创 R and MongoDB

R and MongoDBlibrary(RMongo)mg1 <- mongoDbConnect('test')print(dbShowCollections(mg1))query <- dbGetQuery(mg1, 'person', "{'age': 20}")data1 <- querysummary(data1)

2016-03-16 13:00:53 1816

原创 分类数据之logistic回归

/*分类变量分析之logistc(一),因变量为二分类变量数据coronary中ca为二分类因变量,sex、ecg为二分类自变量,所有的二分类变量用0、1进行区别,构成(0,1)矩阵*/data coronary; input sex ecg ca count @@; datalines;0 0 0 11 0 0 1 40 1 0 10 0 1 1 81 0 0 9 1

2013-09-30 15:46:43 7854 2

原创 分类数据之列联表分析案例with sas

*表一,随机设计四格表;options validvarname=any;data test1; input 用药 $ 敏感性 $ 计数; datalines;服药 不敏感 180服药 敏感 215未服药 不敏感 73未服药 敏感 106;proc freq data=test1 order=data; weight 计数; tables 用药*敏感性

2013-09-29 15:52:45 6055 3

原创 C基础笔记1

现代计算机之父: 冯.诺依曼计算机语言分类:    机器语言    汇编语言    高级语言:B语言系                        C语言系(C,C++,C#,java,Perl,Python)C语言及标准化         最早由Dennis Ritchie于1973年为unix设计并实现,从贝尔实验室到世界各地         标准:

2013-07-24 22:11:15 2063

原创 java笔记1

From 达内JAVA基础一、java工具JDKjava开发工具包,sun官方提供的Java下载安装包,份操作系统和版本JREJava运行环境,下载安装JDK即可得到JRE,需要陪着环境变量JVMJava虚拟机,是java的核心功能的提供者,java程序必须运行在JVM中GC内存垃圾的回收机制,由JVM提供IDE集成开发环境,是大规模的商业开发工

2013-07-21 22:27:05 1941

原创 生成月度数据

data yu; data=.; do i=0 to intck("month",'01jan2013'd,"01jan2014"d); time=intnx("month",'01jan2013'd,i,"b");output; end; format time monyy.; drop i;run;

2013-04-13 18:46:54 2190

转载 哑变量矩阵生成dummy matrix with sas

FROM:http://support.sas.com/kb/23/217.htmlFor a specified model, there are several procedures that allow you to save the design matrix to a data set:For models using GLM parameterization (also

2012-11-28 00:02:56 4354

原创 Creditmetrics模型

维基百科里面有详细的介绍:http://wiki.mbalib.com/wiki/Creditmetrics模型。一、概况起来,其中主要的思想有:1.转换矩阵(Transition Matrix):它是一个信用等级的信用工具转移到另一个信用等级的概率矩阵;2.信用工具的在险价值VaR:信用工具的价值取决于其信用等级;3.信用计量模型的一个基本特点就是从资产组合并不是单一资产的角度来

2012-11-09 14:14:30 8723

原创 高低点比较、突破策略 using sas

/*俞高2012年10月15日1) 高低点比较策略通常人们判断趋势处于上升的理由是,当前低点比前一个低点要高,当前高点也比前一个高点要高。判断趋势处于下跌的理由是,当前低点比前一个低点要低,当前高点也比前一个高点要低。如果仅仅以高低点的比较去判断趋势的涨跌,这样的情况一天内会发出上百次而导致交易过于频繁。而且很多高低点之间的价格差距并不大,就是说,有时几乎没有上升,或者上升

2012-10-16 11:38:02 4894

原创 套利组合收益的节假日统计

需求:统计节假日效应:节前一周内开仓和节后一周内开仓的收益情况其中,套利组合在开平仓信号内,按照周一-周五分别开仓。解决步骤:1.数据处理1.1导入周一-周五组合的市值数据,组合数据包含开仓时间(start),平仓时间(end),   开仓市值(open),平仓市值(close),平仓沪深300市值(hs_close)。PROC IMPORT OUT= WORK.e

2012-10-15 15:29:10 2744

原创 读光大证劵“股指期货微观市场初探—高频数据、交易的解读”笔记

读光大证劵“股指期货微观市场初探—高频数据、交易的解读”笔记/*交易信号1: 根据每笔交易价格与交易前报价的关系确定此笔交易的触发方向,即买方触发还是卖方触发。 如价格与买一接近,则此单被定为卖单触发;如价格与卖一接近,则被定为买单触发。 如价格与买一和卖一距离相等,则不确认这单的触发方向。 */data trade_test1; set m_te

2012-09-27 16:47:10 3883

原创 过滤高频数据的微小波动using sas

*1) 均线化因为行情的日内高频价格序列波动比较剧烈,看起来也几乎是杂乱无章的,所以我们为了捕捉趋势需要过滤掉一些干扰的噪声,均线是过滤微小扰动的一种常用的方式,而且也适合用于捕捉趋势。我们将A 个连续的数据取均值,形成MA(A),在本文所作测试中A 取为10,下文都称经过均值化的数据位MA(10)。由于采用的原始价格序列是6 秒高频数据,所以均线化后的数据类似于60 秒价

2012-09-21 17:05:25 3462

原创 游程检验

*4)市场的有效性检验—游程检验:1) 对分笔成交价格的变化进行计数。当发生持续同方向变化时我们记这些持续的变化为一次连续;2) 统计样本内正向连续和负向连续的累积次数u。统计样本内正向变化次数n1和负向变化的次数n2。3) 如果价格变化是随机的,则发生连续的次数的期望值为:e=(2*n1*n2)/(n1+n2)+1,s=sqrt((2*n1*n2(2*n1*n2-n1-n2)/(

2012-09-20 14:22:41 3988

原创 完全复制沪深300指数

完全复制亦即购买标的指数中的所有成份股票,并且按照每种成份股在标的指数中的权重确定买卖比例,从而达到复制指数的目的。*主要步骤:*收集T日收盘价close,成份股权重weight,T日沪深300点位hs300;*成份股权重计算:根据分级靠当方法,计算成分股流通股本,流通市值, 最终得到成份股权重weight;*股票交易规则要求购买股票数量是100的整数倍,这里取法为:股票数量/10

2012-09-14 15:46:13 3800

原创 股票数据合并

一个月在论坛上提问过个股数据合并问题,问题如下:现有100只股票数据txt,命名形如:daysh600000,daysh600004...,daysz000001....,600000等是股票代码(id);数据的结构都一样,内含变量,date,open,high,close等,但不含股票代码:data daysh600000;    input date open hight low

2012-09-11 13:33:41 2568

转载 Steps to implementing a scan loop in SAS

Steps:1. Store the number of observations in a data set to a macro variable (RECCOUNT)2. Increment a variable (I) fromone to RECOUNT using a %DO loop3. Use the FIRSTOBS option in a DATA step to

2012-09-07 22:51:25 2037

原创 Black Scholes期权定价模型

data BS; input S X r v T; d1 = (log(S/X) + (r+v**2/2)*T)/v/sqrt(T); d2 = d1 - v*sqrt(T); *编辑公式计算买权call和卖put的定价; C = S*cdf('Normal',d1) - X*exp(-r*T)*cdf('Normal',d2);

2012-08-17 11:30:44 4296

原创 动量策略&反转策略初探sas

MBAlib百科对动量策略和反转策略作了很好的解释:动量/反向策略是指买入赢家/输家组合,同时卖空输家/赢家组合的交易策略。其主要步骤为:  ①确定目标证券市场作为交易对象的范围。  ②选定一个时间长度作为证券业绩评价期,通常称为投资组合的形成期或排名期。  ③计算形成期各样本证券的收益率。  ④根据形成期各样本证券的收益率的大小,对目标市场所有样本证券进行升序、降序排列,然后

2012-08-08 12:11:06 9211 7

原创 sas用于金融计算的函数

http://support.sas.com/documentation/cdl/en/lrdict/64316/HTML/default/viewer.htm#a003180371.htm重新整理了下:一些名词:Issue:证劵发行日;first-interest:证劵的第一个付息日;settlement:证劵清算日;rate:利息率;par:证劵的票面价值(sas中默认1000$)

2012-08-03 14:55:08 6385

原创 sas探索交易数据信息

长江证劵分析员做过题为“交易数据反映的信息及预测性”研究,见:http://www.docin.com/p-68475999.html。笔者试图套用文章的模型进行高频数据的研究:期货数据形如:....*读取主力合约数据;data test; set quote20120731; format date yymmdd10.; time1=input(tim

2012-07-31 16:41:38 2811

原创 图示期货价格变动对成交量的影响

*读取主力合约数据;data test; set quote20120725; format date yymmdd10.; time1=input(time,time8.); format time1 time8.; *10:00:00时间格式; hour=hour(time1); *提取小时; minute=minute(time1

2012-07-25 17:04:54 1639

转载 缺失值添加帖子汇总

https://communities.sas.com/thread/35155https://communities.sas.com/message/129069#129069https://communities.sas.com/message/109396#109396https://communities.sas.com/message/121311#121311https

2012-07-23 22:07:34 997

转载 Comparing Stock Returns Forecasting Methods Using SAS

http://support.sas.com/resources/papers/proceedings12/163-2012.pdf文章比较了较传统的股票分析方法:移动平均MA,相对强度指标RSI,布连线;处于数据的连续和完整,文章选取1981.1.2-2010.12.31时间内纽交所都进行交易的股票数据,共计355只个股。数据包含了一下变量:日期date,股票的ID,日收益RET,股票调整价

2012-07-17 13:53:38 1247

转载 Portfolio Backtesting

转载,author:Xuan Liu, Mark KeintzAbstractOne of the most regularly used SAS programs at our business school is to assess the investmentreturns from a randomly populated set of portfolios coverin

2012-07-14 20:51:20 1809

原创 A股股票小参数计算

libname yu "E:\yugao\时间跨度相关\TXT";*sh600000数据测试;data test; set yu.tar(rename=(var1=date var2=open var3=high var4=low var5=close

2012-07-12 17:10:38 1030

原创 数据筛选first. and last.

/*期货数据筛选。期货数据包含:合约代码/行情日期/行情时间/各种价格等变量,期货数据结构较复杂。要筛选出指定日期相对应的合约,需要利用first. last.*/DATA GUZHI;*合并股指数据,对变量进行重命名,筛选出部分重要变量; set base.quote:(rename=(_COL2=fundid _COL4=open1 _COL9=high1 _COL10=low

2012-07-04 14:01:51 719

转载 表链接proc sql

朱世武的书的例子很详细,现在想想基本上涵盖了一些论坛上的问题./*21.1.1 简单连接*/proc sql;select * from resdat.china, resdat.usa;quit/*21.1.3 内部连接*/proc sql;select * from resdat.china, resdat.usawhere china.level=usa.level;q

2012-07-02 20:13:18 2530

转载 sas用于时间的函数

处理股票数据,经常要对时间变量作处理,特意摘录sas.support.com的样例来学习sas的用于时间的函数.另外《DATE HANDLING IN THE SAS ® SYSTEM》一文中也有很多详细的例子。*计算年龄;/* Create sample data */data birth; input name $ bday :mmddyy10.;datalines;

2012-06-23 22:11:56 6424

原创 比对沪深300成份股派息情况

/*目的:比对沪深300成份股派息情况细节:proc import读取沪深300成份股信息,从中财网提取A股派息情况(目前系统过粘贴成文本进而导入sas), 最后proc sql依据股票ID进行合并处理遇到的问题:在合并过程中会遇到两数据变量的属性不一致的问题,merge...by报错,proc sql结果多于300条记录*/*导入沪深300数据,该数据系20120

2012-06-21 15:41:25 3485

原创 派息与股价

//*源数据来自招商证据软件,fundid:股票代码,x系除权除息日开盘价与股权登记日收盘价的差值除以股权登记日收盘价,反应股价波动率y:派息率,派息金额与股权登记日收盘价比值*//;data test;   input fundid $6.  x y;cards;601288 -0.0375  0.044494382000031 -0.0166  0.0056

2012-06-21 14:45:38 1145

原创 实习流水帐

1.华泰柏瑞沪深300ETF申购赎回清单libname yugao "E:\yugao\work\htbr300ETF";data yugao.ht120531; infile "Z:\300_0531.ETF" dlm="|" firstobs=15 obs=300 lrecl=1024; retain fundid fundname fundnum cashrep

2012-05-31 17:51:03 1145

转载 异方差/自相关/多重共线性/协整

from:《金融计量学-基于SAS的金融实证研究》chapter4*异方差;proc reg data=capm.rip1outest=capm.beta;model meanrif=meanrmf;output out=capm.r r=e;/*把回归残差值赋给变量e*/by p;run;data capm.r;set capm.r;r2=e*e;

2012-05-29 15:38:37 3922

原创 proc rank

一个中文博客:http://blog.sina.com.cn/s/blog_6849f0730100we95.html排序方法详解(文档):Proc rank 计算 观测值对应数值型变量的秩次语法:      Proc rank ;          By variable-1 variable-n ;*分组变量;          Var data-set-var

2012-05-28 15:42:46 2131

原创 经典线性回归拾穗

1.来历Francis.Galton,研究父母身高/儿女身高时,发现子辈身高趋向于全体人口的平均身高.该现象由其朋友Karl.Pearson证实.2.涵义研究因变量对自变量的依赖关系,试图通过自变量的确定来估计或预测因变量的均值.3.回归与因果因变量与自变量的依赖关系,并不一定意味着因果关系,从逻辑上讲,统计关系式本身不可能意味这任何因果关系.4.回归与相关相关是衡量变

2012-05-19 13:49:39 702

转载 sas时间序列试验指导(含程序)

实验一 分析太阳黑子数序列一、 实验目的:了解时间序列分析的基本步骤,熟悉SAS/ETS软件使用方法。二、实验内容:分析太阳黑子数序列。三、实验要求:了解时间序列分析的基本步骤,注意各种语句的输出结果。四、实验时间:2小时。五、实验软件:SAS系统。六、实验步骤1、开机进入SAS系统。2、 创建名为exp1的SAS数据集,即在窗中输入下列语句:data

2012-05-14 14:53:14 16003

原创 条件判别命令---ifc&ifn

if/else..where等条件判别语句比较常见,ifc&ifn语句的出现提高了某些条件判别的效率.这里从文档里翻译摘录些ifc&ifn的说明.1.语法:IFC(logical-expression, value-returned-when-true, value-returned-when-false value-returned-when-missing>);IFN(logi

2012-05-04 20:22:23 1164

原创 sas tips

1.查询每个月初数据(月底),利用intnx()函数,比较first.(last.)data stocks; set sashelp.stocks; by stock date notsorted; if first.date then output;run;data stocks2; set sashelp.stocks; by stock date not

2012-05-04 19:49:50 844

转载 Safely Merging Many Datasets

如题,该代码摘自“Safely Merging Many Datasets”一文,可以下载原文http://support.sas.com/resources/papers/proceedings11/409-2011.pdf/********************************************************A macro to safely merge al

2012-04-28 17:50:59 446

转载 sas做广义估计方程

赵目等在“纵向数据下广义估计方程估计”一文从数学角度对广义估计方程进行了探讨,这里转载个sas做广义估计方程的例子:data thall; input id y visit trt bline age; intercpt=1; cards;104 5 1 0 11 31104 3 2 0 11 31104 3 3 0 11 31104 3 4 0

2012-04-26 21:04:26 5207

原创 极差标准化方法&因子分析综合得分

1.极差标准化方法经济统计分析中对正负指标标准化的一种处理方法:sas计算:proc sql; create table new as select (x-min(x))/(max(x)-min(x)) as z_x, (max(x)-x)/(max(x)-min(x)) as f_x from mydata;quit;

2012-04-22 22:29:32 19123

朴实贝叶斯算法

朴素贝叶斯算法,c/c++语言的 它能提供比非泛型强类型集合更好的类型安全性和性能。

2011-11-13

id3算法ppt

id3算法,适合初学者。免费分享,欢迎下载

2011-11-13

java提高级讲义

文档来自中科院计算所培训中心讲义,适合有一定java基础的并期望提高的同学

2011-09-20

中科院c++讲义

文档系中科院计算所培训中心讲义,课件内容

2011-09-20

Guide to Report Writing Examples

基于sas软件的报告设计,该书里面有很多例子,这些例子都是日常工作常遇到的问题

2011-07-26

100 Statistical Tests(the third edition)

介绍100种统计检验,包括各种常用的假设检验

2011-07-26

数据分析方法(数据挖掘与统计学结合)

该书介绍了各种数据挖掘分析的方法,容易上手,适合初学者。

2011-04-30

sas for mixed models

该书详细介绍了各种复杂的统计模型,给出了sas软件对此进行处理的方法。

2011-04-30

sas的EM模块范例

该文件主要是介绍了SAS的EM模块的例子,其中有html格式的文字说明,对照学习。

2011-03-10

Proc SQL beyond the basics using SAS

该书详细介绍了sas中的sql语言,不仅适合初学者学习sas,也可以帮助开阔高手提高自己编程的思路。

2011-03-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除