自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Cirno's Bioinformatic Career

The Journey from ⑨ to Expert

  • 博客(18)
  • 收藏
  • 关注

原创 芯片数据分析步骤7 合并重复探针

合并重复探针合并探针的原因为了避免非特异性结合等干扰因素影响实验结果,芯片厂商往往采取多个探针检测同一基因表达的策略,从而导致注释探针后发现许多探针被注释为同一个基因。但在后续的分析中,程序往往不能接受表达矩阵中存在多个探针对应同一基因。因此,在进行后续分析之前,我们需要选取一个标准,对被注释为同一基因的探针进行合并。唯一要注意的是,要在过滤后再合并重复探针。合并重复探针的方法...

2018-05-27 12:16:28 10928 3

原创 芯片数据分析步骤6 探针注释

注释探针注释探针的原因为了防止非特异性结合造成的干扰,芯片厂商往往会使用多个探针检测同一个基因的表达。因此,芯片厂商不会使用基因名作为探针的名称,而是使用自己定义的探针名称。要合并重复探针,我们必须先对探针进行注释,确定每个探针对应检测哪个基因的表达,然后再合并重复探针。而后续分析如GSEA,只能对基因进行分析,因此也要求对探针进行注释。注释探针的方法1 使用芯片厂商的...

2018-05-22 18:46:36 30974 5

原创 芯片数据分析步骤5 过滤探针

过滤探针过滤探针的原因表达谱芯片上的探针往往能够覆盖到所有人类基因,也就是说,能够同时检测所有人类基因的表达。但先前的实验表明,一个细胞中不可能所有基因都同时表达,能够同时表达的基因反而是少数。同时表达的基因约占总基因的40%左右。由于探针与目标之间一定存在着非特异性结合,所以所有的探针均会产生信号。如果不加以过滤,认为这些探针对应的基因都表达,即不符合事实,也会对后续的分析产生影...

2018-05-22 18:42:11 8310 3

原创 芯片数据分析步骤4 标准化-affy

标准化标准化的原因芯片实验中存在大量干扰因素,标准化可以削弱这些干扰因素,使得实验条件下的测量可以相互比较。常见干扰因素:芯片杂交的RNA总量不一致、芯片表面不平整、探针非特异性结合、杂交条件不一致。注意,limma包的说明里面提供了两点建议。一,如果要进行探针过滤(filter),最好在进行标准化之后再过滤。二,如果要在后续分析中使用limma包,请不要进行基于方差(vari...

2018-05-17 20:05:37 22395

原创 芯片数据分析步骤3 芯片质量控制-affy

affy芯片质量控制前言大家手头的芯片数据一般有两个来源,一个是自己做的芯片的数据,一个是从数据库下载的芯片数据。如果是自己做的芯片的数据,是一定要进行芯片质量控制的。虽然厂家会提供芯片质量分析的结果,但如果有可能的话,最好还是自己也进行质量分析。根据分析的结果,决定排除哪些芯片的数据,甚至重做也是有可能的。一定只能用质量好的芯片数据,否则可能影响实验结果。自己做的芯片数据在质量控...

2018-05-16 13:47:58 11531 5

原创 芯片数据分析步骤2 读取数据-affy

读取affy表达谱芯片数据的方法Affymetrix表达谱芯片数据读取的方法分3种:1、使用affy包读取。(HGU95/HGU133芯片)2、使用oligo包读取。(Whole Transcriptome 芯片/ NimbleGen 芯片/ SNP芯片等)3、使用simpleaffy包读取。(HGU95/HGU133芯片)说明1 使用 affy 包读取1 ju...

2018-05-12 15:51:33 13627

原创 芯片分析步骤1 芯片数据下载-ArrayExpress

从ArrayExpress数据库下载数据的方法1、在ArrayExpress Search中输入编号或是关键词,选择符合的Accession,在ftp中进行手动下载,或是在R中用ArrayExpress包下载。2、使用R包ArrayExpress的queryAE命令下载搜索结果,挑选合适的Accession,在R中使用ArrayExpress包进行下载。ArrayExpress数据库的...

2018-05-12 15:49:02 10814

原创 simplyaffy包常用函数

simplyaffy常用函数1 call.exprs功能:使用MAS5,GCRMA或RMA算法生成表达矩阵。返回值:ExpressionSet。call.exprs(x, algorithm = "rma", do.log = TRUE, sc = 100, method = NA) 参数 注释 x AffyBatch对象。 al...

2018-05-12 15:45:11 1121

原创 oligo包常用函数

oligo常用函数1 darkColors功能:提供颜色。返回值:表示颜色的字符。darkColors(n)seqColors(n)seqColors2(n)divColors(n)注意:darkColors是基于RColorBrewer包设计的。2 fitProbeLevelModel功能:对FeatureSet拟合robust Probe L...

2018-05-12 15:39:21 2667

原创 gcrma包常用函数

gcrma常用函数1 compute.affinities功能:计算探针亲和数据。返回值:返回一个包含有PM和MM探针亲和数据的AffyBatch。compute.affinities(cdfname,verbose=TRUE)compute.affinities2(cdfname,verbose=TRUE) 参数 注释 cdfname ...

2018-05-12 15:33:50 1590

原创 genefilter包常用函数

genefilter常用函数1 findLargest功能:只留下检验统计量最大的探针,舍弃其他重复探针。返回值:包含探针名称的list。findLargest(gN, testStat, data = "hgu133plus2") 参数 注释 gN 包含所有探针名称的list。 testStat 包含检验检测统计量的list...

2018-05-12 15:31:41 2949

原创 GEOquery包常用函数

GEOquery常用函数1 getGEO功能:从GEO数据库下载数据。返回值:GDS/GSE/GSM/GPL。取决于GEO参数。getGEO(GEO = NULL, filename = NULL, destdir = tempdir(), GSElimits = NULL, GSEMatrix = TRUE, AnnotGPL = FALSE, getGPL = T...

2018-05-12 15:30:36 8688

原创 arrayQualityMetrics包常用函数

arrayQualityMetrics常用函数1 aqm.writereport功能:使用aqmReportModule生成质量报告。返回值:质量报告。aqm.writereport(modules, arrayTable, reporttitle, outdir) 参数 注释 modules 含有 aqmReportModule 对象的...

2018-05-12 15:29:16 1080

原创 ArrayExpress包常用函数

ArrayExpress常用函数1 ae2bioc功能:将MAGE-TAB文件从raw data转换为bioconductor对象。返回值: AffyBatch, ExpressionSet 或 NChannelSet。assayData储存表达值,phenoData储存sdrf,featureData储存arf,experimentData储存idf。ae2bioc(...

2018-05-12 15:27:26 3638

原创 affyPLM包常用函数

GEOquery常用函数1 fitPLM功能:通过拟合探针水平模型(probe-level model),将AffyBatch转换为PLMset。返回值:PMLset。fitPLM(object,model=PM ~ -1 + probes +samples,variable.type=c(default="factor"),constraint.type=c(de...

2018-05-12 15:25:24 3225 1

原创 芯片数据分析步骤1 芯片数据下载-GEO

从GEO数据库下载数据的方法1、在GEO DATASETS中输入关键词,选择符合的GSE,在ftp中进行手动下载2、找到符合的GSE,在R中使用GEOquery包进行下载GEO数据库的数据种类1、Platforms 平台包含有芯片的探针信息,如cDNAs,寡核苷酸,ORFs,抗体。以GPLxxx编号。一个platform可以包含不同人上传的不同sample。不同...

2018-05-06 13:17:53 14944

原创 affy包常用函数

affy常用函数1 AffyRNAdeg功能:计算RNA降解相关的统计数据并用图形展示。返回值:RNA降解相关的统计数据及图形展示。 项目 描述 sample.names 样品名称 means.by.number average intensity by probe position ses standard error...

2018-05-06 13:10:31 4782

原创 人生第一篇生物信息学博客

这虽然不是人生的第一篇博客,但却是踏入生物信息学领域后的第一篇博客。 先说说我自己吧。93年生人,在基督教信徒眼中最神圣的节日出生。但无论是心性,才华亦或是雄心壮志,都无法与那位相提并论,甚至连衣角都不可触及。 从小由于亲人因为肿瘤去世,便立志投身于肿瘤领域,为攻克癌症尽一份力。从初中开始便参加生物竞赛,高中更是成为省队中的一员。由于我那年竞赛体制还没有改革,所以有幸逃过高考一劫,进入了复旦大...

2018-04-20 16:34:43 5295 5

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除