自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

卫博

在读生物研究生,平时做点小生信

  • 博客(23)
  • 收藏
  • 关注

原创 RNA-seq数据分析(HISAT2+featureCounts+StringTie)

RNA-seq数据分析简介简介基因表达是功能基因组学研究的一个重要领域。基因表达与基因信息从基因组DNA模板到功能蛋白产物的流动有关(图1)。大规模并行RNA测序(RNA-seq)已成为一种标准的基因表达检测方法,尤其用于询问相对转录本丰度和多样性。一些研究已经证实,它的测量精度可以与其他成熟的方法如微阵列和定量聚合酶链反应(qPCR)相媲美[2-4]。它有蜜蜂...

2020-08-21 21:53:58 15149 5

原创 R语言基础图形绘制——箱线图

R语言绘制箱线图箱线图主要是通过四分位数描述数据分布,通过最大值,上四分位数,中位数,下四分位数,最小值五处位置描述数据分布情况。

2020-08-12 12:27:56 82921 5

原创 R语言基础——简单相关性分析(1)

简单相关性分析(1)简介简介初次接触相关性分析,在摸索中前进,也顺便将笔记记录下来,未雨绸缪嘛!简单来说,相关性分析就是衡量两个变量之间的依赖性强弱的一种统计学方法。相关系数可以用来描述定量变量之间的关系。相关系数的符号(±)表明关系的方向(正相关或负相关),其值的大小表示关系的强弱程度(完全不相关时为0,完全相关时为1) 。...

2020-08-08 18:35:07 12653 1

原创 转录组差异表达分析和火山图可视化

利用R包DEseq2进行差异表达分析和可视化count数矩阵在Linux下,通过HISAT2 对下载的GSE数据进行比对,FeatureCounts软件进行基因水平定量,得到count数矩阵。之后便可以载入R语言中进行差异分析。差异分析第一次分析RNA-seq数据,走到这一步相对容易了许多。转录组数据分析主要参考了生信技能树Jimmy老师的相关课程及推文。RNA-seq的read count普遍认为符合泊松分布,但是之前分析过的芯片数据符合正态分布,所以筛选DEGs的方法有一定差别。.

2020-07-30 13:44:33 10985

原创 R tidyverse学习01

tidyverse 包是 Hadley Wickham 及团队的集大成之作,集数据读取,操作,探索和可视化于一体的一系列R包的集合。其理念是一开始先忽略编程的一些基础概念,如向量,矩阵,数据框,因子等,而是直接从数据的操作入手,可以有效的在短时间内学会数据的处理和可视化。但需要强调的一点是,如果想深入学习R语言以及其他编程语言,基础乃根本。1. 基础tibbles数据框和管道操作是学习tidyverse的基础。tibble是通过对传统的数据框功能的修改,开发的一种简单的数据框,更易于使用。在进行线..

2021-03-07 00:30:48 827

原创 R语言基础绘图——dot plot

一步步绘制和美化dot plot简介开始1. 查看数据并转换为长数据格式2. 绘制基础图形3. 添加errorbar和pointrange4. 修改颜色和坐标轴主题5. 加注释总结简介作为文章中经常出现的一种图形,dot plot 可以展示点的分布和统计变化之后的数据均值等特征值。以下是一篇已发表的文章中的图,今天我们将构造数据,一步步实现它。开始1. 查看数据并转换为长数据格式library(tidyverse)library(magrittr)data %<>% pivo

2021-02-23 16:54:16 8505

原创 python交互式地图绘制

python学习过程中的第一篇记录。本文参考于《python编程:从入门到实践》。文中的数据population_data.json可直接在网上找到。import jsonfrom pygal_maps_world.i18n import COUNTRIESimport pygalfrom pygal.style import RotateStyledef get_country_code(country_name): """从pygal获取两个字母的国别码""" for

2021-02-04 13:09:38 2489 1

原创 PCA从原理到实践(基于R)

自己之前也做过几次PCA分析,但对其原理的了解和产生的数据构成以及可视化和R函数的选择都是一头雾水,希望这篇文章能够带你进一步了解PCA,进而更好的应用它。

2020-12-10 23:38:07 1800

原创 Linux三剑客--awk(生物信息数据处理)

AWK的名字来自其设计师的首字母:Alfred V. Aho、Peter J. Weinberger和Brian W. Kernighan。AWK命令可以追溯到Unix早期。它是POSIX标准的一部分,应该可以在任何类unix系统上使用。虽然与Perl等多用途语言相比,AWK有时会因其过时或缺少特性而受到质疑,但它仍然是我在生信分析中喜欢使用的工具。本篇教程带你由浅入深,一步步掌握awk命令在生信分析中的重要作用。声明:1、 作者水平有限,不足之处请指正!2、本文不定时持续更新!AWK comm

2020-12-06 11:09:48 832

原创 R自定义函数

说明:#代表注释,##代表运行结果。函数定义递归函数最大的优点是代码复用,模块化设计。也就是说如果这一段代码块需要在多处使用,就应将其写成一个函数,多次调用,有效的规避了代码的重复。并且在修改时只需要修改函数即可。在定义函数时,个人建议将一小段代码封装成一个函数,使得代码可读性更高,并且能够降低程序的复杂性。定义函数名 <- function(形参) 函数体一个自定义R 函数由三个部分组成:函数体body(),即要函数定义内部要执行的代码;formals(),即函数的形式参数表以及可能

2020-11-26 22:42:10 5651

原创 R扩展包管理

整理的初衷是因为记忆力真不行啊,学到很多新知识,不落实记下来很快就忘,所以下决心一定要把自己学到的新知识和经验记录下来。避免反复,提高效率! 本文基于windows系统,Rstudio编辑器 R扩展包管理1. 安装1.1 从CRAN安装1.2 从Github安装1.3 从Bioconductor安装2. 更新3. 迁移4. 加载、卸除,卸载1. 安装目前为止,R语言已经有一万多个扩展包,提供了各式各样的功能。这些扩展软件包主要由CRAN,Github和Bioconductor提供。每个网站都提供了不

2020-11-22 00:47:13 419

原创 R语言对多个数据框的相同列进行操作

最近需要处理一批数据,每个数据问及那都具有相同的列名和列数,但是行数不同,所以就想着将数据框写入列表中,之后对列表进行循环操作,达到处理列表中数据框的列。由于能力不足,也折腾了一上午,所以在此记录下来。数据如下:其中每一个数据框都包括三列,如下:接下来,我想通过cut()函数对V2列进行区间分割(如果大家有什么好的方法,欢迎讨论区留言)# 定义函数map_list <- function(a){ library(tidyverse) for(i in seq_len(length

2020-11-21 13:29:26 7014

原创 GEO数据挖掘(学习笔记)

GEO数据挖掘1. GEO数据库简介2. 数据下载1. GEO数据库简介NCBI Gene Expression Omnibus(GEO)是一个存储各种高通量实验数据的公共数据库。这些数据包括基于单通道和双通道微阵列的实验,检测mRNA,基因组DNA和蛋白质丰度,以及非阵列技术,如基因表达系列分析(SAGE),质谱蛋白质组学数据和高通量测序数据。网址如下:https://www.ncbi.nlm.nih.gov/geo/2. 数据下载在这里插入代码片...

2020-08-26 18:16:25 18295 20

原创 R语言运行shiny的函数报错的解决办法

今天记录一个R语言中报错的解决办法。shiny运行runExample(“01_hello”)或者其他函数使出现报错,如下:解决办法: 更新Rcpp包,如果问题没有解决,那就可以考虑 将R语言已安装的包都升级到最新版本。我就是升级了所有的包,但肯定有比这更好的方法。之后运行成功界面如下:...

2020-08-22 19:33:18 1821

原创 R语言基础图形绘制——折线图

折线图简介1. 基础函数2. ggplot()函数3. 实践参考书籍简介折线图通常用来对两个连续变量之间的相互依存关系进行可视化。x轴可以是连续型变量,也可以是离散型变量。生物学中,通常用来表示不同药物剂量下实验对象的变化,或者是基因在不同类型组织或细胞中的表达模式。1. 基础函数简单示例:使用plot()函数,改变参数type,更多类型请查看帮助文档。# 查看作图数据BOD# Time demand# 1 1 8.3# 2 2 10.3# 3 3 .

2020-08-17 18:27:49 58972 4

原创 R语言基础——layout()函数

简介par()函数的mfrow和mfcol 参数是较为常用的一页多图的方法,但是这两个参数的限制在于它们只能将图形区域拆分为网格状,每一格的长和宽都分别必须相等,而且每一格中必须有一幅图形,不能实现一幅图形占据多格的功能。layout()函数突破了这种限制,接下来详细介绍。layout()函数用法layout(mat, widths = rep.int(1, ncol(mat)), heights = rep.int(1, nrow(mat)), respect = FALSE)

2020-08-09 18:48:00 15267 2

原创 R语言基础图形元素——文本和图例

R语言基础图形元素--文本和图例简介1. 文本2. 图例简介1. 文本示例plot(1:10,1:10,type = "b",col = "red",pch = 19, xlim = c(1,12),ylim = c(1,12), xlab = "this is x",ylab = "this is y")text(x = 1:10,y = 2:11,labels = paste("(",1:10,",",1:10,")",sep = ""),col = rgb(1,seq(

2020-08-07 13:40:48 2867

原创 R语言基础图形元素——坐标轴和网格线

R语言基础图形元素--坐标轴和网格线简介简介

2020-08-06 23:35:52 7888

原创 R语言基础图形元素——多边形

R语言基础图形元素--多边形简介1. `rect()`函数2. `polygon()`函数3. 综合使用示例4. `box()`函数参考书籍简介在R语言中,绘制多边形是非常方便的,一般使用的是polygon()函数,矩形的绘制可以通过rect()函数完成。多边形可以设置填充色等。1. rect()函数绘制矩形。用法rect(xleft, ybottom, xright, ytop, density = NULL, angle = 45, col = NA, border = NUL.

2020-08-05 14:10:15 3414

原创 R语言基础图形元素——点和线

R语言基础图形元素--点和线简介1. 点2. 线2.1 `abline()`函数2.2 `segments()`函数2.3 `arrows()`函数2.4 `xspline()`函数参考书籍简介点和线是构成图形的基础元素。在R语言中,关于点的设置,很多函数都可以通过pch()参数进行点的设置,也可以通过底层的points()函数向已有图形中添加点来实现。关于线条,R 中可以实现几乎无数种线条样式,因为它的 lty 参数相当灵活。下面将分别介绍这两种基本的图形构成元素。1. 点点的类型:pch 参.

2020-08-04 21:52:17 7355

原创 R语言基础图形元素——颜色

简介任何一幅统计图形都是由基础的图形元素组成的,包括了颜色,点,线,以及多边形等。每一幅精美的图形都不离不开这些基础的图形元素。R语言提供了诸多函数,为图形添加点,线,颜色等。这里主要对R语言中基础的颜色选择函数进行介绍。R中关于颜色的基础函数在默认情况下,grDevices 包为R语言的颜色设置提供了支撑,它提供了大量的颜色选择函数和生成函数,用以实现不同的配色方案。参考谢益辉《现代统计图形》,将grDevices 包中的所有关于颜色的函数分为三类,分别是:固定颜色选择函数、颜色生成和转换函数、特定

2020-08-03 02:00:36 4845

原创 R语言基础——reshape2包

简介1. rehsape2包reshape2包是由Hadley Wickham开发的一个R包,从其命名不难看出,reshape2包可以对数据重塑,就像炼铁一样,先融化数据,再重新整合数据,它的主要功能函数为cast和melt,实现了长数据格式和宽数据格式之间的相互转换。比如说,如果你要做回归等等的多变量分析,用到glm等等,那必然要用宽格式数据;再比如说,如果你要到ggplot里面画图,按照Hadley大神的可视化语法思想,多半是要用长格式的数据的。2. 长宽数据格式宽数据格式:每个变量单独成一列

2020-08-02 01:53:18 13511

原创 R语言基础图形绘制——条形图

简介条形图也许是最常用的数据可视化方法,通常用来展示不同的分类下(在 x 轴上)某个数值型变量的取值(在 y 轴上)。1. 基础函数barplot()绘制条形图(1) R包安装# 首先绘制类风湿性关节炎新疗法研究的结果,该数据包含于vcd包中。if(!require("vcd")) install.packages("vcd")# 因为我已经安装过vcd包,所以上面的命令会直接加载vcd包,否则,需要载入vcd包# suppressPackageStartupMessages(libr

2020-07-30 22:33:19 11577

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除