自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

宁生信

生物信息学(网易云课堂,腾讯课堂)

  • 博客(49)
  • 资源 (6)
  • 收藏
  • 关注

原创 python TypeError: 'module' object is not callable

写入如下代码:import randomprint(random.random())查了下原因是:文件名是random.py。当文件名file name 与模块名 module 相同时会出现如下错误:另外:Python导入模块的方法有两种1、import module 2、 from module import 区别是前者所有导入的东西使用时需加上模块名的

2017-09-07 19:20:43 901

原创 Python小程序:三级菜单

要求:打印省市县三级菜单可返回上级可随时推出#__author: greg#date: 2017/9/2 8:37menu={ '北京':{ '朝阳':{ '朝阳门':{ '银河SOHO':{}, '外交部':{} },

2017-09-02 09:22:33 1788

原创 Ubuntu安装cummeRbund

安装好R语言后,接下来安装cummeRbundbiocLite("cummeRbund")由于系统环境原因,有些文件没安装,如libxml2-dev libcurl-dev,这些都是安装cummeRbund时需要提前配置的。由于错误可能很多,所以我选择先手动安装cummeRbund所需要的包。过程如下:  install.packages("RSQLite")

2017-08-24 20:07:03 1473

原创 Ubuntu安装R语言

在Ubuntu界面下,快捷键Ctrl+Alt+T打开终端。输入命令:sudo -s。回车,输入用户密码,将权限提升为root权限。入命令:apt-get update。获取最新软件包信息。使用命令:apt-get install r-base。自动安装R语言。安装过程中,若出现选择提示,一律选择允许。安装完成后,输入R,出现如图所示的画面,安装成功。安装扩展包(软件

2017-08-24 19:56:23 2294

原创 GSEA使用(初级)

首先我们先了解一下什么叫做基因富集分析 基因富集分析是分析基因表达信息的一种方法,富集是指将基因按照先验知识,也就是基因组注释信息进行分类。2005年提出了基于基因集(gene set)定义的基因富集分析方法。  首先要定义基因集,也就是基于我们的先验知识(基因组注释信息),将基因富集,可以想象成,用一堆代表基因功能的箱子(bin)把具有相同或相似功能的基因装起来,起到了降维的作用,当然,

2017-07-31 11:37:49 16612

原创 PICRUSt 根据16S 数据推测宏基因组

PICRUSt (根据16S 数据推测metagenome) Phylogenetic Investigation of Communities by Reconstruction of Unobserved StatesPICRUSt推测metagenome的准确度:样品中的OTU与已知微生物越相近,预测准确度越高。人体微生物群落(肠道、皮肤等)由于测序数据丰富,PICRUSt的

2017-07-03 23:51:08 2460

原创 anaconda2安装TVTK

推荐Anaconda2 ,然后新建py36环境,默认安装的的库只有几个,不会有冲突C盘建立文件夹把下面的考进去py36基础环境搭好,按照提示下载所需的库文件,是Unofficial的,依次安装:VTK-7.1.1-cp36-cp36m-win_amd64.whlnumpy-1.12.1+mkl-cp36-cp36m-win_amd64.whltraits-4.6.0-c

2017-06-25 12:24:34 2943

原创 微生物测序分析LEfSe

LEfse分析定义 LEfse分析即LDA Effect Size分析,可以实现多个分组之间的比较,还进行分组比较的内部进行亚组比较分析,从而找到组间在丰度上有显著差异的物种(即biomaker);

2017-06-21 11:08:29 49267

原创 21款生物信息在线分析工具汇编

1,promoter scan功能:启动子预测网址:https://www-bimas.cit.nih.gov/molbio/proscan/2,ORF finder功能:ORF预测网址:https://www.ncbi.nlm.nih.gov/orffinder/3,NCBI-BLAST功能:序列比对网址:https://b

2017-06-15 19:36:36 13196 2

原创 宏基因组拼接方法

de novo定义:from the beginning(从头拼接), no reference genome guided(无参考基因组)三类de novo基因拼接的计算方法:1. Greedy algorithm:对于含重复区的序列拼接效果不好Shortest common string (SCS):最短的、包含原序列S中所有的k-mer的序列但是Greedy algo

2017-06-14 20:18:19 4415

原创 比较基因组学

以全基因组测序为目标的结构基因组学( structural genomics)。以基因功能鉴定为目标的功能基因组学( functional genomics),又被称为后基因组( postgenome)。比较基因组学(Comparative Genomics)是基于基因组图谱和测序基础上,对已知的基因和基因组结构进行比较,来了解基因的功能、表达机理和物种进化的学科。图谱和测序基

2017-06-13 15:58:51 28890 1

原创 tophat生成文件之BED文件格式

BED 文件格式提供了一种灵活的方式来定义的数据行,以用来描述注释的信息。BED行有3个必须的列和9个额外可选的列。 每行的数据格式要求一致。The first three required BED fields are:1.chrom - The name of the chromosome (e.g. chr3, chrY, chr2_random) or scaffold (e.

2017-06-12 10:56:20 3752

原创 tophat常见错误

转录组tophat2序列比对时遇到Tophat Error : Couldn't build bowtie index with err = 1

2017-06-12 09:31:47 3778

原创 Ubuntu安装BWA和samtools

Ubuntu安装BWA和samtools时通常需要提前安装zlib.h而centos并不需要。 安装命令:apt-get install zlib1g-devBWA下载地址:    https://sourceforge.net/projects/bio-bwa/files/解压:tar -xjvf bwa-0.7.15cd bwa-0.7.15less INSTALL

2017-06-11 18:30:51 8333

原创 bowtie和samtools在tophat中的使用

Bowtie介绍1 Bowtie和一般的比对工具不一样,他适用于短reads比对到大的基因组上,尽管它也支持小的参考序列像amplicons和长达1024的reads。Bowtie采用基因组索引和reads的数据集作为输入文件并输出比对的列表。Bowtie设计思路是,1)短序列在基因组上至少有一处最适匹配,2)大部分的短序列的质量是比较高,3)短序列在基因组上最适匹配的位置最好只有一处。这

2017-06-11 10:35:42 2952

转载 基因表达量计算与差异表达分析常见问题

问 1:在没有重复实验的情况下,用 RPKM 要怎么做检验呢?答:如果要用泊松分布做差异分析模型的话,必须要用 reads count 的。只有 RPKM值的话,可以用 RPKM 的公式反推 reads count 数,再做检验。问 2:Deseq 是怎么控制 reads 多重比对的?答:Deseq 只是一个差异分析的软件,多重比对的分配是在 Deseq 之前的。 Deseq 是输入的

2017-06-10 22:30:19 40883 4

原创 RNA-seq中的基因表达量计算和表达差异分析

差异分析的步骤:1)比对;2) read count计算;3) read count的归一化;4)差异表达分析; 背景知识:1)比对:普通比对: BWA,SOAP开大GAP比对:Tophat( Bowtie2);2) Read count(多重比对的问题):丢弃平均分配利用Unique region估计并重新分配表达量计算的本质

2017-06-10 22:23:08 71658 3

原创 Linux下BLAST安装及BLAST使用

1、把BLAST的压缩文件解压,然后将bin目录下的文件拷贝至/usr/local/bin下;2、制作软链接,将解压后的文件中bin目录链接至/home/username下,eg:ln -s /home/username/blast/bin;3、在当前用户目录下,编辑bashrc文件,在文件中加入export PATH=/home/username/bin/=$PATH;

2017-06-09 11:22:32 30448

转载 samtools使用大全

samtools是一个用于操作sam和bam文件(通常是短序列比对工具如bwa,bowtie2,hisat2,tophat2等等产生的,具体格式可以在消息框输入“SAM”查看)的工具合集,包含有许多命令。以下是常用命令的介绍。1.Viewview命令的主要功能是:将sam文件与bam文件互换;然后对bam文件进行各种操作,比如数据的排序(sort)和提取(这些操作 是对bam文

2017-06-08 09:25:15 37247 1

原创 Python编程

1.经典程序设计问题:找第n个默尼森数。P是素数且M也是素数,并且满足等式M=2**P-1,则称M为默尼森数。例如,P=5,M=2**P-1=31,5和31都是素数,因此31是默尼森数。输入格式:按提示用input()函数输入输出格式:int类型输入样例:4输出样例:127import math def prime(n): if n

2017-06-08 09:16:17 2883

原创 微生物群落功能预测工具

微生物群落研究主要有16S/ITS多样性测序、宏基因组测序还有宏转录组测序等研究手段。其中16S/ITS等多样性测序由于价格便宜,性价比高而经常使用。    利用16S/ITS多样性测序,我们可以准确知道群落的物种结构,但越来越多的研究表明,微生物的群落功能组成比物种组成与环境关系更为密切,因此我们需要借助宏基因组等研究手段来获取群落功能信息。现阶段的宏基因组、宏转录组的价格相对较高,在经

2017-06-07 23:40:43 10288 1

原创 全基因组基因家族成员相关数据获取

一、基本分析内容数据库检索与成员鉴定进化树构建保守domain和motif分析.基因结构分析.转录组或荧光定量表达分析.二、数据库检索与成员鉴定1、数据库检索1)首先了解数据库用法,学会下载你要分析物种的基因组相关数据。一般也就是下面这些数据库了Brachypodiumdb:http://www.brachypodium.org/TAIR:http://ww

2017-06-06 09:52:46 12470

原创 RNA-Seq数据去接头(Adapter)

1、adapter是一段短的序列已知的核酸链,用于链接序列未知的目标测序片段。2、barcode,也称为index,是一段很短的寡居核酸链,用于在多个样品混合测序时,标记不同的样品。3、insert是用于测序的目标片段,因为是包括在两个adapter之间,所以被称为“插入”片段。一个常见测序片段类似与adapter--barcode--insert--adapter。测序开

2017-06-04 09:12:17 16735

原创 Linux需要具备管理员特权才能修改网络设置

win10家庭版常常碰到管理权限问题,即使更改账户类型为永不通知,有时候还是会需要管理员权限选择更改设置,这个时候不能用桥接模式和仅主机模式,而要用NAT模式,把桥接模式和仅主机模式移除网络打开NAT设置确定后,再虚拟机里设置打开Ubuntu,就可以上网了

2017-06-04 08:36:43 7658 1

原创 最新版VMare安装Ubuntu和fedora失败问题

VMare安装Ubuntu和fedora遇到以下情况:cpufreq: cpufreq_online: Failedto initialize policy for cpu: 0 (-19)cpufreq: cpufreq_online: Failedto initialize policy for cpu: 1 (-19)常见于Ubuntu 16,

2017-06-03 20:55:10 4031

原创 SRA数据库的各种编号

S R A 数据库, 最初的命名为Short Read Archive,现已改为SequenceRead Archive。SRA 数据库的组织架构1,meta 数据是指与测序实验及其实验样品相关的数据, 如实验目的、 实验设计、 测序平台、 样本数据(物种, 菌株,个体表型等),在SRA数据库中,meta数据分如下层次来存储:(1)研究课题(study)。 在 SRA 数据库中

2017-06-03 18:26:19 7472

原创 GTF基因注释文件详解

GFF和GTF是两种最常用的数据库注释格式,在信息分析中建库时除了需要fasta文件一般还会需要这两种文件,提取需要的信息进行注释。Cufflinks/Tophat 软件需要 GTF文件作为基因注释文件。 GFF全称为general feature format,这种格式主要是用来注释基因组。GTF全称为gene transfer format,主要是用来对基因进行注释。目

2017-06-03 12:33:55 50371 3

原创 R语言ggplot2绘图教程——Pathway富集分析气泡图

library(ggplot2)pathway = read.table("C://Users//Desktop//path.richFactor.head20.tsv",header=T,sep="\t")# 画图p = ggplot(pathway,aes(richFactor,Pathway))p=p + geom_point()# 改变点的大小p=p + geom_point(

2017-06-01 08:52:41 41268 1

原创 R语言绘制精美PCoA图

什么是PCoA?principal coordinate analysis微生物群落结构受多种因素影响,例如光照、温度、人群性别、年龄等。要了解目的分组是否与某种因素存在联系,我们常常会用到PCA、PCoA等排序方法。PCoA能够将样本之间的相似性距离(虚拟距离),经过投影后,在低维度空间进行欧几里德距离展示,以最大限度地保留原始样本的距离关系,使相似的样本在图形中的距

2017-06-01 00:09:51 39325 15

原创 Linux与生物信息(第一章——Linux常用命令3)

2 进程管理2.1进程查看2.1.1 ps(process status)功能说明:显示用户进程语 法:ps x [-u ]参 数:-u 显示usr用户的进程(默认显示自身用户进程)Example :ps x2.1.2 top功能说明:显示用户进程(实时)语 法:top [-bcdu]参 数:-b 批处理模式,可以将top内容重定向到文件中-c 显示详

2017-05-31 16:29:34 756

原创 linux下FTP、SFTP命令详解

FTP> ! 从 ftp 子系统退出到外壳。FTP> ? 显示 ftp 命令说明。? 与 help 相同。格式:? [command]说明:[command]指定需要帮助的命令名称。如果没有指定 command,ftp 将显示全部命令的列表。 FTP> append 使用当前文件类型设置将本地文件附加到远程计算机上的文件。格式:append

2017-05-30 22:04:46 39553 2

原创 Linux里如何查找文件内容

从文件内容查找匹配指定字符串的行:$ grep "被查找的字符串" 文件名例子:在当前目录里第一级文件夹中寻找包含指定字符串的.in文件grep "thermcontact" */*.in从文件内容查找与正则表达式匹配的行:$ grep –e “正则表达式” 文件名查找时不区分大小写:$ grep

2017-05-30 22:02:22 408

原创 R语言绘制热图——pheatmap

pheatmap: Pretty Heatmaps——Implementation of heatmaps that offers more control over dimensions and appearance.library(pheatmap)#创建数据集test测试矩阵test = matrix(rnorm(200), 20, 10)test[1:10, seq(1, 10,

2017-05-26 15:24:35 181025 6

原创 Linux与生物信息(第一章——Linux常用命令2)

1.3 压缩解压缩1.3.1 tar功能说明:加入或还原备份文件内的文件语 法:tar -f[cxzjv] 参 数:-f 必加参数-c 创建备份文件-x 从备份文件中还原文件-z 调用gzip/gunzip来压缩/解压缩文件-j 调用bzip2/bunzip2来压缩/解压缩文件-v 显示命令执行过程Example

2017-05-26 15:17:18 678

原创 Linux与生物信息(第一章——Linux常用命令)

(网易云课堂,腾讯课堂生物信息讲师,高级生物信息工程师)第一章——Linux常用命令1. 目录和文件管理1.1目录相关1.1.1 mkdir功能说明:建立目录语 法:mkdir [-p] 参 数:-p 若所要建立目录的上层目录目前尚未建立,则会一并建立上层目录。Example :mkdirtestdirmkdir -p n

2017-05-26 15:11:10 3597

原创 RCircos绘制圈图(2)

#导入内建人类染色体数据data(UCSC.HG19.Human.CytoBandIdeogram);head(UCSC.HG19.Human.CytoBandIdeogram); chr.exclude  cyto.info  tracks.inside  tracks.outside   #导入上面四个基本参数 RCircos.Set.Core.Co

2017-05-24 17:36:03 9568

原创 RCricos绘制圈图(1)

library(RCircos)#导入内建人类染色体数据data(UCSC.HG38.Human.CytoBandIdeogram)cyto.info <- UCSC.HG38.Human.CytoBandIdeogramRCircos.Set.Core.Components(cyto.info, chr.exclude=NULL,tracks.inside=10, tracks.ou

2017-05-24 17:33:24 3028 1

原创 Python或者R语言出现中文字体乱码的情况

在用Python和RStudio加载上文链接提供下载的编程代码时,出现提示“Not all characters in E:/a.txt could be decoded using CP936."cp936 的意思是 Codepage 936, 是简体中文的编码。此外,中文字符集编码还包括:Unicode ,GB2312 ,GBK,GB18030,UTF-8等。U

2017-05-24 14:52:06 5714

原创 R语言多重线性回归错误分析:Error in model.frame.default

Error in model.frame.default(Terms, newdata, na.action = na.action, xlev = object$xlevels) : 因子factor(o)里出现了新的层次设置train和test时保证test and train 数据集要有相同的因子水平。简言之,各因子水平要同时存在test and train 里。否则你再怎么查资料,重写

2017-05-22 21:44:02 22361 9

原创 R语言绘图实战:RDA冗余分析

#载入vegan包library(vegan)#读取“样本-物种”文件sp <- read.table(file=file.choose(),sep="\t",header=T,row.names=1)sp#读取“样本-环境因子”文件se <- read.table(file=file.choose(),sep="\t",header=T,row.names=1)se#选择用RDA

2017-05-13 10:36:24 68598 28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除