自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(71)
  • 资源 (1)
  • 收藏
  • 关注

原创 IGV web 工具部署

现在使用的查看bam文件的方式主要还是需要把bam文件下载到本地,导致下载花费时间较长,偶然间看到igv.js版本,可以把igv部署在web端访问,网上的资料有限,现总结如下,希望可以帮到有同样需求的人。下载安装###下载git文件git clone [email protected]:igvteam/igv-webapp.git####下载之后就是一个文件夹cd ./igv-webappnpm installnpm run build###上面这两步需要先安装npm才能用,而且非常容易通不

2020-09-01 11:15:35 1861

原创 SAM BAM 和 CRAM

处理NGS数据的生信人员每天都会接触各种数据格式,什么sam、bam、vcf、gvcf等,大家对sam和bam都听得比较多,可能对cram不熟悉,此篇博文梳理下三个以‘AM’ 结尾的文件,不会具体说明三个文件的具体格式,因为已经有很多博文讲到了,可自行百度google。 SAM sam(Sequence Alignment Mapping) 序列比对映射,纯文本格式,所以直接用more命令或者其他查看文本的命令可以打开,基本格式就是下图这样 BAM BAM文件是SAM文件的二进制格

2020-07-06 16:56:22 2185

原创 python 字典和列表的读取速度问题

最近在进行基因组数据处理的时候,需要读取较大数据(2.7G)存入字典中,然后对被处理数据进行字典key值的匹配,在被处理文件中每次读取一行进行处理后查找是否在字典的keys中,以下两段代码的效率差别非常大:第一段:if(pos in fre_dist.keys()):newvalue= fre_dist[pos]第二段:if(pos in fre_dist):new

2017-04-21 09:50:07 11571 2

原创 MutSigCV in cancer genome

最近研究突变数据的分析,可以用到软件MutSigCV(http://www.broadinstitute.org/cancer/cga/),根据博文Application of MutSigCV in cancer genome research中的描客述进行安装,有几点需要注意,1. Installation of MCRMatlabDownload appropriate vers

2014-12-05 13:55:48 8416 1

转载 转录组数据饱和度评估方法

转自:http://www.biodiscover.com/group/topic/655.html基因表达分析里面,RNA-seq是现在转录组研究常用的技术了,但是通过二代测序获得数据后,在正式分析前我们通常需要做两件事情:其一是reads的饱和度分析,另一个是RNA-seq测序的数据与mRNA真实表达水平之间的一致性。另外,本来大家还讨论了关于基因组组装、宏基因组测序、以及非编码R

2014-12-01 10:25:09 11632 1

转载 生存分析函数小结

本文引用地址:http://bbs.sciencenet.cn/blog-252888-719677.html 生存分析(survival analysis)适合于处理时间-事件数据。例如中风病人从首次发病到两次复发,其中就涉及到时间和事件。此例中时间就是复发的时间间隔,事件就是是否复发。如果用普通的线性回归对复发时间进行分析,就需要去除那些没有复发的病人样本。如果用Logistic回归对

2013-12-24 14:52:37 21354 6

转载 相关分析

转自:http://blog.csdn.net/dmwithr/article/details/170774551 相关分析简介相关分析简介现代自然科学研究, 经济检验, 企业管理等活动中普遍存在相互影响的关系函数关系是严格的确定对应关系,相关关系-是一种不要求确定性对应, 具有一定随机性的关系相关分析用来研究变量间相关关系相关关系的种类

2013-12-12 17:29:02 2505

转载 NGS数据的质量评估和reads的处理

转自:http://www.hzaumycology.com/chenlianfu_blog/?p=14561. 基因组测序和转录测序的NGS数据处理策略从测序公司拿到数据后,首先需要对数据进行预处理,主要分两步走:1.1 QC(reads的质量控制)Quality Control,即过滤低质量reads,低质量的reads有如下几种:含有Primer/Adap

2013-07-02 15:08:14 27405

转载 Jmeter:图形界面压力测试工具

转自:Jmeter:图形界面压力测试工具Jmeter是一款强大的图形界面压力测试工具,完全用Java写成,关于Jmeter的介绍,网上其实有不少的文章,我原本是不想再重复写类似文章的,但我发现有些很关键性的,在我们测试中一定会用到的一些设置或操作很少见到有文章写清楚的,比如有这样的一个常见问题:如何对一个网站的多个链接进行压力测试?因为通常情况下,我们要测试的不是一个链接,假如我们

2013-06-22 15:54:21 1732 1

转载 Clustalx 多重序列比对图解教程(By Raindy)

软件简介:  CLUSTALX-是CLUSTAL多重序列比对程序的Windows版本。Clustal X为进行多重序列和轮廓比对和分析结果提供一个整体的环境。   序列将显示屏幕的窗口中。采用多色彩的模式可以在比对中加亮保守区的特征。窗口上面的下拉菜单可让你选择传统多重比对和轮廓比对需要的所有选项。 主要功能:  你可以剪切、粘贴序列以更改比对的顺序;  你可以选择序列子集

2013-06-01 15:05:17 36016 3

转载 系统进化树构建及数据分析的简介

本文引用地址:http://blog.sciencenet.cn/blog-344534-352797.html 1.涉及基本概念例如,“分子进化与生物进化是不是一个概念”,“关于微卫星进化模型有没有什么新的进展”以及“关于Kruglyak的模型有没有改进的出现”,等等。2.关于构建进化树的方法的选择例如,“用boostrap NJ得到XX图,请问该怎样理解?能否应用于文章?用

2013-05-23 15:31:10 22777 2

原创 php 调用 linux 的一点问题

php 调用linux 的命令有很多介绍的文章,但是这里我也说的是关于php 调用linux 的 cd 命令中的问题,在php 文件中,有时需要进入到其他目录,在linux 中很简单的命名就是cd  path ,但是在php  中,通过exec( "cd  path ") ; 实现不了功能,这个问题也是一样的 ,根据其中提到的chdir 命令,直接可以在php 中执行<?phpchdir

2013-04-26 21:13:12 1009

原创 linux 安装HTSeq

安装HTSeq并不是太难,按照HTSeq安装说明,关键是在我安装好后,导入的时候遇到的很多问题,整理如下:命令:import  HTSeq 在python 下导入HTSeq 出现如下问题:File "numpy.pxd", line 154, in init HTSeq._HTSeq (src/_HTSeq.c:33259)ValueError: numpy.ndarray

2013-02-01 11:23:09 12714

转载 Python环境变量PYTHONPATH设置和easy_install简单使用

1.把自己编写的python模块添加到PYTHONPATH上要想让python解释器找到自己编写的模块,则该模块必须PYTHONPATH上,否则在导入该模块时会出现找不到该模块的错误,因此必须把所需要的模块的路径添加到PYTHONPATH(一般情况下是把lib/python2.6/site-packages添加到PYTHONPATH)。具体做法如下:a. 假设所需要的python模块(或包

2013-01-31 17:45:31 10110

转载 Bioconductor简介

源:Bioconductor: open software development for computational biology and bioinformatics,Genome Biology 2004, 5:R80Bioconductor的产生是计算生物学及生物信息学(computational biology and bioinformatics, CBB)发展的产物,其目的是有

2013-01-25 16:16:25 11723

转载 一个关于RNA-Seq分析方法的投票

原文在这儿Q1. What do you prefer to align your reads to?Most respondents align to the genome only (47.3%) , and this is closely followed by those who align to both genome and transcriptome (39.8%). Key

2013-01-25 14:27:17 2317

转载 一个生物信息在线Manual网站

这是一个很不错的Manuals网站,主要针对生物信息学的研究人员,里面包括R、Bioconductor、NGS、EMBOSS、Linux等软件和系统的使用教程。如:R Basics ManualBioConductor ManualNGS Analysis with R/BioconductorNGS Analysis with Galaxy and IGV

2012-12-31 10:57:31 2293

转载 转录组分析工具tophat之完全手册

转载自:第20121105期集结号-转录组分析工具tophat之完全手册TopHat是将RNA-Seq数据允许gap的回贴回参考基因组上!是转录组分析的必备工具之一!此帖的内容涵盖了tophat的介绍,安装、使用、异常处理等,是tophat使用的完全手册!1,介绍转录组数据分析之tophat篇 http://seq.cn/1650-79TopHa

2012-12-30 17:23:09 14288

转载 linux下解压命令大全

转自:http://www.cnblogs.com/eoiioe/archive/2008/09/20/1294681.html.tar 解包:tar xvf FileName.tar打包:tar cvf FileName.tar DirName(注:tar是打包,不是压缩!)———————————————.gz解压1:gunzip FileName.gz解压2

2012-12-26 17:05:11 1194

转载 假设性检验

决策与风险(统计推断与检验)/*读书笔记,白话统计系列,力图用普通话讲述统计学的基本概念。这里的题目是“决策与风险”,讲的就是两类错误(type I and type II errors)。以下改编至维恩堡《数理统计初级教程》(常学将等译,太原:山西人民出版社,1986),英文名叫Statistics: An Intuitive Approach By George H

2012-12-13 10:07:55 4720

转载 GO分析相关工具汇总

GO委员会工具AmiGO [http://amigo.geneontology.org/cgi-bin/amigo/go.cgi]AmiGO 提供检索和浏览GO委员会提供的本体学(ontology)和注释(annotation)数据。用户可以通过检索蛋白获得相应的GO术语,可以检索GO术语得到相应的细节和相关的蛋白注释,AmiGO还提供了BLAST搜索引擎,比对有GO术语注释的基因和基因产

2012-11-10 12:18:11 9582

转载 [转载]转录组测序分析中cufflinks的使用及问题

在转录组高通量测序数据分析过程中,主要就是转录本的构建(拼接)及表达水平的衡量,其次还包括可变剪接之类的转录后修饰等研究分析。因此,做过RNA-seq转录组测序数据分析的童鞋们一定使用过或至少听说过Cufflinks这个软件。Cufflinks是加利福尼亚大学伯克利分校数学和计算机生物实验室,由LiorPachter领导的StevenSalzberg’s团队,和马里兰大学生物信息和

2012-11-01 15:00:27 15941

转载 高通量测序领域常用名词解释大全

什么是高通量测序?高通量测序技术(High-throughput sequencing,HTS)是对传统Sanger测序(称为一代测序技术)革命性的改变, 一次对几十万到几百万条核酸分子进行序列测定, 因此在有些文献中称其为下一代测序技术(next generation sequencing,NGS )足见其划时代的改变, 同时高通量测序使得对一个物种的转录组和基因组进行细致全貌的分析

2012-11-01 11:11:39 8083

原创 RNA-seq 流程、问题总结(一)

这是2012 年的3月份的一篇nature protocol ,下面是我作为一个RNA-seq 方面的菜鸟在根据这个protocol 跑流程时遇到的问题及解决的方法,现总结如下:一、果蝇全基因组下载Fruit fly iGenome packages (Ensembl build; download via the TopHat and Cufflinks websites, along

2012-10-31 09:44:28 13684 2

转载 RPKM简介

RNA-seq是透过次世代定序的技术来侦测基因表现量的方法,在衡量基因表现量时,若是单纯以map到的read数来计算基因的表现量,在统计上是一件相当不合理事,因为在随机抽样的情况下,序列较长的基因被抽到的机率本来就会比序列短的基因较高,如此一来,序列长的基因永远会被认为表现量较高,而错估基因真正的表现量,所以Ali Mortazavi等人在2008年提出以RPKM在估计基因的表现量。RPKM是

2012-10-10 11:30:05 3022

原创 测序技术

第一代测序技术-Sanger末端终止法用双脱氧核苷酸作为链终止试剂(双脱氧核苷酸在脱氧核糖上没有聚合酶延伸链所需要的3-OH基团,所以可被用作链终止试剂)通过聚合酶的引物延伸产生一系列大小不同的分子后再进行分离的方法。测序引物与单链DNA模板分子结合后,DNA聚合酶用dNTP延伸引物。延伸反应分四组(如下图)进行,每一组分别用四种ddNTP(双脱氧核苷酸)中的一种来进行终止,再用P

2012-09-22 13:50:38 4352

转载 Fastq格式详解

FASTQ是基于文本的,保存生物序列(通常是核酸序列)和其测序质量信息的标准格式。其序列以及质量信息都是使用一个ASCII字符标示,最初由Sanger开发,目的是将FASTA序列与质量数据放到一起,目前已经成为高通量测序结果的事实标准。格式说明FASTQ文件中每个序列通常有四行:序列标识以及相关的描述信息,以‘@’开头;第二行是序列第三行以‘+’开头,后面是序列标示符、描述信息,或

2012-09-20 16:14:09 25480

转载 取消php和phpMyAdmin上传最大2M文件限制 转

网上查了一下,两段话:“当用 phpMyAdmin 导入的数据库大小大于 2M 的时候,会出现如下提示:No data was received to import. Either no file name was submitted, or the file size exceeded the maximum size permitted by your PHP configurat

2012-09-18 11:15:55 1347

原创 Java GUI 中的JTable-Netbeans设置

Swing颇受欢迎的JTable类为显示大块数据提供了一种简单的机制。JTable有很多东西是用于数据的生成和编辑,其中的很多东西还可以自定义,从而更进一步增强其功能。本文会引导你一步步地进入JTable的世界。  Listing A包含了一个简单示例的代码,这个示例会说明常用JTable的行为。用户能够更改JTable的布局、拖放它的栏,或者通过拖动标题的分隔线来改变其大小。

2012-09-17 20:01:01 7004 1

转载 监听文本框内容改变

作为一个跨平台的编程解决方案,Java显然不能像Delphi那样,在用户界面设计方面提供强大、直观和快捷的设计支持。比如对于文本框的控制,当我们 要在程序中感知用户是否修改了文本框中的内容时,Delphi提供了一个直接的事件调用OnValueChanged(),可以在文本框内容得到实际的改 动时被激活。而要在Java中实现这一功能就似乎麻烦了一点,直接的调用只有keyPressed()和keyTy

2012-08-17 15:37:56 1063

转载 串行的blast+2.2.25本地化: blastdbcmd,makeblastdb,blastn.简介

串行的blast+2.2.25本地化系列: blastdbcmd,makeblastdb,blastn.使用简介----------------------------------------------------------------------- blast+中有许多命令.blastdbcmd,makeblastdb是处理数据库较为常用的命令blastn是核苷酸与核苷酸

2012-07-23 14:09:35 6447

转载 PHP中通过 JavaBridge+Lucene实现全文搜索站内搜索

转自:http://blog.csdn.net/woijal520/article/details/7377378LUCENE实现站内搜索一、软件需求  php-java-bridge_6.2.1_documentation.zip:来自于http://php-java-bridge.sourceforge.net。 JavaBridge.jar

2012-06-30 22:18:39 2320 1

转载 unix常用命令

第一章 目录及文件操作1.1 ls    [语法]:ls  [-RadCxmlnogrtucpFbqisf1]   [目录或文件......]    [说明]: ls命令列出指定目录下的文件,缺省目录为当前目录 ./,缺省输出顺序为纵向按字符顺序排列。        -R  递归地列出每个子目录的内容        -a  列出所有文件,包括第一个字符为“.”的隐藏文件

2012-06-04 16:22:04 1640

转载 shell中的${},##和%%的使用

假设我们定义了一个变量为:file=/dir1/dir2/dir3/my.file.txt可以用${ }分别替换得到不同的值:${file#*/}:删掉第一个 /及其左边的字符串:dir1/dir2/dir3/my.file.txt${file##*/}:删掉最后一个 /  及其左边的字符串:my.file.txt${file#*.}:删掉第一个 .  及其左边的字符串:f

2012-06-04 16:14:27 34024 1

原创 让google map 动起来

最近在研究怎么在网页版的google map 中实现类似flash 的效果,本来google map 是有自己的flash 版的,但是现在Flash V2版的还是需要Key 的,但是现在google官网是没法申请key 了,所以只好自己想办法。      我想实现的效果就是这两个输入框中,用户输入时间,把这两个时间点的数据以marker 的形式标记在地图上,不是一次性全部显示,而是以天为单位能

2012-05-11 16:40:56 988

原创 折腾了好久,原来是这样............Blast

做网站开发,要在网页中调用blast 命令,开始是在localhost (机子是win7 ),调用命令完全没问题,后来网站发布要上传到远程服务器(unix)上,结果怎么折腾就是不运行命令 $tempFile = tempnam("/tmp", "MCK"); $handle = fopen($tempFile , "w"); fwrite($handl

2012-04-12 19:31:01 1726

转载 核酸序列分析

核酸序列分析核酸序列分析1、核酸序列检索可通过NCBI使用Entrez系统进行检索,也可用EBI的SRS 服务器进行检索。在同时检索多条序列时,可通过罗逻辑关系式按照GenBank接受号进行批量检索。如用“AF113671 [ac] OR AF113672 [ac]”可同时检索这两条序列。其中“[ac]”是序列接受号的描述字段。2、核酸序列的基本分析(1)分子质量、碱基组成

2012-04-12 19:16:10 5029

原创 版本控制之Subversion

什么是版本控制在一个项目开发过程中,开发人员经常修改项目的源代码文件。由于源代码文件经常改动,我们需要一种版本控制系统把各个源代码的各个历史版本管理起来,方便将来参考,跟踪。版本控制系统对于程序开发来说是必不可少的。1.       文档应该集中管理。文档是公司的宝贵资源,集中存放,容易备份,维护。2.       文档的修改历史都有记录,方便跟踪项目的变化。例如,可以查到某个

2012-03-27 09:00:28 742

转载 240个jQuery实现AJAX插件

概述jQuery 是继 prototype 之后又一个优秀的 Javascript. 框架。其宗旨是—写更少的代码,做更多的事情。它是轻量级的js 库(压缩后只有21k) ,这是其它的 js 库所不及 的,它兼容 CSS3,还兼容各种浏览器(IE 6.0+, FF 1.5+,Safari 2.0+, Opera 9.0+)。 jQuery 是一个快速的,简洁的 javaScript. 库,使用

2012-03-20 09:03:33 1561

转载 分享几个查找图标的网站,很给力

以下这两个网站都可以搜索图标,可以下载png、jpg、gif、ico等格式,而且包含多个尺寸,做网页设计的一定要收藏哟http://findicons.com/http://www.iconfinder.com/ http://www.iconarchive.com/

2012-03-16 08:55:52 1465

Highcharts属性说明

web开发中有时要在网页中显示图表,此文档对图表的信息进行详细说明,能够给开发者提供帮助

2011-12-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除