自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

likelet的专栏

new hand

  • 博客(42)
  • 收藏
  • 关注

翻译 Clean and Fat Jar in Netbeans

netbeans是采用ANT对代码进行打包部署的,至于什么是ANT,可以参考下面博客链接http://www.blogjava.net/amigoxie/archive/2007/11/09/159413.html好吧,这都不是重点,重点是如何将我的java源代码和调用第三方类库编译打包到一个jar文件里面方便运行。第一步,选定你当前操作的项目第二步,打开build

2014-05-15 15:50:11 1444

原创 关于illumina产生的测序源文件bcl转换成fastq格式的问题

由于连接测序仪的服务器不知道哪里抽了风,无法直接的生成fastq格式的文件,好久都无解,经过一段时间仍无法解决,所以采用曲线救国的方法,看能不能利用三方软件将bcl转换成fastq文件    google以后发现illumina的OLB(off-line Basecaller)软件可以实现从bcl格式转换成qseq格式,而qseq格式就可以通过简单的perl或者shell或者java脚本转换成

2013-03-12 10:41:12 11629 2

转载 sed 命令

1. Sed简介sed 是一种在线编辑器,它一次处理一行内容。处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”(pattern space),接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到文件末尾。文件内容并没有 改变,除非你使用重定向存储输出。Sed主要用来自动编辑一个或多个文件;简化对文件的反复操作;编写转换程序等。以下

2012-12-21 16:02:53 1864

转载 磁盘IO测试

有时候我们在做维护的时候,总会遇到类似于IO特别高,但不能判定是IO瓶颈还是软件参数设置不当导致热盘的问题.这时候通常希望能知道磁盘的读写速度,来进行下一步的决策.下面是两种测试方法:(1)使用hdparm命令这是一个是用来获取ATA/IDE硬盘的参数的命令,是由早期Linux IDE驱动的开发和维护人员 Mark Lord开发编写的( hdparm has been written

2012-12-18 15:56:23 1997

转载 ENCODE30篇论文全摘要 聚焦人基因组功能研究

转http://yixf.name/2012/12/06/%E8%BD%ACencode30%E7%AF%87%E8%AE%BA%E6%96%87%E5%85%A8%E6%91%98%E8%A6%81-%E8%81%9A%E7%84%A6%E4%BA%BA%E5%9F%BA%E5%9B%A0%E7%BB%84%E5%8A%9F%E8%83%BD%E7%A0%94%E7%A9%B6/作者:Z

2012-12-13 23:29:31 2350 1

转载 使用Aspera从EBI或NCBI下载基因组数据modified

转自:http://www.plob.org/2012/07/31/3013.html做基因组数据分析,可能经常从NCBI的GEO/SRA或者EBI的ENA数据库下载高通量的数据,动辄几十G的数据用wget下载实在太纠结,这时就要用到神器-Aspera了。使用Aspera,最简单的方法当然就是使用浏览器插件Aspera Connect了,跟迅雷、Flashget的用法差不多,直接单

2012-11-26 16:13:46 14196 2

原创 远程关闭重启计算机(windows)

今天远程lab的PC的时候跑着跑着貌似图形界面挂掉了(win7),能连上但是这边显示黑屏,于是就是想能不能通过远程命令行形式关闭远程的pc(我有远程PC的管理员权限),经过在线搜索引擎的帮助我采用下面办法成功的实现对远程电脑的重启首先在进入本机的cmd下接着在cmd窗口中输入:net use \\10.0.0.4$ /user:Administrator输入正确的密码,后提示联接成

2012-11-14 22:39:45 1405

转载 mpich2多机协同作业

转自 http://blog.sina.com.cn/s/blog_4be5711f0101a41z.html一、单机测试。1、命令行方式:注册:mpiexec -register输入你当前登陆帐户名和密码,不注册的话每次执行程序都要求输入帐户和密码。运行:mpiexec -n 2 helloworld.exe这里用两个进程执行当前目录下的hel

2012-10-30 16:39:28 7610

转载 NCBI RefSeq命名格式的详细说明

转自:http://liucheng.name/379/  NCBIRefSeq (美国国立生物技术信息中心参考序列库) 是目前世界上最具有权威性的序列数据库。NCBI的参考序列计划(RefSeq)将为中心法则中自然存在的分子,从染色体到mRNA到蛋白提供参考序列标准。RefSeq标准为人类基因组的功能注解提供一个基础。它们为突变分析,基因表达研究,和多态发现提供一个稳定的参考点。

2012-10-30 11:51:30 6291

转载 Graphviz介绍

转自 http://abruzzi.iteye.com/blog/429042graphviz是贝尔实验室几个计算机牛人设计的一个开源的图表(计算机科学中数据结构中的图)可视化项目,主要用C语言实现,主要实现了一些图布局算法。通过这些算法,可以将图中的节点在画布上比较均匀的分布,缩短节点之间的边长,并且尽量的减少边的交叉。 graphviz提供命令式的绘图方式,它提供一个dot语言

2012-10-13 14:59:39 1889

原创 差异表达分析软件GFOLD安装以及GSL安装问题

同济GFOLD软件是一款根据mapping结果直接进行差异表达分析的软件,http://www.tongji.edu.cn/~zhanglab/GFOLD/index.html,文献中提到,该软件在分析无重复的转录组数据的时候,不以p值为计算依据,而是以GFOLD值作为标准筛选差异表达基因,命令也比较简单。国产软件还是支持一下。结果要优于其他DESeq、edgeR、cuffldiff等软件,故

2012-10-10 17:59:46 7691 1

转载 UE正则表达式使用

分别来自http://baizheng.iteye.com/blog/37637和space.itpub.net/12350275/viewspace-682549下面是对UltraEdit的Help中针对查找替换使用正则表达式部分的整理,最后还有我前两天用到的一个多行代码查找替换的例子。Ultraedit在使用正则表达式进行查找替换时有两个可使用的语法集合。一个是 UltraEd

2012-10-10 11:01:07 50748 2

原创 DESeq分析基因的差异表达以及安装中出现的问题

DESeq采用NB(负二项分布检验的方式)对reads数进行差异显著性检验,同时还增加了矫正由于长度引起的误差,估算基因表达量的方式采用basemean值来估算表达量(标准化以后)这里,我在R下安装DESeq包出现了一些问题帮助总结一下。首先,我的R是15.0版本打开R source("http://bioconductor.org/biocLite.R") biocLite(

2012-09-14 11:09:50 18862 1

转载 R生成图片svg tiff等

转自好友http://blog.sina.com.cn/s/blog_4be5711f01013e4z.htmlR作为统计语言环境,自然是做统计分析不在话下,但是R同时提供了强大的绘图功能,从低级绘图到高级绘图都有。但是图片默认绘制在X11设备上,面对精美的图片,我们常常想保留下来,用于展示或发表。欲如此,我们可用R提供的其他绘图设备,将好图存起。可有两种行为:一是打开设备并设置相关参数,

2012-08-29 13:27:25 11629

转载 HTML笔记

看到朋友写的 觉得不错 就转载一下 记下来http://user.qzone.qq.com/805853418/blog/13462099540常见标记概览        ……框架集标记               ……浮动框架,详见第9章:框架               ……表单标记              ……控件输入标记

2012-08-29 13:24:27 2882

转载 java中调用R

转自http://jliblog.com/archives/10R与JAVA的整合R是统计计算的强大工具,而JAVA是做应用系统的主流语言,两者天然具有整合的需要。关于整合,一方面,R中可以创建JAVA对象调用JAVA方法,另一方面,JAVA中可以转换R的数据类型调用R的函数,互相取长补短。现在也有一个项目JGR,用JAVA做R的图形界面,可以实现高亮显示自动补全等,还能让JAVA和R

2012-08-03 10:32:34 24047 1

转载 xml文本处理

XML文档 1、 什么是格式正规的XML文档:所以遵守规定的XML基本语法规则的文档(数据)都称为格式正规的XML文档。这类数据在使用时可以不使用DTD或模式来描述它们的结构,它们也称做独立的(或非DTD)XML数据,这些数据不能够依靠外部的声明,属性值只能是没有经过特殊处理的值或默认值。2、 一个格式正规的XML数据包含一个或多个元素,它们相互之间正确地嵌套,其中有一个元素,即文档元

2012-07-24 13:57:21 4329

原创 如何画热图(heatmap)

本人在做芯片数据分析的时候遇到这种情况:筛出来差异表达的基因如何可视化成了问题,一般情况下不同软件对待差异表达基因的可视化有不同处理,这里重点讨论一下常见heatmap图的绘制。传统的方法采用R语言包里面的heatmap()函数对其进行绘制,方法比较简单,如果要求较高可以采用这种方法来画图,但是操作起来会比较麻烦,可以参照这个网址进行操作http://flowingdata.c

2012-06-20 14:05:15 33719

转载 tee命令使用

tee名称:从标准输入中读取并同时写入到标准输出和指定的文件上总揽:    tee [Options]…… [File]……描述:    将标准输入复制到每个指定的文件File中,也输出到标准输出上选项:    -a,--append:不覆盖,而是追加输出到指定的文件中    -i,--ignore-interrupts:忽略中断信息    --help:显示帮

2012-06-20 13:40:04 1638

转载 SAM基因芯片分析软件

转自:http://zhangyuexing.7ta.cn/Article/12289/1441SAM 软件(Significant Analysis of Microarray)它是由 Standford 大学开发的一个免费软件, 目前广泛地被学术界所采用,进行挑选差异基因。SAM 软件可以作为插件在Office Excel 软件中进行应用,很容易被生物医学工作者掌握。SAM 软件进行分

2012-06-17 14:51:34 9278

转载 两列样本差异基因筛选

转自http://blog.sina.com.cn/s/blog_63329a920100o6yd.html两列样本数据的差异基因筛选方法:FoldChange法+FDR控制其中,FDR值的计算方法如下:1)对每个基因进行p-value的计算假设观测到基因A对应的reads数为x,已知在一个大文库中,每个基因的表达量只占所有基因表达量的一小部分,在这种情况下,p

2012-05-29 14:16:11 5883

原创 dbscan算法

dbscan算法是一种基于密度的聚类算法。该算法的目的在于过滤低密度区域,发现稠密度样本点,跟传统的基于层次聚类和划分聚类的凸形聚类簇不同,该算法可以发现任意形状的聚类簇,与传统的算法相比它有如下优点:      与K-means比较起来,你不必输入你要划分的聚类个数;      聚类簇的形状没有bias;      可以在需要时输入过滤噪声的参数;DBSCAN中的的几个定

2012-05-22 13:21:05 18503 5

转载 k-means聚类的缺点

转自http://www.cnblogs.com/emanlee/archive/2012/03/06/2381617.htmlSimilar to other algorithm, K-mean clustering has many weaknesses:  1 When the numbers of data are not so many, initial grouping

2012-05-21 17:07:14 4951

转载 obo文件中标签的含义

obo文件是对应goid和term的映射库 下面是他们对应的term标签信息转自http://www.cnblogs.com/emanlee/archive/2012/04/13/2446300.htmlTags in a [Term] stanza The OBO Flat File Format Specification, version 1.0Required

2012-05-21 17:05:05 2176

转载 BLAST+中makeblastdb参数详解

转自http://hi.baidu.com/lidaof/blog/item/fb4569cfc2011931f9dc612f.html以后打算工作中用到的相关BLAST操作全部用BLAST+来完成与以前的Blast相以,我们还是从格式化数据库到比对开始一般我们是有一个fasta文件用来格式化数据库,以前的命令是formatdb,现在是makeblastdb一般用到的格

2012-05-15 09:57:02 34385 1

转载 LINUX top命令详解

top命令是Linux下常用的性能分析工具,能够实时显示系统中各个进程的资源占用状况,类似于Windows的任务管理器。下面详细介绍它的使用方法。top - 01:06:48 up 1:22, 1 user, load average: 0.06, 0.60, 0.48Tasks: 29 total, 1 running, 28 sleeping, 0 stopped, 0 zombie

2012-04-25 15:46:30 769

转载 核酸序列分析

转载一个很全面的核酸序列分析的文章 核酸序列分析核酸序列分析1、核酸序列检索可通过NCBI使用Entrez系统进行检索,也可用EBI的SRS 服务器进行检索。在同时检索多条序列时,可通过罗逻辑关系式按照GenBank接受号进行批量检索。如用“AF113671 [ac] OR AF113672 [ac]”可同时检索这两条序列。其中“[ac]”是序列接受号的描述字段

2012-04-06 15:03:57 4735 1

转载 linux cat 命令详解

转自 http://linux.chinaunix.net/techdoc/system/2007/11/16/972467.shtml使用方式:cat [-AbeEnstTuv] [--help] [--version] fileName 说明:把档案串连接后传到基本输出(萤幕或加 > fileName 到另一个档案) 参数: -n 或 --number 由 1 开始对所

2012-04-05 14:13:08 595

转载 linux下R安装会遇到问题以及解决方法

How to install R on a local machine, the problems faced and troubleshootingDownload the tarball of R-2.6.2 from  http://www.icewalkers.com/Linux/Software/530020/R.html onto your local machine, f

2012-03-31 14:07:05 5725

转载 Glossary terms

Glossary termsRNA sequencing(RNA-seq). An experimental protocol that uses next-generation sequencing technologies to sequence the RNA molecules within a biological sample in an effort to determi

2012-03-29 21:48:30 867

转载 jtable的鼠标事件监听

今天折腾了这个事件监听了很久,重新定义jtable 继承mouselistener还是监听不到效果,最后发现这段代码很管用,直接在生成的jtable上添加mouseListenner类://给table加上一个鼠标事件监听器对象        table.addMouseListener(new java.awt.event.MouseAdapter(){

2012-03-29 16:57:18 14421 2

翻译 GIF(genomic inflation factor)值的计算方法

GIF值通常用在GWA过程中,用来控制该过程质量;鉴别出那些低质量的基因标记;例如在统计学中,GIF值大于1.0表示结果有低质量数据的出现;那么我们如何计算gwa中的GIF呢;在matlab中,我们使用qqplot()来生成QQplot图,但是这并不意味这我们能够很容易的计算并得到GIF值,我们生成QQplot以后才能从头计算GIF。第一步就是,我们首先得到正态分布的期望顺序统计量;正态分

2012-03-21 14:15:14 6195

转载 Q-Q plot 在GWAS中的意思

Q-Q plot 即Quantile-Quantile Plot。它在各类研究中经常用到,主要是直观的表示观测值与预测值之间的差异。在SPSS中很容做,Analysis - Descriptive statistics - Q-Qplot。Q-Q plot主要是用来估计数量性状观测值与预测值之间的差异。一般我们所取得的数量性状数据都为正态分布数据。在GWAS研究中Q-Q plot的X和Y轴

2012-03-21 13:32:15 20119

转载 OR(odd ratios)

OR值的全称是odd ratio, OR值是相对危险度,又称比值比,对于发病率很低的疾病来说,它是OR值即是相对危险度的精确估计值。计算公式如下:Odd ratio, 95% CI假定我们要鉴别一个基因(或者标记位点SNP)有两个等位基因(等位):记为Allele 1Allele 2Allele 1

2012-03-20 13:25:12 13375

转载 Blast本地化:window平台下blast软件的安装

1.对于windows 2000/xp 用户,下载blast-2.2.18-ia32-win32.exe安装文件ftp://ftp.ncbi.nlm.nih.gov/blast/executables/LATEST/blast-2.2.18-ia32-win32.exe2.创建一个新目录,例如C:\blast,将下载的文件blast-2.2.18-ia32-win32.exe复制到该目录,

2012-02-09 14:07:17 16929

原创 东芝L630-08R装机拆机流程

东芝l630-08r拆机装机流程今天拜托师弟给帮忙清洁一下才买1年多的小本子,拆开以后才想到拍照记下来,具体的就只有装机过程了,拆机过程的话可以反过来看。1、先看一下拆机以后的图吧,这是彻底拆开以后各个部分的图,具体的就不用我介绍了吧,什么a面b面c面d面的,我只标了bc面2、下面一张是主板和散热器,拆开以后吧原来cpu和gpu上的硅脂处理掉(用有机溶剂擦掉),

2011-12-23 16:29:47 18483 4

转载 第二代测序技术

1.概述  DNA测序(DNA sequencing)作为一种重要的实验技术,在生物学研究中有着广泛的应用。早在DNA双螺旋结构(Watson and Crick,1953)被发现后不久就有人报道过DNA测序技术,但是当时的操作流程复杂,没能形成规模。随后在1977年Sanger发明了具有里程碑意义的末端终止测序法,同年A.M.Maxam和W.Gilbert发明了化学降解法。Sanger法因为

2011-12-19 21:53:52 3909

原创 养成良好的java编程习惯

养成良好的java编程习惯1.        应该在每个程序的开始都加上注释,解释该程序的目的、作者以及程序最后一次被修改的日期和时间。2.        使用空行和空格来增强程序的可读性。3.        按照约定,类名标识符中的第一个字母大写,同时将其后每个单词的首字母都大写。java程序员认为这样的标识符通常表示java中的类,所以遵守这个约定,使其可读性增强。4.

2011-12-14 12:49:50 3879 1

转载 隐马尔可夫模型(HMM)攻略

隐马尔可夫模型 (Hidden Markov Model,HMM) 最初由 L. E. Baum 和其它一些学者发表在一系列的统计学论文中,随后在语言识别,自然语言处理以及生物信息等领域体现了很大的价值。平时,经常能接触到涉及 HMM 的相关文章,一直没有仔细研究过,都是蜻蜓点水,因此,想花一点时间梳理下,加深理解,在此特别感谢 52nlp 对 HMM 的详细介绍。  考虑下面交通灯的例子

2011-12-09 10:44:54 224653 52

转载 锌指核酸酶

锌指核糖核酸酶(ZFN) 由一个 DNA 识别域和一个非特异性核酸内切酶构成。DNA 识别域是由一系列 Cys2-His2锌指蛋白(zinc-fingers)串联组成(一般 3~4 个),每个锌指蛋白识别并结合一个特异的三联体碱基。锌指蛋白源自转录调控因子家族(transcription factor family),在真核生物中从酵母到人类广泛存在,形成alpha-beta-beta二级结构。其

2011-11-23 10:26:48 3726

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除