2 sixu_9days

尚未进行身份认证

趁年轻,多经历,多感悟,多成长

等级
TA的排名 12w+

对链特异性建库的理解

刚接触高通量测序的时候就知道有链特异性建库这么个概念,当时也了解可以利用加U法,但是没有思考其中的细节。最近把这个概念掰开了揉碎了好好理解,终于填上了这个坑。正式讲之前,有几个概念是要明确的。DNA的正链和负链,就是那两条反向互补的链。参考基因组给出的那个链就是所谓的正链(forword),另一条链是反链(reverse)。但是这正反一定不能和正义链(sensestrand)反义链(a...

2018-07-27 01:21:03

python-bwt算法的编码和解码

关于bwt算法的原理可以看看这个博客,讲得很好https://blog.csdn.net/blackjack_/article/details/73801003本文是利用python写的bwt算法的编码和解码,有兴趣的同学可以看看。例子是banana这个字符串defbwtencode():globalL,FL=''F=''text...

2018-07-19 02:38:53

对FPKM/RPKM以及TPM的理解

虽然一直在接触FPKM/RPKM以及TPM,但是仅仅是知道它们是转录本定量的值,并未究其根本。最近看了几篇文献,对其深层次的含义有了进一步的理解,因而在这里记录下来。首先来看FPKM/RPKM的起源: 在RNA-Seq中,最简单的定量基因表达量(geneexpression)的方法就是将RNA-Seq数据比对到相应的参考序列上时,会有比对到各个基因的read数量,称为rawreadcoun...

2018-07-03 16:05:53

python爬虫-爬取网易云音乐歌曲评论

本文借鉴了@平胸小仙女的知乎回复https://www.zhihu.com/question/36081767以及@lyrichu的博客 https://www.cnblogs.com/lyrichu/p/6635798.html话不多说,直接开始正题------------------------------------------------------------------------...

2018-06-24 00:07:54

python-生存曲线数据转换器

相信很多人跟我一样在做存活图的时候被前期的数据处理折磨的不行,特别是样本较多的情况下,把各个时间的死亡数转换成做存活图需要的格式,太浪费时间了。于是用python写了一个小软件,将原始数据转换成做图的数据格式。效果如图         下面直接附上代码#!/usr/bin/envpython#coding:utf-8fromtkinterimport*importo...

2018-06-11 13:06:00

python-爬虫:获取163邮箱的收件箱信息列表

在练习python爬虫的时候看到了原博主的关于爬取163邮箱收件箱信息列表的文章,就拿来练手了。这里附上原博客链接https://blog.csdn.net/u011379247/article/details/51019379由于原文用的是python2.X,浏览器的版本也比较早。而本人用的是python3.6,浏览器也是新版本,所以还是有些不一样的地方值得摸索的。主要内容:1.模拟163邮箱...

2018-06-06 22:02:08

python-根据gtf绘制基因全部转录本结构图

根据基因组注释文件gtf绘制基因全部转录本的结构图,利用python进行实现,并实现了GUI可以下载各种gtf,从NCBI,ENSEMBL,UCSC,GENCODE都可以,但是要根据相应的版本修改代码重点是得到所有基因的转录本个数,以及每个转录本的外显子的坐标。先上效果图,这是人类基因组中的ANXA1基因的全部转录本下面直接上代码#!/usr/bin/envpython#coding:ut...

2018-05-15 17:24:47

Windows环境下Python的Tinkter模块的安装

首先要知道python在3.2之后的版本中都自动安装了tkinter模块,只是要注意首字母t是小写的,这点与python3.0及之前的版本是不同的。直接import就行,如下step.1注意下划线和大小写,如果这一步没问题就可以进行第二步。但是注意,3.2之前的版本可能会出现报错“Nomodulenamed_tkinter”就是没有安装Tkinter模块了,进入这个链接下载即可https:...

2018-04-10 15:37:56

R开发实例-map分布图

在网上查找R实战的的时候无意间看到这位大神的R开发实例:绘制分布图。对其十分感兴趣因此按照步骤,从头到尾做了一遍,也算是收获不小。先附上原博客的链接https://www.cnblogs.com/tgzhu/p/5775829.html#undefined下面,实战开始!首先安装包R命令:install.packages("devtools")R命令:library(devtools)R命令:...

2018-03-27 21:46:24

原码、反码、补码的产生及原理

第一个出现的机器码是二进制码,它们没有正负之分,只有单的数字。如果我们给它们分配8位内存(8bit)的限制去存放他们,是下面这个样子的 但是在生活中为了表示”欠别人钱”这个概念,就从无符号数中划分出了“正数”和“负数”而为了表示正与负数,人们发明了“原码“,把生活中应该有的正负概念原原本本的表示出来把最左边的第一位腾出位置,存放符号,正用0表示,负用1表示 

2018-02-01 15:53:40

p-value&FPR以及q-value&FDR

在测序数据中,我们经常能在差异统计表格看到P-value以及FDR值。而在生信数据的分析中,也会经常对P-value进行FDR校正。这么做的目的是什么,FDR校正的原理又是什么呢?首先我们来看P-value的定义:在假设检验中,当原假设(H0)为真时,所得到的样本观察结果或更极端结果出现的概率。如果P-value很小,说明原假设为真时,这个数据甚至更极端的数据出现的概率很小;而当P-val

2018-01-07 00:12:53

illumina SBS测序详解

最近回头重新看了illluminapairedendsequence的测序原理视频,发现了以前没有注意的一些问题,而这些问题也是大家平时容易搞错的,因此花了几天时间将illumina的pairedendsequence从构建文库到上机测序的整个过程以及原理较为详细的写了出来。基础知识:illumina测序的核心在于利用可逆终止的、荧光标记的dNTP进行边合成边测序  

2018-01-02 09:33:56
勋章 我的勋章
    暂无奖章