自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

49

  • 博客(28)
  • 收藏
  • 关注

原创 linux学习笔记(3)

awk语句需求是从几十个文件夹中找出其中的bam文件,然后把它们放到一个文件夹下。for i in $(find ./ -name *.bam);do cp -vf $i ../fold;done-f:强制复制 -v:详细显示命令执行的操作uniq命令:文件合并,自动更新totallog需求是把一个文件夹中几十个文件都与另一个文件夹中的一个文件合并。 能把那一个文件覆盖掉最好,但是试了一下不行,

2017-09-20 17:41:59 361

原创 生信脚本练习(13)文件合并(初识numpy)

这本质上还是个文件合并的问题这是sample文件 这是database文件 要求是把database文件的第四行追加到sample文件后面。限制条件:区间要有重合。也就是说start和end这两列的数字表示每个样本的区间变异类型要一致,也就是type这一行要一样。最后做出来要像这样:最后追加一行有符合限制条件的就追加上去,逗号隔开,没有就空着 # 循环遍历的判定方法import

2017-08-20 17:37:38 608

原创 生信脚本练习(12)求fasta文件各序列长度并统计作图

题目要求是要从一个fasta文件中统计出每条序列的长度分布,并作图。代码如下:import osimport getpassimport matplotlib.pyplot as pltusr = getpass.getuser()os.chdir('c:/Users/' + usr + '/Desktop')seq_len = {}# 把fasta文件全部读取做成字典,键是带‘>’的那

2017-08-20 17:19:37 6262 1

原创 生物信息学习笔记整理

做了不少练习,整理一下以前的经验。 主要是归纳一些模块化的东西,提取一些常用的函数还有一些小tricky# split的用法str = "Line1-abcdef \nLine2-abc \nLine4-abcd"print (str.split( ))print (str.split(' ', 1)) # 从头开始切一刀list1 = [ [1,5,7], [10,3, 4], [6,

2017-08-16 16:12:09 1366

原创 生信脚本练习(11)随机输出5条fastq序列

这个练习目的是从fastq文件中随机选出n条序列,输出成另一个fastq文件。 - 先把文件读一遍,看看有多少条序列,命名为count。 - 然后在此范围内取随机数 - 然后再把文件读一遍,设置一个计数器count2。遇到count2等于随机数就把序列存下来(连续存4行)。 为啥count和count1数值不一样?? count=128,count1=129???# 8.11# 随机选出

2017-08-15 09:51:21 871

原创 生信脚本练习(10)找出fasta文件中最长的转录本

>TRINITY_DN3760_c0_g2_i1 len=284 path=这是一个一个fasta文件的示例。 这个文件中,TRINITY_DN3760_c0_g2是基因名。 没错,TRINITY_DN3760_c0_g2和TRINITY_DN3760_c1_g2是不同的基因。 而i1,i2是不同的转录本,现在要找出一个基因唯一最长的那个转录本,短的都不要。# 17.8.11 import

2017-08-14 20:31:48 6699 1

原创 生信脚本练习(9)合并文件 ②

这个练习也是合并文件,但是只是合并两个文件这是样本信息:MegaID Chr Star Ref Alt Depth170602C304 1 861302 G A 635170602C304 1 906303 G T 290170602C304 1 985841 C T 56170602C304 1 985866 A G

2017-08-07 19:55:34 570

原创 生信脚本练习(8)合并文件 ①

这道题有难度,要把这三个文件合并到一起。文件一1 161514631 T C|0.132632|(272,140,47,16)2 222301193 A C|0.078624|(260,115,23,9)3 89259567 A C|0.043716|(200,150,8,8) 4 55979552 G A|0.211921|(236,12

2017-08-07 19:46:03 661

原创 生信脚本练习(7)求fastq文件质量值分布

这里是求fastq文件的质量类型和比例 注意数几种类型用了set() 的方法with open("Test1.fastq","r") as f: lines = f.readlines()qual = []for line in lines: if lines.index(line)% 4 == 3: line= line.strip('\n')

2017-08-07 19:44:14 902

原创 生信脚本练习(6) 求read每个位点的cg分布

这是另外一题,也是cg含量, 但是是求一个fastq文件中每个read位点的cg分布情况 这个解法是逐行读取文件,比较优雅number = {}buffer = 200for i in range(buffer): kkk = i number[kkk] = 0 with open("Test1.fastq","r") as f: li

2017-08-07 19:35:53 693

原创 生信脚本练习(5)求fastq文件的cg含量

这道题要求求出一个fastq文件中序列的cg含量with open("Test1.fastq","r") as f: lines = f.readlines()seq = []index = []cg_n = []cg_percentage = []head = ['Read', 'CG']cg = open("cg.txt","w") #这里精髓,取出每条序列的标题for

2017-08-07 19:26:04 1368 2

原创 正则表达式练习

把这段文字: - 取出其中的参考文献 - 输出去掉参考文献之后的文本 Large, randomized Phase 3 trials in colorectal cancer have found that panitumumab, when combined with chemotherapy, results in prolonged progression-free survival

2017-07-30 17:54:38 323

原创 生物信息脚本练习(4)按照行列合并文件

这是个新的需求,要求把如下的两个2X5 的文件合并成一个3X5 的。 Program2_1.txt Seq Length cog4 210 cog2 94 cog3 210 cog1 113 cog5 152 Program2_2.txt Seq Depth cog5 93 cog1 110 cog2 114 cog4

2017-07-30 16:01:58 449

原创 生物信息脚本练习(3)gb文件转换

这是个genebank的序列文件 https://www.ncbi.nlm.nih.gov/nuccore/NC_000012.12?report=genbank&from=25204789&to=25252093&strand=true这个文件需要转换成fasta格式的文件,脚本如下:import reoutput = open("data3.txt","w") with open("

2017-07-30 15:56:16 1710 2

原创 生物信息脚本练习(2)求反向互补序列

这是一个简单的生信脚本练习,对一段碱基序列切片,然后求反向互补序列。注意其中join 函数的用法#求反向互补序列lll = []with open("Program1.txt","r") as f: seq = f.readlines() seq = seq[1] print(seq) print("\n") seq = seq[50:101] pr

2017-07-30 15:41:29 3045

原创 生物信息脚本练习(1) 找出fasta文件中大于500的序列

最近做了一些生物信息的脚本练习。 这是第一个例子。 找出一个fasta文件中大于500的序列,并重定向到另一个新的文件中。 这个文件每条序列是如下的样子。 c100027.graph_c0|orf3 type=complete len=150nt loc=c100027.graph_c0:123-272:- ATGAGGATCTTTACGCCAAATGAGGGCCTTGTTGTTGA

2017-07-30 15:38:05 3792 2

原创 flask开发(2)

################git 的问题,无法切换分支了$ git checkout 1aerror: Your local changes to the following files would be overwritten by checkout:        hello.pyPlease commit your changes or stash them bef

2017-06-24 10:39:44 1732

原创 《荒野求生》告诉我们的

《荒野求生》告诉我们的不断尝试保持乐观必要时使用非常手段

2017-05-21 15:50:10 545

原创 基于NCBI的blast小程序

第一次尝试用markdown来写博客 很新鲜的感觉任务首先老板给我一个任务 把一堆序列给我,让我比对,找出他们当中和cilia最为相关的。 是fasta格式的。解决方案1人工高通量 就是把它们上传到NCBI网站上,然后比对。 然后挨个点开看它们的结果,网速慢的话很让人抓狂解决方案2本地blast 这需要一台不错的电脑,我自己的固态硬盘一共才240G。我可以用我们的服务器,但是当

2017-05-16 09:50:38 3099 2

原创 Flask开发(1)

准备做网站了,一开始打算直接用wordpress,然后放到亚马逊云上面但是被老板鄙视了,问了我一大堆问题我都不会他说可以找台不用的电脑整天开着,或者放到学院的服务器上,主要是这样就不用花钱了呗我觉得技术上是可行的所以我要自己写代码了先从flask开始学起申请了一个域名叫做 www.43493.me 21块钱一年,狗爹网买的,不贵。但是两年就要100多是为啥呢我用

2017-04-17 21:08:57 347

原创 我的linux学习笔记(2)grub2 配置

linux默认是由grub2引导启动的,win的话我用过easyBCD,挺好用的。但是双系统用两个引导开机很麻烦,就不用easyBCD了linux的好处在于一切配置都是可以自定义的。看到grub2默认的黑白启动画面那么难看,我就想到这个是不是也可以改一下呢结果发现确实是可以的,而且能更改的不止启动画面。1 grub2 更改菜单顺序sudo gedit /etc/default/

2017-04-16 22:05:11 466

原创 我的linux学习笔记(1)

一个命令:nohup command &但是这样运行常常出现nohup: ignoring input and redirecting stderr to stdout这样的错误只要把这个命令改成 nohup command 2>&1 & 就可以了具体原理还要再理解还有,这种情况下终端不会输出程序运行的反馈,所有信息都保存在当前目录下的nohup.out文件中。这是

2017-03-23 21:00:48 310

原创 我的linux学习笔记

去年冬天,图书馆清理一批旧书。我从那儿买到一本Harley Hahn的《student guide to UNIX》,这是第一版,出版于上世纪90年代。这本书第一句就说this book will change your life 。我喜欢这样自信的作者,而且后来我也同意他的观点。虽然完全是外行,一点都没有接触过UNIX,而且读的是英文版,但是我觉得这本书明显与众不同。跟枯燥的教科书相比幽

2017-03-12 17:35:35 361

原创 我的第二次RNAseq分析

数据还是上次那些,因为我没法解决.count文件里面的数字全是0的情况。所以打算从头开始做。这次我对流程更加熟练了,另外又看了不少攻略,理解也更深了一些1 基因组索引的建立需要从ensemble的FTP下载一个.fa文件和一个.gtf文件(或者.gff3),这次使用师姐留下的.fna代替.fa /public/opt/sc/program/STAR-STAR_2.4.1c/sour

2017-03-11 21:37:25 4660

原创 这世上没有末路,你从不曾孤独

最近几个晚上读了一些小说。 一篇是《了不起的盖茨比》,另一篇是《人间失格》。 都是中短,我觉得我越来越没法静下心来啃大块头的长篇了。把这两个故事放到一起,才发现它们其实有共同点,讲的都是年轻一代人的悲剧。穷小子盖茨比爱上了富家千金黛西,为了得到她去做了几年私酒生意一夜暴富。以为自己有了钱就能永远跟黛西在一起,但是汤姆用事实告诉他,他们永远是两个阶层的人。盖茨比不信,到死也不明白暴发户和贵族

2017-03-11 21:34:51 458

原创 [影评]错的时间和对的人

这些天刷了几部电影。有两部爱情片印象深刻,拿出来说一说。一部是02年的《我的野蛮女友》,另一部是15年的《植物图鉴》。​它们讲的都是在错的时间遇到对的人的故事。为什么是错的时间呢。野蛮女友刚刚失去了前男友就像老母鸡刚刚丢了自己的一窝蛋,每天借酒浇愁还不能自拔哪有心思谈恋爱,男主牵牛这时候出现,没牵到牛牵到了母老虎,正好成了发泄工具整天被幸福地拳打脚踢。而男主也只是个不知道将

2017-03-11 21:33:57 473

原创 我的第一次RNAseq分析

从师姐那儿拿到了整个大概的protocol0. 预处理。  将公司给的fastq格式的文件变成clean.fastq。去掉一些不合格的reads1.比对。 运用以下命令生成一个参考基因组。我有师姐之前留下的基因组文件,名叫GCF_000002035.5_GRCz10_genomic.fna,我也不知道这是个什么格式。从ensemble上下载的目标基因组是.fa格式的。cd /pub

2017-03-09 18:59:29 4075 5

原创 我的实验记录

现在终于有点明白为什么码农爱写博客了  就像我们做实验要写实验记录一样  博客就是他们的实验记录。从今天开始我也做点儿实验记录对了  今天也是五年的第一天good luck

2017-03-05 18:20:35 448

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除