自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(245)
  • 收藏
  • 关注

原创 利用codon神器10倍提升我的python代码效率

可以看到运行时间为13.530s,相较原生python脚本运行时间2m37.856s,效率提高了10倍以上。我用的centos7.9,如果报gcc编译器版本低,某些参数不支持,可通过执行。第一步:利用codon编译器将我的python脚本编译为可执行文件。通过以上操作即可切换GCC至9.3.1版本。第二步:直接执行该命令。

2023-03-23 15:29:37 1023 2

原创 细胞器基因组核酸多样性(pi)计算

细胞器基因组核酸多样性(pi)计算

2022-11-22 10:01:22 3070 2

原创 htmlwidgets实现js动态表格创建、表头固定、关键字搜索、高亮搜索、表头排序实现(通用脚本)

html模板<div id="htmlwidget-1111" class="rhandsontable html-widget"></div><script type="application/json" data-for="htmlwidget-1111">{"x":{"data":[{"p_val": 0.0, "avg_log2FC": 1.0440443913178, "pct.1": 0.919, "pct.2": 0.688, "p_val_adj":

2022-05-07 11:33:41 537

原创 js超大表格瞬间加载实现

javascript <script>var rainData = [{ "id": 1, "name": "5-(2,5-Dimethylphenoxy)-2,2-Dimethylpentanoic Acid" }, { "id": 4, "name": "5-Aminosalicylic Acid" }, { "id": 5, "n...

2022-05-04 18:08:58 725

原创 纯原生javascript手写轮播图案列

纯原生javascript手写轮播图案列代码,欢迎交流学习<!DOCTYPE html><html lang="en"><head> <meta charset="UTF-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge"> <meta name="viewport" content="width=device-width, initial-scale

2022-02-28 16:18:31 123 1

转载 两个div并列一行显示的多种方法

以下提供了5种实现两个div并列一行显示的方法,其中最常用的为浮动,还有定位等方法可以实现。方法一:float浮动,float:left;为左浮动,也可以设置为float:right;右浮动,也可以实现两个div并列一行。#div1{width:50%;height:300px;background:blue;float:left;}#div2{width:50%;height:300px;background:green;float:left;}方法二:display:tab

2021-11-18 16:08:24 31020 2

原创 利用html + css + javascript 创建环形进度条

利用html + css + javascript 创建环形进度条<!DOCTYPE html><html lang="en"><head> <meta charset="UTF-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge"> <meta name="viewport" content="width=device-width, initial-s

2021-11-11 15:34:18 817

原创 linux 磁盘分区格式化及挂载一条龙

1.磁盘分区fdisk -l # 查看磁盘信息#假设未挂载磁盘为/dev/sdcparted /dev/sdc # 开始分区#交互界面mklabel gpt # mbr分区已淘汰,最大只支持2Tmkpart primary 1 100% # 划分一个主分区align-check optimal 1 #检查分区是否对齐print # 打印分区结果quit # 退去2.格式化磁盘mkfs.xfs -f /dev/sdc # 格式化为xfs(推荐)mkfs -t ext4

2021-10-27 09:41:25 384

转载 BSA分析详解

BSA(Bulked segregation analysis)即混合分组分析(BSA,or 集群分离分析法),也称分离群体分组分析,是指利用目标性状存在极端表型差异的两个亲本构建分离群体,在子代分离群体中,选取两组表型差异极端的个体分别构建混合池 ,结合高通量测序技术对混合样本测序,比较两组群体在多态位点(SNP)的等位基因频率(AF)是否具有显著差异,定位与目标性状相关联的位点并对其进行注释,研究控制目标性状的基因及其分子机制。在农学中,经常会遇到将与性状相关的基因或位点在基因组上进行定位的需求,相比于

2021-09-28 16:54:40 10434 1

原创 详解富集分析超几何分布检验

R进行超几何分布计算超几何分布是统计学中的一种离散分布,它描述了由有限个物件中抽出n个物件,成功抽出指定种类的物件的个数。 也是生物信息学中常用的一种统计分布模型。我们在GO,KEGG的富集分析时就采用的是这个模型。 其数学表达式如下:f(k;n,m,N)={{{m \choose k}{{N-m} \choose {n-k}}} \over {N \choose n}}.其中:N: 总样本数m: 总样本中“特定类别”的数量n: 从总样本中随机抽取的数量k: 抽取样本中属于“特定类别”的数量

2021-09-17 15:10:10 2962 1

原创 R 多核并行计算包哪家强: future;future.apply; parallel; foreach ?

R 多核并行计算包哪家强?##### 生存分析 library(RTCGA)#了解数据infoTCGA <- infoTCGA() #这个命令会返回一个数据框,可以知道有哪些数据可被下载#获得临床数据:# Create the clinical data# BiBiocManager::install('RTCGA.clinical')library(RTCGA.clinical)clin <- survivalTCGA(BRCA.clinical) #到这里临床部分的

2021-07-01 08:50:12 2102

原创 单细胞分析R包monocle3服务器安装教程

单细胞分析R包monocle3服务器安装教程(全程踩坑)跟着官网教程走,可很多意外发现运行程序安装BiocManager=3.10版本,必须为该版本,否则会出现问题if (!requireNamespace("BiocManager", quietly = TRUE))install.packages("BiocManager")BiocManager::install(version ...

2020-04-23 17:09:20 9377 2

原创 群体遗传,进化分析利器Popgene分享给大家

Popgene分析方法:SSR为显性分子标记,故将实验分析数据作为单倍型数据进行统计,在某一位点上依据条带的有或无分别记为1或0,输入Excel表中形成二元数据矩阵。在此数据基础上进行如下统计分析:多样性分析,运用POPGENE Version 1.31软件计算地椒各种群间及种群内全部个体多态位点百分率、种群总基因多样性(Ht)、种群内基因多样性(Hs)、种群间的遗传分化指数(Gst)(Gst=...

2020-03-04 21:22:01 8911 7

原创 密码子偏好性分析

密码子偏好性分析_密码子统计数据库与使用方法介绍(深度好文)异源表达的密码子偏好性分析密码子数据库及密码子偏好性分析摘要: 转基因研究中经常要进行基因的异源表达,在翻译过程中,受体物种对外源基因密码子的翻译效率对表达有非常大的制约。因此,利用相应的生物信息学数据库及软件对目标序列进行受体物种的密码子偏好性分析将有助于完成对转基因效率的评价,适当选择合适的受体物种进行高效、可行的表达。在众多的...

2020-03-04 14:56:50 10205

转载 bam格式文件详解

sam/bam格式文件详解1,SAM文件格式介绍SAM(The Sequence Alignment / Map format)格式,即序列比对文件的格式,详细介绍文档:http://samtools.github.io/hts-specs/SAMv1.pdfSAM文件由两部分组成,头部区和主体区,都以tab分列。头部区:以’@'开始,体现了比对的一些总体信息。比如比对的SAM格式版本,比...

2020-03-03 13:03:04 18534 2

原创 VCF变异结果文件详解

看懂变异记录结果文件(VCF)VCF做过DNA重测序,群体遗传进化,BSA,GWAS等项目的人都会遇到VCF文件,这个文件记录了全基因组的变异信息,如果不懂VCF文件就无法进行后续分析。VCF文件介绍:做过DNA重测序,群体遗传进化,BSA,GWAS等项目的人都会遇到VCF文件,这个文件记录了所有样品基因组中所有位置变异(主要包括SNP和InDel)信息。后续几乎所有的分析内容都是基于此文...

2020-01-16 14:23:38 8558

原创 bedtools 用法大全

bedtools 用法大全bedtools等工具号称是可以代替普通的生物信息学数据处理工程师的!我这里用一个专题来讲解它的用法,其实它能实现的需求,我们写脚本都是可以做的,而且我强烈建议正在学编程的小朋友模仿它的各种功能来增强自己的脚本功力。BEDTools是可用于genomic features的比较,相关操作及进行注释的工具。而genomic features通常使用Browser Ext...

2019-10-12 15:34:09 2797

原创 Augustus操作指南

Augustus指南(Trainning部分)目录Augustus指南官方 Tutorial IndexInput:Trainning:PredictionOutput:可能用到的其他软件Trainning Augustus对于没有直接基因结构的情况,可以使用Scipio制作基因结构文件将用于Trainning的基因结构信息分为Trainning set和test set...

2019-09-23 15:59:10 6778

原创 Genscan操作实战

Genscan指南GenScan是一个gene识别软件,主要是通过已知生物的基因结构特征来识别新的基因(parse)。所利用的基因特征请参看readme文件。特点:只考虑编码蛋白的基因。模型考虑每个sequence可能有0个,1个,多个,甚至双链都有基因。假设transcription units没有overlapping。Input:基因组序列Output:文本文件:识别出来的...

2019-09-23 15:56:05 5055 1

原创 组装好基因组后之预测基因

预测基因给定一段fasta格式序列,如何预测其中的基因呢?首先需要判断该片段来自原核生物,真核生物还是病毒序列。如果是原核生物,基因结构比较简单,可以直接使用prodigal或者glimmer3工具进行预测。直接将fasta格式序列输入给软件即可。prodigal -a ref.pep -d ref.cds -f gff -g 11 -o ref.gff -s ref.stat -i re...

2019-09-21 13:58:18 3232

转载 基因家族鉴定分析实战操作手册

基因家族鉴定分析操作手册:基因家族 基因家族鉴定基因家族鉴定分析总结

2019-09-14 15:18:45 15255

原创 TCGA数据中如何区分样本是癌症还是癌旁

TCGA的样品编码方式(barcode)

2019-09-14 14:37:34 12778

原创 生物信息学python必备包和库

**1.pysam :处理基因组序列工具,计算 比对 过滤 汇总**2.biopython:可处理多种生物信息学问题,计算分子生物学和生物信息学工具包**3.Dash_bio:开源 Python 库,用于生物信息学和药物开发应用。...

2019-08-08 18:42:56 4835

原创 hadoop 2.7.3 版本下载

通过Apache 官方仓库可下载老版本:hadoop 2.7.3附上下载地址:https://archive.apache.org/dist/hadoop/core/hadoop-2.7.3/

2019-08-05 20:11:56 7656 4

原创 利用python生成16进制颜色配色

python生成配色

2024-03-06 17:28:27 387

原创 Linux Java 环境变量设置

Linux Java 环境变量设置。

2024-03-05 10:43:32 351

原创 基于基因集打分的单细胞自动注释方法

【代码】基于基因集打分的单细胞自动注释方法。

2024-03-04 14:41:25 379

原创 xopen 一个高效压缩和解压缩python库碾压gzip

xopen高效压缩解压缩python库,碾压gzip。

2024-01-09 15:28:15 433

原创 python按照一定的行数将文件切分成多个文件

大文件分块;大文件切分;python处理

2023-12-28 09:14:54 514

原创 全外显子统计覆盖度

全外显子统计覆盖度

2023-11-03 16:24:37 252

原创 R语言手动评估计算基因组N50,N90

N50计算

2023-09-18 11:56:10 266

原创 R包生成交互网页保存为图片格式(配置phantomjs环境)

R包交互网页保存为图片

2023-09-14 09:26:52 221

原创 fastq文件Phred33/Phred64质量体系

如果有2个以上的质量字符ASCII值小于等于58(即有两个碱基的得分小于等于25),同时没有任何质量字符的ASCII值大于等于75,即判断是Phred+33。如果有2个以上的质量字符ASCII值大于等于75(即有两个碱基的得分大于等于10),同时没有任何质量字符的ASCII值小于等于58,即判断是Phred+64。= (碱基质量值 + 33)的ASCII值 —> 从第一个可见字符!= (碱基质量值 + 64)的ASCII值 —> 从@字符开始。互相转换脚本,待写。

2023-08-16 17:33:03 525

原创 GSEA富集分析结果详解

富集分数:S 反应基因集(比如某个通路内的基因集)成员 s 在排序基因集 L(比如根据 logFC 排序的差异基因集,默认降序,所以上调基因在顶端)的两端富集的程度。正值ES表示基因集 S 在基因集 L 的顶部富集,负值ES表示基因集 S 在基因集 L 的底部富集。第三部分是排序后所有基因 rank 值的分布,热图红色部分对应的基因在 A 组高表达,蓝色部分对应的基因在 B 组高表达,每个基因对应的信噪比(Signal2noise,前面选择的排序值计算方式)以灰色面积图展示。NES:标准化后的富集分数。

2023-08-09 11:46:59 2436

原创 实现数据框行列转换(转置)

数据框行列转换

2023-07-20 10:54:07 127

转载 bismark和bsmap比对原理

甲基化建库测序比对原理

2023-07-17 16:46:16 360

原创 Ka/Ks介绍和分析

在遗传学中,Ka/Ks表示的是两个蛋白编码基因的非同义替换率(Ka)和同义替换率(Ks)之间的比例。这个比例可以判断是否有选择压力作用于这个蛋白质编码基因。如果你手头有两个不同物种的同一个基因的序列,比如人和小鼠的p53基因,然后把这两个基因的序列进行比对,你会发现这两段序列有差异(进化!再仔细观察,你会发现有些碱基的变化导致了编码氨基酸的变化(非同义替换),有些没有导致编码氨基酸的变化(同义替换)。这是由密码子的简并性造成的,因为3个碱基决定1个氨基酸,所以64种碱基组合决定20种氨基酸,会有冗余出现。

2023-07-05 16:05:14 1985

原创 进化树+PCA的R定制化绘图参考代码

进化树和PCA

2023-06-05 17:21:24 179

原创 转录组差异分析代码DESeq2+edgeR+limma(voom)

转录组差异分析代码DESeq2+edgeR。

2023-05-09 13:53:34 722 1

转载 JS逆向常用HOOK代码

JS逆向常用HOOK代码

2023-03-30 10:22:40 626

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除