自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

BioinfoDu

​小杜的生信筆記 ,主要发表或收录生物信息学的教程和基于R的分析和可视化(包括数据分析,图形绘制等)。

  • 博客(141)
  • 收藏
  • 关注

原创 截断堆积柱状图

堆积柱状图是柱状图的常见类型之一,也是平时使用概率较高的图形之一。我们前期发布了很多个柱状图的绘制教程,若你刚兴趣可以自行查看。堆积柱状图,最近也发布了一个相对详细的教程,基于R语言 | 绘制个性化堆积柱状图。对于截断图的绘制,也是相对比较简单,因为我们柱状图和堆积柱状图都是基于ggplot2绘制。因此,基本全部的代码都是可以通用。我们次教程,也是基于前期的教程进行修改即可。

2024-04-22 16:56:23 342

原创 截断堆积柱状图绘制教程

堆积柱状图是柱状图的常见类型之一,也是平时使用概率较高的图形之一。我们前期发布了很多个柱状图的绘制教程,若你刚兴趣可以自行查看。堆积柱状图,最近也发布了一个相对详细的教程,基于R语言 | 绘制个性化堆积柱状图。对于截断图的绘制,也是相对比较简单,因为我们柱状图和堆积柱状图都是基于ggplot2绘制。因此,基本全部的代码都是可以通用。我们次教程,也是基于前期的教程进行修改即可。

2024-04-22 16:53:46 442

原创 Count值计算的几种方式,你会吗??

featureCounts是subread中脚本,可以使用subread流程进行定量,在这里直接使用前面mapped的bam文件进行转录本定量。,主要发表或收录生物信息学的教程,以及基于R的分析和可视化(包括数据分析,图形绘制等);因此,个人建议仍是获得count值,后再进一步的分析,这样的方法更利于下游分析。是stringtie软件中自带的获得转录本丰度的脚本,6.1中的。文件进行转录本表达量的比对,获得转录本的FPKM,此后使用。在网络中吗,都有比较详细的教程,大家可以自己去学习。

2024-04-17 21:20:29 1027

原创 转录组上游分析,Count计算

featureCounts是subread中脚本,可以使用subread流程进行定量,在这里直接使用前面mapped的bam文件进行转录本定量。,主要发表或收录生物信息学的教程,以及基于R的分析和可视化(包括数据分析,图形绘制等);因此,个人建议仍是获得count值,后再进一步的分析,这样的方法更利于下游分析。是stringtie软件中自带的获得转录本丰度的脚本,6.1中的。文件进行转录本表达量的比对,获得转录本的FPKM,此后使用。在网络中吗,都有比较详细的教程,大家可以自己去学习。

2024-04-17 21:17:24 949

原创 基于R语言绘制-散点小提琴图

本期的图形来自发表在Nature期刊中的文章,这样的基础图形在日常分析中使用频率较高。20240405。

2024-04-05 20:49:41 631

原创 R语言绘图 | 散点小提琴图

主要发表或收录生物信息学的教程,以及基于R的分析和可视化(包括数据分析,图形绘制等);分享感兴趣的文献和学习资料!本期的图形来自发表在Nature期刊中的文章,这样的基础图形在日常分析中使用频率较高。若我们的分享对你有用,希望您可以。,这是对小杜最大的支持。照葫芦画瓢-绘制箱线图。

2024-04-05 20:46:38 860

原创 R语言,数据类型转换

今天是4月份的第一天,再过2天后再一次迎来清明小假期。木鸡大家是否正常放假呢?我们在使用R语言做数据分析时,会一直对数据进行不同类型的转换,有时候会被自己弄晕掉,那么就只能一次一次的去解决,去寻找,去学习相关的知识点。虽然,目前很多的云平台都能全自动化的给你绘图,很方便,但是自己依旧喜欢自己使用R来画,这个过程可能会花费很多的时间,但是自己在使用后会有一定的收获,至少让自己的大脑得以运转。这个大脑长时间不用,当你使用时会很迟钝,木鸡大家是否有类似的情况。

2024-04-01 20:03:55 1146

原创 R语言技能 | 不同数据类型的转换

虽然,目前很多的云平台都能全自动化的给你绘图,很方便,但是自己依旧喜欢自己使用R来画,这个过程可能会花费很多的时间,但是自己在使用后会有一定的收获,至少让自己的大脑得以运转。我们在使用R语言做数据分析时,会一直对数据进行不同类型的转换,有时候会被自己弄晕掉,那么就只能一次一次的去解决,去寻找,去学习相关的知识点。,主要发表或收录生物信息学的教程,以及基于R的分析和可视化(包括数据分析,图形绘制等);分享感兴趣的文献和学习资料!,木鸡大家是否有类似的情况。,这是对小杜最大的支持。数值向量转换为字符向量。

2024-04-01 20:01:25 640

原创 使用ggplot2绘制带星号的热图

主要发表或收录生物信息学的教程,以及基于R的分析和可视化(包括数据分析,图形绘制等);分享感兴趣的文献和学习资料!若我们的分享对你有用,希望您可以。,这是对小杜最大的支持。

2024-03-25 14:59:41 349

原创 使用ggplot2绘制带星号“*“的热图

主要发表或收录生物信息学的教程,以及基于R的分析和可视化(包括数据分析,图形绘制等);分享感兴趣的文献和学习资料!若我们的分享对你有用,希望您可以。,这是对小杜最大的支持。设置主题,及字体调整。

2024-03-25 14:56:36 461

原创 关于Count,FPKM,TPM,RPKM等表达量的计算及转换 | 干货

今天使用count值转化TPM,或是使用FPKM转换成TPM。这样的教程,我们在前面已经出国一起相对比较详细的教程了,一文了解Count、FPKM、RPKM、TPM | 相互间的转化,在这个教程中,我们也归纳了各个数值的含义。自己也是这样的,一个人的时间和精力是有限的,我们不可能有那么多的精力。因此,做学习笔记就有很大的帮助,当自己使用的时候有地方找寻。本教程涉及的数据、代码和文件等在社群中可获得!!

2024-03-22 11:14:06 1360

原创 泛基因组分析流程 | 详细教程

泛基因组的文章,我们在2023年做过一期,上面写了很多干货,对于我们的小白理解泛基因组这个概念很有帮助。若是你有需求可以跳转去看泛基因组(Pan-genome)。对于我个人,泛基因组也是很陌生,我开始接触是当时泛基因组真的很火,顶刊文章发出来很多。自己认为是高大上的东西,以及自己也想尝试学习。但是,这篇文章总结以后,自己也就没怎么关注这快内容了。是吧!我不知道大家是否也存在这样的现象…我们有时,认为这块内容很想做,信心满满的去做,但是很难坚持下去。只要,我们坚持做下去,那么你一定会有收获的。

2024-03-22 11:09:39 1206

原创 关于Count,FPKM,TPM,RPKM等表达量的计算

通俗讲,把比对到的某个基因的Fragment数目,除以基因的长度,其比值再除以所有基因的总长度。TPM的全称为Transcripts per million,Transcripts Per Kilobase of exon model per Million mapped reads (每千个碱基的转录每百万映射读取的Transcripts)。自己也是这样的,一个人的时间和精力是有限的,我们不可能有那么多的精力。此外,这个方法只能获得是gene的表达量,若你想获得transcript的表达量,自己未成功。

2024-03-22 11:05:51 812

原创 一文了解如何做全基因集GSEA富集分析

我们前面分享过一文掌握单基因GSEA富集分析的教程,主要使用单基因的角度进行GSEA富集分析。我们社群的同学咨询,全基因集的GSEA如何分析呢??其实,原理都是大同小异的,那么今天我们就简单的整理一下吧。若我们的分享对你有用,希望您可以,这是对小杜最大的支持。

2024-03-18 20:35:03 924

原创 全基因集GSEA富集分析

中间部分为用线条标记位于基因集下的每个基因的位置,每个竖杠代表一个基因,竖杠的位置就是每个基因集里的基因在所有排序好的基因的位置。给定一个排序的基因表L和一个预先定义的基因集S (比如编码某个代谢通路的产物的基因, 基因组上物理位置相近的基因,或同一GO注释下的基因),GSEA的目的是判断S里面的成员s在L里面是随机分布还是主要聚集在L的顶部或底部。这些基因排序的依据是其在不同表型状态下的表达差异,若研究的基因集S的成员显著聚集在L的顶部或底部,则说明此基因集成员对表型的差异有贡献,也是我们关注的基因集。

2024-03-18 20:31:13 978

原创 有参转录组分析 |基因组信息下载和FQ数据过滤教程

这个教程也是前面《转录组上游分析》系列教程的中内容,我们今天单独的给作为一个章节来推送出来,因为,并不是所有人都是有这个系列教程有需求,可能你只是对某一个章节的内容感兴趣呢?

2024-03-17 20:29:08 876

原创 参考基因组序列下载和转录组数据过滤

这个教程也是前面《转录组上游分析》系列教程的中内容,我们今天单独的给作为一个章节来推送出来,因为,并不是所有人都是有这个系列教程有需求,可能你只是对某一个章节的内容感兴趣呢?

2024-03-17 20:24:56 450

原创 R语言图形绘制 | 桑基图绘制教程

在昨天3月10日,我们在知乎B站等分享了功能富集桑基气泡图的绘制教程。NC|高颜值功能富集桑基气泡图桑基气泡组合图。确实,目前这个图在文章中出现的频率相对比较少,但是可能随着的代码的开放,此图会别大家玩出新花样,功能富集图可能会有不同的可视化方式,若你有好的想法,也可以在自己想到后进行实现,你可能成为此图的开山鼻祖。做生物信息的,对图形的要求是比较高的,因此,需要不断的创新,不断的调整,不断的失败,更重要的是需要不断的思考。因此,我们每天学习一点点,也就是一种进步;每天整理一下笔记,也算是一种总结。

2024-03-11 20:27:04 626

原创 R语言绘制桑基图教程

在昨天3月10日,我们在知乎B站等分享了功能富集桑基气泡图的绘制教程。NC|高颜值功能富集桑基气泡图桑基气泡组合图。确实,目前这个图在文章中出现的频率相对比较少,但是可能随着的代码的开放,此图会别大家玩出新花样,功能富集图可能会有不同的可视化方式,若你有好的想法,也可以在自己想到后进行实现,你可能成为此图的开山鼻祖。做生物信息的,对图形的要求是比较高的,因此,需要不断的创新,不断的调整,不断的失败,更重要的是需要不断的思考。因此,我们每天学习一点点,也就是一种进步;每天整理一下笔记,也算是一种总结。

2024-03-11 20:23:40 626

原创 让ChatGPT给你写代码????

对于ChatGPT从我们“惊讶”到现在已经快一年多了,但是,对于个人来说,使用还是比较少的。更确切的来说,也许有些同学是没有使用过。ChatGPT功能确实比较强大,但对于我们使用者来说,可能感觉自己使用时候并没有有直观的感受到他“所谓的强大”。对于个人来说,对于ChatGPT只是用来“搜索引擎”一样的功能。有时候,自己不会的内容,也会让它来搜索。那么用ChatGPT来写绘图代码,或是分析代码可以吗??仁者见仁智者见智。

2024-03-03 19:00:34 651

原创 使用ChatGPT写代码靠谱吗?

为便于教程管理和日常使用,我们通过语雀建立网页版的《生信知识库》,基本收纳了账号全部教程,以及网页版本会收纳部分付费教程(¥< 50.0)。ChatGPT功能确实比较强大,但对于我们使用者来说,可能感觉自己使用时候并没有有直观的感受到他“所谓的强大”。,主要发表或收录生物信息学的教程,以及基于R的分析和可视化(包括数据分析,图形绘制等);到现在已经快一年多了,但是,对于个人来说,使用还是比较少的。其实,也可以不用设定他的人设,直接提问,给出的答案基本是一致的。有时候,自己不会的内容,也会让它来搜索。

2024-03-03 18:58:03 1054

原创 功能富集分析 | GO| KEGG

我们《复现SCI文章系列教程》专栏现在是免费开放,推出这个专栏差不多半年的时间,但是由于个人的精力和时间有限,只更新了一部分。后续的更新太慢了。因此,最终考虑后还是免费开放吧,反正不是什么那么神秘的东西。原本就是一个套路的文章,此外,这篇文章也相对比较简单。在此章节以前,还有一个WGCNA的分析,你若需要可以看**WGCNA分析 | 全流程分析代码**SCI文章复现 | GEO文章套路,数据下载和批次效应处理差异分析和PPI网路图绘制教程在前的教程中,我们已经获得差异基因(2.4 差异分析。

2024-02-26 20:44:44 399

原创 功能富集分析 | GO| KEGG

我们《复现SCI文章系列教程》专栏现在是免费开放,推出这个专栏差不多半年的时间,但是由于个人的精力和时间有限,只更新了一部分。后续的更新太慢了。因此,最终考虑后还是免费开放吧,反正不是什么那么神秘的东西。原本就是一个套路的文章,此外,这篇文章也相对比较简单。在此章节以前,还有一个WGCNA的分析,你若需要可以看**WGCNA分析 | 全流程分析代码**SCI文章复现 | GEO文章套路,数据下载和批次效应处理差异分析和PPI网路图绘制教程在前的教程中,我们已经获得差异基因(2.4 差异分析。

2024-02-19 17:09:25 978

原创 GO和KEGG富集分析

我们《复现SCI文章系列教程》专栏现在是免费开放,推出这个专栏差不多半年的时间,但是由于个人的精力和时间有限,只更新了一部分。自己认为,我们原始获得数据,已经是进行标准化后的数据了,应该是作者上传时就已经处理过。根据文章分析流程,将DEGs和WGNCA分析获得的结果去交集,获得的交集基因进行后续分析。我们在自己做分析时,或在写论文时,其实这些参数可以写进论文中,对读者是比较友好的。在差异分析中,我们获得600多个DEGs,在WGCNA分析中,与纤维化相关的模块为。不知道,能力有限的原因?

2024-02-19 17:07:07 1005

原创 差异表达分析和PPI网络图构建

在原文中,作者获得285个DEG,在此推文中共获得601个DEG。小杜的猜想是标准化的水段不同的原因吧,或是其他的原因。此外,惊奇的发现发表医学类的文章在附件中都不提供相关的信息文件,如DEG数据、GO、KEGG富集信息,或是其他相关的文件。唉!!!难道是怕别人复现结果不一致?仅仅提供对读者不关心的文件信息,我们猜想,这是不是期刊要求必须有附件,所以才产生两个文件呢????20240218若我们的分享对你有用,希望您可以,这是对小杜最大的支持。

2024-02-18 16:59:23 744

原创 文章复现 | 差异分析和PPI网络构建

小杜的猜想是标准化的水段不同的原因吧,或是其他的原因。此外,惊奇的发现发表医学类的文章在附件中都不提供相关的信息文件,如DEG数据、GO、KEGG富集信息,或是其他相关的文件。,主要发表或收录生物信息学的教程,以及基于R的分析和可视化(包括数据分析,图形绘制等);对下载的数据集进行分析可获得,前175列数据作为处理组,后99列数据作为对照组。作者这里就只是简单的分类而已,若细致的分,这里有些数据是可以不被使用的。绘制热图此方法仅是其中一种,大家可以使用前期的教程进行绘制更精美的图形。

2024-02-18 16:49:14 886

原创 差异分析和PPI网路图绘制教程

在原文中,作者获得285个DEG,在此推文中共获得601个DEG。小杜的猜想是标准化的水段不同的原因吧,或是其他的原因。此外,惊奇的发现发表医学类的文章在附件中都不提供相关的信息文件,如DEG数据、GO、KEGG富集信息,或是其他相关的文件。唉!!!难道是怕别人复现结果不一致?仅仅提供对读者不关心的文件信息,我们猜想,这是不是期刊要求必须有附件,所以才产生两个文件呢????若我们的分享对你有用,希望您可以,这是对小杜最大的支持。

2024-02-18 00:00:00 653

原创 GEO文章套路,数据下载和批次效应处理

近年来,世界范围内肾纤维化的发病率不断上升,极大地增加了社会负担。然而,该疾病的诊断和治疗工具不足,因此需要筛选潜在的生物标志物来预测肾纤维化。「Methods:」利用基因表达综合数据库(Gene Expression Omnibus, GEO),我们获得了来自肾纤维化患者和健康个体的两个基因阵列数据集(GSE76882和GSE22459)。我们鉴定了肾纤维化和正常组织之间的差异表达基因(DEGs),并使用机器学习分析了可能的诊断生物标志物。

2024-02-17 15:21:59 1323

原创 SCI文章复现 | GEO文章套路,数据下载和批次效应处理

近年来,世界范围内肾纤维化的发病率不断上升,极大地增加了社会负担。然而,该疾病的诊断和治疗工具不足,因此需要筛选潜在的生物标志物来预测肾纤维化。「Methods:」利用基因表达综合数据库(Gene Expression Omnibus, GEO),我们获得了来自肾纤维化患者和健康个体的两个基因阵列数据集(GSE76882和GSE22459)。我们鉴定了肾纤维化和正常组织之间的差异表达基因(DEGs),并使用机器学习分析了可能的诊断生物标志物。

2024-02-17 15:20:50 1485

原创 R语言绘图教程 | 双侧条形图绘制教程

双侧条形图在我们的文章中也是比较常见的,那么这样的图形是如何绘制的呢?以及它使用的数据类型是什么呢?这些都是我们在绘制图形前需要掌握的,至少我们知道绘图的数据集如何准备,这样才踏出第一步。今天的教程,我们会从数据的准备,以及数据如何整理,以及结合自己的绘图过程中遇到问题是如何解决来进行讲解。PS:仅代表个人的观点,以及自己遇到此问题时自己的方法来进行说明。也许,这个并不会死唯一且最好的方法,大家在绘图中请结合自己的能力和方法。

2024-02-05 23:15:39 1864

原创 双侧条形图绘制教程

在这里我们发现,我们有很多个富集通路,但是我们绘图的时候需要这么多吗?这里我们使用已经整理好的数据进行绘图,我们使用Execl进行整理数据。到这里我们也就可以使用以上的代码进行分析了,你可以使用P值或是LogFC进行绘制,我们论文中一般使用的是P值进行绘制图图形。今天的教程,我们会从数据的准备,以及数据如何整理,以及结合自己的绘图过程中遇到问题是如何解决来进行讲解。这些都是我们在绘制图形前需要掌握的,至少我们知道绘图的数据集如何准备,这样才。筛选出的作图的数据,这里我们的直接使用。,这是对小杜最大的支持。

2024-02-05 23:13:20 677

原创 一文掌握单基因GSEA富集分析

关于GSEA分析,我们在前期的教程单基因GSEA富集分析 | 20220404有出过类似的分享。今天,我们也结合相关的资源整理出一篇关于GSEA的教程及出图教程。每个方法的教程很多,我们大家结合自己的需求进行分析即可。以及,对于目前知识分享博主很多,只要你自己动手搜索,基本可以找到你的需求。更新!对于GSEA的教程原计划是在2月2日发表,但是由于有预约被占用了,因此这个教程也就是往后推迟。我在2月1日将我们的教程发在社群中,**也有同学提出疑问:**单基因也可以做GSEA分析,以及给出自己的疑问?

2024-02-03 14:04:18 1157

原创 一文掌握单基因GSEA富集分析 | gseaGO and gseaKEGG

给定一个排序的基因表L和一个预先定义的基因集S (比如编码某个代谢通路的产物的基因, 基因组上物理位置相近的基因,或同一GO注释下的基因),GSEA的目的是判断S里面的成员s在L里面是随机分布还是主要聚集在L的顶部或底部。这些基因排序的依据是其在不同表型状态下的表达差异,若研究的基因集S的成员显著聚集在L的顶部或底部,则说明此基因集成员对表型的差异有贡献,也是我们关注的基因集。GSEA用来评估一个预先定义的基因集的基因在与表型相关度排序的基因表中的分布趋势,从而判断其对表型的贡献。其输入数据包含两部分,

2024-02-03 14:01:44 1691

原创 R包免费分享 | 你还为下载R包烦恼吗??

在上周,我们在社群讨论。安装R包是个玄学”有时候真的很奇怪,在自己的电脑上就是无法安装,但是在其他电脑都可以正常安装…,不是感到很无语????没有办法,类似的问题,我个人认为不止只有那么几个人遇到,可能所有人都有遇到。当我们遇到这样的问题时,你是如何解决的的呢???一是换网络继续安装(PS:可能无济于事,因为类似这样的问题,网络只是很小的问题);二是从其他电脑中拷贝安装包过来(PS:这个可能是一个不错的办法,但是前提是你手中有其余的电脑,以及可以正常安装);三是关机大法(PS:可能有用,可能无效)。

2024-01-21 16:40:56 771

原创 18G大小的R包 | 将你需要的R包全部下载

那么,我们就想,是否大家可以将所有的R包都下载后,我们就可以直接使用。刚开始,我想建立一个共享文件,大家可以将自己的R包免费上传后,这样有利于R包的多样性,以及可以不停的丰富R包的数量。因此,大家若需要,请尽快下载,早下载早得。原本是很简单的分析,没有办法,类似的问题,我个人认为不止只有那么几个人遇到,可能所有人都有遇到。这个教程,也是我们2021年开始分享时前几个教程,也还是有用的,大家可以在服务器或本地中修改路径使用。(PS:这个可能是一个不错的办法,但是前提是你手中有其余的电脑,以及可以正常安装);

2024-01-21 16:36:48 1078

原创 转录组数据比对教程 | Bowtie2

随着我们教程逐渐发布,我们转录组分析系列教程也逐渐分章节开放。若你有需要,可直接查看转录组上游分析教程[零基础(完)]。个人笔记,可能会出现一些错误!若我们的分享对你有用,希望您可以,这是对小杜最大的支持。Bowtie2和Bwa是用于短reads的比对软件,bowtie2主要用于50-1000bp的reads进行比对,生产SAM文件。在做转录组数据分析前,会过RNA-seq数据中的tRNA等序列,常常使用bowtie2进行过滤。Bowtie2的使用手册。

2024-01-09 15:20:05 832

原创 Bowtie2数据比对教程

Bowtie2和Bwa是用于短reads的比对软件,bowtie2主要用于50-1000bp的reads进行比对,生产SAM文件。在做转录组数据分析前,会过RNA-seq数据中的tRNA等序列,常常使用bowtie2进行过滤。网址:https://sourceforge.net/projects/bowtie-bio/files/bowtie2/,主要发表或收录生物信息学的教程,以及基于R的分析和可视化(包括数据分析,图形绘制等);若我们的分享对你有用,希望您可以。若我们的分享对你有用,希望您可以。

2024-01-09 15:15:43 1202

原创 服务器磁盘挂载及格式化

最近一直折腾组装的电脑,来回折腾了很久关于我花费六千多组了台window+Linux主机,目前基本是可以使用了。对于Windows主机配置基本是没问题,一直在使用,以及桌面化软件,都可以自己安装,只是说这台主机有些软件可能一时半会安装不了(PS:有些软件想不起来需不需要,只有使用时再安装)。此外,就是折腾Linux服务器的配置。我这边的方案是使用VMware虚拟机安装Linux系统,今天有同学留言,说是想使用window中的Ubuntu子系统。

2024-01-04 13:50:44 988

原创 Linux系统硬盘的挂载

对于Windows主机配置基本是没问题,一直在使用,以及桌面化软件,都可以自己安装,只是说这台主机有些软件可能一时半会安装不了(PS:有些软件想不起来需不需要,只有使用时再安装)。但是,我个人感觉这并不是很好的方案,这个子系统有些功能是被阉割的,我们使用虚拟机安装,也是很方便的。但是,我不想弄的这么麻烦,那么直接将操作系统挂载在这个硬盘中,岂不是悠哉,后期使用时不需要考虑自己新建文件位置错误的情况。因此,每次操作,都会做记录。由于是第一次操作,不熟悉,软件未安装,导致格式化不成功,也导致后面的挂载失败。

2024-01-04 13:45:03 956

原创 性价比window+Linux二合一主机

高性价比主机!!

2024-01-03 09:06:17 1164

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除