自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(26)
  • 收藏
  • 关注

原创 Cell Ranger 细胞分群及差异分析

今天来点干货 说一说Cell Ranger 细胞分群及差异分析软件官网:https://www.10xgenomics.com/company主要使用在10X单细胞测序主要用途:10X单细胞测序分析,是一个很厉害很实用的单细胞测序数据分析软件官方简介:10x Genomics 产品已被世界各地的研究人员采用,包括《自然》杂志 2019 年排名前 100 的所有全球研究机构,以及 2019 年研发支出排名的全球前 20 名制药公司。我们的产品被 2,500 多篇研究论文引用,促成了肿.

2021-09-28 15:10:13 1451

原创 单细胞多样本多平台合并分析(二)

继续上篇文章所做的,接下来进行数据质控使用R语言代码:scRNA <- scRNA3 #以后的分析使用整合的数据进行##meta.data添加信息proj_name <- data.frame(proj_name=rep("demo2",ncol(scRNA)))rownames(proj_name) <- row.names([email protected])scRNA <- AddMetaData(scRNA, proj_name)##切换数据集Default

2021-08-31 10:20:59 3105 3

原创 单细胞多样本多平台合并分析

前言使用工具:R一.下载数据到网站NCBI下载数据我这次选择了两个样本GSM4138111和GSM4138110进行下载, 需要下载下面的三个文件,下载的时候要将文件归类,数据是那个样本的就放到以该样本命名的文件夹中。二.文件改名在使用的时候需要对文件名进行更改,改成如下名字:genes改成features就好如果样本很多,那么改名字就很麻烦了,可以使用以下R语言代码进行批量更改名字:fs=list.files('.文件夹所在位置,'^GSM')library(tidyv..

2021-08-24 17:09:02 8106 8

原创 单细胞和生信前沿知识-SCI文章:人类胸腺发育的细胞图谱定义了T细胞全谱系的形成

文章名:人类胸腺发育的细胞图谱定义了T细胞全谱系的形成发表期刊:Science影响因子:41.0发表时间:2020.02文章摘要:胸腺为T细胞的分化和选择提供了一个培养环境,这一过程由它们与多种胸腺细胞类型的相互作用所协调。我们使用单细胞RNA测序技术创建了人类一生中胸腺的细胞普查,并重建了T细胞分化轨迹和T细胞受体(TCR)重组动力学。使用这种方法,我们原位鉴定并定位了CD8aa+T细胞群、胸腺成纤维细胞亚型和激活的树突状细胞状态。此外,我们揭示了TCR重组和选择的偏差,这归因于基因.

2021-08-18 14:20:28 757

原创 GO/KEGG富集分析与GSEA区别

 概念:GO是基因本体联合会所建立的数据库,旨在建立一个适用于各种物种的,对基因和蛋白质功能进行限定和描述的,并能随着研究不断深入而更新的语义词汇标准。GO 提供了一系列的语义用于描述基因功能的概念/类,以及这些概念之间的关系。KEGG(京都基因与基因组百科全书)是了解高级功能和生物系统,从分子水平信息,尤其是大型分子数据集生成的基因组测序和其他高通量实验技术的实用程序数据库资源,是国际最常用的生物信息数据库之一,以“理解生物系统的高级功能和实用程序资源库”著称。GSEA:基因集富集分析,用

2021-08-17 09:16:40 6433

原创 单细胞-GSEA结果解读

做单细胞富集分析的,大家都应该知道GSEA这个软件吧,但是GSEA分析的结果是一个很复杂的图,大家很难看懂,我在这里给大家说下这个结果图怎么看。这个图分为三个部分第一部分:为基因 Enrichment Score 的折线图,横轴为该基因下的每个基因,纵轴为对应的 Running ES,在折线图中有个峰值,该峰值就是这个基因集的 Enrichemnt score,峰值之前的基因就是该基因集下的核心基因,核心基因就是在单细胞很重要很关键的基因,如果基因在顶部富集,我们可以说,从总体上看,该基

2021-08-12 13:33:58 6501

原创 聊一聊单细胞测序的PCA与TSNE降维

01 PCA PCA 是最常用的降维方法,通过某种线性投影,将高维的数据映射到低维的空间中表示,并期望在所投影的维度上数据的方差最大,以此使用较少的数据维度,同时保留住较多的原数据点的特性。说到这里,大家可能还是对PCA的作用感到有一些模糊,那么大家可以这么想,你有一堆细胞,但是你需要将这些细胞进行分群,但是你又不知道这些细胞如果进行分群的话是按照什么依据进行分群,所以你就需要先使用PCA降维找到细胞分群的主要特点这也就是我们常说的主成...

2021-08-09 16:06:39 4231 1

原创 数据挖掘—GEO,TCGA,Oncomine联合(四)对于下载的原始数据进行处理

系列文章目录数据挖掘—GEO,TCGA,Oncomine联合数据(一)挖掘概述数据挖掘—GEO,TCGA,Oncomine联合(二)GEO在线工具的应用数据挖掘—GEO,TCGA,Oncomine联合(三)GEO数据的下载和数据质量分析前言数据需要:之前所下载的原始数据(下载数据时,最好是cel文件)一、步骤将下载的原始数据进行解压,并分别建立tumor与normal两个文件夹,将属于tumor或者normal的样本分别拖入文件夹中(cel文件拖入)打开R的ide

2021-08-09 15:32:39 2231

原创 数据挖掘—GEO,TCGA,Oncomine联合(三)GEO数据的下载和数据质量分析

系列文章目录数据挖掘—GEO,TCGA,Oncomine联合数据(一)挖掘概述数据挖掘—GEO,TCGA,Oncomine联合(二)GEO在线工具的应用前言要做分析那肯定要下载数据,这下载数据的过程大家肯定都会,但是下载完的数据真的能直接就使用吗?使用工具: R提示:以下是本篇文章正文内容,下面案例可供参考一、数据质量分析有什么用吗?GEO可以对芯片的数据进行管理,但是并不对数据的质量进行监控,所以这就需要我们对所下载的芯片的数据进行质量风险,规避之后做的分析有风险。.

2021-08-06 15:38:09 3481

原创 数据挖掘—GEO,TCGA,Oncomine联合(二)GEO在线工具的应用

系列文章目录数据挖掘—GEO,TCGA,Oncomine联合数据(一)挖掘概述前言GEO在线工具:GEO2R提示:以下是本篇文章正文内容,下面案例可供参考一、GEO2R是什么?是GEO在线分析工具,基于此工具可以对部分GEO样品数据进行基因差异表达分析。该工具主要针对芯片数据,借助R及Limma包完成分析过程,用户只需要在网业上进行简单的点击等手动操作即可获得分析结果二、使用步骤1.对样本数据的搜索,这一过程在单细胞中已经讲过,我们就跳过了如果有不知道的,可以去单细.

2021-08-04 17:21:15 3263

原创 数据挖掘—GEO,TCGA,Oncomine联合数据(一)挖掘概述

数据挖掘​概述:使用计算机技术手段从大数据集中寻找规律的技术,由于大数据具有高价值,低密度的特性所以它的规律并不是很简单就可以看出来的,而是隐含在大数据之中,所以我们需要一定的技术手段进行对我们所需要的数据进行寻找和挖掘。我们在进行疾病分析的时候需要大量的数据进行分析,但是这些数据怎么获得,怎么应用​,怎么作用在我们的研究中,这就需要数据挖掘的作用了。TCGA:是地球上当前最大的肿瘤数据库,有很多的临床信息,可以从临床信息中得出很多有效的数据如癌症的生存率GEO :GEO数据库是一个储存芯片

2021-08-02 14:06:38 3824

原创 数据挖掘—GEO,TCGA,Oncomine联合

这篇文章主要是目录我会分为11篇文章向大家介绍使用GEO,TCGA,Oncomine联合进行数据挖掘目录​:(一)数据挖掘概述(二)GEO在线工具的应用(三)GEO数据的下载和数据质量分析(四)对于下载的原始数据进行处理(五)寻找差异基因及制作热土和火山图(六)GO富集分析(七)KEGG分析(八)蛋白互作网络分析(九)TCGA数据库的数据下载(十)TCGA数据的整理和基因的注释(十一)寻找差异基因和生存率制作我所做的所有分析与教程的代码都会在我的个人公众号

2021-08-02 13:41:35 1033

原创 单细胞分析——为什么要过滤线粒体高表达的细胞和红细胞?

1.线粒体高表达的细胞(1)发生时期:处在凋亡状态或者裂解状态的细胞(2)过滤原因:对于线粒体基因比例过高的细胞,会干扰细胞分群,在分析过程中为了避免这些细胞的影响,通常会根据实际情况设计一个阈值进行细胞的过滤2.红细胞.(1)过滤原因:本身不含有细胞核,携带基因量少,且携带的基因与疾病,生物发育,组织发育并没有太大联系,可以直接剔除就好。...

2021-08-02 13:21:38 5454

原创 生信分析——聚类分析

概念:将物理或者抽象的对象的集合分成有类似的对象组成的多个类或者多个簇的过程被称为聚类。实现过程:1.进行数据预处理(在生信中聚类分析的预处理是使用PCA进行主成分分析)2.进行数据的标准化主要的聚类算法都包括:1.基于划分的的聚类方法(这主要就是生信聚类分析的主要算法):对给定的包含n个样本的数据集,可以将数据划分为k个组,即构成数据的k个划分(与k-means关系?),每个划分表示一个聚簇。要求:(1)每个组至少包括一个对象(2)每个对象必须且仅属于一个组2.基于层次的聚类方

2021-07-30 14:49:53 4239

原创 生信的一些基本知识-p-value和富集分析与BP,CC,MF联系

01—什么是P-VALUE?请用自己的语言简要概括,并举一例子在假设原假设(H0)正确时,出现现状或更差的情况的概率。在生物信息学差异分析的表达图中,p-VALUE代表的是显著差异,p值越小,代表这个基因的表达越显著,举例:H0:硬币均匀,正反出现概率各为1/2。这次实验我们抛10次硬币,发现有8次反面,那么在这里面出现的现状和更差的情况是8,9,10,0,1,2 ...

2021-07-29 15:05:50 31361

原创 单细胞测序流程(十)单细胞的kegg富集分析和圈图(终章)

系列文章目录文章目录 单细胞测序流程(一)简介与数据下载 单细胞测序流程(二)数据整理 单细胞测序流程(三)质控和数据过滤——Seurat包分析,小提琴图和基因离差散点图 单细胞测序流程(四)主成分分析——PCA 单细胞测序流程(五)t-sne聚类分析和寻找marker基因 单细胞测序流程(六)单细胞的细胞类型的注释 单细胞测序流程(七)单细胞的细胞类型轨迹分析单细胞测序流程(八)单细胞的marker基因转化和​GO富集分析 单细胞测序流程(九)单细胞的GO圈图

2021-07-23 13:53:26 9770 5

原创 单细胞测序流程(九)单细胞的GO圈图

系列文章目录提示:这里可以添加系列文章的所有文章的目录,目录需要自己手动添加例如:第一章 Python 机器学习入门之pandas的使用提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录 单细胞测序流程(一)简介与数据下载 单细胞测序流程(二)数据整理 单细胞测序流程(三)质控和数据过滤——Seurat包分析,小提琴图和基因离差散点图 单细胞测序流程(四)主成分分析——PCA 单细胞测序流程(五)t-sne聚类分析和寻找marker基因 单

2021-07-22 13:32:24 5345 2

原创 单细胞测序流程(八)单细胞的marker基因转化和​GO富集分析

系列文章目录单细胞测序流程(一)简介与数据下载单细胞测序流程(二)数据整理单细胞测序流程(三)质控和数据过滤——Seurat包分析,小提琴图和基因离差散点图单细胞测序流程(四)主成分分析——PCA单细胞测序流程(五)t-sne聚类分析和寻找marker基因单细胞测序流程(六)单细胞的细胞类型的注释单细胞测序流程(七)单细胞的细胞类型轨迹分析————————————————本期主讲内容——单细胞的maeker基因转化和​富集分析marker基因转化是为了将基因的id和基.

2021-07-21 14:53:02 9012

原创 单细胞测序流程(七)单细胞的细胞类型轨迹分析

系列文章目录单细胞测序流程(一)简介与数据下载单细胞测序流程(二)数据整理单细胞测序流程(三)质控和数据过滤——Seurat包分析,小提琴图和基因离差散点图单细胞测序流程(四)主成分分析——PCA单细胞测序流程(五)t-sne聚类分析和寻找marker基因单细胞测序流程(六)单细胞的细胞类型的注释本期主讲内容——单细胞的细胞类型轨迹分析可以看到细胞的分化从哪里开始,从哪里终止,会分化出什么类型的细胞,或者细胞亚群的分化​。一、课前准备之前所使用的数据(上个视频中运行.

2021-07-20 14:45:45 8334 4

原创 单细胞测序流程(六)单细胞的细胞类型的注释

系列文章目录单细胞测序流程(一)简介与数据下载单细胞测序流程(二)数据整理单细胞测序流程(三)质控和数据过滤——Seurat包分析,小提琴图和基因离差散点图单细胞测序流程(四)主成分分析——PCA单细胞测序流程(五)t-sne聚类分析和寻找marker基因本期主讲内容——单细胞的细胞类型的注释课前了解:GO:是一个数据库,旨在建立一个适用于各种物种的,对基因和蛋白质功能进行限定和描述的,并能随着研究不断深入而更新的语义词汇标准。GO 提供了一系列的语义用于描述基因功能,以及这些.

2021-07-14 14:18:09 20642 9

原创 单细胞测序流程(五)t-sne聚类分析和寻找marker基因

系列文章目录单细胞测序流程(一)简介与数据下载单细胞测序流程(二)数据整理单细胞测序流程(三)质控和数据过滤——Seurat包分析,小提琴图和基因离差散点图单细胞测序流程(四)主成分分析——PCA本期主讲内容——t-sne聚类分析和寻找marker基因介绍:T-SNE是一种用于探索高维数据的非线性降维算法。它将多维数据映射到适合于人类观察的两个或多个维度。一、课前准备之前所使用的数据R语言的IDE二、过程聚类分析的目的是根据细胞的差别所进行细胞分群,两个..

2021-07-13 13:49:54 21517 14

原创 单细胞测序——基本知识

出这个篇章的原因是因为可能大家对单细胞测序中的一些基本知识并不了解,所以在此做一些补充单细胞测序平台常用的测序平台有三个1.Single Tube人工操作法原理:在完成单个细胞的分选后,进行mRNA全长扩增及建库,完成单细胞样本的上机测序分析。优点:对样本需求量较低,可从实验的开端判断细胞状况;基因检出率高。缺点:人工技术要求较高;通量低、成本较高适用范围:微量细胞样本,适用于深入研究2.微孔板技术平台原理:利用大量的微孔完成细胞的捕获,随后进行单细胞转录组文库的构建。加入带有barcod

2021-07-12 11:09:41 8744

原创 单细胞测序流程(四)主成分分析——PCA

PCAPCA:线性降维,主要用于数据少的时候使用。看结果的时候,看打分的绝对值大小,而不是单独的看数据的大小,PCA 是最常用的降维方法,通过某种线性投影,将高维的数据映射到低维的空间中表示,并期望在所投影的维度上数据的方差最大,以此使用较少的数据维度,同时保留住较多的原数据点的特性。准备之前所使用的数据R的IDE分析目的为以后的细胞分群做准备,以及t-sne聚类分析。结果散点图,横坐标为打分的值,打分的值的绝对值越大,代表相关性越大,每个pc,选取的是前20个基因,根据系数可以绘制后面的

2021-07-08 11:19:29 16537 1

原创 单细胞测序流程(三)质控和数据过滤——Seurat包分析,小提琴图和基因离差散点图

质控和数据过滤准备工具:R。准备数据:上期经过整理的数据geneMatrix。注意事项:R的安装目录和文件所在位置都不可有英文。R 语言所需安装的包:#if (!requireNamespace("BiocManager", quietly = TRUE))# install.packages("BiocManager")#BiocManager::install("singscore")#BiocManager::install("GSVA")#BiocManager::insta

2021-07-07 09:29:20 16605 16

原创 单细胞测序流程(二)数据整理

**数据整理**准备数据:之前所下载的样本数据将之前所下载的样本数据进行解压,使用excel将文件打开发现所下载样本有两种情况,一,有基因名,二,无基因名,只有基因id一,有基因名1.使用excel将文件打开所下载的样本发现第一行为样品名,第一列为基因名,需要滑到最后将注释信息删掉。2.将excel滑到顶端,发现样品名和基因名重叠了,需要将样品名全部向后移动一位,并将第一行第一列的位置命名为id移动前移动后3.从数据末端开始往上移动复制全部内容(不要直接ctrl+a,会将没用的空格也

2021-07-06 16:06:19 9734 5

原创 单细胞测序流程(一)简介与数据下载

**简介**单细胞测序:单细胞测序从宏观来讲是指在单个细胞水平上进行测序。单细胞转录组测序是指对于单个细胞水平上将mRNA反转录扩增后进行高通量测序的技术。单细胞测序通过在单个细胞水平上进行测序,解决了用组织样本无法获得不同细胞间的异质性信息或样本量太少无法进行常规测序的难题,为科学家研究单个细胞的行为、机制等提供了新的方向。``单细胞测序基本步骤:对所选择的单细胞进行分离→扩增→进行高通量测序→使用生物信息学技术进行数据分析。数据下载进入NCBI GEO网站:https://www.ncbi

2021-07-06 14:41:37 14555 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除