自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(46)
  • 收藏
  • 关注

原创 梳理系统学习R语言1-R语言实战-使用ggplot进行高阶绘图

以下为书中代码,会添加一些理解。

2023-08-24 21:51:53 1025

原创 队列数据分析积累-1

队列数据分析

2023-07-28 09:12:34 777 1

原创 记录一些网址

记录常用的网址

2023-03-30 10:16:54 202

原创 小鼠与人类ID转换

发现一个好用的R包,homologene之前用的包是biomart,不好用,老是连不上网

2022-12-03 23:08:24 675 2

原创 按照分组筛选一组中最小值 tidyverse 包

tidyverse包功能很多,目前用到的就这个。根据name分组,计算不同组的最小值。

2022-11-19 10:11:50 155

原创 记录一下TwoSampleMR安装

虽然有些问题仍然没有解决,但是如果以后再遇到这种github包安装的时候可以借鉴相同思路。为什么要记录TwoSampleMR的安装过程呢?因为这个包足足安装了1个半小时。有帖子说可以用httr包修改代理,但我实在不懂代理是个啥,所有就放弃这个方法了。还是有一些没有解决的问题,比如。安装完依赖包后最后成功。

2022-11-05 16:14:52 6210 3

原创 使用百度网盘上传大文件到云服务器

因为需要把几个7G大小左右的数据上传至服务器,但无奈使用的是共享服务器,上传速度非常慢。管理员建议可以用奶牛快传(目前收费)中转,百度搜了一下,百度网盘有相同作用,正好有会员,就使用了百度网盘来传,速度是几M/s。因为用的是conda,bypy用conda安装不了,需要用pip安装,又创建了一个新环境,用于下载数据(不然后面安装包可能会有的冲突)。参考文章及视频:https://www.jianshu.com/p/4695e09b14ac。先进入服务器下载数据的文件夹下,进行下载。

2022-10-21 10:06:06 1059

原创 使用dplyr包排序

【代码】使用dplyr包排序。

2022-09-17 22:33:09 294

原创 创建conda环境时遇到以下错误: Found conflicts! Looking for incompatible packages.(包含conda卸载)

创建conda环境时遇到以下错误:之前没有遇到过这种问题,在网上搜索了一些帖子尝试升级和降级conda版本都没能解决。有一个帖子说可能是之前用pip安装过软件(具体链接找不到了=_=),与conda有冲突,需要重新安装conda先卸载再重新安装。

2022-09-12 08:56:22 6887 1

原创 ANACONDA中复制安装包命令行

发现有的时候conda安装包安装不上,但是在ANACONDA中复制命令就可以啊。

2022-09-11 20:24:43 305

原创 prefetch下载sra数据报错

奇怪的是加了后缀.sra后可以顺利转,但是之前没有遇到过,觉得不大确定这个数据是否是对的,还是想知道为什么下载不正常,通过搜索发现别人是通过更新sratools包解决的。昨天晚上使用sratools下载sra数据出现报错,之前一直能够顺利下载,检查网络连接后也没能解决。果然,重新下载sratools包后得以解决这个问题,虽然这个报是六个月前更新的。但是在将sra数据转成fastq数据的过程又出现问题。希望对遇到相同问题的童鞋有帮助。whatever,总算解决。

2022-09-06 10:21:36 3578 5

原创 R write.table()不输出行名1,2,3

write.table()不输出行名1,2,3。加参数row.names = FALSE,

2022-08-28 17:50:28 1169

原创 NCBI与其他网站基因转换

参考:http://t.zoukankan.com/djx571-p-10263640.html下载info网址:http://t.zoukankan.com/djx571-p-10263640.html

2022-06-22 00:06:01 642

原创 用R语言进行筛选数据

对于大数据,linux和python是很好的处理工具,但是对于这两个语言不熟悉的盆友来说,R语言是非常好的替代工具最近发现了一个很好用的R包tidyr,可以根据符号将文件中的列分割为多列,比如还有subset(),也非常实用,可以非常轻松地筛选行与列...

2022-06-21 09:20:33 6412

原创 annovar与VEP对SNP进行位置注释

VEP与annover

2022-06-13 16:05:37 1136

原创 conda常用命令(持续更新)

#删除创建的环境conda remove -n hicpro --all#安装包出现Solving environment: failed with initial frozen solve. Retrying with flexible solve问题conda update -n base condaconda update --all#查看环境中已经创建的conda info --envs

2022-06-04 15:42:40 116

原创 HIC-pro安装经验帖

HIC-PRO安装经验帖

2022-06-04 15:26:17 410

原创 crossmap转换坐标(liftover也可以,不过我只用它转换过bed文件)

在创建的python环境下进行conda activate test_py3安装conda install crossmap检查是否可以使用CrossMap.py -h下载chain文件https://pythonhosted.org/CrossMap/示例CrossMap.py bigwig hg38ToHg19.over.chain.gz GSM4950768_KYSE30_2_4.normalized.bigWig KYSE30_2_4_hg38.bigwig#基本格式p

2022-05-19 15:54:09 698

原创 mac版 IGV(版本2.12.3)安装

安装了近2个小时,一直出现的问题就是没有报错,就是点图标无反应,一度想放弃,但终于柳暗花明!之前电脑安装过,但因为电脑之前升级, 基本格式化, 之前的软件环境都没了网上搜解决方法未果. 因为软件应该没问题,就考虑是Java的问题. 最开始安装的Java8(比较久版本的IGV对应version 8), 点图标无反应; 配置环境变量后仍不行, 考虑可能是Java版本的问题, 搜IGV官网也没有说明具体对应的是哪个版本的, 是在老版本的页面发现的需要提前安装Java, 最新版的IGV需要Java11, 官

2022-04-26 21:25:56 1688

原创 conda安装idr出现SOLVING ENVIRONMENT: FAILED WITH INITIAL FROZEN SOLVE. RETRYING WITH FLEXIBLE SOLVE的解决

conda安装idr出现SOLVING ENVIRONMENT: FAILED WITH INITIAL FROZEN SOLVE. RETRYING WITH FLEXIBLE SOLVE的解决借鉴https://blog.csdn.net/qq_32480989/article/details/122880450https://blog.csdn.net/hhhhhhhhhhwwwwwwwwww/article/details/112726892https://blog.csdn.net/qq_3

2022-04-26 16:21:03 319

原创 chipseeker注释出现Error in (function (classes, fdef, mtable) : unable to find an inherited method fo

chipseeker注释出现Error in (function (classes, fdef, mtable) : unable to find an inherited method for function ‘NSBS’ for signature ‘“SortedByQueryHits”’错误如下:上网搜了一圈未果,试了TxDb.Mmusculus.UCSC.mm10.knownGene包是可以的,觉得还是出在txdb上,因此查看了txdb,染色体号没有加“chr". 修改文件的染色体号

2022-04-13 12:59:22 3396

原创 featurecount 计数reads

conda install subreadhttps://www.jianshu.com/p/4f2112a2c219https://wenku.baidu.com/view/92c5ecf95322aaea998fcc22bcd126fff7055dcb.htmlfeatureCounts -T 5 -p -t exon -g gene_id -a Mus_musculus.GRCm38.102.gtf.gz -o A1_count.txt A1_1_sorted.bam

2022-04-13 12:03:59 420

原创 甲基化位点整理代码

甲基化差异分析DSS包使用之前的数据整理代码这个文件是Bismark鉴定后的stat文件,目前我用的不是这个文件(是Bismark去重后的文件)以下是前期处理的代码,思想是可以借鉴的BiocManager::install(version = "3.14")BiocManager::install("DSS")BiocManager::install("bsseq",force = TRUE)install.packages("stringr")install.packages("tidyve

2022-04-06 08:42:26 651

原创 mac pro 13.3从Monterey降到Catalina记录帖

上周因为IGV打不开,加上下载不了colorSlup(11.0以上的系统),就从Catalina升级到了Monterey,升级之后发现vmvare使用不了,目前没有版本适用,微信也打不开,就计划要降回去通过咨询朋友,看帖子,看b站视频,最开始是计划用U盘先下载,然后再安装,之后看到官网有shift+option+Command+R可以回电脑自带系统就决定用联网的方式当时因为想保留软件,还去看了时间机器,咨询apple支持说这一想法不可行,由高版本系统到低版本降级,软件在低版本上即使能保留,会出现不能正常

2022-03-09 20:14:35 6577 3

原创 下载SNP周围的氨基酸序列的fastq文件

首先在ensembl中确认SNP在蛋白上的位置;然后在NCBI上打开这个蛋白的序列,选择SNP所在位置的上下游,即可下载NCBI上如何打开蛋白的序列,可以参照这个百度经验https://jingyan.baidu.com/article/ac6a9a5e11075c2b653eac22.htmlOK!...

2022-02-08 22:24:08 498

原创 虚拟机使用小tips

今天用虚拟机装seqmap包,用conda装,然后第一步就一直报错Collecting package metadata (current_repodata.json): failedCondaHTTPError: HTTP 000 CONNECTION FAILED for url...本来以为是校园网太慢,切换手机热点也不行上网查这个原因,竟然还有遇到一样的错误的后来猛然想起来,很久没有关过虚拟机了,中间电脑断过网看虚拟机的网络连接状态,果然没有连接。。。原来是虚拟机没联网!!!电脑断

2022-01-22 23:05:47 866

原创 R语言 by()用法

今天在学习GEO数据分析时,看到以下代码,看了几遍解读,还是不懂,究其原因是不会by()的用法,在网页上搜了一下,在github上看到一个比较详细的解释。果然这种还是要有例子tmp = by(exp_id, ids$symbol, function(x) rownames(x)[which.max(rowMeans(x))])使用的是R自带的数据warpbreaks,大家如果对这个by函数不理解的话,也最好看着下面的例子操作一下示例1:对warpbreaks这

2022-01-20 20:59:20 3039 1

原创 bedgraph文件转bigwig文件

在linux下直接安装bedgraphtobigwig,fetchchromsizes,bedclip,由于对环境变量理解不够清楚,总是出错,主要我不知道这些软件的安装位置,使用which,whereis也没有找到,搞了非常久,最后决定先用conda安装conda create -n ucsc -c bioconda ucsc-bedgraphtobigwigconda activate ucscconda install -c bioconda ucsc-bedgraphtobigwigconda

2021-11-17 14:46:37 3601

原创 记录常用的R语言的一些零碎知识(包括ggplot2作图)

平常使用R的时候,会遇到一些小问题,这时就会去上网查,但查到结果,如果不记录起来,常常会遇到相同的问题时再次查询,费时费力,因此决定记录下这些零碎的R语言知识(不定时更新)1.查看R版本号version2.输出的txt文件去掉第一列1,2,3…在输出的参数加上row.names=F........................

2021-10-03 18:21:02 908

原创 2021-08-25用ensembl下载小鼠与人的对应文件

需要将小鼠与人的基因名进行转换,使用biomart出现一些重复值,不好用,所以用ensembl下载

2021-08-25 23:36:59 521 1

原创 set.seed()

#set.seed() 随机种子数https://blog.csdn.net/vencent_cy/article/details/50350020t-SNEhttps://zhuanlan.zhihu.com/p/62275210

2021-05-26 13:38:19 95

原创 单细胞测序两组差异分析—seurat包

尝试使用seurat包进行两组间差异分析使用的是seurat包自带的数据#首先载入需要的包library(Seurat)#安装seurat-data包install.packages('devtools') library("devtools")devtools::install_github('satijalab/seurat-data')library(SeuratData)library(patchwork)安装数据集# install datasetInstallData

2021-05-20 09:50:53 23660 7

原创 TCGA_RNA-seq_limma分析

limma分析的大致流程导入read count, 保存为专门的对象用于后续分析原始数据过滤,根据标准化read count 或者 raw count 作为筛选标准raw read count 标准化通过各种算法(如经验贝叶斯,EM)预测dispersion离散值广义线性模型拟合数据差异分析,也就是统计检验部分rm(list=ls())library(limma)genesymbol<-read.delim("/Users/Desktop/ESCC_RNA_count_data/

2021-05-15 20:20:32 2097

原创 RNA-seq分析_edgeR代码整理总结

library(edgeR)#表达矩阵genesymbol<-read.delim("/Users/Desktop/ESCC_RNA_count_data/ESCC_count_cancer_expression.txt",header = TRUE,check.names = F)#样本信息condition<-read.delim("/Users/Desktop/ESCC_RNA_count_data/clinical merge.txt",header=TRUE)#对重复的基因名

2021-05-15 10:57:09 1399

原创 单细胞测序分析软件包_seurat使用笔记

本笔记主要参考https://www.jianshu.com/p/75c6d55a63bb?from=timeline主要是为了理清思路,记录一下,方便以后查找Seurat软件介绍导入分析需要的包library(Seurat)library(dplyr)library(magrittr)读入矩阵#matrix.mtx, genes.tsv, and barcodes.tsv#使用Read10X函数读取矩阵数据pbmc.data <- Read10X(data.dir = "..

2021-05-13 20:53:04 7827 1

原创 RNA-seq分析_DEseq2代码整理总结

#首先整理TCGA基因表达矩阵,在肿瘤样本,有一个样本既有原位癌也有转移数据,要删去肿瘤转移表达数据rm(list=ls())library(DESeq2)library(limma)读入表达矩阵与样本信息,并查看表达矩阵与样本信息genesymbol<-read.delim("/Users/Desktop/ESCC_RNA_count_data/ESCC_count_cancer_expression.txt",header = TRUE,check.names = F)conditi

2021-05-13 14:03:47 1863

原创 clusterprofile进行ID转换

之前用的比较多的biomart这里记录一下clusterprofile的ID转换功能#查看支持的ID转换类型keytypes(org.Hs.eg.db)#转换IDgeneid<-bitr(rownames(expr), fromType='ENSEMBL', toType='SYMBOL', OrgDb='org.Hs.eg.db', drop = TRUE) #去除空值geneid#注释ID#挑出表达文件中数据库中有的基因的所有行expr = expr[ rownames(ex

2021-05-12 20:57:31 1653

原创 R语言笔记_lapply与apply

lapply与apply是R中循环语句apply(a,1,function(x)) 对每一行执行命令,并返回结果;apply(a,2,function(x)) 对每一列执行命令,并返回结果;lapplylapply(a,1,function(x)) 指定的函数对列表中每一个向量执行命令,并返回结果;...

2021-05-10 21:49:13 879

原创 RNA-seq FPKM&RPKM&TPM的介绍区别

一直以来对这几个概念都很混淆,今天发现了一个好帖子,讲的很仔细,总结下来就是:FPKM,RPKM和TPM均是根据测序深度及基因长度标准化的测序数据其中,FPKM,RPKM计算方法一样,先进行测序深度标化,再进行基因长度标化;TPM先进行基因长度标化,再进行测序深度标化TPM数值能体现出比对上某个基因的reads的比例,该数值可以直接进行样本间的比较。详细的帖子如下:http://www.360doc.com/content/18/0112/02/50153987_721216719.shtml

2021-05-10 21:31:09 2029

原创 安装diffbind

之前"diffbind"安装成功后,因为一些原因卸掉后再安装出现依赖包"biomart"一直安装不上但是没有找到原因,就隔了段时间,重新安装,按照报错提示一个包一个包安装,最后终于按上,可能跟网速有一定的关系吧...

2021-02-06 21:30:55 943

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除