自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 收藏
  • 关注

原创 【记录】anaconda 打不开spyder

命令行打开spyder报错:ImportError: DLL load failed while importing QtWebEngineWidgets: 找不到指定的程序。...........................ModuleNotFoundError: No module named 'PyQt5.QtWebKitWidgets'解决:pip install --user pyqt5==5.10.1...

2021-09-16 13:37:49 460

原创 sci论文配色-生信论文可视化绘图配色[个人收集]

色彩三要素:色调(色相):色彩的相貌饱和度(纯度):色彩的鲜艳程度亮度(明度):色彩的明亮程度色相选择:互补色:色相环上相对的颜色近似色:色相环上相邻的颜色三色搭配 / 四色搭配颜色空间:RGB:红色(R)绿色(G)蓝色(B)颜色代码(十六进制):#FF0000##HSL 分别表示色调、饱和度和亮度。个人收集在论文中觉得好看的配色,仅供参考双色配色Kaili Fan, et al. Nucleic Acids Research, 2021...

2021-08-13 12:11:59 44261 1

原创 [记录] GWAS Catalog python爬虫

##pyhon代码格式根据tab缩进判断代码块嵌套,注意缩进格式##python爬虫有常用的包(BeautifulSoup)用来解析HTML格式,一般通过标签提取信息。这里我直接强制转为字典格式输出了。import jsonimport requests##打开输入文件(按行读取)f=open('~/snplist.txt')ls=[]for line in f: ls.append(line.replace('\n',''))f.close()##gwas catalog 为异.

2021-05-13 16:18:53 1249

原创 ggplot2绘图实例第一回——生物信息学物种丰度的堆叠图

原图片链接:https://media.springernature.com/full/springer-static/image/art%3A10.1038%2Fs41467-019-11682-z/MediaObjects/41467_2019_11682_Fig1_HTML.png?as=webpR语言绘制结果 ...

2019-10-25 17:53:06 7711 4

原创 R语言课程练习记录

例1.数据大概是这个样子:1)用 readr 包中的函数读取 mouse genes 文件2)选取常染色体的基因3)画以下两个基因长度 boxplot :按染色体序号排列,从 1 开始按基因长度中值排列,从短 -> 长 …遇到的问题:tibble和data frame的区别?tibble不会自动针对每列生成因子分别读入tibble和data frame数据?mouse...

2019-10-10 19:08:50 1381 4

转载 GWAS相关名词解释及基础知识储备[长期更新]

转载自http://www.360doc.com/content/18/1115/16/42030643_795076897.shtml相关名词解释Genome-wide association studies(关联分析):扫描遗传标记,通常是单核苷酸多态性(SNPs),使用统计学相关的手段以发现与性状相关的变异体Complex traits(杂合性状):无论是由多基因和环境因素共同作...

2019-09-18 10:06:19 15224 5

原创 连锁不平衡的计算以及LDSC分析多基因遗传

连锁不平衡(linkage disequilibrium,LD)是指在某一个群体中,不同座位上两个基因同时遗传的频率明显高于预期的随机频率现象,连锁不平衡的程度通常用 r2 来衡量。D是LD的基本单位,度量观察到的单倍型频率与平衡状态下期望频率的计算方法如下:D=P(AB)-P(A)*P(B)P(AB)表示实际观察到的AB频率,P(A)*P(B)表示AB频率的期望值。(如果发生连锁不平...

2019-09-16 12:03:05 13940

原创 进化树构建的方法原理及检验

进化树的构建(1)数据准备目前,构建生命之树常用的数据包括形态数据和分子数据。形态数据主要通过对形态性状编码来获取;分子数据主要通过公共数据库GeBank下载或实验获取。选择合适的DNA片段对系统发育关系重建至关重要。如果所选基因的进化速率太慢,提供的系统发育信息不足, 系统发育关系可能得不到很好的解决;如果所选基因的进化速率太快,正确的系统发育信息常常会被大量的非同源相似信号淹没...

2019-05-30 13:57:31 38470 2

原创 [笔记]基于R的网络抓取和文本挖掘——XPath

XPath:一种网页查询语言XPath最准确的分类是一种特定域语言,其应用领域相对狭窄——专门用于从标记语言文档(类似于HTML或XML)选取信息的有用工具。参考网站:http://www.r-datacollection.com/materials/ch-4-xpath/fortunes/fortunes.html解析文件> library(XML)> parsed_doc<...

2018-06-10 10:35:22 1126

原创 [笔记]python爬虫学习笔记(三)——设置User Agent和代理IP

运行平台:Windows Python版本:Python3.x IDE:Sublime text3参考学习博客:http://blog.csdn.net/c406495762/article/details/60137956有些网站会检测连接对象,以防止网络爬虫访问。设置User Agent可以起到隐藏访问身份的作用。    User Agent存放于Headers中,服务器就是通过查看Heade...

2018-05-12 14:14:47 1068

原创 [笔记]python爬虫学习笔记(二)——向网页发送请求(json)

# -*- coding: UTF-8 -*-import ioimport sysfrom urllib import requestfrom urllib import parseimport jsonsys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding='gb18030') #改变标准输出的默认编码if __name...

2018-05-12 13:19:17 1878 3

原创 [笔记]python爬虫学习笔记(一)——网页的获取和打印

urllib包:处理URL包含模块:urllib.request:打开并读取URLsurllib.error:包含一些有urllib.request产生的错误,可以使用try进行捕捉urllib.parse:包含一些解析URLs的方法urllib.robotparser:解析robots.txt文本文件,它提供了一个单独的RobotFileParser类,通过该类提供的can_fetch()方法测...

2018-05-12 10:25:56 6173

原创 [笔记]R语言爬虫入门——豆瓣新片数据爬取

工具准备chrome浏览器+SelectorGadget插件。SelectorGadget插件:可以从这里(http://selectorgadget.com)访问和下载Selector Gadge的扩展程序。请确保跟随该网站上的指示来安装这个扩展程序。我已经完成了这一步,现在正在使用谷歌chrome,并且可以通过chrome右上角的扩展栏上的这个图标使用它,选择网站所需要的部分就可以获得相关标签...

2018-05-09 10:18:45 8176 6

原创 [整理]统计数据的可视化——图表绘制(一)

类别数据可视化条形图及其变种简单条形图> par(mfrow=c(1,3),mai=c(0.7,0.7,0.6,0.1),cex=0.7,cex.main=0.8)> barplot(count1,xlab = "频数",ylab = "社区",horiz = TRUE,main = "(a)水平条形图",col=2:5)> barplot(count2,xlab = "性别...

2018-05-04 09:38:06 7352

原创 [整理]统计数据的可视化——数据的频数分布

类别数据用sample函数随机生成调查表> opinion<-sample(c("赞成","反对"),20,replace = TRUE)> home<-sample(c("社区A","社区B","社区C"),10,replace = TRUE)> sex<-sample(c("男","女&q

2018-04-30 11:18:15 3821

转载 [转载]R语言中pasta函数基础

pasta函数主要用于字符串的连接Usagepaste (..., sep = " ", collapse = NULL)paste0(..., collapse = NULL)...为需要转化为字符型的对象sep用于指定分隔符,将返回值分割为字符向量collapse也用于指定分隔符,区别于sep,用于将所有的对象连接在一起,并定义分隔符。paste函数sep变量的默认值设置为空格,paste0没...

2018-04-30 10:14:11 843

原创 [笔记]python对FASTA文件的处理

这学期选了生信的选修课—perl/python在生物信息学中的应用把结课作业的代码整理出来主要是python对FASTA文件的读取和数据处理FASTA文件数据处理FASTA文件读取:只含一个基因序列将FASTA文件的基因序列读取到一个列表中,列表中的每个元素为每一行基因序列构成的字符串f=open('/home/miaoyr/perl_practice/test1_file/DTNBP1.fast...

2018-04-27 19:17:06 27726

转载 [转载]R package安装

下载地址:https://cran.r-project.org/web/packages/包名/,如https://cran.r-project.org/web/packages/RODBC/,这个是RODBC软件包的下载地址。可从该网址上找到所有关于包的说明介绍,如reference manual(pdf格式的)等。安装:1.自动安装(在线安装)(1)install.packages("包名")...

2018-04-26 21:49:10 1966

原创 [整理]数据与R

参考资料:统计学——基于R(第二版)/贾俊平著录入数据> #以向量形式录入数据> names <- c("张青松","王宇翔","田思雨","徐丽娜","张志杰","赵颖颖","王智强","宋丽媛","袁芳芳","张建国")> stat &lt

2018-04-22 22:11:36 454

转载 [整理]R-学习笔记-入门

下载及相关准备windows操作系统R下载:https://www.r-project.org/Rstudio下载:https://www.rstudio.com/products/rstudio/download/Linux操作系统 CENTOSR是已经下好了的 Rstudio wget之后是rpm文件 没有root权限不会编译TAT学习书籍推荐:https://xccds1977.blogsp...

2018-04-22 14:35:08 681

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除