自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(86)
  • 资源 (16)
  • 收藏
  • 关注

原创 【DimPlot】【FeaturePlot】使用小tips

【DimPlot】【FeaturePlot】使用小tips

2024-03-10 16:08:29 1887

原创 【FindAllMarkers】Seruat鉴定差异表达基因的方法与P值的理解

为什么用校正后的P值

2024-03-10 15:13:12 1986

原创 【OrthoFinder】直系同源基因分析工具

它是一个快速、准确和全面的比较基因组学工具。可以找到直系同源基因群和直系同源基因,为所有直系同源基因群推导出有根的基因树,并确定这些基因树中的所有基因复制事件。它还为被分析的物种推导出有根的物种树,并将基因树上的基因复制事件映射到物种树的分支上,为比较基因组分析提供全面的统计数据。它使用简单,运行它所需要的只是一组FASTA格式的蛋白质序列文件(每个物种一个)它与其他直系同源推断软件不同,OrthoFinder使用基因树。这意味着你可以在它所来自的基因树中检查每个直系同源关系。

2024-03-03 19:40:00 769

原创 【 10X summary report】怎么看?详细解读笔记

在开始正式的分析之前,需要查看在对齐和计数过程中生成的任何总结统计信息。下图是由Cell Ranger工具创建的10X总结报告,在从10X scRNA-seq实验生成计数矩阵时会生成。下图为本人使用CellRanger V5.2.0对语一个单细胞数据跑出的结果。

2024-03-03 12:32:45 812

原创 【降维算法UMAP】调参获得更适合的低维图

为什么要降维:单细胞转录组数据往往是数千*数万(细胞数*基因数)的矩阵数据,降维可以帮助可视化和理解大型高维数据集。降维算法:在单细胞转录组生信分析中,常见的降维算法有两种,UMAP和T-SNEUMPA运算速度会更快,并且在保留数据结构的同时提供了更好的扩展性。UMAP的主要步骤学习高维空间中的流形结构找到该流形的低维表示,优化低维图。

2024-03-03 12:20:46 1892

原创 【AUCell打分】:评估一个基因集在单细胞转录组的每个细胞中特定的活性程度

AUCell使用曲线下面积来计算输入基因集的一个有意义的基因子集是否在每个细胞的表达基因中富集。AUC 分数在所有细胞中的分布允许探索特征的相对表达。由于评分方法是基于排名的,因此 AUCell 与基因表达单位和归一化程序无关。此外,由于细胞是单独评估的,因此可以很容易地应用于更大的数据集。

2024-02-28 23:29:36 737

原创 【R包报错】使用sceasy包转换rds文件与h5ad文件报错PyType_GetFlags

【代码】【R包报错】使用sceasy包转换rds文件与h5ad文件报错PyType_GetFlags。

2024-02-28 23:04:43 466

原创 机器学习笔记(8)——数据预处理&特征工程

机器学习笔记(8)——数据预处理&特征工程1. 数据预处理1.1. 数据无纲量化1.2.缺失值1.3. 处理分类型特征1.4.处理连续型特征2. 特征选择2.1.过滤法fliter2.1.1方差过滤2.1.2卡方过滤2.1.3选取超参数K过滤2.1.4F检验过滤2.1.5互信息法过滤2.2.embedded嵌入法2.3.wrapper包装法

2022-05-20 13:39:35 1012 2

原创 机器学习笔记(7)——决策树&随机森林代码

机器学习笔记(7)——决策树&随机森林代码本文部分图片与文字来源网络或学术论文,仅供学习使用,持续修改完善中。目录机器学习笔记(7)——决策树&随机森林代码1、决策树python写决策树sklearn实现决策树分类器sklearn实现决策树回归器2、随机森林sklearn实现随机森林分类器sklearn实现随机森林回归器sklearn用随机森林回归填补缺失值1、决策树决策树(Decision Tree)是一种非参数的有监督学习方法...

2022-05-02 12:04:37 2445

原创 机器学习笔记(6)——线性回归&逻辑回归

1、线性回归西瓜书线性回归代码sklearn实现一元线性回归sklearn实现多元线性回归线性判别分析LDA2、逻辑回归损失函数sklearn实现逻辑回归鸢尾花数据集做逻辑回归

2022-05-01 18:40:52 1275

原创 HTML+PHP搭建一个生物数据增删查改网站

使用HTML+PHP搭建一个生物数据增删查改网站,包含说明文档和代码介绍

2022-03-28 16:09:12 977

原创 R语言可视化【ggplot2】

ggplot实现各种图形:类别比较:柱形图类别比较:条形图类别比较:克利夫兰点图类别比较:南丁格尔玫瑰图数值关系:散点图数值关系:气泡图数值关系:三维散点/气泡图数值关系:瀑布图数值关系:峰峦图数值关系:相关系数图数值关系:韦恩图数据分布:直方图数据分布:核密度估计图局部整体:直方图/密度图数据分布:散点分布图数据分布:柱形分布图数据分布:箱形图数据分布:小提琴图、雨云图数据分布:显著性标签的箱形图

2022-03-20 20:50:11 16326

原创 【生信】全基因组关联分析(GWAS)原理

【生信】全基因组关联分析(GWAS)1.前提知识介绍1.1 最小二乘法1.2 GWAS的数学原理1.3 Hardy-Weinberg定律&卡方检验1.4 连锁不平衡1.5 曼哈顿图1.6 箱式图Box-plot1.7 QQ plot2、GWAS的定义2.1 几个需要知道的概念:2.2全基因组关联分析3、GWAS——数据预处理3.1质控的原因:3.2基因型数据的质控:3.4表型数据质控:3.5正负链翻转3.6 基因型填补3.7群体分层校

2022-03-12 18:53:01 47957 10

原创 【生信】全基因组测序(WGS)

1、全基因组测序(WGS) 的定义2、GWS流程2.1准备工作——分析软件2.2原始数据质控2.3数据预处理2.4变异检测

2022-03-07 21:30:38 31567

原创 【生信MOOC】生物序列比对工具——多序列比对

【生信MOOC】生物序列比对工具2——多序列比对1、多序列比对的定义和用途2、多序列比对的要求3、多序列比对工具——EMBL - Clustal Omega4、多序列比对工具——EMBL - TCOFFEE - Expresso5、多序列比对的保存格式6、多序列比对结果编辑——jalview7、寻找保守区域:序列标识图 WebLogo8、寻找保守区域:序列基序 MEME9、寻找保守区域:PRINTS 指纹图谱数据库

2022-03-05 17:16:57 16111 5

原创 【生信MOOC】生物序列比对工具

1、需了解的背景知识2、替换计分矩阵核酸替换计分矩阵蛋白质替换计分矩阵3、序列比对方法(1)打点法(2)两两序列比对算法4、在线序列比对工具EMBL 全局双序列比对工具Biotools 的双序列比对工具

2022-03-04 13:54:28 5531

原创 【生信MOOC】生信数据库2

1、一级蛋白质序列数据库:UniProt 数据库2、一级蛋白质结构数据库:PDB数据库3、二级蛋白质结构数据库:结构域家族数据库Pfam4、二级蛋白质结构数据库:结构分类数据库CATH5、二级蛋白质结构数据库:结构分类数据库SCOP26、专项数据库:京都基因与基因组百科全书KEGG

2022-03-03 17:23:51 3221

原创 【生信MOOC】生信数据库1

1、认识生物数据库装载的内容2、生物数据库的分类3、文献数据库——PubMed4、一级核酸数据库——NCBI的Genbank数据库4.1——大肠杆菌dUTPas(脱氧尿苷焦磷酸酶)X01714的DNA序列4.2——编码人dUTPase的成熟mRNA序列U902234.3——编码人dUTPase的dut基因序列。序列AF0184305、一级核酸数据库——基因组数据库Ensemble6、一级核酸数据库——微生物宏基因组数据库JCVI7、二级核酸数据库

2022-03-01 20:32:28 4281

原创 HTML学习笔记

HTML学习笔记1.简介HTML 指的是超文本标记语言:HyperTextMarkupLanguage。HTML 不是一种编程语言,而是一种标记语言(标记语言是一套标记标签(markup tag))<!DOCTYPE html>声明为 HTML5 文档 <html>元素是 HTML 页面的根元素 <head>元素包含了文档的元(meta)数据,如<meta charset="utf-8">定义网页编码格式为utf-8...

2022-03-01 11:08:03 637

原创 【CentOS 7 64位】linux常用命令补充

【CentOS 7 64位】linux常用命令补充1、进程处理命令-ps命令-kill命令2、字符串处理命令-echo命令-grep命令

2022-02-10 15:53:02 187

原创 【生信】生物序列比对

1、生物序列比对介绍2、序列比对算法基于全局匹配的算法(1)打分矩阵(2)动态规划算法(3)Needleman-Wunsch算法基于局部匹配的算法Smith-Waterman算法Smith-Waterman算法与Needleman-Wunsch算法的区别启发式搜索算法BWT((Burrows–Wheeler_transform))算法3、多序列比对介绍

2022-02-09 16:57:33 7578

原创 【生信】常见测序数据格式

【生信】常见测序数据格式1、FASTA2、FASTQ3、GFF4、BED5、SAM/BAM6、VCF

2022-02-05 11:34:01 7801

原创 【生信】基因组学中的统计学应用

【生信】基因组学中的统计学应用

2022-02-03 21:07:05 3062

原创 【生信】统计学基础知识

【生信】统计学基础知识本文图片来源网络或学术论文,文字部分来源网络与学术论文,仅供学习使用。

2022-02-03 20:26:21 2551 2

原创 【生信】基因组学相关基础知识2

【生信】基因组学相关基础知识2

2022-02-03 15:31:50 2378

原创 【生信】基因组学相关基础知识1

【生信】基因组学相关基础知识1

2022-02-03 14:40:30 3123

原创 【CentOS 7 64位】Linux无法联网问题

【CentOS 7 64位】Linux无法联网问题

2022-01-29 13:34:29 2660

原创 【CentOS 7 64位】linux文件系统&命令行操作

【CentOS 7 64位】linux文件系统&命令行操作

2022-01-19 18:37:34 2206

原创 【non-coding RNA】 非编码RNA有哪些?

【non-coding RNA】 非编码RNA有哪些?

2022-01-04 16:35:37 7726

原创 机器学习笔记(5)——模型评价指标

机器学习算法评价指标:精确率、召回率、准确率、错误率、F1值、PR曲线、ROC曲线、AUC值

2022-01-04 12:42:22 3608

原创 【书籍】Writing Science How to Write Papers That Get Cited and Proposals That Get Funded阅读小结

Writing Science How to Write Papers That Get Cited and Proposals That Get Funded阅读小结

2021-12-31 12:29:09 892

原创 基因组学两个理念:生命是序列的;生命是数字的。

基因组学是研究基因组的科学,基因组学两个最主要的理念:生命是序列的!生命是数字的!

2021-12-31 12:11:34 981

原创 【生信】第一二三代测序技术原理的理解

作为生信初学者,对基因测序第一、二、三代测序技术的梳理和了解,详细介绍了几个广泛应用的测序技术原理如sanger测序和illumina测序等,仅供学习使用。

2021-12-31 12:01:47 13908 2

原创 【不想读paper的时候看看】阅读文献?

【不想读paper的时候看看】为何阅读文献?最近看了中国科学院大学(国科大/果壳)图书馆对我们一年级集中教学的同学关于图书馆资源与服务的培训PPT,我截取了一些较有感触的slides做一下笔记。

2021-12-28 14:31:35 614

原创 RNA编辑基本形式与相关技术的研究现状(阅读小结)

摘要:生物学的中心法则定义了遗传信息从DNA到RNA再到蛋白质的流动,通常RNA分子通常会准确地遵循其转录基因的序列。但转录后的RNA在编码区可能会发生碱基的加入、丢失或转换等现象,这导致了不同于其DNA模板的RNA产物的产生。RNA编辑是与细胞中功能基因mRNA中核苷酸的修饰有关的基本生化过程。近年来在动植物细胞的RNA编辑研究中都取得了显著的进展。RNA编辑研究对象多为动物细胞的细胞核和线粒体,或者植物细胞的线粒体和叶绿体,RNA编辑也是增加基因转录和功能多样性的重要形式[1]。而RNA编辑位点的预测是

2021-09-09 12:09:30 1602

原创 RNA editing restricts hyperactive ciliary kinases文章翻译

关于MOLECULAR BIOLOGY杂志在2021年6月26日发表的一篇RNA editing restricts hyperactive ciliary kinases文章的翻译前言白驹过隙,不知不觉我的码龄竟然也有四年了。目前,博主正在中国科学院大学雁栖湖校区进行研一的学习,是的,我跨专业保研了,研究生的方向是生物信息分析。与此同时,我也决定慢慢把写博客的习惯捡起来,往后的方向也会侧重生物信息方向的知识记录。刚刚开学两周,要重新学习生物方面的知识,我觉得是很有难度的,特别是深入之后发现生物信息

2021-09-09 12:07:47 608 1

原创 R语言4——字符串&列表&矩阵&数组

R语言4——R的数据类型2目录R语言4——R的数据类型21、字符串1.1 在字符串的语法中,单引号和双引号不能混用1.2 字符串连接函数——paste()函数1.3 字符串格式化函数——format()函数1.4字符串计算长度函数——nchar()函数1.5大小写转换函数——toupper()&tolower()函数1.6截取字符串函数——substring()函数2、列表3.矩阵1、创建矩阵函数——matrix()函数2、转置矩阵函数——t...

2020-11-01 10:43:39 4057

原创 R语言3——判断&循环

R语言3——R中的语法1.R中的判断结构ifif...elseswitch 语句x <- c(1,2,3,4,5)if(2 %in% x ){ print("2 in x")}else{ print("2 not in x")}if(2 %in% x ){ print("2 in x")}else if(6 %in% x ){ print("6 in x")}else{ print("6 not in x")}a <- swit.

2020-10-31 11:34:07 3267

原创 R语言2——数据类型和基本运算

R语言2——数据类型和基本运算目录R语言2——数据类型和基本运算1.R的数据类型1.R的数据类型(1)Logical(逻辑型):只有两个值TRUE, FALSE(2)Numeric(数字):整数、小数等(3)Complex(复合型):带有虚数i的数,如1+ 2i(4)Character(字符):包含在“ ”之中,如“hello!”(5)Vectors向量:c()函数,将元素组合成一个向量。c(1,2,3,4)(6)Lists列表:list()内容包含许多不同类型的元.

2020-10-25 22:48:00 2130

原创 R语言1——R的安装和相关介绍

R语言1——R的安装和相关介绍目录R语言1——R的安装和相关介绍1、R语言和Rstudio的安装2、R语言的基本介绍2.1 hello world!2.2 R中的变量2.3输入输出2.3R默认目录设置2.4Rstudio快捷键前言:反射弧超长的我终于从10月12日推免结束的消息中缓过来哈哈哈哈,给自己历时3年的保研之旅画上了一个完整的句号,成为一名准直博生了,感觉我齐腰的长发保不住了哈哈哈哈。然后呢,最近想要学习一些关于R语言的内容,了解一下用R语言这个工具怎么做统计

2020-10-25 22:03:49 1017

使用HTML+PHP搭建一个生物数据增删查改网站代码

使用HTML+PHP搭建一个生物数据增删查改网站。分为用户模式和管理员模式,用户模式实现对数据库的搜索,管理员模式实现对数据库的增删查改。因为是初学html语言和php,所以代码写得都很简单,具体内容可以参见主页里面的介绍博客。文件里面是全部代码。数据库文件已经导出为sql格式放到mysql文件夹下,修改一下数据库的连接数据,就可以直接在本地运行。

2022-03-28

HTML+PHP搭建一个生物数据增删查改网站使用说明书

使用HTML+PHP搭建一个生物数据增删查改网站。分为用户模式和管理员模式,用户模式实现对数据库的搜索,管理员模式实现对数据库的增删查改。因为是初学html语言和php,所以代码写得都很简单,具体内容可以参见主页里面的介绍博客。里面附带全部代码。

2022-03-28

RNA editing restricts hyperactive ciliary kinases.pdf

RNA editing restricts hyperactive ciliary kinases.pdf

2021-09-09

2018年版北大中文核心期刊目录(第八版).docx

对于想发中文核心论文的同学可以作为参考。我是在《计算机科学》杂志发表了一篇文章,大家想知道论文发表流程可以看我的那篇文章。

2020-03-31

数字图像处理MATLAB实现知识点——个人笔记.docx

主要包含:数字图像处理概述,数字图像处理基础,图像基本运算,图像变换,图像增强,图像恢复,图像分割,彩色加强。

2020-02-03

2020计算机操作系统笔记.docx

《计算机操作系》课本知识点总结,总结易考易错的知识点,另外加个人整理的思维导图,2020年的知识点。

2020-02-03

电子商务知识点总结.docx

《电子商务》课本知识点总结,总结易考易错的知识点,另外加个人整理的思维导图,2019年的知识点。有目录,对电子商务感兴趣的兄弟也可可以去作者博客下面找相关的博客。

2020-01-03

医学统计学笔记——DL.zip

包含统计学基本定义如定量定性,正态分布统计图(表)、t检验,方差分析,卡方检验,非参数秩和检验、 线性相关与线性回归,logistic回归分析,生存分析等

2019-09-18

超详细数据库系统与概论笔记2019上——个人笔记.zip

大部分对应《数据库系统与原理》的目录,从数据库的绪论到并发控制一共是十个章节知识点,文档是对整本书的知识点的总结归纳+个人理解

2019-08-07

超详细的Java复习知识点2019——个人笔记.zip

超级详细,而又直白简单的讲述Java基础知识点的个人笔记(包含自己的解读和一些容易错容易考的题目),标记了重点,适合Java基础入门的童鞋,对相近的知识点进行了对比整理,方便记忆

2019-06-24

csharpspider.7z

实现百度搜索图片下载到指定文件夹,获取网页源代码,可以自己下载,改一下网页的accept,referer,Method 参数等就可以获取到如淘宝京东或其他网页的图片。

2019-06-11

超详细的数据结构知识点-个人笔记

超级详细,而又直白简单的讲述数据结构基础知识点的个人笔记(包含自己的解读),标记了重点,适合数据结构基础入门

2019-05-07

c#草稿纸(记事本)

c#草稿纸,来自我的博客里面的两篇,已经实现所有的的基础功能,包含,打开,保存,复制,粘贴,剪切,打印,删除,全选,字体,颜色,主题,日期,时间,查找和替换

2019-05-07

c#表决器,选择候选城市,选择可以投票的选项数量,当选择数量为2时,只能选择二个候选城市,程序自动限制复选框的选择数量,按提交后选择的城市显示在编辑框中

c#表决器,选择候选城市,选择可以投票的选项数量,当选择数量为2时,只能选择二个候选城市,程序自动限制复选框的选择数量,按提交后选择的城市显示在编辑框中

2019-05-05

c#摇号器,自定义摇号范围和选号个数

c#摇号器,实现简单的自定义摇号范围和选号个数,VS2017编译调试通过,通过简单修改即可直接用于自己的程序 。

2019-05-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除