• 等级
  • 207318 访问
  • 130 原创
  • 19 转发
  • 17477 排名
  • 54 评论
  • 155 获赞

Jupyter Notebook中显示图像和数学公式

1.可以使用LaTeX表示数学公式#可以使用LaTeX表示数学公式fromIPython.displayimportLatexLatex(r"$\sqrt{x^2+y^2}$")2.SymPy的表达式也可以显示为LaTex%load_extsympyprintingfromsympyimport*x,y=symbols("x,y")sqrt(x*...

2019-05-12 14:05:12

基于随机森林(RF)的机器学习模型预测hERG阻断剂活性

从分子相似性评估到使用机器学习技术的定量构效关系分析各种建模方法已应用于不同大小和组成的数据集(阻断剂和非阻滞剂的数量)。本研究中使用从公共生物活性数据开发用于预测hERG阻断剂的稳健分类器。随机森林被用来开发使用不同分子描述符,活性阈值和训练集合成的预测模型。与先前提取数据集的研究报告相比,该模型在外部验证中表现出优异的性能。#导入依赖库importpandasaspdimpor...

2019-05-06 00:04:21

心脏病预测模型(基于Python的数据挖据)

作者:AbdullahAlrhmoun该项目的目标是建立一个模型,该模型可以根据描述疾病的特征组合预测心脏病发生的概率。为了实现这一目标,作者使用了瑞士ClevelandClinicFoundation收集的数据集。该项目中使用的数据集包含针对心脏病的14个特征。数据集显示不同水平的心脏病存在从1​​到4和0没有疾病。我们有303行人数据,13个连续观察不同的症状。此项目研究了不同的经典...

2019-04-13 21:20:00

寒冬 winter:代码无捷径,只怕有心人

2018年初冬,在淘宝996乐队的《持续迭代》的余味中,winter在VueConf上以“挖掘Vue的声明式交互能力”为题做了演讲winter,本名程劭非,前手机淘宝前端负责人,阿里高级技术专家,JavaScript专家,带领团队开发了阿里巴巴开源项目Weex移动前端开发框架。说到前端圈内的技术大牛,winter这个名字就不得不提。winter是谁?有人抓取G...

2019-03-31 13:27:39

Python生物信息学⑥绘制热图及火山图

Python生物信息学⑥绘制热图及火山图Python生物信息学③提取差异基因通过上Python生物信息学③提取差异基因得到了该数据集的差异分析的两个关键参数,1.差异倍数(foldchange)以及2.差异的P值。本篇目的是得到满足差异倍数和差异P值的基因,同时进行可视化(包括差异分析常见的火山图和热图)。绘制火山图(1)第一步制作差异分析结果数据框genearray=n...

2019-03-30 22:42:31

Python生物信息学⑤DNA转录RNA

Python实现DNA转录RNAwithopen("rosalind_rna.txt")asf:dna_fragment=f.read().rsplit()rna_fragment=''.join("U"ifx=="T"elsexforxindna_fragment[0])rna_fragment

2019-03-30 18:47:39

Python生物信息学④计算DNA核苷酸A、C、G、T出现次数

计算DNA核苷酸A、C、G、T出现次数withopen("rosalind_dna.txt")asf:fragment_of_dna=f.read()fragment_of_dna.rsplit()print(fragment_of_dna.count("A"),fragment_of_dna.count("C"),fragment_...

2019-03-30 18:44:56

JavaScript权威Douglas Crockford:代码阅读和每个人都该学的编程

作者:PeterSeibel关于JavaScriptSeibel:在程序学习之路上有哪些令你后悔的事情?Crockford:我了解一些语言,但却一直没有机会使用。我花了不少时间学习APL并了解到其衰败的原因,但这门语言真的非常优雅,可我却没有花时间使用它,这太遗憾了。除此以外,我还了解其他一些语言,知道能用它们做什么,但实际上却并没有机会用这些语言思考。Seibel:我听说你喜欢...

2019-03-28 22:25:21

Python生物信息学③提取差异基因

python做生信分析的流程使用的数据集是GSE5583,来自于2006年的基因芯片结果,该芯片目的是提取野生型和HDAC1小鼠胚胎干细胞用于Affymetrix微阵列上的差异RNA。#导入包importmatplotlib.pyplotaspltimportosimportnumpyasnpimportpandasaspdfromscipyimport...

2019-03-28 20:49:07

差异基因分析:fold change(差异倍数), P-value(差异的显著性)

做基因表达分析时必然会要做差异分析(DE)DE的方法主要有两种:Foldchange t-testfoldchange的意思是样本质检表达量的差异倍数,log2foldchange的意思是取log2,这样可以可以让差异特别大的和差异比较小的数值缩小之间的差距。Q-value,是P-value校正值,P值是统计差异的显著性的。Q值比P值更严格的一种统计。p-value...

2019-03-28 11:28:04

Python笔记:将字典存储为csv格式文件

importpandasaspdpd.DataFrame(col_count,index=[0]).to_csv('col_count.csv')

2019-03-27 10:21:05

Python生物信息学②从PDB文件中提取蛋白序列

环境OSversion:Win10x64python_version:Python3.6.5实例代码aa_codes={'ALA':'A','CYS':'C','ASP':'D','GLU':'E','PHE':'F','GLY':'G','HIS':'H','LYS':'K','ILE':'I','...

2019-03-24 23:23:05

KEGG数据库

KEGG的简介KEGG是一个整合了基因组、化学和系统功能信息的数据库。把从已经完整测序的基因组中得到的基因目录与更高级别的细胞、物种和生态系统水平的系统功能关联起来是KEGG数据库的特色之一。与其他数据库相比,KEGG的一个显著特点就是具有强大的图形功能,它利用图形而不是繁缛的文字来介绍众多的代谢途径以及各途径之间的关系,这样可以使研究者能够对其关注的代谢途径有直观全面的了解。KEGG...

2019-03-24 22:35:18

Python生物信息学①将RNA序列翻译成蛋白质序列。

环境OSversion:Win10x64python_version:Python3.6.5实例代码codon_table={'GCU':'A','GCC':'A','GCA':'A','GCG':'A','CGU':'R','CGC':'R','CGA':'R','CGG':'R','AGA':'R','...

2019-03-24 21:48:07

阮一峰:炫耀从来不是我的动机,好奇才是(图灵访谈)

维克多•雨果曾说过:“未来将属于两种人:思想的人和劳动的人。”对各种事物都有着深刻好奇心和善于考据的思维方式的阮一峰,无疑是一个思想的人,一位对一切美好事物及感情充满向往的真正意义上的知识分子。阮一峰广泛涉猎,善于思考,勤于总结,并且乐于分享:他将自己从一本书、一部电影或者一段经历中所得的感受和思考,都发表在了2003年开通的博客上。累积至今的1500余篇博文,书写了各种庞杂的知识,理性且不乏人文...

2019-03-22 16:51:08

松本行弘:我的编程人生

生平:松本行弘(YukihiroMatsumoto),1965年4月14日出生于日本鸟取县。1984年,就读于筑波大学第三学科信息学系。2年后休学,成为末日圣徒耶稣基督教会的宣讲师。大学复学后,加入中田育男教授的研究室。1990年大学毕业。后在岛根大学攻读博士课程,修满学分后退学,未获学位。现任株式会社Network应用通信研究所研究员、乐天株式会社乐天技术研究所研究员、Rubya...

2019-03-22 16:41:35

Python用turtle画爱心丘比特之剑

**程序员的爱情,在Python中运用调用turtle库来根据函数画出爱心。**fromturtleimport*setup(750,500)penup()pensize(25)pencolor("pink")fd(-230)seth(90)pendown()circle(-50,180)circle(50,-180)circle(75,-50)circle(-...

2019-03-21 11:38:15

statTarget-基于QC样本的代谢组学数据校正

为什么数据质量控制重要呢?质量控制是生物分析的基本概念之一,用在保证组学测定的数据的重复性和精确性。由于色谱系统与质谱直接与样品接触,随着分析样品的增多,色谱柱和质谱会逐步的污染,导致信号的漂移。通过重复使用同一个质控样本来跟踪整个数据采集过程的行为,已经被大多数的分析化学领域专家推荐和使用。质控样本被用于评估整个质谱数据在采集过程中的信号漂移,这些漂移进一步能够被精确的算法所识别...

2019-03-19 22:40:56

Jupyter notebook与Spyder集成

SpydernotebookpluginSpyder插件在Spyder中使用Jupyternotebook。目前,它支持基本功能,例如创建新笔记本,在文件系统中打开任何笔记本以及在任何位置保存笔记本。还可以使用Spyder的文件切换器轻松地在笔记本之间切换,并打开连接到笔记本内核的IPython控制台,以在VariableExplorer中检查其变量。安装#condaco...

2019-03-17 12:53:29

R语言之可视化-火山图

火山图可以方便直观地展示两个样本间基因差异表达的分布情况。通常横坐标用log2(foldchange)表示,差异越大的基因分布在两端,纵坐标用-log10(pvalue)表示,T检验显著性P值的负对数。通常差异倍数越大的基因T检验越显著,所以往往关注左上角和右上角的值。我们根据计算结果在图上按照FDR和我们自定义的logFC值来将这部分显著变化的基因用不同颜色标示出来以区分,这类图像往往呈现类似...

2019-03-17 00:42:54

qq2648008726

关注
  • 制药·生物工程
  • 中国
奖章
  • Github
  • 专栏达人
  • 勤写标兵Lv1