2 高锦-生信

尚未进行身份认证

生物信息 + 深度学习

等级
博文 101
排名 2w+

Sublime Text 2 搭建git 和 github 环境

1.Git安装官网下载安装,将它的cmd文件夹添加至环境变量Path中2.Git配置gitconfig--globaluser.name"mypc"gitconfig--globaluser.email"mypc@126.com"gitconfig--globalpush.defaultmatching#生成SSHkey在开始菜单中找到Git...

2019-06-04 23:52:00

非root用户,用putty连接服务器,启动jupyter notebook教程

如何安装,运行和连接到远程服务器上的JupyterNotebookJupyterNotebook是一个开源的交互式Web应用程序,允许您使用40多种编程语言编写和运行计算机代码,包括Python,R,Julia和Scala。本文将向您介绍如何在Web服务器上安装和配置JupyterNotebook应用程序以及如何从本地计算机连接它。分类:Ubuntupython操作系统编程语言Ubu...

2019-05-22 09:57:13

tensorflow学习笔记--deep-learning中的epochs,batch_size,iterations详解

batch深度学习的优化算法,说白了就是梯度下降。每次的参数更新有两种方式。第一种,遍历全部数据集算一次损失函数,然后算函数对各个参数的梯度,更新梯度。这种方法每更新一次参数都要把数据集里的所有样本都看一遍,计算量开销大,计算速度慢,不支持在线学习,这称为Batchgradientdescent,批梯度下降。另一种,每看一个数据就算一下损失函数,然后求梯度更新参数,这个称为随...

2019-05-14 12:25:35

win10下搭配tensorflow环境----心碎版

本机配置:cpui3-7100,GTX650安装所需软件:visualstudio--2015版,cuda_9.0.176_win10.exe,cudnn-9.0-windows10-x64-v7.zip,tensorflow_gpu-1.5.0-cp35-cp35m-win_amd64.whl(pip包阿里云镜像里面下载)软件依照顺序安装(注意在安装完cudnn后,要用vs...

2019-04-15 15:13:46

Python程序员的 Sublime Text 2 配置

SublimeText2是最近很火的一个代码编辑器,我也跟风玩了一下,果然很好用。方便的插件管理器加上丰富的插件,可以很容易把它调教得很顺手。几乎每项功能都可以用鼠标和键盘两种方式来实现,方便各种习惯的人。SublimeText2的介绍与推荐网上已经有很多,这里记一下我安装的包和配置。 PackageControl 包管理器是必备的,新下载的SublimeText2第一个...

2019-03-27 10:48:47

SVM 的核函数选择和调参

本文结构:1.什么是核函数2.都有哪些&如何选择3.调参1.什么是核函数核函数形式K(x,y)=<f(x),f(y)>,其中x,y为n维,f为n维到m维的映射,<f(x),f(y)>表示内积。12在用SVM处理问题时,如果数据线性不可分,希望通过将输入空间内线性不可分的数据映射到一个高维...

2019-03-21 15:08:34

logistic回归报错问题:Warning messages: 1: glm.fit:算法没有聚合 2: glm.fit:拟合機率算出来是数值零或一

logistic迴歸的時候報錯問題包括下面兩種Warning:glm.fit:algorithmdidnotconvergeWarning:glm.fit:fittedprobabilitiesnumerically0or1occurredWarningmessages:1:glm.fit:演算法沒有聚合2:glm.fit:擬合機率算出來是數值...

2019-03-13 10:24:20

快速编写代码小技巧-----sublime 跳出括号和‘’和“”

打开菜单栏–>Preferences–>KeyBindings-User输入如下文本,保存 [  {"keys":["enter"],"command":"move","args":{"by":"characters","forward":true},"context&

2019-02-22 16:54:39

python -- re 模块使用

re模块在Python中,我们可以使用内置的re模块来使用正则表达式。有一点需要特别注意的是,正则表达式使用 \ 对特殊字符进行转义,比如,为了匹配字符串'python.org',我们需要使用正则表达式 'python\.org',而Python的字符串本身也用 \ 转义,所以上面的正则表达式在Python中应该写成 'python\\.org',这会很容易陷入 \ 的...

2019-02-17 10:54:40

linux常用命令

1、vi和vim编辑器所有的Linux系统都会内建vi文本编辑器。vim具有程序编辑的能力,可以看做是vi的增强版本,可以主动的以字体颜色辨别语法的正确性,方便程序设计。代码补全、编译及错误跳转等方便编程的功能特别丰富,在程序员中被广泛使用。 1.1、vi和vim常用的三种模式1.1.1、正常模式以vim打开一个档案就直接进入正常模式了(这是默认的模式)。在这个模式中,你可...

2019-02-11 17:41:32

SNP连锁不平衡图(LD)可视化R包LDheatmap的使用

理解SNPs之间的联系或连锁不平衡(LD)模式对于单体型的选择具有重要作用,然而,对于密集的SNP图谱,随着区域内SNPs数量的增加,很难直接从复杂的VCF文件来看出SNPs间的连锁不平衡关系。LDheatmap就是这样一个能够可视化SNPs之间连锁不平衡关系的R包。先举个小例子:随机创建100个样本5个SNPs的基因型矩阵,并实现LD热图:rm(list=ls())set.see...

2018-09-20 10:31:50

甲基化芯片入门学习-数据分析(三)

之前甲基化入门学习时本打算重复下提纲给的文献,但是后来学习过程中发现GEO上下载的RAW文件里没有该样本信息文件,就用了ChAMP包的测试数据。最后想了想,还是决定找一篇比较简单的文献的来实践使用下甲基化450K芯片的分析过程。看了几篇关于人的甲基化文献(数据在GEO上的),挑了一篇Intrinsicgenechangesdeterminethesuccessfulestablishm...

2018-09-03 10:35:32

甲基化芯片入门学习-ChAMP包(二)

DNA甲基化芯片分析有不少R包实现,如:minfi、lumi以及ChAMP等,我只粗略看过minfi和ChAMP,发现ChAMP的功能更加齐全以及使用也较为简单,并且其也集成了minfi包的部分功能,所以下面以ChAMP包作为学习对象ChAMP包的安装source("https://bioconductor.org/biocLite.R")options(BioC_mirror="ht...

2018-09-03 10:34:36

甲基化芯片入门学习-基础知识(一)

基本概念梳理 什么是DNA甲基化 DNA甲基化是表观遗传学的中最为常见的一种修饰,其主要形式包括:5-甲基胞嘧啶(5-mC)、少量的N6-甲基腺嘌呤(N6-mA)以及7-甲基鸟嘌呤(7-mG)。 目前常说的DNA甲基化一般指CpG岛甲基化,即在DNA甲基化转移酶(DNMTs)的作用下使CpG二核苷酸5’端的胞嘧啶转变为5’甲基胞嘧啶。 哺乳动物体细胞的DNA胞嘧啶甲基化主要...

2018-09-03 10:33:12

Sam&bam文件格式详解

在SAM输出的结果中每一行都包括十二项通过Tab分隔(\t),从左到右分别是:1 QNAME,序列的名字(Read的名字)2 FLAG,概括出一个合适的标记,各个数字分别代表1  序列是一对序列中的一个2  比对结果是一个pair-end比对的末端4  没有找到位点8  这个序列是pair中的一个但是没有找到位点16 在这个比对上的位点,序列与参考序列反向互补32 ...

2018-06-21 09:46:48

Bioconductor和CRAN mirror

使用bioconductor的biocLite()安装程序包时,可能速度很慢,这时可以设定一个国内的镜像(中科大镜像)使用chooseBioCmirror()选择中国镜像即可。 4是中科大镜像biocLite()通常也需要安装依赖的程序包,这时需要从CRAN下载,默认的CRAN镜像是cran.rstuido.com速度有时也会很慢。可以在安装程序包前先指定CRAN镜像使用chooseCRAN...

2018-04-11 11:13:28

bwa 参数中文解析

名称       bwa – Burrows-Wheeler AlignmentTool内容摘要描述命令行与选项SAM比对格式短序列比对注意事项 比对精确性 估计插入大小分布 内存需求 速度Bwa-0.6中的改变其他作者引用与授权历史摘要bwa index ref.fabwa mem ref.fa reads...

2018-03-05 14:17:46

samtools 使用帮助

1.viewview命令的主要功能是:将sam文件转换成bam文件;然后对bam文件进行各种操作,比如数据的排序(不属于本命令的功能)和提取(这些操作是对bam文件进行的,因而当输入为sam文件的时候,不能进行该操作);最后将排序或提取得到的数据输出为bam或sam(默认的)格式。bam文件优点:bam文件为二进制文件,占用的磁盘空间比sam文本文件小;利用bam二进制文件的运算速度快。

2018-02-07 13:33:50

Pileup 格式详解

Pileup 格式最初是由SangerInstitute的TonyCox和ZeminNing使用的,描述了染色体上每个位置的碱基信息。可以用来 SNP/indel calling,也可以直接用眼睛看一下排列的情况。Pileup文件一般是由SAMtools从sortedbam文件生成。samtoolsmpileup-f../crrbwaidx/cr

2018-02-07 10:03:37

bed文件格式详解

BED文件格式是一个可变方式的数据线,用来描述注释的数据。BED线有3个要求的字段和9个额外的字段。每条线的字段数目必须是任意单条数据的在注释上一致。可选字段的序试结合低数字的字段必须流行如果高位字段被使用。首先是三个要求的BED字段1,chrom,染色体或scafflold的名字(egchr3,chrY,chr2_random,scaffold0671

2018-02-07 09:25:43
奖章
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周上午根据用户上周的博文发布情况由系统自动颁发。