2 高锦-生信

尚未进行身份认证

生物信息 + 深度学习

等级
TA的排名 2w+

基于RNN生成古诗词

转自:http://blog.topspeedsnail.com/archives/10542RNN不像传统的神经网络-它们的输出输出是固定的,而RNN允许我们输入输出向量序列。RNN是为了对序列数据进行建模而产生的。样本序列性:样本间存在顺序关系,每个样本和它之前的样本存在关联。比如说,在文本中,一个词和它前面的词是有关联的;在气象数据中,一天的气温和前几天的气温是有关联的。例如...

2019-08-12 14:34:45

为服务器加装机械硬盘

目录1.确认原硬盘节点2.加装物理硬盘,并再次查看硬盘信息3.创建分区4、创建新的挂载点5、手动挂载分区6、添加访问权限7、设置为开机自动挂载分区具体加装过程:1.确认原硬盘节点sudofdisk-l即原硬盘标识为sda2.加装物理硬盘,并再次查看硬盘信息新加硬盘显示为sdb,并且已经存在两个分区sdb1和sdb23.创建分区在...

2019-07-02 15:41:39

Xshell, X11, Xming, CentOS, Tk, Tkinter, Matplotlib相关的坑

前言:最近玩机器学习项目,想把阿里云服务器(CentOS7)上python数据分析程序运行的结果可视化(绘制图表)。CentOS没有GUI,而且服务器在云上、平常通过本地Xshell终端与其进行远程交互,怎么弄?方法一,将需要可视化的数据保存到文件,然后将文件从服务器传回本地,利用自己熟悉的本地工具如Matlab、Python等对文件中数据进行可视化。方法二,不通过文件中转,直接在服务器上Pyth...

2019-07-02 14:54:37

Colab挂载Google Drive

前言Google在收购Kaggle之后,在去年整合了kernel推出了Colaboratory,使得我们可以免费使用强大的GPU,TPU资源。我们在上传一些py文件或者数据集时,由于Colab会在长时间闲置时或者一段时间(12个小时)之后,就会断开资源,当然你上传的东西也就没有了!因为每次连接时提供的资源都是随机分配的!那么这时候,Colab也提供了连接GoogleDrive的功能!使用...

2019-06-19 17:08:59

将kaggle的competition中的Titanic数据集直接下载到Colab

!pipinstall-U-qkaggle!mkdir-p~/.kaggle!echo'{"username":"bruce374","key":"43313de75c23e8c5a1b9713cc04183c0"}'>~/.kaggle/kaggle.json#usename和key在kaggle--->myaccount----->createn...

2019-06-19 17:00:40

Sublime Text 2 搭建git 和 github 环境

1.Git安装官网下载安装,将它的cmd文件夹添加至环境变量Path中2.Git配置gitconfig--globaluser.name"mypc"gitconfig--globaluser.email"mypc@126.com"gitconfig--globalpush.defaultmatching#生成SSHkey在开始菜单中找到Git...

2019-06-04 23:52:00

非root用户,用putty连接服务器,启动jupyter notebook教程

如何安装,运行和连接到远程服务器上的JupyterNotebookJupyterNotebook是一个开源的交互式Web应用程序,允许您使用40多种编程语言编写和运行计算机代码,包括Python,R,Julia和Scala。本文将向您介绍如何在Web服务器上安装和配置JupyterNotebook应用程序以及如何从本地计算机连接它。分类:Ubuntupython操作系统编程语言Ubu...

2019-05-22 09:57:13

tensorflow学习笔记--deep-learning中的epochs,batch_size,iterations详解

batch深度学习的优化算法,说白了就是梯度下降。每次的参数更新有两种方式。第一种,遍历全部数据集算一次损失函数,然后算函数对各个参数的梯度,更新梯度。这种方法每更新一次参数都要把数据集里的所有样本都看一遍,计算量开销大,计算速度慢,不支持在线学习,这称为Batchgradientdescent,批梯度下降。另一种,每看一个数据就算一下损失函数,然后求梯度更新参数,这个称为随...

2019-05-14 12:25:35

win10下搭配tensorflow环境----心碎版

本机配置:cpui3-7100,GTX650安装所需软件:visualstudio--2015版,cuda_9.0.176_win10.exe,cudnn-9.0-windows10-x64-v7.zip,tensorflow_gpu-1.5.0-cp35-cp35m-win_amd64.whl(pip包阿里云镜像里面下载)软件依照顺序安装(注意在安装完cudnn后,要用vs...

2019-04-15 15:13:46

Python程序员的 Sublime Text 2 配置

SublimeText2是最近很火的一个代码编辑器,我也跟风玩了一下,果然很好用。方便的插件管理器加上丰富的插件,可以很容易把它调教得很顺手。几乎每项功能都可以用鼠标和键盘两种方式来实现,方便各种习惯的人。SublimeText2的介绍与推荐网上已经有很多,这里记一下我安装的包和配置。 PackageControl 包管理器是必备的,新下载的SublimeText2第一个...

2019-03-27 10:48:47

SVM 的核函数选择和调参

本文结构:1.什么是核函数2.都有哪些&如何选择3.调参1.什么是核函数核函数形式K(x,y)=<f(x),f(y)>,其中x,y为n维,f为n维到m维的映射,<f(x),f(y)>表示内积。12在用SVM处理问题时,如果数据线性不可分,希望通过将输入空间内线性不可分的数据映射到一个高维...

2019-03-21 15:08:34

logistic回归报错问题:Warning messages: 1: glm.fit:算法没有聚合 2: glm.fit:拟合機率算出来是数值零或一

logistic迴歸的時候報錯問題包括下面兩種Warning:glm.fit:algorithmdidnotconvergeWarning:glm.fit:fittedprobabilitiesnumerically0or1occurredWarningmessages:1:glm.fit:演算法沒有聚合2:glm.fit:擬合機率算出來是數值...

2019-03-13 10:24:20

快速编写代码小技巧-----sublime 跳出括号和‘’和“”

打开菜单栏–>Preferences–>KeyBindings-User输入如下文本,保存 [  {"keys":["enter"],"command":"move","args":{"by":"characters","forward":true},"context&

2019-02-22 16:54:39

python -- re 模块使用

re模块在Python中,我们可以使用内置的re模块来使用正则表达式。有一点需要特别注意的是,正则表达式使用 \ 对特殊字符进行转义,比如,为了匹配字符串'python.org',我们需要使用正则表达式 'python\.org',而Python的字符串本身也用 \ 转义,所以上面的正则表达式在Python中应该写成 'python\\.org',这会很容易陷入 \ 的...

2019-02-17 10:54:40

linux常用命令

1、vi和vim编辑器所有的Linux系统都会内建vi文本编辑器。vim具有程序编辑的能力,可以看做是vi的增强版本,可以主动的以字体颜色辨别语法的正确性,方便程序设计。代码补全、编译及错误跳转等方便编程的功能特别丰富,在程序员中被广泛使用。 1.1、vi和vim常用的三种模式1.1.1、正常模式以vim打开一个档案就直接进入正常模式了(这是默认的模式)。在这个模式中,你可...

2019-02-11 17:41:32

SNP连锁不平衡图(LD)可视化R包LDheatmap的使用

理解SNPs之间的联系或连锁不平衡(LD)模式对于单体型的选择具有重要作用,然而,对于密集的SNP图谱,随着区域内SNPs数量的增加,很难直接从复杂的VCF文件来看出SNPs间的连锁不平衡关系。LDheatmap就是这样一个能够可视化SNPs之间连锁不平衡关系的R包。先举个小例子:随机创建100个样本5个SNPs的基因型矩阵,并实现LD热图:rm(list=ls())set.see...

2018-09-20 10:31:50

甲基化芯片入门学习-数据分析(三)

之前甲基化入门学习时本打算重复下提纲给的文献,但是后来学习过程中发现GEO上下载的RAW文件里没有该样本信息文件,就用了ChAMP包的测试数据。最后想了想,还是决定找一篇比较简单的文献的来实践使用下甲基化450K芯片的分析过程。看了几篇关于人的甲基化文献(数据在GEO上的),挑了一篇Intrinsicgenechangesdeterminethesuccessfulestablishm...

2018-09-03 10:35:32

甲基化芯片入门学习-ChAMP包(二)

DNA甲基化芯片分析有不少R包实现,如:minfi、lumi以及ChAMP等,我只粗略看过minfi和ChAMP,发现ChAMP的功能更加齐全以及使用也较为简单,并且其也集成了minfi包的部分功能,所以下面以ChAMP包作为学习对象ChAMP包的安装source("https://bioconductor.org/biocLite.R")options(BioC_mirror="ht...

2018-09-03 10:34:36

甲基化芯片入门学习-基础知识(一)

基本概念梳理 什么是DNA甲基化 DNA甲基化是表观遗传学的中最为常见的一种修饰,其主要形式包括:5-甲基胞嘧啶(5-mC)、少量的N6-甲基腺嘌呤(N6-mA)以及7-甲基鸟嘌呤(7-mG)。 目前常说的DNA甲基化一般指CpG岛甲基化,即在DNA甲基化转移酶(DNMTs)的作用下使CpG二核苷酸5’端的胞嘧啶转变为5’甲基胞嘧啶。 哺乳动物体细胞的DNA胞嘧啶甲基化主要...

2018-09-03 10:33:12

Sam&bam文件格式详解

在SAM输出的结果中每一行都包括十二项通过Tab分隔(\t),从左到右分别是:1 QNAME,序列的名字(Read的名字)2 FLAG,概括出一个合适的标记,各个数字分别代表1  序列是一对序列中的一个2  比对结果是一个pair-end比对的末端4  没有找到位点8  这个序列是pair中的一个但是没有找到位点16 在这个比对上的位点,序列与参考序列反向互补32 ...

2018-06-21 09:46:48

查看更多

勋章 我的勋章
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。