自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(128)
  • 收藏
  • 关注

原创 TCGA Clinical XML file annotation

TCGA临床信息列名解释:Viewer - GDC Docs

2022-12-13 11:37:01 618 1

原创 conda创建数据科学环境最新版

Install anaconda 创建env conda create --name data_science python=3.8.5

2021-06-10 11:08:38 513

原创 搭建数据科学环境

搭建数据科学环境### 本人硬件:cpu i5-9400f ,显卡:rtx 2080ti & gtx960 ,内存 32G### 本人系统:Ubuntu 20.041.install anaconda 官网下载anaconda.sh,安装2.创建data_science环境conda create --name data_science python=3.8.53.Install R & Jupyter(同时嵌入R内核),自己根据地域配镜像提高下载速度...

2021-05-10 15:20:59 481

原创 Ubuntu install Wechat with Wine

1. 在Ubuntu app store中 安装 Winewine --version #显示5.02.安装winetricks获取新版wget https://raw.githubusercontent.com/Winetricks/winetricks/master/src/winetricks修改权限为可执行chmod +x winetricks将可执行文件放置于terminal可调用的目录下sudo mv -v winetricks /usr/loca...

2021-05-08 15:37:31 645 1

转载 TMB简介(肿瘤突变负荷 tumor mutation burden, 简称TMB)

肿瘤的免疫疗法是即手术,放疗,化疗等传统治疗手段之后兴起的一种新型的治疗手段,以PD-1/PD-L1抗体为代表的免疫检查点抑制剂在黑色素瘤,非小细胞肺癌等实体瘤的临床治疗中取得了不错的进展。然而该疗法也存在响应率低的问题,只有10-30%的肿瘤患者可以从该疗法中获益,为了精确筛选出免疫疗法的目标群体,科学家先后尝试了多种marker。最直接的想法是将肿瘤组织中PD-L1的表达水平作为marker, 应用免疫组织化学法检验患者肿瘤组织PD-L1的表达情况,如果高表达,则说明该患者有可能从免疫疗法中获益

2021-04-12 15:37:02 19137

原创 对16S数据使用PICRUSt预测输出KEGG和COG表

step1 原材料:1. OTU表2. OTU.fastastep2 利用qiime转换为GreenGene ID替换原来的OTU_num#qiime的OTU序列注释过程assign_taxonomy.py-iotu.fasta-rgg_13_5_otus/rep_set/97_otus.fasta-tgg_13_5_otus/taxonomy/97_otu_taxonomy.txt--uclust_max_accepts1-ogg97...

2020-10-27 15:15:36 3670

原创 登入docker -- debian版本后需要更新的镜像

step1 查看debian版本cat /etc/os-releasestep2 更新apt-get 镜像 为阿里云镜像cp /etc/apt/sources.list /etc/apt/sources.list.bakvim sources.list#替换为一下内容!<<EOFdeb http://mirrors.aliyun.com/debian/ b...

2020-03-25 11:07:51 533 1

转载 Docker 解决容器时间与主机时间不一致的问题三种解决方案

Docker容器时间与主机时间不一致通过date命令查看时间查看主机时间 [root@localhost ~]# date 2016年 07月 27日 星期三 22:42:44 CST 查看容器时间 root@b43340ecf5ef:/#date...

2020-03-24 16:33:31 1526

原创 Linux-Debian 9 配置apt-get源

查看Debian 版本cat /etc/apt/sources.list备份原来的源配置文件cp /etc/apt/sources.list /etc/apt/sources.list.backup重新编写源配置文件vim /etc/apt/sources.list将下面复制好的内容粘贴,wq保存#debian 9.x (stretch)deb http://mi...

2020-03-12 15:31:15 1267

原创 Linux改变终端用户名的颜色

echo 'PS1 = "\[\e[37;40m\][\[\e[32;40m\]\u\[\e[37;40m\]@\h \[\e[36;40m\]\W\[\e[0m\]]\$"' >> ~/.bash_profilesource ~/.bash_profile

2020-03-11 10:03:51 395

原创 10X cellranger count 后的数据认识和使用

对SRR7722937的三个fastq文件运行cellranger count ,完成后得到结果文件存于SRR7722937,打开其下的outs文件夹 下游分析所需的是红框的文件,利用R读入以上文件,形成expression_matrix#!/usr/bin/Rlibrary(Matrix)cellbarcodes ...

2019-12-27 15:45:56 2618 2

原创 cnetos7 下Rstudio安装hdf5r包

1.首先下载hdf5 源码,版本1.10.6的tar.gz2.解压,用root安装(一定要注意--prefix路径,不能改变)./configure --prefix=/usr --enable-fortran --enable-cxxmakemake install3.进入Rstudioinstall.packages('hdf5r')...

2019-12-24 17:48:49 1011

原创 centos7服务器安装Rstudio-server

1.先安装R(若无R)sudo yum install R2.下载&安装rstudio-serverwget -c https://download2.rstudio.org/server/centos6/x86_64/rstudio-server-rhel-1.2.5033-x86_64.rpmsudo yum installrstudio-server-rhel-1...

2019-12-24 11:47:54 2175

原创 10X_Genomics_scRNA_Seq 名词解释

Sample(样本):单个生物来源(血液、组织等)提取的细胞混悬液。(标示是index)Library(文库):从一个样本制备的1个10X-barcoded测序文库,对应着一个10x Chromium Controller run 的单芯片通道。(标示是barcoded)Flowcell:一个类似载玻片的测序芯片,包含了一个run的测序数据,该数据可根据芯片上的 lane 和 样本的 in...

2019-12-20 16:21:21 1609

原创 10X genomics scRNA_Seq 原理概念解说

单细胞分离--测序原理10X Genomics采用Drop-Seq技术, 横向孔道逐个导入凝胶微珠Gel beads,第一个纵向道输入细胞。当凝胶微珠和细胞碰撞会被吸附在微珠上,然后通过微流控技术运送到第二个纵向通道(“油管”)。这时就会形成一个个的油滴GEMs(一个油滴就是一个凝胶微珠,也就是一个单细胞),然后收集在EP管中。每一个凝胶微珠都布满了不同的Barcode和UMI连接的序列,然后...

2019-12-20 11:09:57 12652 2

原创 PICRUSt工具使用过程中的概念理解

1. MiSeq 2x250 16S V4 下机测序数据经下面pipeline代码转换为OTU table#!/bin/bashif [ x$usearch == x ] ; then echo Must set \$usearch >> /dev/stderr exit 1firm -rf ../outmkdir -p ../outcd ../out# M...

2019-12-17 17:14:24 2140 1

原创 生物信息名称备忘录

生殖系突变(Germline mutation) 与体细胞突变 (Somatic mutation)生殖系突变(英语:Germline mutation)是指在生殖细胞中发生的任何可检测、可遗传的突变。 在生殖细胞系以外的细胞中发生的突变称为体细胞突变,也称作获得性突变。生殖系突变和体细胞突变的不同在于:生殖系突变可遗传给后代,而体细胞中发生的突变不能。鉴定体细胞突变的金标准方法是使用同...

2019-12-16 11:12:10 224

原创 高通量测序中常见名词解释

测序数据量:常见的测序量概念有 M 和 G ,for example 10M 和 10G解释:M 常用于描述reads 的数量。 例如 10M 就是 10 *10^6 条readsG 常用于描述这一批次测序共有的碱基数量。 例如 10G 就是10*10^9个碱基M 和 G 之间的关系比如说对于3G测序量的理解:3G指有 5*10^9 个碱基,假如采取illumia的...

2019-12-13 17:11:47 5795

原创 在阿里云esc上启动jupyter notebook

如常配置python 和 jupyter notebook但在启动jupyter notebook 报错: OSError: [Errno 99]Cannot assign requested addressSolution:1、生成配置文件(~/.jupyter/jupyter_notebook_config.py)jupyter notebook --generate-co...

2019-10-11 16:18:21 421

原创 python中 @符号 表示修饰符

@ 表示修饰符,可以在模块或者类的定义层内对函数进行修饰。出现在函数定义的前一行,不允许和函数定义在同一行def makebold(fn): def warp(): return "<a>"+fn()+"<a>" return warpdef makeitalic(fn): def warp(): re...

2019-10-10 15:35:16 269

原创 MultiClass VS MultiLabels

1.多类别分类和多标签分类的区别有多个类别,但每个实例只分配一个,因此这些问题被称为多类分类(MultiClass)问题 例如电影限制级别,一部电影只会被划分成一种限制级别有多个类别,但每个实例可以分配到多个不同类别(1或不定数量),因此这些问题被称为多标签分类(MultiLabels)问题 例如电影的主题,一部电影可以被同时划分为喜剧片和动作片...

2019-09-23 10:30:18 359

原创 centos7 上安装mujoco-py

step1 su rootstep2 yum install mesa-libOSMesastep3yum install mesa-libOSMesa-develstep4 wget -chttp://download-ib01.fedoraproject.org/pub/epel/7/x86_64/Packages/p/patchelf-0.9-10.el7.x86_64.rp...

2019-09-19 17:03:40 1425 1

转载 基于RNN生成古诗词

转自:http://blog.topspeedsnail.com/archives/10542RNN不像传统的神经网络-它们的输出输出是固定的,而RNN允许我们输入输出向量序列。RNN是为了对序列数据进行建模而产生的。样本序列性:样本间存在顺序关系,每个样本和它之前的样本存在关联。比如说,在文本中,一个词和它前面的词是有关联的;在气象数据中,一天的气温和前几天的气温是有关联的。例如...

2019-08-12 14:34:45 2476 2

转载 为服务器加装机械硬盘

目录1. 确认原硬盘节点2. 加装物理硬盘,并再次查看硬盘信息3. 创建分区4、创建新的挂载点5、手动挂载分区6、添加访问权限7、设置为开机自动挂载分区具体加装过程:1. 确认原硬盘节点sudofdisk-l即原硬盘标识为sda2. 加装物理硬盘,并再次查看硬盘信息新加硬盘显示为sdb,并且已经存在两个分区sdb1和sdb23. 创建分区在...

2019-07-02 15:41:39 2346

转载 Xshell, X11, Xming, CentOS, Tk, Tkinter, Matplotlib相关的坑

前言:最近玩机器学习项目,想把阿里云服务器(CentOS7)上python数据分析程序运行的结果可视化(绘制图表)。CentOS没有GUI,而且服务器在云上、平常通过本地Xshell终端与其进行远程交互,怎么弄?方法一,将需要可视化的数据保存到文件,然后将文件从服务器传回本地,利用自己熟悉的本地工具如Matlab、Python等对文件中数据进行可视化。方法二,不通过文件中转,直接在服务器上Pyth...

2019-07-02 14:54:37 908 1

转载 Colab挂载Google Drive

前言Google在收购Kaggle之后,在去年整合了kernel推出了Colaboratory,使得我们可以免费使用强大的GPU,TPU资源。我们在上传一些py文件或者数据集时,由于Colab会在长时间闲置时或者一段时间(12个小时)之后,就会断开资源,当然你上传的东西也就没有了!因为每次连接时提供的资源都是随机分配的!那么这时候,Colab也提供了连接Google Drive的功能!使用...

2019-06-19 17:08:59 6404 2

原创 将kaggle的competition中的Titanic数据集直接下载到Colab

!pip install -U -q kaggle!mkdir -p ~/.kaggle!echo '{"username":"bruce374","key":"43313de75c23e8c5a1b9713cc04183c0"}' > ~/.kaggle/kaggle.json#usename和key在kaggle--->my account----->create n...

2019-06-19 17:00:40 1597 2

原创 Sublime Text 2 搭建git 和 github 环境

1.Git安装官网下载安装,将它的cmd文件夹添加至环境变量Path中2.Git配置git config --global user.name "mypc"git config --global user.email "[email protected]"git config --global push.default matching#生成SSH key在开始菜单中找到Git ...

2019-06-04 23:52:00 268

转载 非root用户,用putty连接服务器,启动jupyter notebook教程

如何安装,运行和连接到远程服务器上的Jupyter NotebookJupyter Notebook是一个开源的交互式Web应用程序,允许您使用40多种编程语言编写和运行计算机代码,包括Python,R,Julia和Scala。本文将向您介绍如何在Web服务器上安装和配置Jupyter Notebook应用程序以及如何从本地计算机连接它。分类:Ubuntupython操作系统编程语言Ubu...

2019-05-22 09:57:13 3024

转载 tensorflow学习笔记--deep-learning中的epochs,batch_size,iterations详解

batch深度学习的优化算法,说白了就是梯度下降。每次的参数更新有两种方式。第一种,遍历全部数据集算一次损失函数,然后算函数对各个参数的梯度,更新梯度。这种方法每更新一次参数都要把数据集里的所有样本都看一遍,计算量开销大,计算速度慢,不支持在线学习,这称为Batch gradient descent,批梯度下降。另一种,每看一个数据就算一下损失函数,然后求梯度更新参数,这个称为随...

2019-05-14 12:25:35 1837

原创 win10下搭配tensorflow环境----心碎版

本机配置:cpu i3-7100 ,GTX650安装所需软件:visual studio--2015版,cuda_9.0.176_win10.exe ,cudnn-9.0-windows10-x64-v7.zip ,tensorflow_gpu-1.5.0-cp35-cp35m-win_amd64.whl (pip包阿里云镜像里面下载)软件依照顺序安装(注意在安装完cudnn后,要用vs...

2019-04-15 15:13:46 401

转载 Python程序员的 Sublime Text 2 配置

Sublime Text 2是最近很火的一个代码编辑器,我也跟风玩了一下,果然很好用。方便的插件管理器加上丰富的插件,可以很容易把它调教得很顺手。几乎每项功能都可以用鼠标和键盘两种方式来实现,方便各种习惯的人。Sublime Text 2 的介绍与推荐网上已经有很多,这里记一下我安装的包和配置。 Package Control 包管理器是必备的,新下载的Sublime Text 2第一个...

2019-03-27 10:48:47 423

转载 SVM 的核函数选择和调参

本文结构:1. 什么是核函数2. 都有哪些 & 如何选择3. 调参1. 什么是核函数核函数形式 K(x, y) = <f(x), f(y)>,其中 x, y 为 n 维,f 为 n 维到 m 维的映射,<f(x), f(y)> 表示内积。12在用SVM处理问题时,如果数据线性不可分,希望通过 将输入空间内线性不可分的数据 映射到 一个高维...

2019-03-21 15:08:34 1095

转载 logistic回归报错问题:Warning messages: 1: glm.fit:算法没有聚合 2: glm.fit:拟合機率算出来是数值零或一

logistic迴歸的時候報錯問題包括下面兩種Warning: glm.fit: algorithm did not convergeWarning: glm.fit: fitted probabilities numerically 0 or 1 occurredWarning messages:1: glm.fit:演算法沒有聚合2: glm.fit:擬合機率算出來是數值...

2019-03-13 10:24:20 12083

转载 快速编写代码小技巧-----sublime 跳出括号和‘’和“”

打开菜单栏 –&gt;Preferences –&gt; Key Bindings-User输入如下文本,保存 [    {"keys": ["enter"], "command": "move", "args": {"by": "characters", "forward": true}, "context&

2019-02-22 16:54:39 3082

转载 python -- re 模块使用

re 模块在 Python 中,我们可以使用内置的 re 模块来使用正则表达式。有一点需要特别注意的是,正则表达式使用 \ 对特殊字符进行转义,比如,为了匹配字符串 'python.org',我们需要使用正则表达式 'python\.org',而 Python 的字符串本身也用 \ 转义,所以上面的正则表达式在 Python 中应该写成 'python\\.org',这会很容易陷入 \ 的...

2019-02-17 10:54:40 172

转载 linux常用命令

1、vi和vim编辑器所有的Linux系统都会内建vi文本编辑器。vim具有程序编辑的能力,可以看做是vi的增强版本,可以主动的以字体颜色辨别语法的正确性,方便程序设计。代码补全、编译及错误跳转等方便编程的功能特别丰富,在程序员中被广泛使用。 1.1、vi和vim常用的三种模式1.1.1、正常模式以vim打开一个档案就直接进入正常模式了(这是默认的模式)。在这个模式中,你可...

2019-02-11 17:41:32 424

转载 SNP连锁不平衡图(LD)可视化R包LDheatmap的使用

理解SNPs之间的联系或连锁不平衡(LD)模式对于单体型的选择具有重要作用,然而,对于密集的SNP图谱,随着区域内SNPs数量的增加,很难直接从复杂的VCF文件来看出SNPs间的连锁不平衡关系。LDheatmap就是这样一个能够可视化SNPs之间连锁不平衡关系的R包。先举个小例子:随机创建100个样本5个SNPs的基因型矩阵,并实现LD热图:rm(list=ls())set.see...

2018-09-20 10:31:50 14001

转载 甲基化芯片入门学习-数据分析(三)

之前甲基化入门学习时本打算重复下提纲给的文献,但是后来学习过程中发现GEO上下载的RAW文件里没有该样本信息文件,就用了ChAMP包的测试数据。最后想了想,还是决定找一篇比较简单的文献的来实践使用下甲基化450K芯片的分析过程。看了几篇关于人的甲基化文献(数据在GEO上的),挑了一篇Intrinsic gene changes determine the successful establishm...

2018-09-03 10:35:32 9770

转载 甲基化芯片入门学习-ChAMP包(二)

DNA甲基化芯片分析有不少R包实现,如:minfi、lumi以及ChAMP等,我只粗略看过minfi和ChAMP,发现ChAMP的功能更加齐全以及使用也较为简单,并且其也集成了minfi包的部分功能,所以下面以ChAMP包作为学习对象ChAMP包的安装source("https://bioconductor.org/biocLite.R")options(BioC_mirror="ht...

2018-09-03 10:34:36 8892

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除