自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

小孔乘象的天地

不知何时,不甘堕落,愿在这天地留下点滴经验

  • 博客(38)
  • 收藏
  • 关注

转载 用深度学习每次得到的结果都不一样,怎么办?

神经网络算法利用了随机性,比如初始化随机权重,因此用同样的数据训练同一个网络会得到不同的结果。 初学者可能会有些懵圈,因为算法表现得不太稳定。但实际上它们就是这么设计的。随机初始化可以让网络通过学习,得到一个所学函数的很好的近似。 然而, 有时候用同样的数据训练同一个网络,你需要每次都得到完全相同的结果。例如在教学和产品上。 在这个教程中,你会学到怎样设置随机数生成器,才能每次用同样的数据训练同一网络时,都能得到同样的结果。 我们开始。 教程概览 这个教程分...

2022-05-11 11:28:45 5153

转载 训练过程--Batchsize

尽可能地设大batchsize在合理范围内,增大batch size的好处 1)内存利用率提高了,大矩阵乘法的并行化效率提高。 2)跑完一次 epoch(全数据集)所需的迭代次数减少,对于相同数据量的处理速度进一步加快。 3)在一定范围内,一般来说 Batch_Size 越大,其确定的下降方向越准,引起训练震荡越小。 随着 Batch_Size 增大,处理相同数据量的速度越快。 随着 Batch_Size 增大,达到相同精度所需要的 epoch 数量越来越多。" 由于最终收敛精度会陷入不同的局部极值,因

2022-05-11 10:19:33 678

原创 QWERTY键盘排列的历史

我们很多人每天都会面对着电脑,使用键盘打字。“电脑那些事儿”的小编想问大家一个问题,小伙伴们有木有思考过键盘上的字母为什么是现在这种排列方式呢?小编下面就给大家揭秘一下这个有趣的问题。这是一个非常有趣的故事早在18世纪早期,人们就开始研制打字机,以期获得更清晰的文字和更快的书写速度。但是直到19世纪中后期,打字机才慢慢地流行起来。也就是在那个时期,各种各样的打字机开始充斥市场,字母排列的顺序也各不相同。1868 年,美国排字工克里斯托夫·拉森·肖尔斯(ChristopherLatham Sholes)

2022-01-06 20:50:49 3859

原创 显示器接口VGA、DVI、HDMI

将从以下几个方面进行区分HDMI目前最高支持1920*1080P的高清格式。VGA支持从640480一直到高达25601600的各种分辨率,但VGA极容易受其它信号干扰,所以高清分辨率显得有点虚,容易造成画面干扰。HDMI的带宽是数字信号带宽,VGA是模拟信号带宽,这是两种不同技术的传输方式。HDMI信号不需要数模转换,没有信号损失;VGA信号需要数模转换,信号损失大。其它相关知识:HDMI和VGA均是是信号传输方式;VGA(Video Graphics Array)还有一个名称叫D-Su.

2021-09-24 21:55:20 1359

原创 top 命令看服务器运行情况

授人以渔:强推linux命令网址:linux命令手册在一段时间内,CPU正在处理以及等待CPU处理的进程数之和。三个数字分别代表了1分钟,5分钟,15分钟的统计值第一行:top:当前时间up:机器运行了多少天xx users:当前有多少用户load average:分别是过去1分钟,5分钟,15分钟的负载 (CPU正在处理以及等待CPU处理的进程数之和)第二行:Tasks:当前有多少进程running:正在运行的进程sleeping:正在休眠的进程stopped:停止的进程z

2021-09-24 21:35:51 998

原创 《看穿一切数字的统计学-西内启著(日)》

ABtest,随机对照试验历史第一次随机对照试验:fisher的夫人与奶茶(经典:先放奶还是先放红茶)

2021-03-10 21:53:51 510

原创 中心极限定理 central limit theorem

中心极限定理 central limit theorem中心极限定理是很多统计的基础,解释自然界中大多数数据属于正态分布,这使得正态分布在统计学中的应用非常广泛。「为什么中心极限定理能够解释数据属于正态分布,接下来我们就以不同类型的原始数据进行证明。」even if you’re not normal,the average is normal中心极限定理指的是给定一个任意分布的总体(除了无法计算均值的分布以外)。每次从这些总体中随机抽取 n 个抽样,一共抽 m 次。然后把这 m 组抽样分别求出平均值

2021-02-16 15:50:09 4400

原创 R语言-出图时的中英文字体解决方案

目录方案1- showtext方案2-Cairo在某些时候,需要在 R 画图中添加中文,但是默认情况下,R 对中文的支持不好。方案1- showtext这里推荐一个showtext的 R 包。如果需要将含有中文字体的图形保存为 pdf 文件,可以使用下面讲到的方案,最新版的showtext已经支持了ggplot2,推荐使用此种方案。这样,在你写的 R 代码中,开头添加:library(showtext)showtext_auto(enable=True) # 表示之后用上同样的字体fon

2021-02-15 22:08:16 4606 2

原创 统计学三大相关性系数:pearson,spearman,kendall

在文献以及各种报告中,我们可以看到描述数据之间的相关性:pearson correlation,spearman correlation,kendall correlation。它们分别是什么呢?计算公式?怎样用R语言简单实现计算呢?本文一一介绍~建议前期阅读:协方差与相关系数-“傻傻”也能分清总的来讲,三个相关性系数(pearson, spearman, kendall)反应的都是两个变量之间变化趋势的方向以及程度,其值范围为-1到+1,0表示两个变量不相关,正值表示正相关,负值表示负相关,值越大表示

2021-02-14 12:16:45 3409 1

原创 R语言:无法精确计算带连结的p值

当你在使用cor.test,wilcoxon.test等这些函数时,不知道有没发现一个exact参数,以及是否遇到过无法精确计算带连结的p值这个warning。如果有,请往下看。这个问题应该是很常见的,《非参统计》书里写道:数据中有相同的数字,成为结(tie),结中的秩为按照升幂排列后位置的平均值,如果结多了,零分布的大样本公式就不准了,因此要做修正。”Example对于wilcox.test,是基于样本来自连续对称分布的总体,所以本不应该有相同的值,但是由于四舍五入,连续变量观测到的值都是离散

2021-02-14 12:01:12 14088 5

原创 ggplot2 进阶--多重color/fill scales

ggplot2 迄今是R里最受欢迎画图package,个人感觉最主要的一个因素就是layer叠加的语法结构(图层),类似于photoshop的图层概念。而且,ggplot2的变量映射aes也是很厉害。那么,就有个局限,每个变量只能映射一种scale,那怎么样在同一个图中出现两种或者多种color/fill scale的映射呢?ggnewscale这个包你值得拥有!github链接使用方法】其实很简单,见如下说明# 直接在需要增加scale的geom之前加如下代码?new_scale#格式:

2021-02-07 20:21:37 2569

原创 协方差与相关系数-“傻傻”也能分清

目录协方差相关系数相关系数的p value相关系数与R2协方差协方差(covariance) 的主要思想之一,其可以将数据分为三类关系:正向趋势的关系(slope > 0)负向趋势的关系(slope < 0)无任何趋势的关系(slope = 0)协方差的计算公式暗示,协方差本身并不能告诉我们相关性直线的斜率(陡峭或平坦),也不能告诉我们样本是否靠近相关性直线,它仅仅告诉我们两变量之间的相关性直线的斜率是正还是负协方差本身的意义难以诠释,故我们不会以计算协方差为目标

2021-02-04 20:58:18 2067

原创 生物信息常用知识-snp,vcf等突变专题

snp造成的consequence 解释https://www.targetvalidation.org/variants(网站部分截图如下)

2021-01-30 15:59:22 423

原创 批量给文件重命名

1. 简单重命名Linux下文件重命名可以通过两个命令完成mv和rename。mv: 直接运行可以进行单个文件的重命名,如 mv old_name.txt new_name.txtrename: 默认支持单个文件或有固定规律的一组文件的批量重命名,比如:touch YSX_a_1.fq.gz YSX_a_2.fq.gz YSX_b_2.fq.gz YSX_b_1.fq.gz把文件名中的易生信(YSX)改为易汉博 (ehbio)#rename '被替换文字' '要替换成的文字' 操作对象ren

2021-01-28 21:49:38 634

原创 什么是API?

阅读编程资料时经常会看到API这个名词,网上各种高大上的解释估计放倒了一批初学者。初学者看到下面这一段话可能就有点头痛了。**API(Application Programming Interface,应用程序编程接口)**是一些预先定义的函数,目的是提供应用程序与开发人员基于某软件或硬件得以访问一组例程的能力,而又无需访问源码,或理解内部工作机制的细节。——百度百科这篇文章我们就来通俗易懂地解释下什么叫做 API,你只需要花费1分钟时间。1. 从文件操作开始谈API。以C语言为例,我们使用fo

2021-01-28 19:36:53 720 1

原创 让操作linux更“丝滑”的技巧

目录history 命令加上时间显示lasted updeate: 2021-01-15history 命令加上时间显示export HISTTIMEFORMAT='%F %T ' #注意”%T”和后面的”’”之间有空格,不然查看历史记录的时候,时间和命令之间没有分割# 可以把这个写入到 ~/.bashrc 文件中,自启动;或者写在/etc/profile中或者写在/home/$USER/.bash_profile中如果你追求更加细节,再加上比如登陆过系统的用户、IP地址、操作命令以及操作时间

2021-01-15 21:36:37 208

原创 优秀的文章链接合集

目录linux 服务器被入侵二三事lasted updated: 2021-01-15说明自己在阅读的时候经常会看到一些很精彩的文章,因为是别人写的,我也没有时间搬运,特此收集到这里,一方面自己做个记录,另一方面也分享给大家~特此说明:如果链接的主人期望我附上原作者的说明等,麻烦与我联系,有点懒,我就不一一说明了emm。linux 服务器被入侵二三事服务器被动变“矿机”,高占用CPU急死!CPU被挖矿了,却找不到哪个进程!记一次 Linux 被入侵全过程...

2021-01-15 21:22:20 717

原创 R语言-爬虫rvest

爬虫就是批量自动将网页的内容抓取下来。用任何语言做爬虫必须要了解的就是网页语法,网页语言无非就是HTML,XML,JSON等,因为正是通过这些我们才能在网页中提取数据,过多的就不再描述,大家可以自行参考大量的资料,大多数语法都是树形结构,所以只要理解了,找到需要数据的位置并不是很难。用R语言制作爬虫无非就是三个主要的包。XML,RCurl,rvest,这三个包都有不同的主要函数,是R语言最牛的网络爬虫包。了解htmlHTML框架简单说就是任何HTML网页文件中都会包含的基本代码内容。如果我们打算写一个

2020-11-08 18:34:32 4509

原创 HGVS基因突变命名规则

HGVS基因突变命名规则人类基因组变异协会(HGVS:Human Genome Variation Society)规则是目前学术界所公认的突变命名规则。从不同的维度出发,相同的基因突变可以有多种不同的表现形式,例如,参考序列的不同、表现层次的不同(DNA、RNA或蛋白质水平)都会导致突变的表现方式产生差异。目前,通用的参考序列主要包括:基因组参考序列(以前缀“g.”表示)、cDNA参考序列(以前缀“c.”表示)、非编码DNA参考序列 (以前缀“n.”表示)、RNA参考序列(以前缀“r.”表示)、蛋白质

2020-09-05 18:26:52 1122

原创 R-日常使用tips

目录利用提取R自带的数据集持续更新last update:202009利用提取R自带的数据集输出R内置数据集data()data(package = ‘datasets’)任意一个包自带有哪些数据集,可以有命令:data(package = ‘包名’)查看R所有包的数据情况,从下面参数all.available = TRUE也能猜出来。data(package = .packages(all.available = TRUE))提取数据方法:mydat <- data(“

2020-09-05 15:17:18 487

原创 教你下载微信小程序里的视频

目录利用 Fiddler (http抓包工具)IDM 油猴脚本下载利用 Fiddler (http抓包工具)在电脑上打开了小程序的视频,但是我们现在还是不能获取到视频的url地址,这里就需要用到我们的fiddler工具了(Fiddler是一个http协议调试代理工具,它能够记录并检查所有你的电脑和互联网之间的http通讯,设置断点,查看所有的“进出”Fiddler的数据(指cookie,html,js,css等文件)。 Fiddler 要比其他的网络调试器要更加简单,因为它不仅仅暴露http通讯还提供了

2020-07-14 21:34:11 27525 12

原创 markdown-语法记录

目录一、Markdown 是什么?二、印象笔记里 Markdown 有什么特点?三、如何创建 Markdown 笔记?四、印象笔记 Markdown 笔记支持哪些语法?设置分级标题一级标题二级标题三级标题四级标题五级标题六级标题加粗文本斜体下划线删除线添加分隔线插入目录引用文本添加符号列表或者数字列表添加待办事项插入链接插入图片插入表格插入图表插入行内代码或代码块插入数学公式插入流程图插入时序图插入甘特图设置目录五、印象笔记 Markdown 支持什么快捷键?本文内容来自印象笔记官网,版权归印象笔记官方

2020-07-06 22:08:21 255

原创 R-眼前一亮的绘图

神奇的R-神奇的图忘记了那里扒下来的代码了,如果原作者看到了,告诉我哈,我会附上原文链接library(TeachingDemos)data <- rbind(c(80394, 32903, 13.2), c(82560, 36230, 13.8), c(85213, 26921, 10.8))faces2(data, which = c(3, 14, 12), labels = c("北京", "上海", "天津"), ncols = 3)黑客图nx = 100ny = 80

2020-07-06 17:16:37 195

转载 GWAS相关的曼哈顿图-SNP密度图

R包 CMplot官网链接https://github.com/YinLiLin/CMplotA high-quality drawing tool designed for Manhattan plot of genomic analysisInstallationCMplot is available on CRAN, so it can be installed with the following R code:> install.packages("CMplot")> l

2020-07-05 23:22:23 5662

转载 画基因结构图 gggenes 用法

目录画基因结构图 gggenes 用法Drawing gene arrows with geom_gene_arrow()Beautifying the plot with theme_genesAligning genes across facets with make_alignment_dummies()Labelling genes with geom_gene_label()Reversing some genes with the optional forward aestheticViewin

2020-07-05 23:02:06 5208 2

原创 ggplot-易忘知识点手册

目录点线类型点线类型shape = xlty = x可以使用代码展示library(ggpubr)show_point_shapes() #显示点的形状(ggpubr包内的函数)show_line_types() #显示线条类型(ggpubr包内的函数)type = x # 类型

2020-07-05 22:40:44 208

原创 修改word文档模板

目录简介方法一:直接在Word默认载入的模板文件上修改方法二:新建自定义的dotm模板,每次新建word手动选择加载简介在使用word工作的过程中,大家会发现word模板默认的格式很多不符合我们实际工作的需求,比如标题/字体/行间距等等,那怎么修改word默认的模板呢?使得我们每次新建word都是我们自定义的格式呢?这样就不需要每次新建word都重新修改字体样式等,一劳永逸~注意,其它比如设置ppt的模板等也是同样的的操作过程。方法一:直接在Word默认载入的模板文件上修改找到新建word时默

2020-07-05 00:22:52 1729

原创 R-GenVisR包-绘制snp突变landscape-瀑布图-参数详解

绘图文件,此R包对输入文件格式进行了规定,R包可以通过搜索列文件名来找出作图所需要的信息。文件格式可以为MAF、MGI和custom(自定义文件)三种,每种文件至少包含三列信息,分别如下:MAF必须包含以"Tumor_Sample_Barcode", “Hugo_Symbol”, “Variant_Classification"命名的列;MGI必须包含"sample”,“gene_name”,“trv_type"命名的列;Custom文件必须包含"sample”, “gene”, "variant_

2020-07-05 00:15:40 3785

原创 【精华】linux error 常见合集

这里写目录标题Linux error 常见error处理出现乱码最后更新于 2020-0427Linux error 常见error处理出现乱码关键词:linux 中文乱码 英文乱码 设置语言 字符集1.1.1 原因系统安装的语言包不是常用的英文(en_US.UTF-8)及中文(zh_CN.UTF-8),只要修改回来就ok了。使用locale命令查看当前系统状态使用的语言系统(字符集),如下。在Linux中通过locale来设置程序运行的不同语言环境,locale由ANSI C提供支持。loc

2020-07-05 00:12:06 947

原创 office-word-报错合集

目录Office Word 2019中找不到EndnoteX9的解决方案每次打开都弹出配置进度的问题打开ppt出错电脑打开PPT文件总提示修复如何解决Office Word 2019中找不到EndnoteX9的解决方案在Windows 10操作系统上,最近安装了Office 2019,和最新的Endnote X9。无论如何重新安装,还是先后顺序安装,都无法在Word中加载Endnote X9。解决办法Word中加载末显示插件Word中 文件选项卡 —— 选项 —— 加载项 —— 最下方”转到”

2020-07-04 23:25:29 523

原创 私藏好用的软件分享

目录办公效率软件everythingislidesnipastegoogle 插件办公效率软件everything超级快速的文件查找工具,而且占内存极小,对于我这种多文件星人真是无敌了~官网:http://www.voidtools.com/参考链接:https://www.jianshu.com/p/51534f6ecf48islideppt插件,一键自动排版,一键设置字体等,各种免费好看的icon,无敌好用,个人感觉,除了会有点卡(看个人电脑)之外,没毛病。链接:http://w

2020-07-04 21:02:09 298

原创 R-ggsci-NCS期刊级别的配色

目录简介使用单独展示 ggsci的配色方案简介官方链接如下:https://github.com/nanxstats/ggsci使用参考官方展示的内容,大部分都是翻译https://nanx.me/ggsci/articles/ggsci.htmlggsci包可以说是ggplot2的一个扩展包,主要的应用是对ggplot绘制的图形提供设定好的配色方案,但同时该包中的配色方案也能够被base或lattice等其它绘图方式所调用。ggsci包的配色方案使用scale_color_palnam

2020-07-04 15:44:24 3723

原创 在R使用matlab

与matlab相关的包R.matlab简单读存mat文件,并在R中调用matlabinstall.packages("R.matlab")library(R.matlab)实例如下dat <- readMat(xxxx.mat)print(dat$xx)注意事项读入压缩.mat文件时:Reading compressed MAT filesFrom MATLAB v7, compressed MAT version 5 files are used by default [

2020-07-04 15:07:57 1906

转载 R-corrplot包-相关性可视化2

1.8cl.pos图例位置1corrplot(mat_cor,method="ellipse",order="AOE",col=palette_2,2addCoef.col="gray20",addCoefasPercent=TRUE,cl.pos="r",3title="图例在右边",diag=TRUE,mar=c(1,1,1,1))4corrplot(mat_cor,method="elli...

2020-07-01 16:59:31 1781 2

转载 R-corrplot包-相关性可视化

简介:相关图是基于相关系数矩阵绘制的图。通常是将1个变量映射到多个视觉元素,所以看起来很花哨。如果是椭圆:则椭圆的色相对应相关性的正负,颜色深浅对应相关性绝对值大小,越深则绝对值越大。椭圆的形状对应相关性绝对值大小,默认越扁,则相关性绝对值越大。如果是圆,则圆的面积对应相关性大小,如果是扇形,则扇形的弧度对应相关性大小。相关系数:自变量X和因变量Y的协方差/标准差的乘积。也可以反映两个变量变化时是同向还是反向,如果同向变化就为正,反向变化就为负。它消除了两个变量变化幅度的影

2020-07-01 16:35:41 2388

原创 R-常见error及其可能原因--笔记

目录)常见error及其可能原因(自用)ggplot 类数据操作类更新于 2019.05.11常见error及其可能原因(自用)以下全部是自己实际过程中遇见过的,现收集起来,方便学习使用,大家有遇到其他的,我也可以收集并更新进这里~ps: 就算你看懂报错的 error 信息,但是也可能找不到具体哪一步错了,所以勿喷“error信息已经说明了blabla之类的话”ggplot 类Q: ...

2019-05-11 16:23:01 19548 7

原创 R包-信息整理--笔记

目录)R包信息(自用)统计分析类画图类其它R包冲突更新于 2019.05.11R包信息(自用)部分包含了 examples,方便学习使用统计分析类library(psych) # pcor.test 偏相关分析library(Hmisc) # cut2 分bin,比如 expression quantiles画图类library(grid) # viewport print自定义...

2019-05-11 15:53:38 405

原创 运算函数以及符号--笔记

文章目录)算术运算符参考链接2019.05.11 更新算术运算符^或** 乘方,求幂值A%%B 取余,模运算A%/%B 整数除法== 严格等于,判断是否相等!x 不等于xx|y 或,&或|比较两个向量的所有元素x&y 与sign() 判断正负&&或|| 逻辑计算操作,只比较两个向量的第一个元素xor ...

2019-05-11 15:32:47 412

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除