自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

sleepinghm的博客

欢迎访问我的个人博客:junono.com

  • 博客(69)
  • 资源 (1)
  • 收藏
  • 关注

原创 网络语音流隐写分析全流程 (Steganalysis of VoIP Speech Streams)

网络语音流隐写分析全流程隐写分析流程介绍:基本知识1. 数据集准备(语音编码参数)1.1 使用现成的语音编码参数1.2 自己准备编码参数1.2.1 wav->pcm1.2.2 pcm->dat1.2.3 dat->txt2. 隐写分析2.1 RSMReference:隐写分析流程介绍:基于“手工特征+分类器”的隐写分析方法:基于深度学习的隐写分析方法:深度学习模型自动提取特征,经过分类层给出分类结果。基本知识隐写:在不影响载体质量的情况下将秘密信息隐藏在多媒体载体(图像,音频

2021-06-21 21:32:46 1872

原创 音频DF检测之RawGAT-ST代码部分(一)——数据集处理

RAWGAT-ST代码部分

2022-11-13 19:47:54 716 1

原创 树莓派4b安装TinyMediaManager

tinymediaserver官方文档上写了要自行下载jre启动器。https://www.tinymediamanager.org/docs/installationtar -xf OpenJDK11U-jre_aarch64_linux_hotspot_11.0.14.1_1.tar.gz -C jre --strip-components 1## Install tinyMediaManager## Download mediainfo repository to get the

2022-03-17 20:54:43 1863

原创 使用frp进行内网穿透,配置frpc.ini和frps.ini

安装地址:https://github.com/fatedier/frp/releases一、小米路由器3使用frps,frps.ini(服务器)下载linux_mipsle.tar.gz后缀解压到指定位置之后,vim frps.ini:[common]bind_port = 7000dashboard_port = 7500dashboard_user = admindashboard_pwd = your password打开路由器IP:7500就可以登录。二、其他待访问的服

2022-02-03 14:17:28 9801

原创 常用地址备份

1. 文献相关文献查询谷歌学术:https://scholar.google.com.hk/SCI期刊查询:http://www.letpub.com.cn/index.php?page=journalapp会议查询:https://www.myhuiban.com/文献部落:http://459.org/sci-hub:https://libgen.ggfwzs.net/;https://sci-hub.ren/中国科学院文献情报中心期刊分区表:http://www.fenqubiao.co

2021-12-06 20:27:29 1483

原创 GPU加速(一)CUDA C编程及GPU基本知识

前 言笔记来自深蓝学院《CUDA入门与深度神经网络加速》课堂笔记1. GPU和CPU的基础知识线程:进程:延迟:指令从发出到最终返回结果的时间。吞吐量:单位时间处理指令的条数。CPU特点(以减少延迟为导向):多级高速缓存结构:经常访问的内容放在低级缓存中,不经常访问的放在高级缓存中。复杂的控制单元:分支预测机制(if else),流水线数据前送。强大运算单元:整型浮点型复杂运算。GPU特点(以增加指令吞吐为导向):缓存小:指令访问缓存的次数减少,提升内存访问指令的吞吐。控制

2021-11-22 16:14:43 2698 4

原创 使用linux子系统安装ROS运行小海龟

开启SSHhttps://blog.csdn.net/qq_42667481/article/details/106550330开启图形化界面https://jingyan.baidu.com/article/ed2a5d1f98577809f6be17a3.html安装ROS

2021-11-18 13:52:08 1110

原创 算法笔记(七)扩大感受野SPP/ASPP/RBF

3. SPP 空间金字塔池化,解决CNN输入图像大小必须固定的问题。对输入的特征图,分成3份(4*4,2*2,1*1)进行池化,取每个池化块中的最大值,所以变成了(16*256,4*256,1*256),其中256是通道数,然后拼接成(21*256),这样展平后输入到全连接层的参数就可以设置成21*256=10752了。其中k为池化核大小,s为步长,p为填充数,w为输入的尺寸,woutw_{out}wout​为池化后输出的尺寸。K=⌈wn⌉,S=⌈wn⌉,p=⌈k∗n−w+12⌉,wout=2∗p

2021-09-29 17:28:18 5781

原创 算法笔记(六)多尺度特征融合之FPN/PANet

前言最近论文快deadline了,一直没空更新…今天复习一下多尺度特征融合的常用模型。FPN 特征金字塔论文:feature pyramid networks for object detection论文链接:https://arxiv.org/abs/1612.03144思路:底层的特征语义信息比较少,但是目标位置准确。高层的特征语义信息比较丰富,但是目标位置比较粗略。...

2021-09-22 20:10:54 9628

原创 onedrive 同步其他文件夹

onedrive可以我的onedrive目录(D:/Onedrive)下所有子目录的文件上传到onedrive中。假如我需要将放在除了onedrive目录的东西上传到onedive,它只能备份除桌面,文档,图片的三个文件夹内的文件。所以,假如我需要放在其他盘的东西(例如 E:/paper1/code)也一并上传到Onedrive,可以使用以下命令:mklink /d D:/OneDrive/paper1/code E:/paper1/code...

2021-09-22 10:32:14 917

原创 win下vscode无法激活conda环境

打开vscode的终端,发现一直是PS开头的,也就是默认powershell终端。只要改成cmd终端就可以成功激活环境。步骤如下:Shift+Ctrl+P搜索settings.json,末尾加入:"terminal.integrated.shell.windows": "C:\\Windows\\System32\\cmd.exe"。重启就可以啦!...

2021-09-19 10:35:50 3528 3

原创 算法笔记(五)各类卷积操作

前言卷积参数kernelkernelkernel:卷积核大小k。CoutC_{out}Cout​:卷积核数量,即输出通道数。CinC_{in}Cin​:卷积核维度,即输入通道数。paddingpaddingpadding:填充数p。stridestridestride:滑动步长s。dilationdilationdilation: 内核点之间的距离d。gourp:将卷积组分组。1. 传统卷积计算假如输入图像(H,W,Cin)(H,W,C_{in})(H,W,Cin​),使用CoutC

2021-09-06 22:26:29 1729

原创 经典卷积模型(四)GoogLeNet-Inception(V3)代码解析

pytorch提供的有六种基本的inception模块,分别是InceptionA——InceptionE。InceptionAclass InceptionA(nn.Module): def __init__(self, in_channels, pool_features): super(InceptionA, self).__init__() self.branch1x1 = BasicConv2d(in_channels, 64, kernel_siz

2021-09-04 17:09:41 3085 1

原创 经典卷积模型(四)GoogLeNet-Inception(V1)代码解析

GoogleNetInception代码官方代码Inception V4Googlenet点卷积深卷积

2021-09-03 20:59:43 1814

原创 经典卷积模型(三)VGGNet代码解析

VGGNetVGGNet主要解决了CNN中的深度问题。相比较之前的卷积网络使用的11x11,7x7的卷积核,VGGNet使用多层更小的卷积核来替代。例如用两层卷积核为3x3的卷积层来替代一层卷积核为5x5的卷积层,用三层卷积核为3x3的卷积层来替代一层卷积核为7x7的卷积层,这样网络就会变深。之所以这样做是因为:增加层数后可以增加模型非线性。网络层数的增长并不会带来参数量上的爆炸,因为参数量主要集中在最后三个全连接层中。2个3x3卷积堆叠等于1个5x5卷积,3个3x3堆叠等于1个7x7卷积,采用更

2021-09-03 16:31:04 643

原创 经典卷积模型(二)LeNet、AlexNetx代码解析

LeNet-5LeNet-5,它是第一个成功应用于数字识别的卷积神经网络。在MNIST数据集上,可以达到99.2%的准确率。LeNet-5模型总共有7层,包括两个卷积层,两个池化层,两个全连接层和一个输出层。代码实现:class LeNet(nn.Module): def __init__(self): super(LeNet,self).__init__() self.conv1=nn.Conv2d(3,6,5) self.conv2=nn

2021-09-03 10:59:52 317

原创 经典卷积模型(一)Resnet代码解析

Resnet18/101设计起因是认为网络增加反而梯度下降困难,因此加入残差结构。残差块代码1:class BasicBlock(nn.Module):"""inplane是输入的通道数,plane是输出的通道数,expansion是对输出通道数的倍乘.""" expansion = 1 def __init__(self, inplanes, planes, stride=1, downsample=None): super(BasicBlock, self).

2021-09-02 11:30:04 2112

原创 vscode编译C/C++(win)

一 假设代码文件夹E:/code有以下文件:E:/code/hello.c#include <iostream>using namespace std;int main(){ cout << "Hello Vscode" << endl; getchar(); return 0;}二 下载G++编译器,放入C:/mingw64三 新建文件夹E:/code/.vscode, 放入以下三个文件:c_cpp_properties

2021-09-01 19:08:26 203

原创 算法笔记(四)梯度消失 梯度爆炸

前言梯度消失与梯度为0有关。表现为只在后层学习,浅层不学习,浅层梯度基本无,权重改变量小,收敛慢,训练速度慢。原因:采用了不适合的激活函数,导致链式法则累乘时被0影响。模型在训练的过程中,会不断调整数据分布,有可能接近激活函数饱和区,此时的导数很小,难以调整权重。解决办法:使用BN,将数据分布拉回归一化。预训练,微调。使用relu等激活函数使用残差结构LSTM梯度剪裁正则化梯度爆炸与链式法则中的权重有关。原因:若初始化权重太大,累乘后会爆炸。梯度>1。

2021-08-31 19:57:35 150

原创 算法笔记(二)激活函数

激活函数的作用增加网络的非线性。数据分布大部分是非线性的,而神经网络的计算是线性的,因此需要引入激活函数,增加网络的非线性,以强化网络的学习能力。可以做概率值的处理,例如Sigmoid和tanh,它们的特点是将输出限制在(0,1)和(-1,1)之间;Relu适合用于深层网络的训练,而Sigmoid和tanh会出现梯度消失。常用的激活函数relu (0,x)公式:relu(x)=max(0,x)relu(x)=max(0, x)relu(x)=max(0,x)不会出现梯

2021-08-30 22:38:48 244

原创 算法笔记(三)过拟合 欠拟合

前言归拟合:过多拟合训练数据,对于测试数据的拟合效果差.欠拟合:没有很好学到数据特征,导致拟合曲线无法拟合数据.欠拟合可以增加特征的多样性减少正则化参数过拟合数据清洗,噪声过大.样本太单一,样本不均衡.增加训练数据,可以数据增强.加入正则化,降低泛化误差.加入dropout,提前停止训练.可使用BN缓解,但BN核心在于优化参数搜索空间,调整数据分布....

2021-08-30 22:33:24 192

原创 算法笔记(一)归一化之BN LN IN

前言规一化的作用:调整数据分布,增加网络泛化度.若每批数据分布不同,神经网络需要不断调整模型权重去适应不同的数据分布,因此可以增加训练速度缓解Internal Covariate Shift问题,将数据分布拉到激活函数的非饱和区,具有权重/数据伸缩不变性的特点.起到缓解梯度消失/爆炸,加速训练,正则化的效果.内部协变量转移internal convarite shift:简设模型函数 y=f(θ,x)y=f(\theta,x)y=f(θ,x),训练时,每层网络的输入数据分布会不断变化

2021-08-30 22:18:50 551

原创 MOT多目标跟踪评价指标代码py-motmetrics

前言先看两篇文章:多目标跟踪评价指标介绍1,多目标跟踪评价指标介绍2,MOT数据集格式介绍。MOT的格式,例如gt.txt:1,0,1255,50,71,119,1,1,12,0,1254,51,71,119,1,1,13,0,1253,52,71,119,1,1,1...例如test.txt:1,1,1240.0,40.0,120.0,96.0,0.999998,-1,-1,-12,1,1237.0,43.0,119.0,96.0,0.999998,-1,-1,-13,1,1237

2021-08-09 15:23:57 10612 45

原创 树莓派宝塔搭建NAS私有云盘nextcloud

宝塔新建网站:假设文件夹根目录为/home/nextcloud创建FTP,数据集。并且选择php版本。删除文件夹根目录/home/nextcloud下的两个html文件。下载nextcloud文件:官网链接可以使用wget:wget https://download.nextcloud.com/server/releases/nextcloud-20.0.0.zip,或者本地端下载后拖过去。多线程下载:sudo apt install axel axel -n 20 ht..

2021-08-01 20:56:45 2226 2

原创 树莓派宝塔搭建图床Chevereto

BUG打开网站后可能会出现Chevereto can’t create the app/settings.php file. You must manually create this file该错误,这时在app目录新建settings.php文件并给予可写入权限即可cd /home/wwwroot/xx.com/apptouch settings.phpchmod -R 777 settings.php刷新后也可能会出现No write permission for PHP user

2021-08-01 03:46:54 902 2

原创 树莓派宝塔部署hexo博客

hexo搭建树莓派:https://www.jianshu.com/p/48b67f344374https://www.cnblogs.com/howarzheng/p/13179742.html我一开始按pi@IP地址:端口号/path/to/blog.git来部署博客到树莓派后出现了这个BUG:fatal: sha1 file '<stdout>' write error: Broken pipeerror: remote unpack failed: unable to cr

2021-07-30 22:17:12 699 2

原创 外网访问家里的树莓派(/服务器)—内网穿透

背景:想在外网访问家里的服务器设备。目前手头有:电信光猫,属于电信内网IP,本地IP是192.168.1.1。主路由器(TP-Link)在客厅,本地IP是192.168.0.1,分配192.168.0.x的地址给连着的设备。副路由器(小米wifi)在卧室,wan口对着主路由器的wan口,本地IP是192.168.31.1,负责分配192.168.31.x开头的私有地址,分配给卧室连着连着的电脑和两个树莓派。开整!首先,打电话申请公网IP,并且将光猫改成桥接方式,这两步很重要!然后重启光猫。

2021-07-29 23:09:43 880

原创 Colab/Kaggle伪挂载Onedrive网盘,实现上传下载操作,附脚本代码。

目测在kaggle也可以。待验证。Colab挂载onedrive验证操作上传文件下载文件BUG验证首先安装库:!pip install onedrivesdk!pip3 install git+https://github.com/OneDrive/onedrive-sdk-python.git!pip3 install --upgrade git+https://github.com/OneDrive/onedrive-sdk-python.git获取验证的代码如下,需要填入的是clien

2021-07-22 10:06:12 2455 1

原创 AVA时空检测数据集下载—AVA_Actions&AVA_Kinetics

这里写目录标题AVA系列AVA-ActionsAVA-KineticsAVA标注规范标签类别标注方式CSV格式旧版视频下载AVA-Actions下载AVA-Kinetics视频以下代码可以在我的github找到。欢迎访问个人主页、博客。AVA系列AVA数据集官方网站,需要科学上网,AVA提供4类数据集:AVA-Kinetics(v1.0)):时空动作检测,包含来自 AVA v2.2 的原始 430 个视频,以及来自Kinetics-700 数据集的238k 个视频 。AVA-Action

2021-07-16 16:20:07 4446 3

原创 Towards Long-Form Video Understanding 走向长篇视频理解

Object Transformer:Towards Long-Form Video Understanding该篇属于基于关系建模的时空行为检测方法。Object Transformer贡献点文章思路Object-Centric设计自我监督预处理掩码实例预训练跨度兼容性预训练实施细节实验看这篇的起因,是因为在AVA数据集排行榜上看到Object Transformer模型排名第一,达到31%mAP,以下如果解读有误,恳请指正。Object Transformer模型是主要做的是长期视频理解,.

2021-07-14 23:14:00 873 2

原创 动作/行为识别调研

动作识别调研1. 简介1.1 基本概念1.2 难点2. 人体动作识别系统2.1 传统方法2.1.1 iDT框架2.2 深度学习方法2.2.1 Two-Stream双流架构2.2.2 3D卷积架构2.2.3 CNN+LSTM架构2.2.4 GCN架构相关文献1. 简介动作/行为识别,也可称为(Human Action/Activity Recognition,HAR),就是从视频片段(可视为2D帧序列)中分辨人的动作类型。从操作角度,可以看作将视频转换为多个RGB帧,再对多帧组合进行特征提取,最后

2021-07-08 10:23:57 4407 3

原创 Ubuntu 安装Texlive,使用VScode编译

安装Tex Livehttps://mirror.ctan.org/systems/texlive/tlnet/install-tl-unx.tar.gz下到后得到文件install-tl-unx.tar.gz解压 tar -zxvf install-tl-unx.tar.gzsudo install-tl输入 I 自动安装VSCode编译TexReferencehttps://www.tug.org/texlive/acquire-netinstall.htmlhttps://www

2021-06-09 20:12:06 1233 4

原创 UBUNTU安装deepin-wine、QQ、微信等

安装deep-winewget -O- https://deepin-wine.i-m.dev/setup.sh | sh安装软件sudo apt-get install com.qq.weixin.deepin# 然后登出-登入用户即可,可注销或重启。完整列表https://deepin-wine.i-m.dev/将com.qq.weixin.deepin替换为下列包名,可以继续安装其他应用:应用包名应用包名微信com.qq.weixin.deepin阿里旺旺

2021-06-09 16:53:10 2001

原创 UBUNTU安装NVIDIA显卡驱动、CUDA、CUDNN、ANACONDA3、PYTORCH、NVIDIA-DOCKER

折腾了两天,整理一下安装过程。一、安装显卡驱动参考https://zhuanlan.zhihu.com/p/59618999第一种安装方法(推荐)ubuntu-drivers devices #查看显卡硬件型号,其中推荐安装的版本号带有recommendedsudo ubuntu-drivers autoinstall # 同意安装推荐版本#或者 sudo apt install nvidia-xxx 安装指定版本第二种安装方法sudo add-apt-repository ppa:gr

2021-06-06 17:37:07 818 1

原创 [code]自定义二分类数据集以及利用保存的模型输出评价指标

from sklearn.metrics import confusion_matrix, f1_score, precision_score, recall_score, accuracy_scoreimport pickleimport numpy as npfrom keras.models import load_modelfrom keras.utils import np_utilsif __name__ == '__main__': # 输入数据、标签和模型的地址 .

2020-12-08 16:45:30 351 1

原创 多任务学习综述

本篇来自论文《An Overview of Multi-Task Learning in Deep Neural Networks》一、Introduction机器学习中,我们通常关心针对特定指标的优化,无论这是某个基准的分数还是业务关键绩效指标。为了做到这一点,我们通常训练一个模型或一组模型来执行我们所期望的任务。然后我们对这些模型进行微调,直到它们的性能不再提高。虽然我们通常可以通过这...

2020-03-30 21:22:41 3775

原创 初始PyTorch(九):对抗生成网络GAN

生成对抗网络GAN包含一个生成器(Generator)和一个判别器(Discriminator)。生成器用来生成假图片,判别器则用来区分,输入的图片是真图片还是假图片。生成器希望生成的图片可以骗过判别器(以假乱真),而判别器则希望提高辨别能力防止被骗。两者互相博弈,直到系统达到一个稳定状态(纳什平衡)。1.训练D:G:2.纳什平衡当G固定住,训练D:当D固定住,...

2020-03-29 20:05:52 281

原创 实战PyTorch(三):Auto Encoder & Variational Autoencoder

1.Auto Encoder具体流程:输入==RESHAPE==>784=>1000=>1000=>20=>1000=>1000=>784==RESHAPE==>输出1.网络网络层:encoder{[b, 784] => [b, 20]} + decoder{[b, 20] => [b, 784]}连接层:input....

2020-03-27 22:36:04 757 1

原创 初始PyTorch(八):自编码器Auto-Encoders

XXX

2020-03-27 20:48:34 420

原创 实战PyTorch(二++):宝可梦自定义数据集之迁移学习

X

2020-03-27 18:06:10 671

Ubuntu20.04 nvidia-docker离线安装包.zip

Ubuntu20.04 nvidia-docker离线安装包.zip

2021-12-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除