自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(54)
  • 资源 (2)
  • 收藏
  • 关注

原创 ubuntu基本配置

安装conda以miniconda为例,Linux下sh Miniconda3-latest-Linux-x86_64.sh -b,然后~/miniconda3/bin/conda init即可。windows下可以搜索下载安装。conda也是一模一样的操作。conda换源显示有哪些源(全局)conda config --show-sources删除所有源conda config --remove-key channels删除某条源conda config --remove channe

2021-07-15 09:59:37 430

转载 Stable diffusion

VAE文件在 Stable Diffusion一代中用于提升眼睛与面部的绘画结果。正如前面讲的,它们是自动编码器所对应的解码器。通过对解码器进行调教,Stable Diffusion模型的生成图像可以拥有更好的细节表现。你可能注意到了我前面有一处描述并不是完全正确的。将图片压缩至潜空间是会丢失原始图像的信息的,因为原始的VAE并不能对细节进行恢复。因此VAE解码器将负责在解码过程中绘制那些精细的细节内容。

2024-01-12 11:25:00 296

原创 dockerDesktop使用方法

不加tag(版本号) 即拉取docker仓库中 该镜像的最新版本latest 加:tag 则是拉取指定版本。并且在软件的设置的Docker Engine里添加阿里镜像源,------当前镜像没有被任何容器使用才可以删除。—无论容器是否开启 都可以进行拷贝。装在C盘会容易满,可以装在D盘,

2023-11-21 16:35:04 572

原创 L1和L2正则化的三种不同角度的理解

正则化是一个专有名词,和正则表达式中的正则没有任何关系。L1和L2正则化就是用L1范数和L2范数来规范模型参数的这么一种方法,Dropout也叫正则化,但这两种方法天差地别。在花书中正则化的定义为凡是可以减少泛化误差而不是减少训练误差的方法都可以称作是正则化方法,即凡是能减少过拟合的方法都能被称作是正则化方法。范数把空间中两点的距离这个概念进行了扩充。

2022-11-18 11:47:57 752 1

转载 2D姿态估计regression-based之RLE损失函数

2D姿态估计 涨点之损失函数

2022-08-29 01:51:15 1596

原创 深度优先搜索(DFS)和广度优先搜索(BFS)

DFS && BFS

2022-08-21 00:06:06 22652

转载 Vision Transformer 必读系列之图像分类综述

转自openmmlab

2022-07-25 11:30:32 1312 2

原创 marathon-envs项目环境配置(强化学习模仿参考动作)

配置环境进行训练

2022-06-09 11:18:28 641

原创 角色动画(Character Animation)的现状与趋势

个人需求需求:靠游戏手柄(用户)以虚拟人物的根轨迹trajectory来控制用户朝向,同时通过控制输入来合成出人难以做到的动作。若缺少数据集,可以用强化学习来完成一些靠手柄来控制的动作如飞踢,还要可以完成用户指哪踢到哪的需求,而身体其他部位的动作靠动捕完成(可以考虑不同人物动作风格),即每一种语义必须由用户来决定。考虑过插帧的方法,即用不同来源动作库、游戏控制、捕捉等来组合进行插帧,经讨论过后还是决定采用第二点。现有问题:动捕数据比较贵缺少大的数据集,并且已有的数据集比如人物动画目前动捕数据

2022-05-24 19:10:54 1176 1

转载 3D人体姿态估计(介绍及论文归纳)

3D人体姿态估计(介绍及论文归纳) 基本概念姿态估计难点人体结构化特性2D 姿态估计任务挑战 3D 姿态估计问题挑战应用方法 数据集类型可用信息姿态数据集PoseTrackCrowdPoseHuman3.6MDensePoseCOCOMPIIFLICLSP RGB数据集Leeds Sports Pose (LSP) DatasetFLIC DatasetMPII Human Pose DatasetMS COCO Keypoint LeaderboardAI ChallengePoseTr.

2022-05-20 19:59:27 1925

原创 由frankmocap得到的.pkl文件转为.bvh或者.fbx

需求由Frankmocap所得到的.pkl文件转为blender里的.bvh或者Maya里的.fbxFrankmocap_github项目地址问题1.到2022年5月9号为止项目原作者还没有更新这一功能,即提供一个blender的addon;2.第三方作者魔改了很多相关的插件,可以为EasyMocap,Vibe,Frankmocap等提供blender接口;然而很多可能满足smpl需求却不满足smplx需求;3.blender里的python环境,package的安装相关教程较少,官方文档又不想

2022-05-09 20:11:35 3212 14

原创 带标记的光学动捕(编码设计及匹配)

介绍:多视角下匹配不同RGB图上的同一ID,并进行三角化重建。编码ID规则:编码规则为 一个中心点周围的 四个角点和另外四个边中心点 分成两组各自为循环数组,若一张图片上的编码即这两组循环数组都与另一张图上的相等,则认为这两个ID是同一个ID。如下两幅示意图:代码:'''author: daobokerdate: 2022.4.28description: 编码规则为 一个中心点周围的 四个角点和另外四个边中心点 分成两组各自为循环数组,\ 若

2022-04-28 16:57:58 277

原创 batchsize对测试集结果有影响吗

batch-size调整后,相应的学习律,梯度累加等可能都要调整,有时候也可以调整一些过拟合参数,比如dropout, bn等。个人理解,在test的时候,batchsize不会对测试结果产生影响,有很多人在test的时候都是不设batchsize的,直接读进去。至于valid,个人认为,只要用了model.eval(),batchsize也不会影响结果。Bachnormalize虽然会带进去两个参数gamma和beta进行训练,但是train完之后就归一化操作中的mean和var就定死了(用了.eva

2022-04-13 15:13:16 4186

转载 人体姿态估计相关理论

姿态估计论文汇总 Stacked Hourglass/CPN/Simple Baselines/MSPN/HRNet制作自己的COCO关键点数据集关键点之热力图Heatmap与坐标FC回归1关键点之热力图Heatmap与坐标FC回归2关键点检测——标签(Ground Truth)构建——Coordinate、Heatmap和Heatmap + Offsets人体姿态估计数据集:MPII、COCO与 AI Challenger 的标注格式可视化两种骨骼关节点检测方式基于深度学习的人体骨骼关节点的

2022-03-21 22:12:38 1661

原创 Auto-Encoders、VAE及实战

无监督学习Why needed降维;预处理:巨大的尺寸,比如224x224,很难处理;可视化:https://projector.tensorflow.org/;利用无监督的数据;压缩、去噪、超分辨率Auto-Encoders我们的目标就是重建他自己,最后一层重建节点784跟原来输入的节点一样。特殊点:1.输入和输出的维度一样,保证可以重建;2.中间有个neck,可以升维也可以降维大部分是降维784=>2,降到两维时可以在二维向量表示,保留原有的信息;Loss function

2022-03-19 18:10:21 3864

原创 自定义数据集(Pokemon)实战

Load datainherit from torch.utils.data.Dataset__len__返回一个样本数量__getitem__去读取一个具体的样本大致的逻辑为:完成初始化工作,把所有图片信息加载进来,图片的路径和label根据mode模式是train还是valid做各种裁剪得到样本数量和具体样本,返回的img和label就是对应idx的自定义数据tensor类型class NumberDataset(Dataset): def __init__(self, training=T

2022-03-17 17:29:40 2688

原创 ResNet和LeNet在CIFAR10数据集上的实战

主函数import torchfrom torch.utils.data import DataLoaderfrom torchvision import datasetsfrom torchvision import transformsfrom torch import nn, optimfrom lenet5 import Lenet5from resnet import ResNet18def main(): batchsz = 12

2022-03-16 17:31:32 246

转载 面试题面经

机器学习面试题面经 深度学习卷积神经网络面试题面经 PyTorch面试题面经 Python面试题面经 Linux,Git面试题面经 HR面试题面经 KNN:特点是完全跟着数据走,没有数学模型可言。适用:需要一个容易解释的模型的时候,比如需要向用户解释原因的推荐算法。 感知机 贝叶斯:核心是根据条件概率计算待判断点的类型。适用:易解释,而且不同维度之间相关性较小的模型。可以处理高维数据,虽然效果一般。 逻辑回归 决策树:适用:它能生成清晰的基于特...

2022-02-23 21:19:51 626

原创 【无标题】

内存地址的计算方法内存地址的计算方法内存是按字节编址的,所以单位是字节哈,1字节可是等于8位的。因为计算的范围一般比较小,所以就记住两个就够了。记住几个常用的2的10次方为1024即1KB2的20次方=(2的10次方)的平方,即1MB就行了如果要求更大的,那就再记住2的30次方=(2的10次方)的3次方=1GB,一般就够用了。DFFFF-A0000 = 3FFFF一眼看不出来大小滴,或许你要用笔算,不过用这个方法两眼就能看出来:3FFFF加1展开为2进制就是2的18次方,是吧,即2的10次方

2022-01-12 16:51:38 780

转载 int类型,构造函数

不同平台下int类型、指针类型的数据大小对于int类型数据和指针类型数据的大小,是非常基础的问题。在一个具体的平台上,确定他们最好的办法就是使用sizeof(type)对其进行判断,返回当前数据类型的大小。在不同的平台下,int类型和指针类型的数据类型大小时怎样的呢?如果要给出一个统一的答案,自然不可能集齐每个平台,一个个地去试,我们必须从底层进行分析。数据总线和地址总线计算机内的数据总线是CPU与外设进行数据交换的通路,而地址总线则是CPU用于寻址的通路。数据总线的位数决定了CPU与外设一次.

2022-01-11 18:30:55 909

转载 Pytorch_加载自己的数据集并训练

如何制作数据集txt,并进行加载1. 根据图片制作train.txt val.txt 和 test.txt# MakeTxt.py"""原始图片保存路径**************文件保存方式 一 *******************--data --train --category_1 --category_2 ... --val --category_1 --category_2

2021-12-09 15:32:48 562

原创 方差、偏差 BN

通过对泛化误差进行分解说明,模型泛化性能是由学习算法的能力、数据的充分性以及任务本身的难度所共同决定的。一般来说,偏差与方差是有冲突的,这称为偏差-方差窘境(bias-variane dilemma)。信息论的基本想法是一个不太可能的事件居然发生了,要比一个非常可能的事件发生,能提供更多的信息。直接计算上式是不行的,我们得进行分解,分解之前需要先知道方差、偏差、噪声的定义。模型训练集上的期望预测与预测之差的平方的期望值,使用样本数相同的不同训练集产生的。的随机遍历进行编码所需的最小字节数,而交叉熵。

2021-12-07 21:23:23 2600

原创 多视图几何三维重建

我们首先介绍使用十分广泛的几种图像处理算法,然后转而介绍器像处理的机器学习实现。本章的主要内容如下:使用SIFT(scale-invariant feature transform,尺度不变特征转换)算法的特征映射使用RANSAC(random sample consensus,随机样本共识算法的图像配准使用人工神经网络的图像分类使用卷积神经网络的图像分类使用机器学习的图像分类重要术语使用SIFT算法的特征映射假设我们有两张图像。一张图像是公园里的长凳,另一张图像是包含那张长凳的整个公园

2021-12-06 21:59:35 4288

原创 pyton3.x上的SMPLify运行

SMPLify Demo Test为了验证之前提出的毕设方案的可行性,这个星期的主要任务是配置环境运行 SMPLify 的 demo 代码,但这个过程中还是遇到不少问题的。 首先,SMPLify 的依赖库有 numpy、scipy、chumpy、opendr、matplotlib、opencv、openGL、SMPL 等,其中:chumpy、opendr、SMPL 仅支持 Python 2.x 版本。但是,考虑到我们之后可能会用到基于 Python 3.x 的外部库(如 Tensorflow 等),我们

2021-12-02 20:43:44 5176 7

转载 YOLOv3 算法的一点理解

YOLOv3 算法的一点理解2018-12-28 | 目标检测 | 2147 阅读 | 8.8k 字 | 35 分钟今天讲一讲 YOLOv3, 目标检测网络的巅峰之作, 疾如风,快如闪电。 1. 算法背景假设我们想对下面这张 416 X 416 大小的图片进行预测,把图中 dog、bicycle 和 car 三种物体给框出来,这涉及到以下三个过程: 怎么在图片上找出很多有价值的候选框?接着判断候选框里有没有物体?如果有物体的话,那么它属于哪个类别?听起来就像把大象

2021-11-30 22:46:33 1781

原创 SMPLify简介及在python2.7环境下的运行

Keep it SMPL: Automatic Estimation of 3D Human Pose and Shape from a Single ImageGetting Start这篇文献介绍了一种新技术 SMPLify。通过使用 SMPLify,我们可以在不进行手工标注特征的情况下将一幅单纯 2D 的人体姿势图像转化为对应的 3D 模型。首先,作者使用了一个名为 DeepCut 的 CNN 来提取 2D 图像输入的特征关节点,但此时的关节点是缺乏深度信息的。作者接下来对上一步获得的 2D 关节

2021-11-27 21:33:07 4838 4

原创 Python, zsbd

汉诺塔问题(Hanoi)任务可以分解成几个步骤进行,这个思想很重要叫做任务分解。分解成几个任务这几个任务跟原来的任务相比形式相同规模变小了,就可以用递归的方法来做了。跟上台阶问题一样,根据“先做一步,看看剩下的问题怎么样”的思想,第一步若是可以爬一级或两级这两类走法,则n级台阶的走法ways(n) = wany(n-1)+ways(n-2)。def Hanoi(n, src, mid, dest): # 将src上的n个盘子,以mid座为中转,移动到dest座,print相当于移动操作 if(n

2021-11-12 23:23:01 1064

转载 kaggle竞赛CowBoy Outfits Detection开源代码——training-cowboy-object-detection-using-yolov5rddc

Cowboy Outfits DetectionIn this notebook, base library used is yolov5 for rddc2020 lib which enables model ensemble The data transfer refers to https://www.kaggle.com/sheepwang/training-cowboy-object-detection-yolov5?rvi=1%cd /kaggle/%ls/kaggleinput

2021-11-11 23:04:00 1003

转载 kaggle竞赛CowBoy Outfits Detection开源代码——windows下使用Yolov5l用于牛仔行头检测

windows下使用Yolov5l用于牛仔行头检测本次牛仔行头检测我使用的是ultralytics/yolov5 ,该仓库提供了s、m、l、x四个规模的预训练模型,我使用的预训练模型是Yolov5l,最后可以在公榜(也就是valid.csv)上达到60的MAP值。由于kaggle上连续训练不能超过6个小时,所以我是在本地上进行的训练和测试。我的电脑系统是windows10,显卡为RTX2070s-8G,训练了200个Epoch。本次是目标检测竞赛,一张图片上可能存在多个目标,每个目标可以用四个值来进行

2021-11-09 21:04:03 851

原创 迁移学习与Fine-tuning微调

fine-tuning介绍

2021-11-07 21:50:58 1368

原创 YOLOV3林业病虫害数据集和数据预处理-paddle教程

林业病虫害数据集和数据预处理方法介绍在本课程中,将使用百度与林业大学合作开发的林业病虫害防治项目中用到昆虫数据集。读取AI识虫数据集标注信息AI识虫数据集结构如下:提供了2183张图片,其中训练集1693张,验证集245,测试集245张。包含7种昆虫,分别是Boerner、Leconte、Linnaeus、acuminatus、armandi、coleoptera和linnaeus。包含了图片和标注,请读者先将数据解压,并存放在insects目录下。!conda list# packa

2021-11-02 11:27:56 3575 5

转载 计算机视觉面试常见问题(含解答)

CNN CNN在图像上表现好的原因 直接将图像数据作为输入,不仅无需人工对图像进行预处理和额外的特征抽取等复杂操作,而且以其特有的细粒度特征提取方式,使得对图像的处理达到了几近人力的水平。 参数和计算量的计算 ![在这里插入图片描述](https://img-blog.csdnimg.cn/40461d6dc7314f8fb91e495931acfc8d.png)调试、修改模型的经验 数据层面 获取更多的数据、数据扩增或生成、对数据进行归一化或者标准化、重新进行特征选择 算法层面

2021-10-14 14:39:29 5370 1

转载 转载:C++后台开发学习路线(秋招,C++后台,面经)

后台开发包括的知识点很多,包括语言基础,算法,linux编程基础,linux内核,网络,数据库,分布式等等。面面俱到很难,一个领域钻研的很深也很难。我认识的大神里有把C++语言吃的非常透的,也有实验室就是搞分布式的,拿offer都非常轻松。语言基础,C++语言相关的: 《C++ Primer》,应该算是工具书,但我花了3个月一个字一个字啃完了,现在能记住的没几个了,但是好在全看完就不用看Effective C++...

2021-10-08 20:55:08 187

原创 Windows应用程序的消息处理机制

Windows应用程序的消息处理机制如图所示。操作系统接收到应用程序的窗口消息,将消息投递到该应用程序的消息队列中。应用程序在消息循环中调用GetMessage函数从消息队列中取出一条一条的消息。取出消息后,应用程序可以对消息进行一些预处理,例如,放弃对某些消息的响应,或者调用TranslateMessage产生新的消息。应用程序调用DispatchMessage,将消息回传给操作系统。消息是由MSG结构体对象来表示的,其中就包含了接收消息的窗口的句柄。因此,DispatchMessage函数总能

2021-10-08 10:43:02 363

转载 神经网络——梯度下降&反向传播

前言本篇是根据上一篇博文《神经网络–前向传播》续写的。https://blog.csdn.net/weixin_43955293/article/details/120297427本文中的数学知识有点,需要一点微分的知识。(会求导)就可以。基本概念在上文我们已经知道了什么是前向传播。就是当前层的输入是上一层的输出,当前层的输出是下一层的输入。然后一层一层的传递下去。反向传播也叫反向更新。根据感知机的原理。神经元产生输出之后要与正确的标签做一个对比然后更新调整自己的参数,经过反复训练达到一个很好的

2021-09-15 11:46:49 637

转载 神经网络-前向传播

前言本文是接着上一文多层感知机所写的。上一文说的了如何初始化一个MLP。本文简单介绍一下前向传播的概念以及代码实现。上文:https://blog.csdn.net/weixin_43955293/article/details/120293820BP网络(Back-ProPagation Network)又称反向传播神经网络, 通过样本数据的训练,不断修正网络权值和阈值使误差函数沿负梯度方向下降,逼近期望输出。它是一种应用较为广泛的神经网络模型,多用于函数逼近、模型识别分类、数据压缩和时间序列预测等

2021-09-14 21:53:02 2246

转载 多层感知机

多层感知器多层感知器(Multilayer Perceptron,缩写MLP)是一种前向结构的人工神经网络,映射一组输入向量到一组输出向量。MLP可以被看作是一个有向图,由多个的节点层所组成,每一层都全连接到下一层。除了输入节点,每个节点都是一个带有非线性激活函数的神经元(或称处理单元)。一种被称为反向传播算法的监督学习方法常被用来训练MLP。 MLP是感知器的推广,克服了感知器不能对线性不可分数据进行识别的弱点。前言本博文主要介绍一下多层感知器的结构,并且用代码实现网络结构的初始化。随笔而已,写的比

2021-09-14 20:52:41 2808

转载 无监督学习分类

  目录 1 聚类 1.1 K-均值算法(K-Means) 1.2 层次聚类(Hierarchical Clustering) 1.3 基于密度聚类Mean Shift 1.4 基于密度聚类DBSCAN 1.5 高斯混合模型(GMM)与EM 1.6 基于图论聚类 2 降维 2.1 主成分分析(Principal Component Analysis,PCA) ...

2021-09-03 22:10:56 12192

原创 pycharm通过ssh远程使用服务器解释器

pycharm专业版,学生免费申请一年可续期部署设置,添加SFTP,填写SSH配置,根路径自动检测,映射不填设置或者新项目设置里面,添加Python解释器(SSH解释器),解释器路径一般为服务器上anaconda3/envs/虚拟环境/bin/python,完成后编辑修改为部署配置。可在设置里的解释器里远程安装package,装不了的用终端命令装,一些难装的包(比如dlib)可以去anaconda.org网站搜索通过命令行安装。每次打开一个新项目,如果要用到远程解释器先改一下部署的映射路径,然后把.

2021-09-02 10:46:39 1333

转载 欧拉角,旋转向量,四元数与旋转矩阵

1.坐标系介绍与旋转角1.坐标系分为左手坐标系和右手坐标系,一般来说,右手坐标系更加常用一些,区别在于: 四指从X轴弯曲到Y轴,若右手大拇指指向Z轴方向,则为右手坐标系。若左手大拇指指向Z轴方向,则为左手坐标系。 2.在三维旋转中,物体的旋转次序也是十分重要的,例如,(a,b,c)在不同的旋转顺序下会有不同 的结果。 欧拉角的旋转顺序有很多,例如:Z-X-Y,X-Y-Z,X-Y-X,Z-X-Y。 且任意旋转可以分解成以下三个轴上的转角: 绕物体的Z轴旋转,得到偏航角yaw;绕旋转之后的Y轴旋转,得到

2021-08-30 16:15:58 2840 2

smplayer-20.6.0-x64.exe

smplayer-20.6.0-x64.exe

2021-06-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除