自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(60)
  • 资源 (1)
  • 收藏
  • 关注

原创 AIGC | Pika1.0免费开放网页版「体验经验分享」

Pika1.0官方宣布正式向所有人开放网页版本试用资格,每个用户都可免费体验该创意视频制作平台。该版本以文生视频为特色,提供3秒视频快速生成和背景修改等功能,尤其擅长动漫风格的动物生成。Pika1.0目前支持文生视频、图生视频、视频生视频和视频编辑等主要功能。

2024-01-05 10:11:18 672

原创 AIGC|一文梳理「AI视频生成」技术核心基础知识和模型应用

2022年是AIGC(生成式AI)元年!从这一年开始,可谓是百家争鸣,各种技术层出不穷,再次迸发出AI的活力。从DALL·E 2、Stable Diffusion、Midjourney等文生图应用点燃了大众的热情,再到ChatGPT的横空出世,更是掀起了一股AI浪潮。2023年是AIGC大爆发的一年,经过一年多的发展,AI绘画可以说已得到了长足的发展,而这也进一步促进了AI视频生成的发展。

2024-01-05 10:03:23 1819 1

原创 开启AI大模型时代|「Transformer论文精读」

目前主流的序列转换模型都是基于复杂的RNN或CNN网络,包括编码器和解码器。最好的性能模型还通过一种注意力机制将编码器和解码器连接起来。本文提出了一种新的简单的网络架构——,它仅基于注意力机制,完全摒弃了循环和卷积。对两个机器翻译任务的实验表明,这些模型在质量上优于传统的模型,并且可以并行化处理,同时需要训练的时间显著减少。我们展示了Transformer在应用到英语成分句法分析(包括大规模和有限数据情况)时,能够成功地进行推广和应用。

2023-10-08 21:27:59 482 3

原创 计算机视觉 | 语义分割与Segmentation

将图像按照物体的类别分割成不同的区域;对每个像素进行分类。2)K-Net5)SAM五、语义分割模型的评估1、真实图与预测图。

2023-06-12 22:21:45 712

原创 计算机视觉 | MMDetection代码实战课

本教程采用 RTMDet 进行演示,在开始自定义配置文件前,先来了解下 RTMDet 算法。RTMDet 是一个高性能低延时的检测算法,目前已经实现了目标检测、实例分割和旋转框检测任务。其简要描述为:**为了获得更高效的模型架构,MMDetection 探索了一种具有骨干和 Neck 兼容容量的架构,由一个基本的构建块构成,其中包含大核深度卷积。MMDetection 进一步在动态标签分配中计算匹配成本时引入软标签,以提高准确性。

2023-06-09 21:51:23 1431

原创 计算机视觉 | 目标检测与MMDetection

给定一张图片 ——》用矩形框框出所感兴趣的物体同时预测物体类别。

2023-06-08 22:18:26 1162

原创 计算机视觉 | 深度学习预训练与MMPretrain

MMPretrain 源自 MMClassification 和 MMSelfSup,并开发了许多令人兴奋的新功能。目前,预训练阶段对于视觉识别至关重要,凭借丰富而强大的预训练模型,我们能够改进各种下游视觉任务。我们的代码库旨在成为一个易于使用和用户友好的代码库,并简化学术研究活动和工程任务。

2023-06-06 21:10:31 566

原创 计算机视觉 | 人体关键点检测与MMPose

从给定图像中识别人脸、手部、身体等关键点输入:图像输出:所有关键点的像素坐标(x1,y1),(x2,y2)... (xj,yj),这里j为关键点的总数,取决于具体的关键点模型。

2023-06-02 23:03:45 1365

原创 计算机视觉 | 开源计算机视觉神器OpenMMLab

OpenMMLab诞生于2018年,是一个由中国开发者主导,有国际影响力的人工智能·计算机视觉开源算法体系。OpenMMLab累计开源超过30个算法库、2400个预训练模型,涵盖图像识别分类、目标检测、图像分割、姿态估计、视频理解、OCR、3D目标检测、3D人体姿态估计、模型轻量化、自监督、少样本、光流、预训练、多模态、AIGC、推理部署等等计算机视觉任务,在Github上累计获得十万颗star,超过了Pytorch。

2023-06-01 23:29:18 329

原创 将博客搬至CSDN

将博客搬至CSDN。

2023-03-11 11:14:24 63 1

原创 【CV第三篇】目标检测风云二十年

开篇寄语气如云气,自我纵横。天地洞明,万物可兵。

2022-07-22 00:00:00 1178

原创 【CV第二篇】图像分类经典网络结构精选论文合集

图像分类(Image Classification)是计算机视觉四大基本任务之一,在上一篇文章中,有讲到计算机视觉四大基本任务,其中介绍了图像分类的原理,并且图像分类也是作为计算机视觉的入门任务,那么快速地吃透经典的baseline论文,无疑是最有效地入门CV的方式,也能够帮助我们快速地构建起学习其他任务的基石。正所谓,基础不牢,地动山摇!接下来,让我们认识下经典的图像分类baseline基石论文吧!!!...

2022-06-20 13:39:31 1589

原创 【CV第一篇】计算机视觉的四大基本任务

修炼一途,乃窃阴阳,夺造化,转涅槃,握生死,掌轮回。武之极,破苍穹,动乾坤!! ——《武动乾坤》

2022-06-14 21:00:00 5162

原创 Visual studio 2019 配置openVINO2021.2开发环境

目录1、下载2、解压并安装3、visual studio 2019 配置openVINO3.1 创建工程3.2 添加【VC++目录】3.3 添加【附加依赖项】4、结束1、下载前往【OpenVINO官方下载地址】,进入下载页面:下载安装包:2、解压并安装选择解压路径:选择安装路径,后续选择Next即可,安装完成后,在安装路径目录下有两个文件夹,如下所示:3、visual studio 2019 配置openVI...

2021-07-16 18:52:19 1565 2

原创 ubuntu16.04安装ffmpeg

1、添加源sudo add-apt-repository ppa:djcj/hybrid2、更新源sudo apt-get update3、安装sudo apt-get install ffmpeg

2020-11-13 15:21:37 266

原创 centos7更新nvidia显卡驱动

问题docker: Error response from daemon: OCI runtime create failed: container_linux.go:344: startingcontainer process caused "process_linux.go:424: container init caused \"process_linux.go:407: runningprestart hook 1 caused \\\"error running hook: exit s

2020-10-14 15:45:26 3774

原创 centos7离线安装docker和nvidia-docker

一、环境 因某些环境,不能联外网,所以使用docker yum源方法行不通,于是打算离线安装 环境:contos7.3(内核需为3.10+)cat /etc/redhat-release# CentOS Linux release 7.3.1611 (Core)下载:docker-18.06.3-ce.tar二、安装步骤1、卸载旧dockera、停止正在运行的容器docker stop $(docker ps -a -q)b、删除所有的容器docker rm

2020-10-14 15:18:23 3635 1

原创 【神奇的CV】计算机视觉不同方向的demo展示

一、行人ReID(跨境追踪)、行人跟踪方向跨境追踪(Person Re-Identification,简称 ReID)技术,又称为行人重识别,是计算机视觉方向的热点课题,主要解决跨摄像头、跨场景下的行人识别与检索。作为人脸识别技术的补充,对无法获取清晰人脸的行人进行跨摄像头的连续跟踪,增强数据的时空连续性。ReID 技术的整个实现流程如下图,完整的 ReID 流程分三个步骤:1)从摄像头监控视频中获取原始图片;2)将原始图片中的行人位置检测出来组成 Gallery 集;3)利用深度学习技

2020-09-18 17:05:51 855

原创 【python】python生成requirements.txt的两种方法

生成requirements.txt,有两种方式:第一种 适用于单虚拟环境的情况:pip freeze > requirements.txt为什么只适用于单虚拟环境?因为这种方式,会将环境中的依赖包全都加入,如果使用的全局环境,则下载的所有包都会在里面,不管是不时当前项目依赖的,如下图当然这种情况并不是我们想要的,当我们使用的是全局环境时,可以使用第二种方法。第二种(推荐)使用pipreqs,github地址为: https://github.com/bndr/p...

2020-09-08 20:02:23 2816

原创 【深度学习环境配置】import cv2报错ImportError: libGL.so.1

ubuntu 16.0.4 import cv2报错解决办法:apt install libgl1-mesa-glx

2020-09-08 14:48:10 2262 1

转载 ubuntu16.04打开以及关闭图形界面

转载自https://blog.csdn.net/qq_36317016/article/details/79548895?utm_source=blogxgwz01.不可恢复:sudo systemctl disable lightdm.service2.可恢复:sudo systemctl set-default multi-user.target打开图形界面,分别针对上述1和21sudo apt-get install --reinstall lightdm2

2020-08-31 13:29:32 1496 1

原创 【史上最全】ubuntu16.04安装NVIDIA显卡驱动+CUDA+CUDNN+nvidia-docker+Anaconda3等深度学习基础开发环境

默认已安装好Ubuntu16.04系统。一、更换软件源1、找到并备份配置文件我们需要对apt源的配置文件进行修改 。进入/etc/apt目录,我们可以看到sources.list文件。为了保证安全,我们在修改前先把sources.list文件进行备份。sudo cp sources.list sources.list.bak2、修改配置文件sources.list建议先安装vim编辑工具,因为自带的vi特别难用,vim是vi的增强版。sudo apt-get insta.

2020-08-29 16:49:50 1936

转载 【pytorch】pytorch查看CUDA支持情况,只需要三行代码

转载自https://www.cnblogs.com/liuke-note/p/10149530.html

2020-08-10 19:54:39 1185

转载 【pytorch】pytorch使用清华源快速安装

转载自https://blog.csdn.net/maitianpt/article/details/104272815

2020-08-10 11:12:28 631

原创 linux查看cuda、cudnn等软件版本的命令

nvcc –V或者:CUDA:cat /usr/local/cuda/version.txtcudnn:cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

2020-07-24 14:15:01 1981 1

原创 目标检测经典网络之Mask R-CNN

Mask R-CNNMask R-CNN是He Kaiming大神于2017年的力作,其在进行目标检测的同时进行实例分割,取得了出色的效果,其在没有任何trick的情况下,取得了2016年COCO比赛的冠军,其网络设计也比较简单,在Faster R-CNN的网络结构基础上,在原本的两个分支上(分类+回归)增加了一个分支进行图像分割,如下图所示:摘要Mask R-CNN可以看作是一个...

2020-02-16 21:19:31 1233

原创 目标检测经典网络之Faster RCNN

Faster R-CNN针对Fast R-CNN的缺陷而提出。由于Fast R-CNN,采用的是Selective Search(SS),测试时的很大一部分时间要耗费在候选区域的提取上。Faster R-CNN正是为解决这个问题而提出来的。为了更好地理解Faster R-CNN,我们先看一下其整体结构,如下图:更为详细的图,如下:通过上图可以看出,Faster R-CNN主...

2020-02-15 16:24:31 714

原创 目标检测之NMS

NMS,全称为Non-maximum suppression,非极大值抑制,是一种去除非极大值的算法,常用于计算机视觉中的边缘检测、目标检测等。其作用是去掉detection任务中重复的检测框。算法流程给出一张图片和其上面许多物体检测的候选框(即每个框可能代表某种物体),但是这些框很可能有相互重叠的部分,我们要做的就是只留下最优的框。假设有N个框,每个框被分类器计算得到的分数为Si,i∈[...

2020-02-07 17:03:44 1090

原创 目标检测之ROI Pooling及其改进

一、什么是ROI PoolingROI是Region of Intersect的简写,是指一张图的感兴趣区域,可以理解为目标检测的候选框也就是region of proposal,我们将原图进行特征提取的时候,就会提取到相应的特征图feature map。那么相应的ROI就会在feature map上有映射,这个映射过程就是ROI Pooling的一部分,一般ROI的步骤会继续进行max po...

2020-02-07 11:21:19 2709 1

原创 目标检测经典网络之Fast R-CNN

Fast R-CNNR-CNN的最大缺陷是:对每个SS产生的proposal都要进行截图再放到CNN中进行计算,假设有2000个region proposal,就要进行2000次,效率非常低!!Fast R-CNN对其改进:对原图先整张图进行一次CNN特征提取。首先,我们先了解一下SPPNetSPPNet:空间金字塔池化卷积网络(Spatial Pyramid Pooling Co...

2020-02-05 16:35:48 329

原创 目标检测经典网络之R-CNN

一、目标检测(Object detection)图像识别是输入一张图像,输出该图像对应的类别。目标检测输入是一张图像,但输出不单单是图像的类别,而是该图像中所含的所有目标物体以及它们的位置,通常使用矩形框来标识物体的位置。大部分的目标检测方法流程是:生成区域候选框,对这些区域框提取特征(SIFT 特征 、HOG 特征、CNN),使用图像识别方法(SVM、CNN),得到所有分类成功的区域...

2020-02-05 15:34:09 267

原创 【Python】pip和Anaconda添加清华镜像源

一、pip添加清华镜像源pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple二、Anaconda添加清华镜像源conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/conda ...

2019-12-11 14:05:40 2977

转载 目标检测(Object Detection)入门概要

转自:目标检测(Object Detection)入门概要 - hyfine - CSDN博客https://blog.csdn.net/f290131665/article/details/81012556

2019-10-11 11:08:09 126

转载 【YOLO系列】yolov3技术总结整理

yolov3可去darknet官网下载,github上有caffe、keras、pytorch等版本。基本思想首先通过特征提取网络对输入的图像提取特征,得到一定大小的feature map 比如 13X13,然后将输入的图像分为13X13个grid cell,然后如果groundtruth中的某个物体的中心坐标落到那个grid cell中就由该grid cell预测该物体,每个grid c...

2019-08-20 11:51:02 1088

原创 【深度学习】DNN网络简单理解

深度神经网络1、基本概念DNN(Deep Neural Network)神经网络模型又叫全连接神经网络,是基本的深度学习框架。与RNN循环神经网络、CNN卷积神经网络的区别就是DNN特指全连接的神经元结构,并不包含卷积单元或是时间上的关联。2、DNN发展历程1)神经网络技术起源于上世纪五、六十年代,当时叫感知机(perception),拥有输入层、输出层和一个隐含层。但单层感知机并...

2019-08-12 11:34:57 2838

原创 【数据集】计算机视觉方向常用公开数据集

做深度学习人工智能方向,两大块最为重要:一、数据;二、算法模型!!!我认为数据在模型训练中占据至关重要的地位,甚至达到整个项目开发中的70%以上!!在偶然间发现了一个计算机视觉方向很全的数据集地址,原文链接如下:http://homepages.inf.ed.ac.uk/rbf/CVonline/Imagedbase.htm#action这对计算机视觉算法模型的训练和评估具有很大的帮助...

2019-07-25 11:38:49 361

原创 【python】利用python批量处理将图片粘贴到另一张图片上并保存

pillow真的是一个很强大的图像处理库!!!!本人利用pillow库实现了将文件夹下的批量照片随机粘贴到另一张图片上,并批量保存到指定文件夹!!!直接上代码:from PIL import Imageimport osimport randomdef handle_img(imgdir,imgFlodName): imgs = os.listdir(imgd...

2019-06-25 17:30:43 7212 1

转载 【宏观认识YOLO系列】目标检测之yolo系列总结

YOLO的思想:本文逐步介绍yolov1-v3的设计过程一、YOLOv1基本思想YOLO将输入图像分成SxS个格子,如果某物体的Ground truth的中心位置的坐标落入到某个格子,那么这个格子就负责检测出这个物体。每个格子预测B个bounding box及其置信度,以及C个类别概率。网络结构1、YOLOv1网络借鉴GoogleNet分类网络结构。但并未使用inc...

2019-06-25 11:42:15 1263

原创 【python爬虫】python爬取百度图片中的图片

话不多说,直接上代码,一看便懂!!!!!!!!!# coding=utf-8"""根据搜索词下载百度图片"""import reimport sysimport urllibimport requestsimport randomdef getPage(keyword, page, n): page = page * n keyword = urllib.pa...

2019-05-31 15:25:51 249

原创 【tensorflow】tf.shape()和x.get_shape()的用法

一、tf.shape()获取的是张量的大小,直接上代码,一看便知:#tf.shape()获取的是张量的大小import tensorflow as tfimport numpy as npa_array = np.array([[1,2,3],[4,5,6]])b_list = [[1,2,3],[4,5,6]]c_tensor = tf.constant([[1,2,3],...

2019-05-09 12:00:43 1802

BINGobjectness特征实验

BINGobjectness特征实验——程明明源码——快速实时目标检测程序

2018-03-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除