顾道长生'-CSDN博客

原创更改pip源至清华、阿里、中科大镜像（临时使用）

可以在使用pip的时候加参数清华源：-i https://pypi.tuna.tsinghua.edu.cn/simple阿里源：-i https://mirrors.aliyun.com/pypi/simple中科大源：-i https://pypi.mirrors.ustc.edu.cn/simple/ ...

2019-10-05 16:29:07 12581

原创 (ICML-2021)从自然语言监督中学习可迁移的视觉模型

SOTA计算机视觉系统经过训练可以预测一组固定的预定目标类别。这种受限的监督形式限制了它们的通用性和可用性，因为需要额外的标记数据来指定任何其他视觉概念。直接从原始文本中学习图像是一种很有前途的替代方案，它利用了更广泛的监督来源。我们证明，预测哪个标题与哪个图像对应的简单预训练任务是一种高效且可扩展的方法，可以在从互联网收集的 4 亿对（图像、文本）数据集上从头开始学习 SOTA 图像表示。预训练后，使用自然语言来引用学习的视觉概念（或描述新的视觉概念），从而实现模型零样本传输到下游任务。

2024-04-23 22:29:50 555

原创学术论文写作

字数：期刊（300字左右）、会议（150字左右）、毕业论文（一般不超过一页）第一，要在摘要里提及的是，你要研究的任务是什么，有什么理论和实际应用价值。这大概可以用一句话来进行总结。比如步态识别根据走路的姿势识别身份，就可以写“步态识别是生物认证的方式之一，在社会安全、视频监控、身份认证方面有重要应用。与其他生物认证特征如人脸、虹膜、指纹等不同，步态是唯一可远距离识别的生物认证特征”。第二，是概括性地总结现有的技术路线和方案，帮助读者了解前沿进展在哪里。

2024-04-03 11:06:21 481

原创 (CVPR-2021)RepVGG：让 VGG 风格的 ConvNet 再次伟大

我们提出了一种简单但功能强大的卷积神经网络架构，它具有类似 VGG 的推理时间主体，仅由3×33 \times 33×3卷积和 ReLU 堆栈组成，而训练时间模型具有多分支拓扑。这种训练时间和推理时间架构的解耦是通过结构重参数化技术实现的，因此该模型被命名为 RepVGG。据我们所知，在 ImageNet 上，RepVGG 达到了超过 80% 的 top-1 准确率，这对于普通模型来说是第一次。

2024-02-03 09:43:55 972

原创 “天作之合”softmax与CrossEntropy

本文从max到logsumexp，再到softmax进行了一个简单推导，最后说明了softmax与CrossEntropy的关系。希望帮助大家理解多分类损失函数CrossEntropy。

2023-12-04 16:44:09 205

原创 (CVPR-2023)InternImage：利用可变形卷积探索大规模视觉基础模型

与近年来大规模视觉变换器（ViT）的巨大进步相比，基于卷积神经网络（CNN）的大规模模型仍处于早期状态。这项工作提出了一种新的基于 CNN 的大规模基础模型，称为 InternImage，它可以从增加参数和训练数据（如 ViT）中获得增益。与最近关注大密集核的CNN不同，InternImage以可变形卷积作为核心算子，使得我们的模型不仅具有检测和分割等下游任务所需的大有效感受野，而且还具有自适应空间聚合以输入和任务信息为条件。

2023-09-13 17:07:35 590

原创（CVPR-2023）用于步态识别的动态聚合网络

步态识别有利于多种应用，包括视频监控、犯罪现场调查和社会安全等。然而，步态识别在实际场景中常常受到多种外部因素的影响，例如携带条件、穿着大衣、不同的视角等。近年来，各种基于深度学习的步态识别方法取得了可喜的成果，但它们往往使用固定权重的卷积网络来提取显着特征之一，没有很好地考虑关键区域步态特征之间的关系，并且忽略忽略了完整运动模式的聚合。在本文中，我们提出了一个新的观点，即实际步态特征包括多个关键区域的全局运动模式，并且每个全局运动模式由一系列局部运动模式组成。

2023-08-23 17:14:45 750

原创 (CVPR-2019)用于人体姿势估计的深度高分辨率表示学习

人体姿势估计是计算机视觉中的一个重要研究领域。随着深度学习技术的发展，人体姿势估计的精度和鲁棒性得到了显著提高。其中，深度高分辨率表示学习是人体姿势估计领域的一种重要方法,它可以通过学习高分辨率的人体部位表示来提高姿势估计的准确性。一些常见的深度高分辨率表示学习方法包括：Hourglass网络、Stacked Hourglass网络、CPM网络等。

2023-07-13 15:02:33 231

原创（CVPR-2017）用于目标检测的特征金字塔网络

特征金字塔是识别系统中用于检测不同尺度对象的基本组件。但最近的深度学习对象检测器避免了金字塔表示，部分原因是它们是计算和内存密集型的。在本文中，我们利用深度卷积网络固有的多尺度、金字塔层次结构来构建具有边际额外成本的特征金字塔。开发了一种具有横向连接的自顶向下架构，用于构建所有尺度的高级语义特征图。这种称为特征金字塔网络 (FPN) 的架构在多个应用程序中显示出作为通用特征提取器的显着改进。

2023-06-19 09:52:12 1901

原创（CVPR-2014）DeepPose：通过深度神经网络进行人体姿态估计

我们提出了一种基于深度神经网络 (DNN) 的人体姿态估计方法。姿势估计被表述为基于 DNN 的针对身体关节的回归问题。我们提出了一系列这样的 DNN 回归器，从而产生高精度的姿态估计。该方法具有以整体方式推理姿势的优势，并且具有简单但强大的公式，它利用了深度学习的最新进展。我们对不同真实世界图像的四个学术基准进行了详细的实证分析，具有最先进或更好的性能。

2023-06-18 21:42:43 2188

原创 (ICIP-2022)GAITTAKE：通过时间注意和关键点引导嵌入进行步态识别

步态识别是指根据远距离采集的视频数据，根据人的体型和行走方式对人进行识别或识别，广泛应用于犯罪预防、法医鉴定和社会保障等领域。然而，据我们所知，大多数现有方法都使用外观、姿势和时间特征，而没有考虑用于全局和局部信息融合的学习时间注意机制。在本文中，我们提出了一种新颖的步态识别框架，称为时间注意和关键点引导嵌入（GaitTAKE），它有效地融合了基于时间注意的全局和局部外观特征以及时间聚合的人体姿势特征。

2023-06-16 15:41:35 603

原创 (CVPR-2023)通过有效的时空特征融合进行多模态步态识别

步态识别是一种生物识别技术，通过步行模式识别人。基于剪影的方法和基于骨架的方法是两种最流行的方法。但是剪影数据容易受到衣服遮挡的影响，骨架数据缺乏体型信息。为了获得更稳健、更全面的步态识别表示，我们提出了一种基于 transformer 的步态识别框架，称为 MMGaitFormer，它有效地融合和聚合了来自骨架和轮廓的时空信息。具体来说，空间融合模块（SFM）和时间融合模块（TFM）分别被提出用于有效的空间级和时间级特征融合。

2023-06-05 20:12:13 3917 7

原创 (ICCV-2017)可变形卷积网络

由于其构建模块中的固定几何结构，卷积神经网络 (CNN) 本质上仅限于模拟几何变换。在这项工作中，我们引入了两个新模块来增强 CNN 的转换建模能力，即可变形卷积和可变形 RoI 池化。两者都是基于这样的想法，即在没有额外监督的情况下，使用额外的偏移量来增加模块中的空间采样位置，并从目标任务中学习偏移量。新模块可以很容易地替换现有 CNN 中的普通模块，并且可以通过标准反向传播轻松地进行端到端训练，从而产生可变形的卷积网络。广泛的实验验证了我们方法的性能。

2023-04-03 16:02:14 958 1

原创 (CVPR-2022)视觉转换器与变形注意力

Transformer最近在各种视觉任务中表现出了卓越的表现。大的，有时甚至是全局的感受野赋予Transformer模型比CNN模型具有更高的表示能力。然而，单纯扩大感受野也会引起一些问题。一方面，使用密集注意力(例如在ViT中)会导致过多的内存和计算成本，并且特征可能会受到超出感兴趣区域的无关部分的影响。另一方面，在PVT或Swin Transformer中采用的稀疏注意力是数据不可知的，可能会限制对长期关系建模的能力。

2023-03-31 14:36:48 909

原创 (CVPR-2022)将内核扩展到31x31:重新审视cnn中的大型内核设计

我们回顾了现代卷积神经网络(cnn)中的大型内核设计。受视觉变形器(ViTs)最新进展的启发，在本文中，我们证明了使用几个大的卷积内核而不是一堆小内核可能是一个更强大的范例。我们提出了五个指导原则，例如，应用重参数化的大深度卷积来设计高效的高性能大内核cnn。根据指导方针，我们提出了RepLKNet，这是一种纯CNN架构，其内核大小为31×31，与常用的3×3形成对比。

2023-03-23 09:49:03 768

原创 (MM-2022)使用多跳时间转换在野外进行步态识别

现有的步态识别研究以实验室场景为主。由于人们生活在现实世界的感官中，因此野外步态识别是一个更实际的问题，最近引起了多媒体和计算机视觉界的关注。目前在实验室基准测试中获得最先进性能的方法在最近提出的野外数据集上的准确性要差得多，因为这些方法很难模拟不受约束场景中步态序列的变化时间动态。因此，本文提出了一种新颖的多跳时间转换方法，以实现对真实场景中步态模式的有效时间建模。具体而言，我们设计了一种名为多跳时间转换网络 (MTSGait) 的新型步态识别网络，以同时学习空间特征和多尺度时间特征。

2023-03-13 16:47:23 449

原创 (JMLR-2019)NAS综述鼻祖-神经架构搜索：一项调查

过去几年，深度学习在图像识别、语音识别和机器翻译等各种任务上取得了显着进步。这一进展的一个关键方面是新颖的神经架构。目前使用的架构大多是由人类专家手动开发的，这是一个耗时且容易出错的过程。正因为如此，人们对自动化神经架构搜索方法越来越感兴趣。搜索空间搜索策略和性能评估策略。关键词：神经架构搜索、AutoML、AutoDL、搜索空间设计、搜索策略、性能估计策略。

2023-01-07 10:18:15 1058

原创 (ICIP-2019)通过神经结构搜索进行视频动作识别

深度神经网络在视频分析和理解方面取得了巨大成功。然而，设计高性能神经架构需要大量的努力和专业知识。在本文中，我们首次尝试让算法自动设计用于视频动作识别任务的神经网络。具体来说，时空网络是在由有向无环图建模的可微空间中开发的，因此可以执行基于梯度的策略来搜索最佳架构。尽管如此，它在计算上是昂贵的，因为评估每个体系结构候选者的计算负担仍然很重。为了缓解这个问题，我们针对视频输入引入了一种时间段方法，以在不丢失全局视频信息的情况下降低计算成本。对于架构，我们通过引入伪 3D 运算符在高效的搜索空间中进行探索。实验

2022-12-04 15:30:06 1090

原创 (ICLR-2019)DARTS：可微分架构搜索

本文通过以可微分的方式制定任务来解决架构搜索的可扩展性挑战。与传统的在离散的、不可微分的搜索空间上应用进化或强化学习的方法不同，我们的方法是基于架构表示的连续松弛，允许使用梯度下降法有效搜索架构。在CIFAR-10、ImageNet、Penn Treebank和WikiText-2上的大量实验表明，我们的算法在发现用于图像分类的高性能卷积架构和用于语言建模的循环架构方面表现出色，同时比最先进的不可微分技术快了几个数量级。我们的实现已公开，以促进对高效架构搜索算法的进一步研究。发现最先进的神经网络架构需要人类

2022-12-03 20:07:05 1929

原创神经架构搜索的综合调查：挑战和解决方案(二)

NAS 是一项很有前途的研究。在本节中，我们根据主流搜索方法 [27, 28] 对现有 NAS 的性能进行分类和比较，同时还根据第 3 节报告了它们使用的优化策略。这些搜索方法主要包括以下内容：强化学习（RL），进化算法（EA），梯度优化（GO），随机搜索（RS）和基于序列模型的优化（SMBO）[162]。我们在图 15 中总结了 NAS 背景下 RL、SMBO 和 EA 的一般框架比较。图 15a 显示了 NAS 上下文中 RL 的一般框架。

2022-11-30 17:08:17 311

原创神经架构搜索的综合调查：挑战和解决方案(一)

深度学习以其强大的自动表示能力在很多领域取得了突破和实质性进展。已经证明，神经架构设计对于数据的特征表示和最终性能至关重要。然而，神经架构的设计在很大程度上依赖于研究人员的先验知识。并且由于人类固有知识的局限性，人们很难跳出原有的思维范式，设计出最优模型。因此，一个直观的想法是尽可能减少人为干预，让算法自动设计神经架构。神经结构搜索（Neural Architecture Search，NAS）就是这样一种革命性的算法，相关的研究工作复杂而丰富。因此，对NAS进行全面系统的调查是必不可少的。

2022-11-30 17:06:52 1055

原创 (CVPR-2022)AdaViT:用于高效图像识别的自适应视觉变换器

建立在自注意力机制之上的视觉变换器最近在各种任务上都表现出了显著的性能。虽然取得了卓越的性能，但它们仍然需要相对密集的计算成本，随着patch、自注意力头和变换器块数量的增加而急剧扩大。在本文中，我们认为，由于图像之间的巨大变化，它们对patch之间长距离依赖关系的建模需求是不同的。为此，我们引入了AdaViT，这是一个自适应计算框架，它可以学习推导出关于在每个输入的基础上在整个骨干网中使用哪些patch、自注意力头和变换器块的使用策略，旨在提高视觉变换器的推理效率，使图像识别的准确性下降到最小。以端到端的

2022-11-16 10:30:28 847

原创（NIPS-2018）ChannelNets：通过 Channel-Wise Convolutions 的紧凑而高效的卷积神经网络

卷积神经网络 (CNN) 已显示出解决各种人工智能任务的强大能力。然而，不断增加的模型大小给在资源有限的应用程序中使用它们带来了挑战。在这项工作中，我们建议通过使用通道卷积来压缩深度模型，它用 CNN 中的稀疏连接替换特征映射之间的密集连接。基于这种新颖的操作，我们构建了称为 ChannelNets 的轻量级 CNN。ChannelNets 使用三个通道卷积实例；即分组通道卷积、深度可分离通道卷积和卷积分类层。

2022-09-06 20:56:27 975

原创 (CVPR-2017)在身体和潜在部位学习深度上下文感知特征以进行行人重识别

行人重识别（ReID）是通过不同的摄像头识别同一个人。由于人体姿势、遮挡、背景杂乱等方面的巨大变化，这是一项具有挑战性的任务。如何提取强大的特征是 ReID 中的一个基本问题，并且在今天仍然是一个悬而未决的问题。在本文中，我们设计了一个多尺度上下文感知网络（MSCAN）来学习全身和身体部位的强大特征，它可以通过在每一层中堆叠多尺度卷积来很好地捕捉局部上下文知识。此外，我们提出使用具有新颖空间约束的空间变换器网络 (STN) 来学习和定位可变形的行人部件，而不是使用预定义的刚性部件。...

2022-08-10 18:32:57 601

原创 (Nips-2015)空间变换器网络

卷积神经网络定义了一类异常强大的模型，但仍受限于缺乏以计算和参数有效的方式对输入数据保持空间不变的能力。在这项工作中，我们引入了一个新的可学习模块，即 Spatial Transformer，它明确允许对网络内的数据进行空间操作。这个可微分模块可以插入到现有的卷积架构中，使神经网络能够根据特征图本身对特征图进行主动空间变换，而无需任何额外的训练监督或对优化过程的修改。我们展示了空间变换器的使用导致模型学习平移、缩放、旋转和更通用的变形的不变性，从而在多个基准测试和许多类别的变换中产生最先进的性能。...

2022-08-09 09:06:03 1147

原创 (ECCV-2022)GaitEdge：超越普通的端到端步态识别，提高实用性(续)

数据集。有一些可用的步态识别数据集，例如，CASIAB [26]、OUMVLP [21]、Outdoor-Gait [20]、FVG [30]、GREW [32] 等。但是，并非所有数据集都是对于基于端到端的步态识别方法很有用。例如，提出的工作不能应用两个世界上最大的步态数据集 OUMVLP [21] 和 GREW [32]，因为它们都没有提供 RGB 视频。简而言之，我们理想的步态数据集拥有几个重要属性：可用的 RGB 视频、丰富的相机视角和多种步行条件。CASIA-B [26] 似乎是一个不错的选择。.

2022-08-05 21:59:33 853

原创 (ECCV-2022)GaitEdge：超越普通的端到端步态识别，提高实用性

步态是远距离识别个体的最有前途的生物识别技术之一。尽管以前的大多数方法都专注于识别轮廓，但一些直接从 RGB 图像中提取步态特征的端到端方法表现更好。然而，我们证明这些端到端方法可能不可避免地受到与步态无关的噪声的影响，即低级纹理和彩色信息。在实验上，我们设计了跨域评估来支持这一观点。在这项工作中，我们提出了一种名为 GaitEdge 的新型端到端框架，它可以有效地阻止与步态无关的信息并释放端到端的训练潜力。...

2022-08-02 17:16:53 1703 5

原创 (CVPR-2019)选择性的内核网络

在标准的卷积神经网络（CNN）中，每层的人工神经元的感受野被设计成具有相同的大小。在神经科学界众所周知，视觉皮层神经元的感受野大小受刺激的调节，这在构建CNN时很少被考虑。我们提出了一种CNN中的动态选择机制，允许每个神经元根据输入信息的多个尺度来适应性地调整其感受野的大小。我们设计了一个叫做选择性核（SK）单元的构件，其中具有不同核大小的多个分支在这些分支的信息指导下，使用softmax注意力进行融合。对这些分支的不同关注产生了融合层中神经元的有效感受野的不同大小。...

2022-07-28 17:04:02 1046 1

原创 (arxiv-2018) 重新审视基于视频的 Person ReID 的时间建模

基于视频的行人重识别是一项重要任务，由于监控和摄像头网络的需求不断增加，近年来备受关注。一个典型的基于视频的personreID系统由三部分组成图像级特征提取器（例如CNN）、聚合时间特征的时间建模方法和损失函数。尽管已经提出了许多时间建模方法，但很难直接比较这些方法，因为特征提取器和损失函数的选择对最终性能也有很大影响。我们全面研究和比较了四种不同的时间建模方法（时间池化、时间注意力、RNN和3D卷积网络），用于基于视频的行人reID。...

2022-07-27 15:44:20 937

原创 (ICLR-2022)TADA！用于视频理解的时间自适应卷积

空间卷积广泛用于许多深度视频模型。它从根本上假设时空不变性，即对不同帧中的每个位置使用共享权重。这项工作提出了用于视频理解的时间自适应卷积(TAdaConv)，这表明沿时间维度的自适应权重校准是促进视频中复杂时间动态建模的有效方法。具体来说，TAdaConv通过根据其局部和全局时间上下文校准每帧的卷积权重，使空间卷积具有时间建模能力。与之前的时间建模操作相比，TAdaConv更有效，因为它在卷积核而不是特征上进行操作，其维度比空间分辨率小一个数量级。此外，内核校准带来了模型容量的增加。...

2022-07-25 17:02:45 1228

原创一些时序建模策略(一)

在 [30, 42] 之后，我们将视频网络分解为分别处理空间线索和时间关系。利用高效的 BiCnet 充分挖掘空间线索，我们构建了一个 Temporal Kernel Selection 块来联合建模短期和长期时间关系。由于不同尺度的时间关系对于不同的序列具有不同的重要性（如图 2 所示），TKS 以动态方式组合多尺度时间关系，即根据输入序列为不同的时间尺度分配不同的权重。特别的, TKS\mathrm{TKS}TKS 以一系列连续帧特征图 F={Ft}t=1TF=\left\{F_{t}\right\}_

2022-07-24 18:33:15 893

原创 (ICCV-2021)TransReID：基于transformer的目标重识别

提取稳健的特征表示是目标重识别（ReID）的关键挑战之一。尽管基于卷积神经网络（CNN）的方法已经取得了巨大的成功，但它们一次只能处理一个局部邻域，并受到卷积和下采样操作（如池化和分层卷积）造成的细节信息损失的影响。为了克服这些限制，我们提出了一个纯粹的基于transformer的目标识别框架，名为TransReID。具体来说，我们首先将图像编码为一个patch序列，并通过一些关键的改进建立一个基于transformer的强基线，在几个ReID基准上取得了与基于CNN的方法相竞争的结果。链接。...

2022-07-21 15:01:15 2946

原创 (ICLR-2021)一幅图像相当于16X16个words:大规模图像识别的Transformer

虽然Transformer体系结构已经成为自然语言处理任务的事实上的标准，但它在计算机视觉中的应用仍然有限。在视觉中，注意力要么与卷积网络结合使用，要么用于替换卷积网络的某些组件，同时保持其整体结构不变。我们表明，这种对CNN的依赖是不必要的，直接应用于图像块序列的纯transformer可以在图像分类任务中表现得非常好。当对大量数据进行预训练并传输到多个中型或小型图像识别基准(ImageNet、CIFAR-100、VTAB等)时。...

2022-07-21 10:19:44 867

原创 (Applied Intelligence-2022)TransGait: 基于多模态的步态识别与集合Transformer

作为一种可以从远处识别的生物特征，步态在预防犯罪、司法鉴定和社会安全等方面有着广泛的应用。然而，步态识别仍然是一项具有挑战性的任务，在典型的步态识别方法中存在两个问题。首先，现有的步态识别方法对行人的衣服和携带物的鲁棒性很弱。第二，现有的步态识别的时间建模方法不能充分地利用序列的时间关系，并要求步态序列保持不必要的顺序约束。在本文中，我们提出了一个新的基于剪影和姿势特征的多模态步态识别框架来克服这些问题。轮廓和姿势的联合特征对行人的衣服和携带物具有很高的可判别性和鲁棒性。...

2022-07-20 07:51:14 2652

原创 (CVPR-2022)具有密集 3D 表示和基准的野外步态识别

现有的步态识别研究以二维表示为主，例如受限场景中的人体轮廓或骨架。然而，人类在不受约束的3D空间中生活和行走，因此将3D人体投影到2D平面上会丢弃很多关键信息，例如用于步态识别的视角、形状和动态信息。因此，本文旨在探索用于野外步态识别的密集3D表示，这是一个实际但被忽视的问题。特别的，我们提出了一个新的框架来探索用于步态识别的人体3DSkinnedMulti-PersonLinear(SMPL)模型，名为SMPLGait。链接。...

2022-07-18 14:01:40 1658

原创 (CVPR-2022)用于改进步态识别的拉格朗日运动分析和视角嵌入

步态被认为是人体的行走模式，包括形状和运动线索。然而，主流的基于外观的步态识别方法依赖于轮廓的形状。目前尚不清楚运动是否可以在步态序列建模中明确表示。在本文中，我们使用拉格朗日方程分析了人类步行，并得出结论，时间维度中的二阶信息对于识别是必要的。我们根据得出的结论设计了二阶运动提取模块。此外，通过分析当前的交叉视图任务方法没有明确考虑视图本身的问题，设计了一个轻量级的视角嵌入模块。在 CASIA-B 和 OU-MVLP 数据集上的实验表明了我们方法的有效性，并且对提取的运动进行了一些可视化以显示我们的运动提

2022-07-12 21:24:28 975

原创 (TNNLS-2022)步态质量感知网络：面向轮廓步态识别的可解释性

由于步态识别可以在远距离以非侵入性方式进行，并应用于换衣服的情况，因此步态识别越来越受到人们的关注。现有的大多数方法都是以步态序列的轮廓作为输入，从多个轮廓中学习统一的表示，以匹配probe和gallery。然而，这些模型都面临着缺乏可解释性的问题，例如，不清楚步态序列中的哪个轮廓以及人体中的哪个部位对识别相对更重要。在这项工作中，我们提出了一种用于步态识别的步态质量感知网络（GQAN），该网络通过两个block明确评估每个轮廓和每个部分的质量：帧质量块（FQBlock）和部分质量块（PQBlock）。具体

2022-06-01 10:55:23 1813 2

原创 (TIP-2019)基于判别特征学习的跨视角步态识别

基于判别特征学习的跨视角步态识别paper题目：Cross-View Gait Recognition by Discriminative Feature Learningpaper是中国科学院大学发表在TIP 2019的工作paper地址：链接Abstract最近，由于卷积神经网络（CNN）的强大能力，基于深度学习的跨视角步态识别变得流行。当前的深度学习方法通常依赖于广泛用于人脸识别任务的损失函数，例如对比损失和三元组损失。这些损失函数存在难负样本挖掘的问题。本文提出了一种稳健、有效

2022-05-21 19:49:35 919

原创（ECCV-2018）重新思考时空特征学习：视频分类中的速度-准确度权衡

重新思考时空特征学习：视频分类中的速度-准确度权衡paper题目：Rethinking Spatiotemporal Feature Learning: Speed-Accuracy Trade-offs in Video Classificationpaper是GoogLe Research 发表在ECCV 2018的工作paper地址：链接Abstract.尽管采用卷积神经网络 (CNN) 在视频分析方面取得了稳步进展，但相对改进并没有 2D 静态图像分类那么剧烈。存在三个主要挑战

2022-05-10 17:25:36 1200

设计模式代码（包含uml类图、和实验报告）

国际象棋c++小游戏，qt开发

Linux实验报告一.docx

pytorch.html

概率的公式推导，这步不知道怎么推过去的