upDiff-CSDN博客

原创 Ubuntu/Centos文件误删恢复

值得注意的是，为了确保文件恢复的成功率，你应该在发现文件误删后尽快停止使用相关的硬盘或分区。幸运的是，有相关的数据恢复工具，它能够帮助我们解决Linux服务器上的文件误删问题。作为TestDisk工具套件的一部分，它以其强大的文件恢复能力，尤其擅长处理Linux服务器上的文件误删问题而闻名。这款工具能够深入扫描整个硬盘或指定的分区，寻找被删除但尚未被覆盖的文件，并尝试恢复它们。Photorec会开始扫描你选择的区域，寻找被删除的文件。为恢复的文件指定一个输出目录，确保这个目录有足够的空间来保存恢复的文件。

2024-04-06 13:03:15 37

原创 google硬盘无法启动

google硬盘无法启动，重装客户端，直接删除后启动GoogleDriveFS.exe即可。

2023-12-08 20:41:48 428

原创 VoteHMR训练代码跑通流程整理

注释labels = labels.permute(0, 2, 1)，同时加上labels = labels.float()，和features = features.permute(0, 2, 1)surreal_save_path：预处理后的数据路径，对应网盘SURREAL_Preprocess.tar.gz文件。【4】将 votenet.py 的self.pos_mlp进行修改。将SURREAL_v1.tar.gz进行解压，得到文件夹。【1】修改base_options中的3个pkl路径。

2023-12-03 20:46:44 1319 1

原创【NeRF原理】第四章：NeRF模型训练与推理详解

1-模型训练全流程: 详细介绍NeRF模型的训练流程，包括数据准备、损失函数和优化算法等。2-模型推理流程: 解释NeRF模型的推理流程，包括如何生成高质量的图像和体积渲染结果。购买本专栏后，可通过CSDN官方在本博客最后提供的微信名片添加我，提供1v1答疑。第四章：NeRF模型训练与推理。【前方多图，流量预警！

2023-12-02 19:31:24 922

原创【NeRF原理】第三章：计算机图形学背景补充

购买本专栏后，可通过CSDN官方在本博客最后提供的微信名片添加我，提供1v1答疑。1-相机原理: 讲解相机的基本原理和参数，为后续的图像渲染和体渲染提供基础。2-图像渲染: 介绍图像渲染的基本概念和技术，包括光照模型、阴影和纹理等。3-体渲染: 探讨体渲染的基本原理和方法，包括体积数据表示和光线传播等。第三章：计算机图形学背景补充。【前方多图，流量预警！

2023-12-02 19:21:14 432

原创【NeRF原理】第二章：从AI视角理解NeRF

1-模型结构: 详细介绍NeRF的模型结构，包括多层感知机（MLP）和位置编码等关键组件。购买本专栏后，可通过CSDN官方在本博客最后提供的微信名片添加我，提供1v1答疑。2-MLP+位置编码+?=NeRF: 解释MLP、位置编码和NeRF之间的关系。第二章：从纯AI视角理解NeRF。

2023-12-02 18:55:24 375

原创 [Python入门系列之十二]安装Jupyter notebook与代码运行

Jupyter Notebook是一个开源的Web应用程序，允许你创建和共享包含代码、图片和文本的文档。它支持多种编程语言，但最常与Python结合使用。Notebook界面包括输入和输出单元格，可以逐一运行，非常适合进行Python编程学习、实验和教学。

2023-11-29 20:52:40 470

原创 [Python入门系列之十一]在windows上安装OpenCV

对于其他的python版本，安装时可能需要编译，在Windows上编译安装容易失败。这种情况安装低版本即可，版本号可以探测出来。如果是python3.7–python3.9(已测试)，直接安装即可。注：conda需要先激活虚拟环境后再安装。

2023-11-29 07:43:24 559

原创【NeRF原理】第一章：NeRF概述

本专栏对应视频课程位于：https://edu.csdn.net/course/detail/39038

2023-11-28 08:03:19 532

原创快速查看Linux系统占用多的文件夹

租用了一台云服务器，存储很快就满了，想看下哪部分占用多，然后进行清理

2023-11-12 19:40:55 108

原创 CVPR2023新作：文本监督下语义分割

(4): 通过在 PASCAL VOC 2012、PASCAL Context 和 COCO 数据集上的实验，证明本文提出的方法性能比现有最先进的方法更好，而且无需额外的标注和监督信息即可实现无监督的文本监督下的语义分割。论文的方法在没有额外的标注和监督信息的情况下实现了文本监督下的语义分割任务，可以为文本监督下的语义分割领域提出更有效的方法。(1): 本文提出的文本监督下的语义分割框架可以在无需额外标注和监督信息的情况下实现语义分割任务，为文本监督下的语义分割领域提供了一种更有效的方法。

2023-10-25 06:56:27 307

原创 CVPR2023新作：基于组合空时位移的视频修复

(1): 本文提出了一种轻量级的视频修复框架，利用组合空时位移块来捕捉多帧间的对应关系，并扩展有效感受野。其中，组合空时位移块通过局部位移和空间注意机制对输入进行建模，并通过平均池化和最大池化来聚合特征，并利用反卷积恢复图像细节。(2): 该算法分为两个关键步骤：(i) 异质帧间信息聚合；其中，第一步采用组合空时位移块实现，可以有效地扩展有效感受野；(3): 文中提到，该方法可以节省75%的计算成本。实验结果表明，该算法在视频去模糊和视频降噪两个任务上均优于之前的最先进方法，证明了该方法的有效性和实用性。

2023-10-25 06:55:17 344

原创【Python】OpenCV立体相机配准与三角化代码实现

下面的介绍了使用python和OpenCV对两个相机进行标定、配准，同时实现人体关键点三角化的过程。

2023-09-09 16:18:51 328

原创【图卷积神经网络】1-入门篇：为什么使用图神经网络(下)

我们讨论了图学习的不同应用，包括节点分类和图分类，并强调了四个主要的图学习技术家族。最后，我们强调了GNNs的重要性以及它们相对于其他技术的优越性，特别是对于大型、复杂的数据集。GNNs已经成为图学习的强大工具，在各种任务和行业中显示出优秀的结果。实际上，有各种类型的GNN和GNN层，每种类型都有独特的结构和从邻居节点聚合信息的方式。这些不同变体的GNNs也有其自己的优点和局限性，并且非常适合特定类型的图数据和任务。此外，我们还将深入研究不同类型的图及其应用，例如有向图和无向图，以及加权图和非加权图。

2023-09-09 11:00:11 639

原创【图卷积神经网络】1-入门篇：为什么使用图神经网络(上)

我们讨论了图学习的不同应用，包括节点分类和图分类，并强调了四个主要的图学习技术家族。然而，表格版本的数据集不显示这些人之间的联系。图的研究近年来取得了快速发展，这得益于大型数据集的可用性、强大的计算资源以及机器学习和人工智能的进步。此外，我们还将深入研究不同类型的图及其应用，例如有向图和无向图，以及加权图和非加权图。但是，图的多功能性使它们也可以应用于关系结构不太自然的领域，从而开启新的见解和理解。通过将复杂系统表示为实体和相互作用的网络，我们可以分析它们之间的关系，从而更深入地了解它们的基本结构和模式。

2023-09-07 08:28:00 160

原创【nerfStudio】6-nerfStudio数据格式转换

使用OpenGL/Blender（以及原始NeRF）的坐标约定来表示相机。+X表示向右，+Y表示向上，+Z指向相机的后方和远离相机。-Z是视线方向。其他代码库可能使用COLMAP/OpenCV约定，其中Y和Z轴与本约定相反，但+X轴保持不变。

2023-09-06 07:14:12 496

原创【nerfStudio】5-nerfStudio导出3D Mesh模型

在这里我们将介绍如何从nerfstudio中导出点云和网格。您将使用的主要命令是ns-export。我们将点云导出为.ply文件，纹理网格导出为.obj文件。

2023-09-05 07:29:41 1719

原创【nerfStudio】2-基于nerfStudio训练第一个NeRF模型

Nerfstudio允许以强大的方式从CLI自定义训练和评估配置，但需要了解一些事情。CLI结构的最具示例性和有用的例子是以下命令之间输出的差异：以下内容将列出支持的模型在模型规范之后应用--help将提供模型和训练特定的参数。在命令的末尾，可以指定使用的数据解析器。默认情况下使用_nerfstudio-data_数据解析器。同时还包括其他数据解析器，如_Blender_、_NuScenes_等。要获得特定数据解析器的参数列表，请在命令的末尾添加--help。

2023-09-04 07:52:34 412

原创【nerfStudio】1-在windows上安装nerfStudio

安装Git。安装Visual Studio 2022。在安装CUDA之前必须完成此步骤。必须在“桌面开发与C++”工作流程（在BuildTools版本中称为“C++构建工具”）中包含所需的组件。Nerfstudio要求。我们建议使用conda来管理依赖关系。在继续之前，请确保安装了Conda。依赖关系PyTorch请注意，如果安装了低于2.0.1的PyTorch版本，则应卸载先前版本的pytorch、functorch和tiny-cuda-nn。基于CUDA 11.8的Torch 2.0.1安装基

2023-09-04 07:12:19 636

原创【Python】OpenCV4图像、视频读写操作

OpenCV提供了imread函数来从文件中加载图像，以及imwrite函数来将图像写入文件。这些函数支持各种静态图像的文件格式。通常支持BMP、PNG、JPEG和TIFF等格式。让我们来探索在OpenCV和NumPy中表示图像的结构。图像是一个多维数组；它有列和行的像素，并且每个像素有一个值。对于不同类型的图像数据，像素值可能以不同的方式格式化。在这里，每个像素由一个8位整数表示，这意味着每个像素的值在0-255范围内，其中0表示黑色，255表示白色，中间的值表示灰度。这是一个灰度图像。

2023-09-02 21:28:42 523

原创基于Open3D和PyTorch3D读取三维数据格式OBJ

在上面的代码片段中，可以使用Open3D的draw_geometries函数交互式地可视化立方体的网格。请注意，这里在PyTorch3D中使用的顶点索引是从0开始的，索引从0开始。然而，在OBJ文件中，顶点索引是从1开始的，索引从1开始。根据此处的代码片段输出，我们知道返回的vertices变量是一个形状为8 x 3的PyTorch张量，其中每一行是一个具有x、y和z坐标的顶点。在第二个示例中，我们将使用一个名为cube_texture.obj的示例文件来突出显示更多的OBJ文件特性。

2023-09-02 11:16:03 1528

原创三维数据Ply格式介绍与读取

但是，这次我们将获得几个PyTorch张量，例如一个用于顶点的张量和一个用于面的张量。当运行此代码片段时，返回的顶点应该是一个形状为[8, 3]的PyTorch张量 - 也就是说，有八个顶点，每个顶点有三个坐标。类似地，返回的面应该是一个形状为[12, 3]的PyTorch张量 - 也就是说，有12个面，每个面有3个顶点索引。cube.ply文件定义了一个由八个顶点和六个面组成的立方体的网格，每个面由两个面组成。例如，三个数字-1，-1，-1指定顶点的x坐标为-1，y坐标为-1，z坐标为-1。

2023-09-02 11:07:37 540

原创 cl: 命令行 error D8021 :无效的数值参数“/Wno-cpp“

在windows上安装pycocotools时报错

2023-08-05 15:41:27 470

原创 CVPR2023新作：源数据集对迁移学习性能的影响以及相应的解决方案

本文提出的方法可以定位迁移学习的脆弱性，检测数据泄漏和源数据集中的误导性例子等问题，并且能够自动提取目标数据集的细粒度子群体。(3): 本文提出了一种基于数据的框架，用于衡量和分析源数据集的组成对迁移学习性能的影响。通过基于数据的框架，能够定位迁移学习中的脆弱性和数据泄漏问题，并自动提取目标数据集的细粒度子群体，从而提高迁移学习的效果。(2): 创新点：本文的创新点在于关注源数据集的构成对迁移学习的重要性，并提出了一个基于数据的框架来衡量和分析源数据集的影响。或扫描文章底部⬇️二维码。

2023-07-31 07:52:42 738

原创 CVPR2023新作：考虑3D一致性的人脸关键点检测

(3):本文提出了一种新的多视角一致的学习策略，构建了一个基于合成数据的人脸关键点检测数据集，并提出了一种3D感知模块，利用此模块可以提高现有基于学习的人脸关键点检测算法的准确性。(3): 本文的贡献在于提出了一种基于合成数据的多视角一致训练方法，以及一种3D感知模块，这些方法可以提高现有基于学习的人脸关键点检测算法的准确性，并具有较广的适用性。(2): 创新点：本文提出了基于合成数据和多视角一致训练的方法，避免了现有方法在3D一致性方面的缺陷，同时提出了一种3D感知模块，处理获得了更加准确的人脸关键点；

2023-07-27 08:09:52 361

原创 CVPR2023新作：3D感知的AI换脸算法

(2): 创新点：该方法将2D人脸图像投影到3D生成模型的潜在空间中进行交换，利用3D人脸的强几何和纹理先验，实现了3D感知的人脸交换，克服了传统方法中2D人脸姿态的局限性。该论文提出的3D感知的人脸交换方法，利用3D人脸的强几何和纹理先验，将2D人脸投影到3D生成模型的潜在空间中。在权威的FaceForensics++数据集上的评测中，该方法相比现有最好的2D方法提高了3.13%的身份相似度，维持了相似的质量，并且生成图像的间距离相对于真实3D人脸的平均间距离降低了56%以上。

2023-07-26 23:11:05 1146

原创 CVPR2023新作：pix2pix3D

(3)将3D神经场引入条件生成模型，将大量双眼标签和monocular视图放入训练生成器中，使模型能够对每个3D点分配标签、所对应的色彩和密度。(4)本文提出的pix2pix3D模型能够在给定2D条件习得3D对象的结构学直观的编辑控制。还提供了相应互动系统。(2)过去方法纯粹在2D层面操作，没有对应3D架构，这限制了模型的可控性。本文基于现有资源，进一步扩展条件生成模型的特性，将3D融入图像生成。(1)本文研究背景是现有的图像到图像翻译方法只在2D层面上操作，没能正确推理内容的潜在3D结构。

2023-07-25 07:44:19 728

原创 CVPR2023新作：从2D图像生成个性化3D卡通人物

(2): 过去的方法大多是基于已知的3D模型和图像对生成3D人物，因此需要大量的3D模型和参数注释，且生成的卡通人物质量不高。(2): 该方法通过调整相机参数分布和纹理质量的优化方法和变形建模技术，将2D的GAN生成器的知识转移到3D生成器上，从而实现对3D卡通人物的生成和编辑。(3): 本文提出一种基于调整相机参数分布、纹理质量的优化方法和变形建模技术，可以将2D的GAN生成器的知识转到3D生成器上，从而实现对3D卡通人物的生成和编辑。(1): 本文提出了一种从2D图像生成个性化3D卡通人物的方法。

2023-07-25 07:37:55 222

原创 CVPR2023新作：3D视频物体检测

(1): 本文研究的是3D视频物体检测，探索长期时间上的视觉对应优化。(3): 本文提出了一个端到端的优化目标检测器BA-Det，它实现了可学习的物体中心时空对应关系和特征度量型物体绑定调整，针对动态物体和静态物体对应关系引入了不同的约束。结果表明，BA-Det算法具有更好的性能，不仅可以检测静态物体，而且可以处理动态物体，并在3D检测任务上取得了最先进的水平。(4): 在大量的实验中，BA-Det算法的成功应用使得其在相应的3D检测任务上取得了最先进的水平，并且在瓶颈部位的时间、空间参数提升也非常显著。

2023-07-25 07:35:57 597

原创 CVPR2023新作：3D场景的视频循环算法

(2): 创新点：本文针对3D场景提出了一种稀疏3D视频表达方式，即多瓦片视频，并通过时间重定向算法实现了循环损失，使得算法能够实现3D视频循环播放。研究者们通过采用视频时间重定向算法的循环损失，在3D场景中实现循环播放。(3): 本文为解决3D场景的异步循环问题提出了一种新的稀疏3D视频表达方式 —— 多瓦片视频，并在此基础上提出了两阶段乃至于实现视频循环所需的各个步骤。(1): 本研究的意义在于创新性地提出了一种可以处理3D场景的视频循环算法，实现了基于完全异步的多视角二维视频的3D循环。

2023-07-25 07:34:06 198

原创 CVPR2023新作：3D空间多模态知识积累与场景图预测

(2): 创新点: 本文的创新点在于将物理空间的层次结构引入深度神经网络，利用空间的语义和清晰的模式来处理复杂的3D场景。(1): 本文的方法旨在通过将物理空间的层次结构引入深度神经网络，利用空间的语义和空间排列的清晰模式来解决处理具有物理连接、密集布置、尺寸变化和丰富关系的部分扫描对象的3D场景的挑战。(3): 本文提出了一种利用外部知识基础的方法，通过积累上下文化的视觉内容和文本事实构建3D空间多模态知识图，同时提出了一个利用3D空间知识的场景图预测模块来约束关系的语义空间。

2023-07-25 07:32:13 173 1

原创 CVPR2023新作：恶劣天气下点云语义分割

通过提出一种新的人造数据集和域随机化技术，本文提出的方法在恶劣天气条件下的语义分割任务中具有state-of-the-art的性能。(2):现有的点云数据集都是在正常天气下采集的，缺乏针对恶劣条件下的点云语义分割。(2): 创新点：本文提出了一种新的人造数据集SemanticSTF和一种域随机化技术，增加了数据集的差异性，提高了模型在恶劣天气下的泛化能力。该技术通过改变点云的几何颜色并对其嵌入进行聚合，从而可以增加不同天气条件下的数据集的差异性，提高模型在恶劣天气下的泛化性能。

2023-07-25 07:27:55 350

原创 CVPR2023新作：3D点云配准--3D Registration with Maximal Cliques

(3): 本文提出了一种3D Registration with Maximal Cliques (MAC) 方法，主要步骤包括构建兼容性图，寻找最大团集合，针对团结合对点云位姿猜想并通过SVD算法求解，选取最佳猜想执行配准。(1): 本文提出了一种基于最大团的3D点云配准方法，称为MAC，该方法通过构建兼容性图和寻找最大团集合来提高配准的精度。(2): 构建兼容性图：通过计算两组3D点云之间的关联度，以及利用最大团理论的优势，建立兼容性图，将关联性强的3D点云分为一组。

2023-07-25 07:24:14 966

原创 CVPR2023新作：三维神经场生成模型

(4): 本文在 ShapeNet 数据集上进行了实验，取得了高质量、多样性的三维场生成结果，并比先前的三维扩散模型和其他三维生成方法表现更好。实验证明了本文方法的有效性。(3): 本文提出了一种新的三维神经场生成模型，该模型基于已有的二维扩散模型，并通过将三维场转换为轴对齐三面的二维特征平面，使二维扩散模型可以直接进行三维图像的生成。(1): 本文提出了一种新的三维神经场生成模型，基于已有的二维扩散模型，并通过将三维场转换为轴对齐三面的二维特征平面，使二维扩散模型可以直接进行三维图像的生成。

2023-07-25 07:19:49 102

原创 CVPR2023新作：三维场景的线条映射

该方法改进了线条的定位和匹配方法，利用了线条之间的多种几何约束，如共面、平行、垂直等约束，从而推断线条的空间位置，并优化求解线条的3D坐标。(1): 本文的意义在于提出了一种基于线条的高效准确的三维重建方法，可以无缝与现有的SfM方法集成使用，适用于室内场景和城市景观，为视觉定位和场景分析的应用提供了有力支持。(2): 本文在实验评估中，比较了本文方法与其他方法在3D线条重建、视觉定位和捆绑调整等任务上的性能，结果表明本文方法在多种情况下表现出较好的性能，广泛适用于室内场景和城市景观的三维重建。

2023-07-25 07:18:24 103

原创 CVPR2023新作：3D人体姿态估计II

(1): 该文章提出了一个新的3D人体姿态估计的方法，称为STCFormer。(3): 该论文提出的方法是利用transformer结构进行空间和时间拆分，提出了一个新的Spatio-Temporal Criss-cross attention的块和一个新的Structure-enhanced Positional Embedding (SPE)方法，结合多个Spatio-Temporal Criss-cross attention的块构成了STCFormer。这个结果可以支持他们的研究目标。

2023-07-23 22:10:23 933

原创 CVPR2023新作：3D人体姿态估计

本文的方法是通过于SMPL Body的物理学、以及把压力热图、压力中心、SMPL Body的重心考虑进去，这一具有鲜明特色的方法实现的。(1): 本文提出的方法是利用直观物理学（IP）的思想，从3D SMPL Body与场景的交互中推断出身体上的压力热图、压力中心和SMPL Body的重心。(2): 在IPMAN中，压力热图用于表示3D SMPL Body与场景之间的接触，压力中心表示场景施加的力影响着身体的哪些部位，而SMPL Body的重心（通过计算所有顶点的加权平均）有助于保持姿势的稳定性。

2023-07-23 22:09:11 1002

原创 CVPR2023新作：3D人体网格估计

(2): 创新点：本文采用虚拟标记的中间表示来处理人体网格估计问题，该方法不仅弥补了传统骨架方法的局限性，还能够更准确地重建人体真实形状的网格；工作量：本文采用了机器学习方法来学习虚拟标记和3D网格的生成模型，在训练过程中进行了数据增强和正则化，但该方法的实现较为简单，具有一定的易用性和快速性。(1): 本文的意义在于提出了一种新的处理人体网格估计问题的方法，采用虚拟标记的中间表示来重建真实形状的网格，方法创新性强，能够在多样性身体形态方面实现精确重建。(1):本文旨在解决3D人体网格估计的问题。

2023-07-23 22:08:08 574

原创 CVPR2023新作：在点云中无监督地学习人体关键点

在实验中，作者将GC-KPL方法与其他基于监督学习和无监督学习的方法进行比较，并在Waymo Open Dataset数据集上进行了验证实验。结果表明，GC-KPL方法可以达到和监督学习方法相当的结果，并且在few-shot learning方面表现出较好的泛化能力。(2): GC-KPL方法包括两个阶段。第二个阶段，采用一系列的微调方法和增强方法对训练得到的模型进行优化，以提高模型的泛化能力和准确性。(1): 本文提出了一个基于几何一致性的无监督学习方法，名为GC-KPL，用于在点云中学习人体关键点。

2023-07-23 22:06:43 233

原创 CVPR2023新作：自然语言描述下的3D形状语义定位

然而，本文仅在少量的数据集上进行了实验，需要在不同数据集上进一步验证和优化其方法。(1): 本文提出了一种文本输入下的3D形状语义定位方法，命名为3D Highlighter，使用了一个神经场对网格表面上的点进行编码，将输入文本信息与预训练的CLIP编码器融合，最终使用输出的概率权重对输入的3D形状进行着色。(3): 本文提出了一种文本输入下的语义本地化方法，使用了一个神经场对网格表面上的点进行编码，并通过预训练的CLIP编码器获取输入文本的信息，最终使用输出的概率权重对输入3D形状进行着色。

2023-07-23 22:05:56 75

vtt2srt.zip

windows_labelImg_v1.3.1

win10_CUDA8.0.txt

cocos2d-x切水果

空空如也