zaf赵-CSDN博客

原创使用vscode调试带-m参数的python代码

我在命令行运行的是python -m debugpy --listen 5678 --wait-for-client render.py -m LangSplat/preprocessed_dataset/sofa/sofa --include_feature -l luage_features_1080p_dim3，但是在VSCode中的普通调试，会报模块找不到的问题（原因是普通调试不会带-m参数，所以有些路径就会找不到）。因此，本文记录如何用VSCode调试在命令行输入的如上Python指令。

2024-02-21 11:44:29 407

原创 huggingface镜像网站下载模型

huggingface镜像网站下载模型

2024-01-30 09:43:44 695

原创 Colmap三维重建详解与使用方法

在重建场景的稀疏表示和输入图像的相机姿势后，MVS现在可以恢复更密集的场景几何。：空间中的一点与两张图片相机的光心，三者围成一个极平面，极平面与两张图片相交形成两条极线，对极几何约束是指，空间点X在摄像机1的成像平面中的像素点x，与之相匹配的摄像机2的成像平面中的像素点 x' 一定落在极线上。是通过一系列有重叠的且不同视角的图片重建出物体的三维结构（稀疏点云），并且输出相机的内外参数，内参指的是将真实空间的三维点通过内参矩阵转换为相机图片上的二维点，外参包含相机在切换不同视角时的平移和旋转信息。

2023-11-23 17:51:26 2888

原创神经辐射场（NeRF）中-相机参数与坐标系变换

为了唯一地描述每一个空间点的坐标，以及相机的位置和朝向，我们需要先定义一个世界坐标系。一个坐标系其实就是由原点的位置与XYZ轴的方向决定。接着，为了建立3D空间点到相机平面的映射关系以及多个相机之间的相对关系，我们会对每一个相机定义一个局部的相机坐标系。下图为常见的坐标系定义习惯。常见的相机坐标系定义习惯（右手坐标系）。注意：在OpenCV/COLMAP的相机坐标系里相机朝向+z轴，在LLFF/NeRF的相机坐标系中里相机朝向-z轴。

2023-10-07 18:24:29 661

原创 NeRF项目LLFF 解决新场景pose生成的问题

最近一直在做NeRF相关的项目，其中LLFF前向数据集，是NeRF常用数据集，本文讲下怎么对NeRF数据进行处理几个重要的链接地址。

2023-09-07 09:49:40 323

原创 Ubuntu下多用户共享conda环境

现在你已经安装好了想要的 anaconda。如果有新用户，只需将其加入conda用户组，即可使用共享环境或创建新环境。参考。

2023-04-10 13:35:16 1665 1

原创 Ubuntu报terminals database is inaccessible

在Ubuntu的命令行窗口中使用clear命令的时候报terminals database is inaccessible错误clear方法一1.执行以下命令2.再次运行clear命令clear3.执行以下命令。

2023-04-07 18:09:14 669 1

原创用神经辐射场在大场景中漫游

自 2020 年以来，神经辐射场 (NeRF) [1] 一直是计算机视觉领域的热门话题。通过使用神经网络对体积场景函数进行建模，NeRF 实现了新视图合成的最先进结果。虽然与 NeRF 相关的方法在学术界很受欢迎，但它们尚未在产品上广泛实施以提供用户体验。本文旨在演示如何使用 Neural Radiance Field 为徘徊在大型景点周围的用户创造身临其境的体验。

2023-02-20 10:40:56 893

原创基于 NeRF 的 App 上架苹果商店，照片转 3D 只需一部手机，网友们玩疯了

原文标题：《基于 NeRF 的 App 上架苹果商店！照片转 3D 只需一部手机，网友们玩疯了》只用一部手机，现实中的 2D 照片就能渲染出 3D 模型？没错，无需再手动上传电脑或安装激光雷达，苹果手机自带 App 就能生成 3D 模型。这个名叫 Luma AI 的“NeRF APP”，正式上架 App Store 后爆火：小如 3D 装饰，兼具灯光和形状细节：大到整个墓园的 3D渲染版，都能被很好捕捉：这样无论是风景、3D 物体还是人物，都可以被很好地保存进手机，并快速生成对应的 3D 模型。

2023-02-09 10:53:50 1293

原创论文笔记：NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis

传统方法中，通常这一任务采用三维重建再渲染的方式实现，NeRF 希望不进行显式的三维重建过程，仅根据内外参直接得到新视角渲染的图像。分层采样方案来自于经典渲染算法的加速工作，在前述的体素渲染 (Volume Rendering) 方法中，对于射线上的点如何采样会影响最终的效率，如果采样点过多计算效率太低，采样点过少又不能很好地近似。如图所示，白色点为第一次均匀采样的点，通过白色均匀采样后得到的分布，第二次再根据分布对进行红色点采样，概率高的地方密集，概率低的地方稀疏 (很像粒子滤波)。

2023-01-30 10:59:13 1112 1

原创世界坐标系-＞相机坐标系详细推导

首先我们需要定义三个量眼睛的位置 ee，就是相机放在什么地方。视线朝向的向量 gg，相机看向什么地方，类似于眼睛往哪里看。朝向上方的向量 tt，相机顶部的朝向，类似于人头顶的朝向，一般都朝向天空。以上的信息足够让我们定义出一个相机坐标系来首先gg是相机看过去的方向，而一般相机坐标系都是朝着ww轴的负方向看去，因此对gg取反并归一化，得到单位向量ww。接着tt类似于vv的朝向，然后tt和ww做叉乘得到uu，因为叉乘得到的是tt和ww构成平面的法向量，然后归一化。同理ww和uu叉乘得到v。

2023-01-30 09:59:42 1149

原创专利情况的基本了解

专利

2023-01-29 17:38:56 178

原创元宇宙与数字孪生有区别

元宇宙拥有完整的经济逻辑，数据、物体、内容以及IP都可以在元宇宙中存在，元宇宙的核心在于永续性、实时性、多终端、经济功能、可连接性和可创造性，而数字孪生、混合现实、物联网、5G等是建设元宇宙的手段和工具。元宇宙世界的却不限于物理世界，元宇宙作为一个独立的世界，一方面能够映射物理世界，优化物理世界的不同场景，另一方面也能够突破物理世界规则的现实，实现虚拟世界创造。在不断改变我们的生活，作用在生活中的各个场景，但是也仅仅作用于人类的物质生活层面。不仅作用于人类的物质生活，更是作用于人类的精神世界。

2023-01-29 17:22:40 608

原创元宇宙构建基石：三维重建技术

首先，接收输入物体的图像后，算法会对图像进行预处理，主要是做背景抠除，只保留被拍摄的物体本身，之后所有的图像运算都将限制在物体的蒙版上进行。通常基于深度学习的方法训练时，需要输入物体的真实三维结构，但三维结构需要通过精度很高的桌面扫描仪获得，导致金钱成本和时间成本都比较高，同时还面临着算法泛化性的风险。元宇宙的爆发式发展必定会带来内容自动生产的大量机会，依托百度领先的AI和VR技术，百度VR也将继续在这一领域持续深耕，致力将原本复杂的建模操作变得更为简单直接，让用户快速生成高质量的三维模型。

2023-01-29 16:13:56 514

原创 NeRF染助力虚拟物体创造

对于二维图像背后的三维世界建模，哪一种三维表示最合适？现在常见的表示方法有点云、体素和网格，其中多边形网格具有良好的紧致性和几何性质。但是使用神经网络直接由多边形网格生成图像比较困难，因为光栅化的过程阻止了反向传播。因此，本项目所参考的Repo的原作者提出了一个近似的梯度栅格化，使渲染集成到神经网络。使用这个渲染器，可以执行带有轮廓图像监督的单图像三维网格重建，并且该系统比现有的基于体素的方法更好。利用此类可微分的多边形网格光栅化与渲染，才有机会在元宇宙三维世界中进行视觉上的物体生成。

2023-01-09 13:58:46 150

原创 Colmap安装与实践

源码下载地址：COLMAP可以作为独立的app，通过命令行或者图形交互界面使用，也可以作为一个库被包含到其他源代码中。

2022-10-17 14:52:50 2574

原创 Win10下VsCode远程免密连接服务器

输入如下，期间的要求连按三次回车即可。填下服务器的账户名称。

2022-08-17 17:56:56 322

原创 Ubuntu下jax安装与使用

该项目目前仍然没有官方的Windows支持，需要自己编译。

2022-08-17 17:25:46 3800

原创 Ubuntu 给用户添加sudo权限

有时需要使用 root 权限，比如安装软件、启动服务等操作时就需要用到sudo命令来提升权限才能进行操作。而新添加的普通用户是没有权限进行 sudo 操作的，所以我们需要对普通用户授予 sudo 权限。授予 sudo 权限有三个方法，第一个是把用户添加到 sudo 用户组，第二个是修改 sudo 配置文件 ()，第三个是添加配置文件到目录中。选其中一个即可，推荐第三个方法。...

2022-08-17 17:03:46 15248

原创 Python：RuntimeWarning: invalid value encountered in true_divide解决方案

最近在做NeRF相关的项目，其中用到colmap估计图像位姿，运行python出现“RuntimeWarning: invalid value encountered in true_divide”问题。不要使分母为0，可以把分母设置为1e-12。

2022-08-17 16:40:30 5152

原创 Ubuntu开放指定端口

输入如下指令即可完成测试。

2022-08-17 15:39:25 15166 1

原创 OpenCV 4.0.0学习笔记 (一) 图像与视频的读写

它是一系列的预定义的常量，其命名规则为CV_(位数）+（数据类型）+（通道数）U（unsigned integer）表示的是无符号整数，S（signed integer）是有符号整数，F（float）是浮点数。第一个参数是数据流或视频路径，第二个是API设置，读取的摄像头编号，默认CAP_ANY=0,自动检测摄像头。imread读取图像，返回Mat对象，两个参数，第一个是文件名，支持位图bmp、dib，JPEG图像，PNG，webp，pbm，pgm,ppm,TIFF等多种图像，读取失败则返回空矩阵。....

2022-08-17 15:37:26 269

原创 Ubuntu安装NVIDIA独立显卡驱动出现X service error问题解决方法

5、修改驱动程序的执行权限：输入命令：chmod 777 NVIDIA-Linux-x86_64-396.18 #使所有用户和组都具有读、写和执行的权限。6、安装驱动程序：输入命令：sudo ./NVIDIA-Linux-x86_64-396.18.run #当前目录下执行NVIDIA驱动程序。3、输入命令：sudo service lightdm stop 或者 sudo stop lightdm，以便关闭X窗口会话。0、到NVIDIA 官网上下载驱动文件（.run 格式）：。....

2022-08-17 15:20:56 1916

原创语义分割与实例分割

语义分割只能划分类别，而同类无法划分，因此在语义分割之后还需要用实例分割来划分同类别的不同实例。

2022-08-17 14:52:20 649

原创 startx 命令详解

startx 命令用来启动 X Window X11 会话。startx 脚本是 xinit 的前端，它为运行 X Window 系统的单个会话提供了更好的用户界面，它通常没有参数运行。

2022-08-11 15:32:08 3305

原创 Win10配置instant-ngp算法环境说明

在进行源码下载过程中，如下图示红色矩形框部分，由于网速下载不全，会导致下载失败，需要手动对应的下载，然后放到源码对应的位置，切记依赖项。以为是交叉环境问题，然后各种百度，最后在网上找的答案统统都不对，让自己欲哭无泪，因此必须保证自己的源代码文件内容完整和版本一致。文件夹中比对查看依赖项是否完全下载完整，重要事情说三遍：一定要确保文件下载完整！按照官网说明进行安装，亲测cuda11.7都可以运行成功，cuda11.3会有报错。由于vs2019原因会出现相应库缺失，一定要保证库版本一致，不然会出现。......

2022-08-11 10:41:54 2730 12

原创 Pose Animator：使用实时TensorFlow.js模型的SVG动画工具

目录背景将 FaceMesh 和 PoseNet 与 TensorFlow.js 一起使用来制作全身角色动画索具流程概述钻机定义矢量路径的线性混合蒙皮运动稳定展望未来自己试试吧！正在上传…重新上传取消正在上传…重新上传取消正在上传…重新上传取消正在上传…重新上传取消正在上传…重新上传取消正在上传…重新上传取消正在上传…重新上传取消正在上传…重新上传取消正在上传…重新上传取消正在上传…重新上传取消基于置信度分数的剪裁网格化或不网格化新的编辑功能...............

2022-07-14 14:01:33 1460 1

原创 Windows Docker 安装与问题解决

启动docker时报以下错误查看是否启动以下选项如果已经勾选依然报以下错误分析：未安装或安装的不是最新的wsl2，安装后即可正常打开docker安装：下载安装包，点击安装即可。

2022-07-14 11:40:30 384

原创 Windows安装wsl

管理员运行命令行然后执行现在一般使用wsl2，所以还需要设置接下来就可以打开Microsoft store安装想要安装的linux系统，这里我自己安装的是Ubuntu。或者在命令行中进行安装通过该命令设置默认root登录ubuntu（此步骤可以省略）官方指导：这里默认主机环境可以连接外网直接使用官方脚本自动安装.........

2022-07-14 11:32:11 617

原创【WSL2 Win10】解决子系统中nividia-smi出现的Failed to initialize NVML GPU access blocked by the operating systeM

环境：WIN10专业版 WSL2 Ubuntu x64架构尝试在WSL2中装CUDA，装好以后在wsl系统中输入nvidia-smi命令，结果报错。但是在Win10的CMD中正常显示Failed to initialize NVML: GPU access blocked by the operating systemFailed to properly shut down NVML: GPU access blocked by the operating system在网上搜了一下，没太多类似的情况

2022-07-14 10:48:31 2936 1

原创 OBJ格式模型详细介绍

obj格式有4种数据，分别以一下字母开头：v顶点vt纹理坐标vn顶点法向量f 面一、顶点格式：v x y z意义：每个顶点的坐标二、纹理坐标格式：vt u v w意义：绘制模型的三角面片时，每个顶点取像素点时对应的纹理图片上的坐标。纹理图片的坐标指的是，纹理图片如果被放在屏幕上显示时，以屏幕左下角为原点的坐标。注意：w一般用于形容三维纹理，大部分是用不到的，基本都为0。三、顶点法向量格式：vn x y z意义：绘制模型三角面片时，需要确定三角面片的朝向，整个面的朝向，是由构成每个面

2022-07-14 09:56:02 2245

原创 RTSP SDP RTP/RTCP介绍

SDP（1）SDP（Session Description Protocol）是服务器端生成的描述媒体文件的编码信息以及所在服务器的链接等信息的文件，客户端通过它来设置播放软件的参数。SDP只是一种用于会话描述的协议，它并不是一种传输协议，只是用于在不同传输协议之间传递消息的通知协议，其主要目的是解决多媒体会话通知、邀请和另外一些媒体会话的初始化工作。（2） SDP内容包括：会话名称和目的、会话持续时间、媒体类（音频、视频等）、传输协议（RTP/UDP/IP，H.320等）、媒体编码格式（MPEG4、H.

2022-07-12 10:51:01 900

原创 Python之format用法说明

一、填充1.无参（1）print('{} {}'.format('hello','world'))hello world2.无参（2）print('{0} {1}'.format('hello','world'))1hello world3.无参（3）print('{1} {0} {1}'.format('hello','world'))1world hello world4.key valueprint('ID:{id},Nam..

2022-07-12 10:14:58 482

原创 NLP中关键字提取方法总结和概述

关键词提取方法可以在文档中找到相关的关键词。在本文中，我总结了最常用的关键字提取方法。什么是关键词提取？关键字提取是从文本文档中检索关键字或关键短语。这些关键词从文本文档的短语中选择出来的并且表征了文档的主题。在本文中，我总结了最常用的自动提取关键字的方法。自动从文档中提取关键字的方法是从文本文档中选择最常用和最重要的单词或短语的启发式方法。我将关键字提取方法归入自然语言处理领域，这是机器学习和人工智能中的一个重要领域。关键字提取器用于提取单词（关键字）或创建短语（关键短语）的两个或多个单词的组。在本文中，

2022-07-04 10:39:00 1567

原创深度学习3D 人体姿态估计面临的问题和挑战

在 3D 人体姿态估计中，学者们致力于研究基于单目 RGB 视频的 3D 人体姿态估计，这是因为目前单目 RGB 摄像头应用广泛、价格低廉，在人们日常使用的手机、电脑均配备有摄像头，因此该技术有着广大的应用前景。但与此同时，该技术也具有更高的挑战性，以下主要介绍几个痛点问题及挑战：（1）深度模糊问题：3D 人体姿态估计的本质为，从 2D 图像信息中恢复出 3D人体姿态，即从低维度信息中恢复出高维度信息。深度模糊是指，对于 2D 图像中的人体姿态，在 3D 空间中可能有多个姿态与之对应，这是一项极具挑战性的问

2022-07-01 17:53:32 1793

原创 TensorRT 开始

TensorRT 是 NVIDIA 自家的高性能推理库，其 Getting Started 列出了各资料入口，如下：本文基于当前的 TensorRT 8.2 版本，将一步步介绍从安装，直到加速推理自己的 ONNX 模型。进 TensorRT 下载页选择版本下载，需注册登录。本文选择了，可以注意到与 CUDA cuDNN 要匹配好版本。也可以准备 NVIDIA Docker 拉取对应版本的 nvidia/cuda 镜像，再即可。之后，编译运行样例，保证 TensorRT 安装正确。样例在，说

2022-07-01 16:35:25 1733 1

原创 Python 三维姿态估计+Unity3d 实现 3D 虚拟现实交互游戏

随着人机交互技术飞速发展，人体姿态估计技术越来越受到重视。姿态估计作为人体行为识别的重要组成部分，近年来逐渐成为计算机视觉领域的一个重要的研究热点。由于人体结构和姿态的复杂性以及视觉理论的局限性，最初人体姿态估计算法仅从图像或者视频当中预测人体二维骨架节点的坐标位置。2015年马普所提出了由姿态与体型参数驱动的蒙皮多人线性模型，由于该模型具有出色的建模效果与快速的计算效率，许多团队提出了利用该模型进行人体姿态估计的方法。目前基于人体形变模型的姿态估计方法可以根据两个标准进行分类：一类是基于优化的方法，另一类

2022-07-01 10:01:01 2290

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

videoinput源码

kalal大神的TLD目标跟踪算法MATLAB源码

斯坦福大学机器学习课程个人学习笔记（全集）

Object Tracking via Partial Least Squares Analysis论文和代码

数字水印 Digital+Watermarking+and+Steganography 第二版

水印的算法

空空如也