自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(73)
  • 收藏
  • 关注

原创 论文笔记 - CFNet: Cascade and Fused Cost Volume for Robust Stereo Matching. CVPR 2021

论文笔记。本文是2021年CVPR的一篇文章,针对双目立体匹配任务。文章数提出了一种级联+融合的costvolume构造和回归策略,从而获得了高精度、对数据高鲁棒性的立体匹配结果。本文的切入点主要针对立体匹配的鲁棒性,指出由于数据集之间的差异以及视差分布的差异,导致很多算法只能在特定数据集获得很好的结果,迁移性和泛化性不足,这也严重制约了很多算法模型在真实场景的应用。因此,本文提出了CFNet采用融合+级联的方式提升立体匹配算法的鲁棒性。...

2022-07-22 19:50:08 1155 1

原创 论文笔记 - RAFT-Stereo: Multilevel Recurrent Field Transforms for Stereo Matching

这篇博客是对论文RAFT-Stereo: Multilevel Recurrent Field Transforms for Stereo Matching的阅读笔记。论文地址位于,代码已开源,位于:RAFT-Stereo: Multilevel Recurrent Field Transforms for Stereo Matching本文是一篇将光流算法RAFT迁移至立体匹配领域的文章,基于光路估计网络RAFT,提出了多级卷积GRU实现立体匹配的代价传播。文章对RAFT进行优化,并得到了一个高精度

2022-05-14 11:06:57 2128 1

原创 LeetCode 第275场周赛

本次周赛题目比较简单,比赛链接位于这里No.1 检查是否每一行每一列都包含全部整数对一个大小为 n x n 的矩阵而言,如果其每一行和每一列都包含从 1 到 n 的 全部 整数(含 1 和 n),则认为该矩阵是一个 有效 矩阵。给你一个大小为 n x n 的整数矩阵 matrix ,请你判断矩阵是否为一个有效矩阵:如果是,返回 true ;否则,返回 false 。示例 1:输入:matrix = [[1,2,3],[3,1,2],[2,3,1]]输出:true解释:在此例中,n = 3 ,

2022-01-11 17:14:51 672

原创 LeetCode 第274场周赛

本次周赛是2022年的第一场周赛。题目链接位于这里No 1. 检查是否所有 A 都在 B 之前 显示英文描述User Accepted:1635User Tried:1773Total Accepted:1640Total Submissions:2009Difficulty:Easy给你一个 仅 由字符 ‘a’ 和 ‘b’ 组成的字符串 s 。如果字符串中 每个 ‘a’ 都出现在 每个 ‘b’ 之前,返回 true ;否则,返回 false 。示例 1:输入:s = “aaabbb”

2022-01-09 22:25:17 501

原创 LeetCode 第273场周赛

LeetCode 第273场周赛 解析这次周赛应该是2021年度的最后一场周赛了,下一场就到2022年了。这篇博客对本次周赛的题目做一个解析。题目链接位于这里No 1.反转两次的数字反转 一个整数意味着倒置它的所有位。例如,反转 2021 得到 1202 。反转 12300 得到 321 ,不保留前导零 。给你一个整数 num ,反转 num 得到 reversed1 ,接着反转 reversed1 得到 reversed2 。如果 reversed2 等于 num ,返回 true ;否则,返

2021-12-27 15:50:46 323

原创 LeetCode 第271场周赛

这篇文章小结一下271场周赛的题目和解析。这场比赛在这里No.1 环和杆总计有 n 个环,环的颜色可以是红、绿、蓝中的一种。这些环分布穿在 10 根编号为 0 到 9 的杆上。给你一个长度为 2n 的字符串 rings ,表示这 n 个环在杆上的分布。rings 中每两个字符形成一个 颜色位置对 ,用于描述每个环:第 i 对中的 第一个 字符表示第 i 个环的 颜色(‘R’、‘G’、‘B’)。第 i 对中的 第二个 字符表示第 i 个环的 位置,也就是位于哪根杆上(‘0’ 到 ‘9’)。例如,“

2021-12-12 14:01:00 3877

原创 LeetCode 第 267 场周赛

本文对267场周赛题目做一个小结。周赛题目链接在此No 1 买票需要的时间有 n 个人前来排队买票,其中第 0 人站在队伍 最前方 ,第 (n - 1) 人站在队伍 最后方 。给你一个下标从 0 开始的整数数组 tickets ,数组长度为 n ,其中第 i 人想要购买的票数为 tickets[i] 。每个人买票都需要用掉 恰好 1 秒 。一个人 一次只能买一张票 ,如果需要购买更多票,他必须走到 队尾 重新排队(瞬间 发生,不计时间)。如果一个人没有剩下需要买的票,那他将会 离开 队伍。返回位

2021-11-14 14:50:38 5111 1

原创 LeetCode 第264场周赛

本次周赛开幕雷击,题目难度并不高,但是第一题就很麻烦,一定程度上影响了参赛者的积极性。本文小结一下周赛题目。No 1 句子中的有效单词数句子仅由小写字母(‘a’ 到 ‘z’)、数字(‘0’ 到 ‘9’)、连字符(’-’)、标点符号(’!’、’.’ 和 ‘,’)以及空格(’ ')组成。每个句子可以根据空格分解成 一个或者多个 token ,这些 token 之间由一个或者多个空格 ’ ’ 分隔。如果一个 token 同时满足下述条件,则认为这个 token 是一个有效单词:仅由小写字母、连字符和/

2021-10-24 14:52:34 2597

原创 论文笔记 - Omnidirectional stereo depth estimation based on spherical deep network

论文笔记 Omnidirectional stereo depth estimation based on spherical deep network本文是2021 Image and Vision Computing上的一篇文章。IVC算是领域内认可度较高的期刊之一。本文针对双目全景深度估计,提出了基于球面卷积的级联网络,将全景图的平面投影转换到球面表示,获取了高精度的全景深度图。......

2021-09-15 20:59:06 999 1

原创 训练过程中Loss突然变为NaN的可能原因与解决

训练过程中Loss突然变为NaN的可能原因与解决深度学习训练过程中,我们依赖模型当前参数训练得到的loss,根据所选择的优化策略,如Adam、SGD等得到参数步进调整值,对参数进行不断的调整,直到模型达到我们的预期。但在实际训练过程中,有时候会发现loss变为NaN或Inf的情况,导致训练无法正常进行。出现这种情况的原因主要有以下几点:1. 梯度爆炸2. 出现除零、对数函数自变量为负值等数学问题3. 出现坏样本1. 梯度爆炸训练过程中由于学习率等超参数设置的不合理,导致优化过程中没有减小los

2021-07-27 13:03:19 28142 14

原创 第232场LeetCode周赛

第232场LeetCode周赛No 1. 仅执行一次字符串交换能否使两个字符串相等给你长度相等的两个字符串 s1 和 s2 。一次 字符串交换 操作的步骤如下:选出某个字符串中的两个下标(不必不同),并交换这两个下标所对应的字符。如果对 其中一个字符串 执行 最多一次字符串交换 就可以使两个字符串相等,返回 true ;否则,返回 false 。示例 1:输入:s1 = “bank”, s2 = “kanb”输出:true解释:例如,交换 s2 中的第一个和最后一个字符可以得到 “bank”

2021-03-18 21:24:12 141

原创 第47场 LeetCode 双周赛

第47场 LeetCode 双周赛本次周赛链接No.1 找到最近的有相同 X 或 Y 坐标的点给你两个整数 x 和 y ,表示你在一个笛卡尔坐标系下的 (x, y) 处。同时,在同一个坐标系下给你一个数组 points ,其中 points[i] = [ai, bi] 表示在 (ai, bi) 处有一个点。当一个点与你所在的位置有相同的 x 坐标或者相同的 y 坐标时,我们称这个点是 有效的 。请返回距离你当前位置 曼哈顿距离 最近的 有效 点的下标(下标从 0 开始)。如果有多个最近的有效点,请返

2021-03-11 22:50:57 403

原创 论文笔记 - BiFuse: Monocular 360◦ Depth Estimation via Bi-Projection Fusion. CVPR 2020

论文笔记 - BiFuse: Monocular 360◦ Depth Estimation via Bi-Projection Fusion. CVPR 20201. Introduction2. Related Work3. Approach4. Experimental Results实际测试:这篇博客介绍一篇CVPR2020的论文,这篇论文结合了全景图(360°图像)的两种常见投影方式,设计了融合模块及双分支神经网络,实现了出色的单目全景图深度估计性能。论文地址:https://ieeexplor

2021-03-06 22:03:00 1046

原创 第219场LeetCode周赛

第219场LeetCode周赛No.1 比赛中的配对次数给你一个整数 n ,表示比赛中的队伍数。比赛遵循一种独特的赛制:如果当前队伍数是 偶数 ,那么每支队伍都会与另一支队伍配对。总共进行 n / 2 场比赛,且产生 n / 2 支队伍进入下一轮。如果当前队伍数为 奇数 ,那么将会随机轮空并晋级一支队伍,其余的队伍配对。总共进行 (n - 1) / 2 场比赛,且产生 (n - 1) / 2 + 1 支队伍进入下一轮。返回在比赛中进行的配对次数,直到决出获胜队伍为止。示例 1:输入:n = 7

2020-12-15 15:05:29 235

原创 论文笔记 - PSM-Net: Pyramid Stereo Matching Network. CVPR 2018

Pyramid Stereo Matching Network. CVPR 2018本文指出,通过立体图像对估计深度已经能够表征为监督学习任务并且通过卷积神经网络解决。但是已有算法都依赖于基于patch的孪生网络,缺乏对上下文信息的利用,难以找到非适定区域关联性。本文提出了金字塔立体匹配网络PSM-Net,主要包括了空间金字塔池化与3D CNN。空间金字塔池化能够通过多尺度累积获取全局语境信息,3DCNN能够通过堆叠沙漏网络及中间结果监督规则化cost volume,获取视差图。Introduction

2020-12-10 21:33:12 989

原创 第218场LeetCode周赛

第218场LeetCode周赛No 1. 设计 Goal 解析器请你设计一个可以解释字符串 command 的 Goal 解析器 。command 由 “G”、"()" 和/或 “(al)” 按某种顺序组成。Goal 解析器会将 “G” 解释为字符串 “G”、"()" 解释为字符串 “o” ,"(al)" 解释为字符串 “al” 。然后,按原顺序将经解释得到的字符串连接成一个字符串。给你字符串 command ,返回 Goal 解析器 对 command 的解释结果。示例 1:输入:command

2020-12-07 22:07:37 164

原创 ubuntu编译caffe可能遇到的坑

ubuntu编译caffe可能遇到的坑caffe作为深度学习最早的框架之一,对于现在DL的发展起到了很大的贡献。然而相比于现在更加主流的tensorflow、pytorch等,其编译过程常常让人很痛苦。这篇博客记录一下caffe编译配置过程中常见的问题,能够解决的问题会给出解决方案。首先caffe不一定非要手动编译,以ubuntu为例,在20.04之前的版本,可以通过apt安装caffe-cuda和caffe-cpu(cpu版本)。然而Ubuntu20.04只有caffe-cpu,可能过段时间会加上吧

2020-11-25 22:16:27 479 1

原创 第216场LeetCode周赛

第216场LeetCode周赛

2020-11-22 22:25:21 131

原创 LeetCode 第38次双周赛

//No 1 vector<int> frequencySort(vector<int>& nums) { unordered_map<int, int> m; for (auto n : nums)m[n]++; vector<pair<int, int>> vp; for (auto mm : m) { vp.push_back({ mm.second,mm.first }); }

2020-11-03 11:45:01 237

原创 pytorch命令行打印模型结构的两种方法及对比

pytorch命令行打印模型结构的两种方法及对比当我们使用pytorch进行模型训练或测试时,有时候希望能知道模型每一层分别是什么,具有怎样的参数。此时我们可以将模型打印出来,输出每一层的名字、类型、参数等。常用的命令行打印模型结构的方法有两种:一是直接print二是使用torchsummary库的summary但是二者在输出上有着一些区别。首先说结论:1. print输出结果是每一层的名字、类别、以及构造时的参数,例如对于卷积层,还包括用户定义的stride、bias等;而torch summ

2020-10-24 22:42:26 33837 4

原创 C++ 字符串分割、整行输入分割等问题

C++ 字符串分割、整行输入分割等问题1. C++处理含分隔符的字符串

2020-10-24 18:59:59 4518

原创 LeetCode 第211场周赛

LeetCode 第211场周赛1. 两个相同字符之间的最长子字符串给你一个字符串 s,请你返回 两个相同字符之间的最长子字符串的长度 ,计算长度时不含这两个字符。如果不存在这样的子字符串,返回 -1 。子字符串 是字符串中的一个连续字符序列。示例 1:输入:s = “aa”输出:0解释:最优的子字符串是两个 ‘a’ 之间的空子字符串。示例 2:输入:s = “abca”输出:2解释:最优的子字符串是 “bc” 。提示:1 <= s.length <= 300s 只含

2020-10-18 21:48:20 426

原创 pytorch 使用预训练模型如resnet、vgg等并修改部分结构

pytorch 使用预训练模型并修改部分结构

2020-10-06 17:28:03 29014 13

原创 LeetCode 股票买卖系列 best time to buy and sell stock

LeetCode 股票买卖系列 best time to buy and sell stock

2020-10-05 15:22:45 265 1

原创 LeetCode第209次周赛

LeetCode第209次周赛本次周赛题目都不算很难,但是有一种“剑走偏锋”的感觉。No.1 特殊数组的特征值给你一个非负整数数组 nums 。如果存在一个数 x ,使得 nums 中恰好有 x 个元素 大于或者等于 x ,那么就称 nums 是一个 特殊数组 ,而 x 是该数组的 特征值 。注意: x 不必 是 nums 的中的元素。如果数组 nums 是一个 特殊数组 ,请返回它的特征值 x 。否则,返回 -1 。可以证明的是,如果 nums 是特殊数组,那么其特征值 x 是 唯一的 。示例

2020-10-04 16:19:19 249

原创 LeetCode第204场周赛

LeetCode第204场周赛本场周赛题目位于这里本次题目感觉还是比较有趣的,不是繁琐的业务或者单纯的技巧,注重思考的过程。1· 重复至少 K 次且长度为 M 的模式给你一个正整数数组 arr,请你找出一个长度为 m 且在数组中至少重复 k 次的模式。模式 是由一个或多个值组成的子数组(连续的子序列),连续 重复多次但 不重叠 。 模式由其长度和重复次数定义。如果数组中存在至少重复 k 次且长度为 m 的模式,则返回 true ,否则返回 false 。示例 1:输入:arr = [1,

2020-08-30 17:05:06 269

原创 解决PyTorch 出现RuntimeError: Function AddBackward0 returned an invalid gradient at index 1 问题

解决PyTorch 出现RuntimeError: Function AddBackward0 returned an invalid gradient at index 1 问题在使用pytorch框架训练中,进行loss.backward()一步时可能出现如下的问题:RuntimeError: Function AddBackward0 returned an invalid gradient at index 1 - expected type TensorOptions(dtype=float,

2020-08-12 11:14:11 14770 7

原创 LeetCode 第200场周赛

LeetCode 第200场周赛本期周赛依旧不算太难,不过需要比较仔细,不然容易被罚时。1.//No 1 int countGoodTriplets(vector<int>& arr, int a, int b, int c) { int ans = 0,len=arr.size(); if (len<3) return 0; for (int i = 0; i < len - 2; ++i) { for (int j = i +

2020-08-03 00:18:20 224

原创 LeetCode 第31场双周赛

LeetCode 第31场双周赛本周双周赛又是一次福利场,无奈手速不够快1. 在区间范围内统计奇数数目给你两个非负整数 low 和 high 。请你返回 low 和 high 之间(包括二者)奇数的数目。示例 1:输入:low = 3, high = 7输出:3解释:3 到 7 之间奇数数字为 [3,5,7] 。示例 2:输入:low = 8, high = 10输出:1解释:8 到 10 之间奇数数字为 [9] 。解析本题要求区间内(左右都是闭区间)的奇数数量。实际上奇数大约占一

2020-07-26 00:18:43 254

原创 LeetCode 第30场双周赛

LeetCode 第30场双周赛大佬们的手速场,本菜鸡手速拼不过,不过本次双周赛依然是我做过最简单的一次了,福利场涨涨自信好了。1·转变日期格式给你一个字符串 date ,它的格式为 Day Month Year ,其中:Day 是集合 {"1st", "2nd", "3rd", "4th", ..., "30th", "31st"} 中的一个元素。Month 是集合 {"Jan", "Feb", "Mar", "Apr", "May", "Jun", "Jul", "Aug", "Sep", "

2020-07-12 00:33:25 256

原创 论文笔记 - Cycle-GAN Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks

论文笔记 - Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks本文是ICCV 2017的一篇文章,也就是著名的Cycle-GAN一文。同时期研究生成模型的算法很多(现在依然有很多)起了各种xxxGAN的名字。CycleGAN是生成模型中很有启发性的一个工作,马和斑马的图也在网络上广为流传。论文和源码、模型都可以在作者的网页找到。AbstractIntroduction &&

2020-07-09 21:54:20 437

原创 LeetCode 662 Maximum Width of Binary Tree 二叉树的最大宽度

LeetCode 662 Maximum Width of Binary Tree 二叉树的最大宽度题目描述Given a binary tree, write a function to get the maximum width of the given tree. The width of a tree is the maximum width among all levels. The binary tree has the same structure as a full binary tre

2020-07-09 21:13:18 252

原创 【论文笔记】Generative Adversarial Frontal View to Bird View Synthesis - 论文阅读笔记

【论文笔记】Generative Adversarial Frontal View to Bird View Synthesis这篇论文是一篇发表在3DV会议上的文章,提出了基于GAN进行视角迁移与生成的方法,针对的场景是基于正面视角frontal view来生成俯视图bird view。作者提出了名为Bridge GAN的模型,结合homography,实现了由Frontal view生成Bi...

2020-07-08 20:36:11 322

原创 LeetCode weekly contest 196 第196期周赛

LeetCode weekly contest 196 第196期周赛1· 5452. 判断能否形成等差数列给你一个数字数组 arr 。如果一个数列中,任意相邻两项的差总等于同一个常数,那么这个数列就称为 等差数列 。如果可以重新排列数组形成等差数列,请返回 true ;否则,返回 false 。示例 1:输入:arr = [3,5,1]输出:true解释:对数组重新排序得到 [1,3,5] 或者 [5,3,1] ,任意相邻两项的差分别为 2 或 -2 ,可以形成等差数列。示例 2:输入

2020-07-05 17:22:41 207

原创 LeetCode 871. Minimum Number of Refueling Stops 最少加油次数

LeetCode 871. Minimum Number of Refueling Stops本题是LeetCode 871题,最少加油次数。题目描述A car travels from a starting position to a destination which is target miles east of the starting position.Along the way, there are gas stations. Each station[i] represents a

2020-07-04 21:32:14 317

原创 论文笔记 - Cascaded Refinement Network for Point Cloud Completion - 2020 CVPR

论文笔记 - “Cascaded Refinement Network for Point Cloud Completion”本文是2020年CVPR的一篇文章。作者是来自新加坡国立大学的 Xiaogang Wang, Marcelo H Ang Jr ,Gim Hee Lee。论文地址源码地址本文是一篇基于深度学习进行点云补全的文章。背景简要介绍一下本文的introduction部分的研究背景。作者团队首先提出了三维点云的生成存在着稀疏、不完整、不规则的特点,学习到准确的点云的特征以及多样的分

2020-07-03 20:25:25 4456 1

原创 ubuntu20.04 编译安装早期版本(如2.2.1)的OpenEXR

ubuntu20.04 编译安装早期版本(如2.2.1)的OpenEXR在一些slam问题相关的源码编译时,往往需要OpenEXR。有一些SOTA的slam相关工作是比较早期完成的,当时依赖的OpenEXR版本可能比较早。本文介绍如何在较新的系统下自行编译安装老版本OpenEXR。apt 安装存在的问题对于比较新的系统,apt很可能是找不到老版本库的。apt 安装openexr可以直接通过:sudo apt install libopenexr-dev得到。但是一般是比较新的版本,比如ubun

2020-07-02 19:29:28 1284

原创 LeetCode 97 交错字符串 Interleaving String

LeetCode 97 交错字符串 Interleaving String题目描述Given s1, s2, s3, find whether s3 is formed by the interleaving of s1 and s2.本题给定3个字符串,求第三个能否由前两个交错的组成。示例如下:Example 1:Input: s1 = “aabcc”, s2 = “dbbca”, s3 = “aadbbcbcac”Output: trueExample 2:Input: s1 = “aa

2020-07-01 20:35:37 237

原创 pytorch 网络train、eval以及在训练与测试时实现不同输出的方法

pytorch 网络train、eval以及在训练与测试时实现不同输出的方法深度学习网络往往都是通过训练过程将初始参数调优,然后通过训练后的模型进行测试与预测。对于一些场景,比如图像生成、深度图预测、分割等,有可能需要在训练过程中采用多尺度的思想,生成不同尺度的结果并计算loss,但是在测试与预测阶段,实际上只需要输出最后要求的一个尺度(分辨率)下的结果即可。这就需要我们在测试和训练时实现不同的输出。方法pytorch的网络模型有一个属性 training,用于判断当前模型是否处于训练阶段,因此,我们

2020-06-28 17:40:48 4328 4

原创 Ubuntu 18.04 升级内核 配置GPU驱动+CUDA+CUDNN

Ubuntu 18.04 升级内核 配置GPU驱动+CUDA+CUDNN本文简述Ubuntu 18.04系统下内核的升级以及CPU驱动、CUDA、CUDNN等的配置过程。希望能够能帮助大家避坑。首先我系统初始为4.15版本内核的Ubuntu 18.04系统,这里我对内核做了一下升级。实际上不升级也完全没有问题,不影响后续操作。需要注意的地方在于内核版本与NVIDIA驱动版本应当匹配(比如410版本的驱动就无法在4.18以上的内核正常运行)。升级内核这里只需要简单的通过apt安装即可。sudo ap

2020-06-26 21:29:15 2336

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除