Klay Ye-CSDN博客

原创论文分享 A ConvNet for the 2020s

视觉识别的“咆哮的 20 年代”始于 Vision Transformers (ViTs) 的引入，它迅速取代了 ConvNets，成为最先进的图像分类模型。另一方面，vanilla ViT 在应用于对象检测和语义分割等一般计算机视觉任务时面临困难。正是层次化的 Transformers（例如 Swin Transformers）重新引入了几个 ConvNet 先验，使得 Transformers 作为通用视觉骨干实际上可行，并在各种视觉任务上展示了卓越的性能。

2023-05-24 17:12:45 894

原创论文分享：ArcFace: Additive Angular Margin Loss for Deep Face Recognition

ArcFace

2022-07-16 18:39:47 1229

原创论文分享 Knowledge-guided synthetic medical image adversarial augmentation for ultrasonograph

摘要背景和目的：图像分类是许多医学应用中的一项重要任务。基于深度学习的方法在计算机视觉领域取得了巨大的成就。但是，它们通常依赖于带注释的大规模数据集。如何获得如此大的数据集仍然是医学领域的一个严重问题。方法：在本文中，我们提出了一种用于合成医学图像的知识引导的对抗性增强方法。首先，我们设计术语和图像编码器来从放射科医生那里提取领域知识，然后我们使用领域知识作为新条件来约束辅助分类器生成对抗网络 (ACGAN) 框架，以合成高质量的甲状腺结节图像。最后，我们展示了我们对超声甲状腺结节进行分类任务的方法。我

2022-04-06 22:01:28 1527

原创论文分享 MobileNetV2: Inverted Residuals and Linear Bottlenecks

摘要在本文中，我们描述了一种新的移动架构 MobileNetV2，它提高了移动模型在多个任务和基准测试以及不同模型大小范围内的最新性能。我们还描述了在我们称为 SSDLite 的新框架中将这些移动模型应用于对象检测的有效方法。此外，我们演示了如何通过我们称为 Mobile DeepLabv3 的 DeepLabv3 的简化形式来构建移动语义分割模型。基于倒置残差结构，其中快捷连接位于薄瓶颈层之间。中间扩展层使用轻量级深度卷积来过滤特征作为非线性源。此外，我们发现去除窄层中的非线性以保持代表性很重要。我

2022-03-07 22:50:54 2464

原创论文分享 Unified Focal loss: Generalising Dice and cross entropy-based losses to handle class

Department of Radiology, University of Cambridge, Cambridge CB2 0QQ, United KingdomSchool of Clinical Medicine, University of Cambridge, Cambridge CB2 0SP, United Kingdom摘要自动分割方法是医学图像分析的重要进步。机器学习技术，尤其是深度神经网络，是大多数医学图像分割任务的最新技术。类别不平衡的问题对医学数据集提出了重大挑战，相对于背景

2022-02-19 22:56:37 466

原创论文分享 MetaBalance: High-Performance Neural Networks for Class-Imbalanced Data

摘要类不平衡数据，其中一些类包含比其他类多得多的样本，在现实世界的应用程序中无处不在。处理类不平衡的标准技术通常通过对重新加权损失或重新平衡数据进行训练来工作。不幸的是，针对此类目标训练过度参数化的神经网络会导致少数类数据的快速记忆。为了避免这个陷阱，我们利用元学习，它同时使用“外环（outer-loop）”和“内环（inner-loop）”损失，每个损失都可以使用不同的策略进行平衡。我们在图像分类、信用卡欺诈检测、贷款违约预测和具有严重不平衡数据的面部识别任务上评估我们的方法 MetaBalance。

2022-02-19 22:46:50 483

原创论文分享 Class-Weighted Evaluation Metrics for Imbalanced Data Classification

摘要不平衡数据集中的类分布偏斜可能导致模型对多数类具有预测偏差，从而使分类器的公平评估成为一项具有挑战性的任务。平衡精度等指标通常用于评估分类器在此类场景下的预测性能。但是，当类别的重要性不同时，这些指标就会不足。在本文中，我们提出了一个简单且通用的评估框架，用于不平衡数据分类，该框架对类基数和重要性的任意偏差敏感。在来自三个不同领域的真实数据集上测试了几个最先进的分类器的实验表明了我们框架的有效性——不仅在评估和排名分类器方面，而且在训练它们方面。图1：类基数或类重要性分布的偏差，以及它们之间的潜

2022-02-19 20:32:19 884

原创 Linux 自启动程序（autostart）

1. 创建 .desktop 文件.desktopDesktop Entry 文件是 Linux 桌面系统中用于描述程序启动配置信息的文件，它以 .desktop 为后缀名，相当于Windows系统下的桌面快捷方式。通常一个二进制可执行程序是一个没有后缀没有图标的文件，不可以随意移动。以 Kgt.desktop 为例[Desktop Entry]Name=<应用程序名>Type=ApplicationExec=<应用程序完整路径>Icon=<应用程序图标的完整路径

2022-01-19 20:44:49 3611

原创《Linux C编程完全解密》第10章进程间通信（IPC）

更优秀的介绍：进程间通信（IPC）介绍 1. 管道#include <unistd.h>#include <fcntl.h>匿名管道（pipe）是一种半双工的通信方式，数据只能单向流动，而且只能在父子进程间使用。通过匿名管道实现进程间通信的步骤如下：父进程创建管道，得到两个⽂件描述符指向管道的两端父进程fork出子进程，⼦进程也有两个⽂件描述符指向同⼀管道。父进程关闭fd[0],子进程关闭fd[1]，即⽗进程关闭管道读端,⼦进程关闭管道写端（因为管道只支持单向通

2022-01-07 23:39:52 1149

原创七.CUDA编程（1）

指向device内存的指针，cpu上对它进行操作就会报错！让每个线程执行以下程序，从而去掉了CPU版本的2层外循环，实现了并行处理。由于每个结果都是独立的，所以不需要锁或同步。...

2021-12-09 19:44:04 71

原创六.GPU编程模型

缓存设计是成本和速度的折中。

2021-12-09 18:14:48 221

原创五.GPU体系架构概述

GFLOPS：十亿次TFLOPS：一万亿次Shader主要编辑顶点着色器和片元着色器来影响渲染效果。GPU设计思路：算术逻辑单元(arithmetic and logic unit) 是能实现多组算术运算和逻辑运算的组合逻辑电路，简称ALU。停滞（stalls）NVidia Kepler架构评价GPU的标准一般而言有两条：1，单精度浮点数计算能力，双精度浮点数计算能力;2，数据传输带宽3，对于嵌入式系统的GPU来说，还会增加一条是功耗。...

2021-12-09 14:26:01 4645

原创四.CUDA开发环境搭建和工具配置

硬件：将GPU插入主板上的PCIe插槽上，再接上显示器以及电源。一般采用两块GPU，一块用来计算，一块用来显示，这样才能更流畅。软件：在官方网站（CUDA ZONE）找到CUDA TOOLKIT，下载CUDA。windows：先要安装visual studio（>2015），才能安装CUDA。安装成功后通过visual studio即可进行开发。Linux：先查看Ubuntu版本：cat /etc/issue查看是否有支持的GPU：lspci | grep -i nvidia查看

2021-12-09 13:47:26 2534

原创三.并行程序设计概述

同步实际上在一定程度上影响了并行计算。同步：进程之间存在依赖关系，一个进程结束的输出作为另一个进程的输入。具有同步关系的一组并发进程之间发送的信息称为消息或者事件；并行：单处理器中进程被交替执行，表现出一种并发的外部特征；在多处理器中，进程可以交替执行，还能重叠执行，实现并行处理，并行就是同事发生的多个并发事件，具有并发的含义，但并发不一定是并行，也就是说事件之间不一定要同一时刻发生；...

2021-12-09 13:25:26 772

原创二.CPU体系架构概述

CPI(Cycles Per Instruction)DDR内存全称是DDR SDRAM(Double Data Rate SDRAM，双倍速率SDRAM)。DDR SDRAM最早是由三星公司于1996年提出，由日本电气、三菱、富士通、东芝、日立、德州仪器、三星及现代等八家公司协议订立的内存规格，并得到了AMD、VIA与SiS等主要芯片组厂商的支持。它是SDRAM 的升级版本，因此也称为「SDRAM II」。Intel Core i7 39960X 芯片中间最大部分是共享的三级缓存。CP...

2021-12-09 11:17:35 424

原创一.CPU并行计算和GPU程序开发

计算机很多时间并不是在处理计算问题，而是在处理各种事务。

2021-12-09 10:08:50 325

原创论文分享 Simple Baselines for Human Pose Estimation and Tracking

Bin Xiao1∗, Haiping Wu2∗†, and Yichen Wei1 1Microsoft Research Asia ECCV2018https://github.com/microsoft/human-pose-estimation.pytorch摘要近年来，在姿态估计方面取得了显著的进展，并且对姿态跟踪的兴趣日益增加。同时，整体算法和系统复杂度也随之增加，使得算法分析和比较更加困难。这项工作提供了简单有效的基线方法。它们有助于激发和评估该领域的新想法。在具有挑战性的基准测试中获得

2021-06-17 18:08:13 255 1

原创论文分享 Stacked Hourglass Networks for Human Pose Estimation

Alejandro Newell, Kaiyu Yang, and Jia Deng University of Michigan, Ann Arbor 2016.7https://github.com/raymon-tian/hourglass-facekeypoints-detection摘要这项工作介绍了一种新的卷积网络结构的任务，人体姿态估计。对所有比例的特征进行处理和整合，以最好地捕捉与身体相关的各种空间关系。我们展示了重复的自下而上、自上而下的处理与中间监管相结合对于提高网络性能的重要性。

2021-06-17 17:37:43 213

原创论文分享 Asymmetric Loss For Multi-Label Classification

DAMO Academy, Alibaba Group 2020.9https://github.com/Alibaba-MIIL/ASL摘要日常生活的图片本质上是多标签的。因此，多标签分类通常用于分析其内容。在典型的多标签数据集中，每张图片只包含几个正标签，以及许多负标签。这种正负不平衡会导致训练过程中来自正标签的梯度强调不足，从而导致准确性差。在这篇文章中，我们介绍了一种新的非对称损失(“ASL”)，它在正负样本上有不同的操作。这种损失动态地降低了简单阴性样本的重要性，导致优化过程更多地关注阳性

2021-06-17 17:09:33 1614 1

原创 TensorRT简单介绍

优化推理效率原理自动选取最优算子（矩阵乘法、卷积有多种CUDA实现方式，根据数据大小和形状自动选取最优实现）计算图优化（kernel融合，减少数据拷贝）支持fp16/int8（对数值进行精度转换与缩放，充分利用硬件的低精度高通量计算能力）TensorRT上手方法基本框架卷积层的迁移调用TRT network API，创建相应的层：网络不难搭，参数不好搞，即如何设置权重：kernel和bias。从TensorFlow获取参数，设置在TRT上：...

2021-04-28 22:36:33 266

原创 Horovod原理及实现细节

并行训练介绍按照并行方式，分布式训练一般分为数据并行和模型并行两种，当然也有数据并行和模型并行的混合模式。模型并行：分布式系统中的不同 GPU 负责网络模型的不同部分。例如，神经网络模型的不同网络层被分配到不同的 GPU，或者同一层内部的不同参数被分配到不同 GPU；数据并行：不同的 GPU 有同一个模型的多个副本，每个 GPU 分配到不同的数据，然后将所有 GPU 的计算结果按照某种方式合并。因为模型并行各个部分存在一定的依赖，规模伸缩性差（意思是不能随意增加 GPU 的数量），在实际训练中用

2021-04-09 15:33:19 5183

原创论文分享 A Distance Map Regularized CNN for Cardiac Cine MR Image Segmentation

摘要心脏图像分割是生成个性化心脏模型和量化心脏性能参数的关键过程。已经提出了几种卷积神经网络结构来从心脏核磁共振图像中分割心室。本文提出了一种基于多任务学习(MTL)的正则化框架用于心脏磁共振图像分割。该网络被训练来执行语义分割的主要任务，以及同时进行的像素级距离图回归的辅助任务。提出的距离图正则化块是添加到现有CNN架构的瓶颈层的解码器网络，便于网络学习鲁棒的全局特征。训练后去除正则化块，使网络参数的原始个数不变。我们表明，所提出的正则化方法在两个公开可用的心脏电影磁共振成像数据集上改善了二类和多类

2021-01-27 17:16:31 748

原创论文分享 Automatic calcium scoring in low-dose chest CT using deep neural networks with dilated convolut

摘要接受低剂量胸部CT筛查的重度吸烟者，受心血管疾病和肺癌的影响一样大。筛查中获得的低剂量胸部CT扫描能够量化动脉粥样硬化钙化，从而能够识别心血管风险增加的受试者。本文提出了一种利用两个连续卷积神经网络在低剂量胸部CT中自动检测冠状动脉、胸主动脉和心脏瓣膜钙化点的方法。第一个网络根据潜在钙化点的解剖位置来识别和标记潜在钙化点，第二个网络识别检测到的候选钙化点中的真实钙化点。这种方法是在国家肺部筛查试验的1744次CT扫描中训练和评估的。为了确定是否任何重建或仅用软组织过滤器重建的图像可用于钙化检测，我

2020-12-26 13:22:21 238

原创面试：找出出现次数超过1/2和1/3的数

剑指 Offer 39. 数组中出现次数超过一半的数字数组中有一个数字出现的次数超过数组长度的一半，请找出这个数字。同 LeetCode 169. 多数元素。要求：时间复杂度为O(n)，空间复杂度为O(1)输入: [1, 2, 3, 2, 2, 2, 5, 4, 2]输出: 2可以排除一些常规的简单做法，比如暴力（时间复杂度O(n^2)），排序（时间复杂度O(Nlogn)），计数（空间复杂度O(n)）。unordered_map计数法class Solution {public:

2020-11-13 15:48:43 441

原创面试：排序算法

各排序算法复杂度及稳定性：计数排序：原理：https://blog.csdn.net/alzzw/article/details/98245871特点：非比较排序，桶思想的一种适用场景：量大但是范围小，如：某大型企业数万员工的年龄排序范围（0–100）如何快速得知高考名次（腾讯面试题）范围（0–750）特点：计数排序只适用于元素值较为集中的情况，若集合中存在最大最小元素值相差甚远的情况，则计数排序开销较大、性能较差。通过额外空间的作用方式可知，额外空间存储元素信息是通过计算.

2020-11-13 11:16:19 206

原创 Pycharm 系统找不到指定的路径（相对路径）

使用相对路径时报错：xml_dir = "traffic_signs/traffic_signs/Annotations"FileNotFoundError: [WinError 3] 系统找不到指定的路径。: 'traffic_signs/traffic_signs/Annotations'原因：working direction设置错误。将D:\Python_Projects\traffic-sign-detection\svm_hog_classification改成项目路径即可，即去掉后

2020-11-01 09:55:55 6253 1

原创 C++ 面试：内联函数

内联函数在C++中，以inline修饰的函数叫做内联函数。1）内联函数是以空间换时间的做法，省去调用函数的额外开销。所以代码很长或者有循环/递归的函数不适宜使用内联。2）inline对编译器而言只是一个建议，如果定义的函数体内有递归/循环等，编译器优化时会自动忽略掉内联。3）Inline必须与函数定义放在一起，才能成为内联函数，仅将内联放在声明前是不起作用的。4）定义在类内的成员函数默认定义为内联函数，可以使用所在类的保护成员和私有成员5）一般情况下，内联函数只会用在函数内容非常简单的情况，如果

2020-10-20 11:19:50 666

原创 VS 配置环境 OpenCV / LibVLC

配置 LibVLC下载 LibVLC 开发包（SDK）将开发包放入工程内在工程名上右键->属性->C/C++ ->常规->附加包含目录（添加头文件目录）链接器->附加库目录（添加静态库目录/lib）链接器->输入（添加静态库文件.lib）或者：#pragma comment(lib, "libvlc.lib")#pragma comment(lib, "libvlccore.lib")添加动态库将 dll库和 plugins文件放在生成

2020-10-14 14:20:53 411 1

原创 Qt udp聊天demo

客户端mainwindow.h#ifndef MAINWINDOW_H#define MAINWINDOW_H#include <QMainWindow>#include <QUdpSocket>QT_BEGIN_NAMESPACEnamespace Ui { class MainWindow; }QT_END_NAMESPACEclass MainWindow : public QMainWindow{ Q_OBJECTpublic:

2020-10-13 09:55:46 269

原创 Qt tcp聊天demo

客户端mainwindow.h#ifndef MAINWINDOW_H#define MAINWINDOW_H#include <QMainWindow>#include <QTcpSocket>QT_BEGIN_NAMESPACEnamespace Ui { class MainWindow; }QT_END_NAMESPACEclass MainWindow : public QMainWindow{ Q_OBJECTpublic:

2020-10-12 18:49:47 177

原创 Qt QTimer的使用及示例

在QT5中，我们有一个专门的计时器类，QTimer，我们可以利用它完成一些关于定时的操作，实例如下：#include <QTimer>QTimer* timer = new QTimer();timer->start(value); //以毫秒为单位QObject::connect(timer,&QTimer::timeout,receiver,&slot); //时间结束，发送timeout信号void slot(){

2020-10-11 19:12:48 3647

原创 Qt 信号槽、事件及事件过滤器

信号与槽（Signal、Slot）信号信号就是在特定情况下被发射的事件，例如PushButton 最常见的信号就是鼠标单击时发射的 clicked() 信号，一个 ComboBox 最常见的信号是选择的列表项变化时发射的 CurrentIndexChanged() 信号。槽槽就是对信号响应的函数。槽就是一个函数，与一般的C++函数是一样的，可以定义在类的任何部分（public、private 或 protected），可以具有任何参数，也可以被直接调用。槽函数与一般的函数不同的是：槽函数可以与一个信

2020-10-10 16:36:37 2272

原创 LR为什么不可以用MSE作为损失函数

附录： Hessian矩阵性质参考：https://blog.csdn.net/Matrix_cc/article/details/105610513

2020-08-29 13:56:10 712

原创论文分享 Unsupervised Cross-Modality Domain Adaptation of ConvNets for Biomedical Image Segmentations wi

摘要：卷积网络(ConvNet)在各种具有挑战性的视觉任务中取得了巨大的成功。然而，当遇到域偏移时，ConvNet的性能会降低。领域自适应在生物医学图像分析领域具有更大的意义，同时在生物医学图像分析领域具有挑战性，其中跨模态数据具有很大的不同分布。鉴于注释医疗数据是特别昂贵的，有监督的迁移学习方法并不是很理想。本文提出了一种用于跨模态生物医学图像分割的具有对抗性学习的无监督域自适应框架。具体来说，我们的模型是基于一个扩展的完全卷积网络进行像素预测。此外，我们还构建了一个即插即用领域适应模块(D

2020-08-10 16:11:23 983

原创论文分享 Deep Distance Transform for Tubular Structure Segmentation in CT Scans

Deep Distance Transform for Tubular Structure Segmentation in CT Scans摘要医学图像中的管状结构分割，如CT扫描中的血管分割，是利用计算机辅助筛选早期相关疾病的重要步骤。但由于CT扫描中存在对比度差、噪声大、背景复杂等问题，使得管状结构的自动分割成为一个具有挑战性的问题。管状结构通常具有圆柱形，可通过其骨架和横截面半径（比例）很好地表示出来。受此启发，我们提出了一种几何感知的管状结构分割方法Deep Distance Transform

2020-05-31 21:08:41 3408 3

原创论文分享 Learning tree-structured representation for 3D coronary artery segmentation

Learning tree-structured representation for 3D coronary artery segmentation(2019.8)摘要冠状动脉的分割已经进行了广泛的研究，然而，由于其复杂的解剖结构，从三维冠状动脉ct血管造影（CCTA）中自动分割冠状动脉具有极大的挑战性。受近年来利用树状结构的长短期记忆（LSTM）来模拟具有树状结构的NLP任务的启发，我们提出了一种新的树状结构卷积门控递归单元（ConvGRU）模型来学习冠状动脉的解剖结构。然而，与针对自然语言处理

2020-05-16 16:54:16 1500 7

原创论文分享 CFUN: Combining Faster R-CNN and U-net Network for Efficient Whole Heart Segmentation

CFUN: Combining Faster R-CNN and U-net Network for Efficient Whole Heart Segmentation摘要本文提出了一种结合Faster R-CNN和U-net网络的心脏分割方法。由于R-CNN具有更快的精确定位能力和U-net强大的分割能力，CFUN只需要一步检测和分割推理就可以得到完整的心脏分割结果，在显著降低计算成本的情况下获得了良好的分割效果。此外，CFUN采用了一种新的基于边缘信息的损失函数3D-edge-loss作为辅助损失

2020-05-14 23:04:38 827

原创论文分享 DeepCenterline: A Multi-task Fully Convolutional Network for Centerline Extraction

DeepCenterline: a Multi-task Fully Convolutional Network for Centerline Extraction摘要提出了一种新的中心线提取框架，该框架将可端到端训练的多任务全卷积网络（FCN）与最小路径提取器相结合。FCN同时计算中心线距离映射并检测分支端点。该方法生成的中心线为单像素宽，没有伪分支。它处理任意树结构的对象，不需要事先假定树的深度或分支模式。它还对目标对象不同部分的大量尺度变化和对象分割掩码的微小缺陷具有鲁棒性。据我们所知，这是第一种

2020-05-09 11:49:55 1278 5

原创论文分享 3D RoI-aware U-Net for Accurate and Efficient Colorectal Tumor Segmentation

摘要从三维磁共振（MR）图像中分割结直肠癌区域是放射治疗的一个关键步骤，传统的放射治疗方法要求精确地描绘肿瘤边界，但要耗费大量的人力、时间和可重复性。虽然基于深度学习的方法在三维图像分割任务中提供了良好的基线，但小的适用切片尺寸限制了有效的感受域，降低了分割性能。此外，大体积三维图像的感兴趣区域（RoIs）定位作为一种先行操作，在速度、目标完整性、减少误报等方面带来了多重好处。与基于滑动窗口或非...

2020-04-30 00:34:06 1470 4

原创论文分享 ErrorNet: Learning error representations from limited data to improve vascular segmentation

ErrorNet: Learning error representations from limited data to improve vascular segmentation摘要深度卷积神经网络已被证明在各种模态的医学图像中分割病变和解剖结构是有效的。然而，在存在小样本和域偏移问题的情况下，这些模型往往会产生具有非直观分割错误的mask。本文提出了一个称为ErrorNet的分割框架，该...

2020-04-29 10:54:11 247

空空如也

空空如也