- 博客(91)
- 资源 (7)
- 收藏
- 关注
原创 ONNC Open Neural Network Compiler 开源神经网络编译器 一个 开源、模块化、可重用编译器算法和工具链的库,专门针对深度学习加速器(DLA)部署导入ONNX模型
ONNC是一个集合了开源、模块化、可重用编译器算法和工具链的库,专门针对深度学习加速器(DLA)。ONNC从底层开始构建,旨在将ONNX中间表示(IR)翻译成专有DLA代码。其软件架构设计强调可移植性和可重用性,从而简化了开发新后端的工作。上图展示了ONNC软件栈的顶层框图。软件栈从导入ONNX计算图模型到输出相应的硬件二进制文件,展示了各个功能块。
2024-03-12 19:52:05 1049 3
原创 程序员为何偏爱“永不休眠”的电脑? 程序员为什么不喜欢关电脑?
在深夜的办公室里,灯光昏暗,只有一台台电脑屏幕散发着微弱的光芒。你可能会想,这些程序员们难道不知道疲倦吗?为什么他们的电脑总是24小时不关机?今天,就让我们一探究竟,看看这些“电脑痴迷者”背后的故事!
2024-02-23 11:57:22 153
原创 程序员必看的电影:编程的魔法与现实 黑客帝国 社交网络 源代码
这部电影不仅让我们对编程和黑客技术有了更深入的了解,更让我们思考了虚拟世界与现实世界的边界在哪里。这部电影不仅揭示了互联网创业背后的艰辛与挑战,更让我们看到了编程与创新的力量。这些电影不仅展示了编程技术的魅力,更让我们看到了计算机科学背后的故事和挑战。在这部电影中,主角柯特·史蒂文斯通过特殊的编程技术,得以不断重复过去的8分钟,以此来阻止一场灾难的发生。这部电影不仅展示了编程技术的神奇,更让我们思考了时间、命运与选择的关系。在这个科技日新月异的时代,程序员们不仅是代码的编织者,更是数字世界的魔法师。
2024-02-23 11:27:54 220
转载 自动驾驶 Autopilot ADAS 感知识别定位 高精度地图 bev鸟瞰图 决策规划控制
自动驾驶系统主要包含三部分:环境感知、决策规划以及运动控制。感知层对车辆周边环境进行感知识别,用于获取环境信息;决策层充当人类驾驶员的角色,主要解决三个核心问题:“我在哪?我要去哪?我该如何去?”;控制层保证各项硬件系统稳定的运行在计算好的最佳设定值上;保证各项子系统的运行维持在最优的区间范围;规避可能性风险,精准调控至最佳路径。
2023-12-08 14:55:56 195
原创 LLVM IR 构建 分析 转换 优化 IRBuilder Pass AI编译器后端代码生成
LLVM IR 构建 分析 转换 优化LLVM汇编语言是一种 静态单赋值(SSA) 的中间表示,提供了类型安全检查,低层次的操作符,灵活和清晰表达‘几乎所有’高级语言的能力。同时,它也是LLVM编译算法中各个阶段的一种通用代码表达形式。...
2022-08-07 21:24:52 879
原创 python ast NodeTransformer Transformer代码转换 代码插桩 新增node节点 编译生成新函数 类内函数更新
python ast NodeTransformer 代码插桩 装饰器 代码修改 子函数更新# 代码转换passclass dump_trans(ast.NodeTransformer): def visit_Assign(self, node): ...
2022-05-18 11:04:00 714
原创 python一些进阶用法 高阶函数 reduce filter sort lambda 装饰器 枚举类 魔法函数 fram 运行帧跳转 AST 抽象语法树 源码遍历 numba jit加速 cache
高阶函数接收/返回 函数 的 函数reduce 归并 序列# 利用map和reduce编写一个str2float函数,把字符串'123.456'转换成浮点数123.456# -*- coding: utf-8 -*-from functools import reducedef str2float(s): DIGITS = {'0': 0, '1': 1, '2': 2, '3': 3, '4': 4, '5': 5, '6': 6, '7': 7, '8': 8, '9': 9}
2022-02-27 17:15:27 562
原创 AI System 人工智能系统 TVM深度学习编译器 DSL IR优化 计算图 编译 优化 内存内核调度优化 DAG 图优化 DFS TaiChi 函数注册机 Registry
DSL 领域专用语言 TVM深度学习编译器参考项目TaiChi 三维动画渲染物理仿真引擎DSLTVM 深度学习DSL 密集计算DSLLLVM 模块化编译器编译器相关资料参考DSL(Domain Specified Language)领域专用语言,它是用于解决特定领域问题的语言。所谓领域专用语言(domain specific language / DSL),其基本思想是“求专不求全”,不像通用目的语言那样目标范围涵盖一切软件问题,而是专门针对某一特定问题的计算机语言。与GPPL(通用目的
2021-05-05 15:18:01 1660 1
原创 编译器 LLVM Clang原理与实战 制作自己的编译器 source-to-source 源代码转换 编译遍 compile pass 代码插桩
编译器 LLVM Clang原理与实战参考1clang简介LLVM的命名最早来源于底层语言虚拟机(Low Level Virtual Machine)的缩写。它是一个用于建立编译器的基础框架,以C++编写。创建此工程的目的是对于任意的编程语言,利用该基础框架,构建一个包括编译时、链接时、执行时等的语言执行器。目前官方的LLVM只支持处理C/C++,Objective-C三种语言,当然也有一...
2020-03-15 11:38:08 8283 4
原创 linux shell脚本编程 自动化脚本 awk sed grep find 文本分析 LinuxShell命令行及脚本编程实例详解
linux shell脚本编程 自动化脚本 awk sed grep find 文本分析 LinuxShell命令行及脚本编程实例详解本文githubwindow 下 从零开始——PowerShell应用入门(全例子入门讲解) 各种逗比脚本参考参考代码1参考代码2Linux-Shell脚本编程书籍代码把平时有用的手动操作做成脚本,这样可以便捷的使用awk 与 sed 学习,包括了...
2019-09-25 23:28:52 1659
原创 GPU并行加速编程 opencl CUDA 核函数
GPU并行加速编程 opencl CUDA 核函数OpenCL(全称为Open Computing Langugae,开放运算语言)是第一个面向异构系统(此系统中可由CPU,GPU或其它类型的处理器架构组成)的并行编程的开放式标准。它是跨平台的。OpenCL由两部分组成,一是用于编写kernels(在OpenCL设备上运行的函数)的语言,二是用于定义并控制平台的API(函数)。OpenCL...
2019-07-07 15:58:01 4247 2
原创 ARM_NEON_CNN编程 SIMD单指令多数据流 intrinsics指令 内联汇编 CNN卷积网络优化 深度学习优化
ARM_NEON_CNN编程SIMD单指令多数据流 intrinsics指令 CNN卷积网络优化 深度学习优化本文github术语:System-on-Chip(SOC) 片上系统:核心、内存控制器、片上内存、外围设备、总线互连和其他逻辑(可能包括模拟或射频组件),以便产生系统。 SOC通常指集成度较高的设备,包括单个设备中系统的许多部分,可能包括模拟、混合信号或射频电路。专用集成电...
2019-04-30 11:55:22 6148
原创 数据结构和算法:Big-Data-Structure 大话数据结构 算法复杂度 线性表 非线性表 查找 排序
Big-Data-Structure 大话数据结构本文github我们学习数据结构和算法,并不是为了死记硬背几个知识点。我们的目的是建立时间复杂度、空间复杂度意识,写出高质量的代码,能够设计基础架构,提升编程技能,训练逻辑思维,积攒人生经验,以此获得工作回报,实现你的价值,完善你的人生。所以,不管你是业务开发工程师,还是基础架构工程师;不管你是初入职场的初级工程师,还是工作多年的资深架构师,...
2019-02-21 21:49:24 1677
原创 cpp程序优化 嵌入式C/C++代码优化 C/C++代码优化具体方案
cpp程序优化C++编程优化——让你的代码飞起来 RGB格式的彩色图像先转换成黑白图像C/C++代码优化具体方案 c++ 性能优化策略1.关于继承:尽量少使用多重继承 不可否认良好的抽象设计可以让程序更清晰,代码更看起来更好,但是她也是有损失的,在继承体系中子类的创建会调用父类的构造函数, 销毁时会调用父类的析构函数,这种消耗会随着继承的深度直线上升,所以不要过度的抽象和继...
2019-02-10 13:16:12 1482
原创 C++数据结构和算法2 栈 双端/队列 冒泡选择插入归并快排 二三分查找 二叉树 二叉搜索树 贪婪 分治 动态规划
C++数据结构和算法2 栈 双端/队列 冒泡选择插入归并快排 二三分查找 二叉树 二叉搜索树 贪婪 分治 动态规划github章3 Stack栈 和 队列Queue===========================3.1 Stack栈 叠起来的 碗,放在一摞的书…都是栈的实例…一种 插入 和 删除 操作只能在一端( 栈顶Top() )进行的 容器是一种 后进先出(Last In F...
2019-01-24 18:45:15 826
原创 C++数据结构和算法1 c++基础 枚举 结构体 抽象数据结构-类 模板函数、模板类 数组 列表 单向链表 双向链表
C++数据结构和算法1 c++基础 枚举 结构体 抽象数据结构-类 模板函数、模板类 数组 列表 单向链表 双向链表github程序分析章1 基础知识======================================1.1 C++基础控制程序走向if else结构 int i =200; if(i > 100) cout <&l...
2019-01-16 19:13:37 558
原创 python数据结构和算法 时间复杂度分析 乱序单词检测 线性数据结构 栈stack 字符匹配 表达式求值 queue队列 链表 递归 动态规划 排序和搜索 树 图
python数据结构和算法1参考本文github 计算机科学是解决问题的研究。 计算机科学使用抽象作为表示过程和数据的工具。 抽象的数据类型允许程序员通过隐藏数据的细节来管理问题领域的复杂性。 Python是一种强大但易于使用的面向对象语言。 列表、元组和字符串都是用Python有序集合构建的。 字典和集合是无序的数据集合。 类允许程序员实现抽象的数据类型。 程...
2019-01-02 14:42:10 1229
原创 GPU CUDA编程2 opencv GPU 图像叠加 空间转换 阈值处理 直方图均衡化 变形 仿射变换 滤波器 腐蚀膨胀 边缘 特征 匹配 人脸检测 背景去除
opencv图像读取、显示、视频播放等 opencvGPU接口图像add、sub、颜色空间转换、阈值操作等1 opencv 图像读取#include <opencv2/opencv.hpp>#include <iostream>using namespace cv;using namespace std;int main(int argc, char** ar...
2018-12-28 19:39:18 2460 1
原创 GPU CUDA编程1 存储器类型 数据交换 设备 共享数据 原子操作atomic 常量 纹理存储器 向量加法 点乘 矩阵乘法 事件计时 stream异步 排序 直方图
CUDA编程参考参考2参考3The CMake version of cuda_by_example CUDA Program:CUDA image rgb to gray;CUDA KLTCUDA 编程 加速 计算机视觉 !!!推荐CUDA存储器类型:每个线程拥有自己的 register寄存器 and loacal memory 局部内存每个线程块拥有一块 shared mem...
2018-12-27 22:23:31 720
原创 SIGIA_4P python学习 列表 字典 集合 面对对象编程 闭包 装饰器 函数式编程 作用域 异常处理
SIGIA_4P python学习 列表 字典 集合 面对对象编程 闭包 装饰器 函数式编程 作用域 异常处理本文连接简介SIGIA_4P 网址a. 课程OKR Objectives and Key Results 即目标与关键成果法 目标,Objectives : 掌握AI领域的Python开发 成果1 KR1linux 目录结构为什么学习python...
2018-12-26 12:03:46 1171
原创 ROS 教程5 基础综合应用C++ 发布订阅 话题 服务 action 动态参数配置 坐标变换 日志 发布图像/点云/marker/雷达扫描/里程计
Learn ROS本文github中国大学MOOC《机器人操作系统入门》课程代码示例ROS 1 和 ROS 2 的前世、今生、安装使用说明与资料汇总ROS(1和2)机器人操作系统相关书籍、资料和学习路径move_base的全局路径规划代码研究1move_base的全局路径规划代码研究2move_base代码学习一octomap中3d-rrt路径规划ROS多个master消息互通...
2018-12-25 17:15:55 2210
原创 ROS 教程4 机器人视觉识别控制 OpenCV OpenNI2 PCL 2D 3D目标检测 目标跟踪object tracking人体跟踪person followin
机器人视觉一、准备工作1、开源库: OpenCV, 二维图像处理和机器学习 OpenNI2 +OpenKinect(freenect), 深度传感器(MicrosoftKinect and Asus Xtion Pro)驱动和处理库 PCL. 点云库 处...
2018-12-08 14:41:40 7791 2
原创 ROS 教程3 机器人语音 语音识别理解合成控制 ASR NLU TTS
一、语音处理总体框架 1. 语音识别(ASR , Automatic Speech Recognition ) 2. 语义理解(NLU , Natural Language Understanding) e. 语音合成(TTS , Text To Speech)1. 语音识别 **ASR**:支持的包: 国外:CMU SPhinx ——> pocket...
2018-12-08 14:18:57 6239 1
原创 ROS 教程2 机器人雷达建图 蒙特卡洛定位 导航 路径规划 仿真
ros 机器人雷达建图 蒙特卡洛定位 导航 路径规划 仿真 move_base gmapping acml博文github一、安装 turtlebot 移动机器人底座 进行导航1、安装系统依赖sudo apt-get install ros-indigo-turtlebot-bringup \ros-indigo-turtlebot-create-desktop ros-indigo...
2018-12-07 17:18:52 10366 1
原创 ROS 教程1 机器人操作系统 基础知识 节点 话题 消息 服务 行动 参数 日志 TF变换 目标结构 启动文件
ROS机器人操作系统 基础知识 节点 话题 消息 服务 行动 参数 日志 TF变换 目标结构 启动文件1. 安装官方安装指北博文githuba 添加 sources.list sudo sh -c 'echo "deb http://packages.ros.org/ros/ubuntu $(lsb_release -sc) main" > /et
2018-12-06 14:00:12 3249
原创 双目立体匹配 等 算法 论文 综述 全局局部算法 CSCA NLCA SegmentTree树 DoubleBP Belief-Propagation AD-Census SGM
双目立体匹配 等 算法 论文 综述本文GITHUB双目立体视觉技术实质就是模拟人的双眼视觉处理系统来处理通过摄像机采集所获取的图像,它利用两台或多台摄像机在一定约束条件下采集同一场景的图像,对采集到的图像进行信息提取和整合,最终恢复图像中场景的三维信息。 基于双目视觉的立体匹配算法研究涉及模式识别、人工智能、机器视觉、计算机图形学等领域的许多相关复杂的研究课题。随着许多著名专家学者对...
2018-11-02 22:19:42 12483 7
原创 ncnn 框架分析 openmp多核加速 缓存 仿存 cache 快速矩阵乘法 单指令多数据指令SIMD
ncnn 框架分析本文github链接在ncnn中建立新层参考1参考21. param 和 bin 文件分析param 7767517 # 文件头 魔数 75 83 # 层数量 输入输出blob数量 # 下面有75行 Input data 0 1 data 0=227 1=227 2=3 ...
2018-09-25 21:14:00 5070
原创 神经网络高性能计算 卷积计算优化 openblas GEMM 矩阵乘法优化 ncnn mobileNet-ssd shueezeNet-ssd
HighPerformanceComputing 高性能计算(High performance computing, 缩写HPC) 指通常使用很多处理器(作为单个机器的一部分) 或者某一集群中组织的几台计算机(作为单个计 算资源操作)的计算系统和环境。 有许多类型的HPC 系统,其范围从标准计算机的大型集群,到高度专用的硬件。 大多数基于集群的HPC系统使用高性能网络互连,...
2018-08-25 12:51:09 5259
原创 操作系统 ucore-lab2 系统内存的探测 pmm 物理内存管理 页表 虚拟内存 物理内存 段页式内存管理机制
lab2 系统内存的探测参考博客主要涉及操作系统的物理内存管理。操作系统为了使用内存,还需高效地管理内存资源。这里我们会了解并且自己动手完成一个简单的物理内存管理系统。实验目的理解基于段页式内存地址的转换机制理解页表的建立和使用方法理解物理内存的管理方法实验内容1. 首先了解如何发现系统中的物理内存;2. 然后了解如何建立对物理内存的初步管理,即了解连...
2018-08-19 18:05:44 3505
原创 操作系统-ucore-lab1 Bootloader启动操作系统 A20 GDT全局描述符 使能和进入保护模式 ELF格式os 8259A中断控制器 8253定时器 函数调用堆栈跟踪函数
操作系统-ucore-lab1本文详细地址实验一:系统软件启动过程参考重要文件调用顺序 1. boot/bootasm.S | bootasm.asm(修改了名字,以便于彩色显示) a. 开启A20 16位地址线 实现 20位地址访问 芯片版本兼容 通过写 键盘控制器8042 的 64h端口 与 60h端口。 b...
2018-08-17 21:19:55 2545
原创 神经网络量化之 Ristretto、增量量化INQ、IAO代码实战分析
神经网络量化之 Ristretto、增量量化INQ、IAO代码实战分析1. Ristretto 固定点浮点数量化详细介绍量化逼近方案Ristretto允许以三种不同的量化策略来逼近卷积神经网络: 1、动态固定点:修改的定点格式, DYNAMIC_FIXED_POINT。 2、迷你浮点型:缩短位宽的浮点数,MINIFLOAT。 3、两个幂参数...
2018-08-15 23:34:23 8369 5
原创 视觉惯性里程计 综述 VIO Visual Inertial Odometry msckf ROVIO ssf msf okvis ORB-VINS VINS-Mono gtsam
视觉惯性里程计 VIO - Visual Inertial Odometry 视觉−惯性导航融合SLAM方案视觉惯性SLAM专栏VINS技术路线与代码详解VINS理论与代码详解0——理论基础白话篇vio_data_simulation VIO数据测试仿真视觉惯性单目SLAM知识 IO和之前的几种SLAM最大的不同在于两点: 首先,VIO在硬件上需要传感器的融...
2018-07-24 20:50:09 38533 16
原创 深度学习库 caffe使用 源码分析 依赖库分析 caffe glog gflags openBlas prototxt yolo_darknet 转 caffe
深度学习库 caffe使用 源码分析 依赖库分析 caffe glog gflags openBlas本文github链接yolo_darknet 转 caffecaffe 安装Caffe代码解析caffe网络模型结构在线可视化CAFFE使用 源码分析等caffe 模型配置文件 prototxt 详解caffe.proto 系统变量层类型参数配置文件 caffe...
2018-07-17 01:08:16 1349
原创 深度学习结合SLAM 研究现状总结 Co-Fusion MaskFusion
深度学习结合SLAM 研究现状总结本文github链接1. 用深度学习方法替换传统slam中的一个/几个模块: 特征提取,特征匹配,提高特征点稳定性,提取点线面等不同层级的特征点。 深度估计 位姿估计 重定位 其他 目前还不能达到超越传统方法的效果, 相...
2018-07-15 10:50:49 13904 7
原创 PTAM特征点法跟踪和建图 SLAM FAST Patch
Parallel Tracking And Mapping (PTAM) 特征点法本文github项目主页github 代码 makefile工程改成了cmake工程 PTAM[1]是视觉SLAM领域里程碑式的项目。 在此之前,MonoSLAM[2]为代表的基于卡尔曼滤波的算法架构是主流, 它用单个线程逐帧更新相机位置姿态和地图。 2007年,Klein等人提...
2018-07-07 23:57:55 7886 1
原创 神经网络压缩 剪枝 量化 嵌入式计算优化NCNN mobilenet squeezenet shufflenet
性能提升方法本文github链接1. 小模型 mobilenet , 更精细模型的设计,紧致网络设计 mobilenet squeezenet shufflenet MobileNet逐通道卷积 + 普通点卷积 SqueezeNet 1∗1 和3∗3 卷积较少通道数量 ShuffleNet 分组点卷积+通道重排+逐通道卷积2. 模型压缩:参数稀疏、剪裁、量化、分解...
2018-07-06 21:32:45 15358 3
原创 ORB-SLAM2 特征点法SLAM 单目 双目 rgbd相机SLAM 单应/本质矩阵恢复运动 小图大图地图优化
ORB-SLAM2 ORB特征点法SLAM 支持单目、双目、rgbd相机安装测试本文github链接orbslam2 + imuORB-SLAM是一个基于特征点的实时单目SLAM系统,在大规模的、小规模的、室内室外的环境都可以运行。该系统对剧烈运动也很鲁棒,支持宽基线的闭环检测和重定位,包括全自动初始化。该系统包含了所有SLAM系统共有的模块: 跟踪(Tracking)...
2018-07-01 00:43:07 10894 4
原创 视频行为识别检测综述 IDT TSN CNN-LSTM C3D CDC R-C3D
本文github地址Video Analysis之Action Recognition(行为识别)行为识别就是对时域预先分割好的序列判定其所属行为动作的类型,即“读懂行为”。 [行为检测|论文解读]行为检测调研综述 较新基于Deep Learning 的视频识别技术科研成果—-中国科学院深圳先进技术研究院 面向人体姿态行为理解的深度学习方法 CVPR 2014 Tut...
2018-06-20 21:23:38 139861 43
原创 LSD_SLAM 单目直接法 半稠密slam 加权LM优化 深度值高斯-高斯分布卡尔曼滤波
LSD_SLAM 单目直接法 半稠密 slam系统lsd是一个 大规模的 单目直接法 视觉半稠密 slam系统本文github连接LSD_slam & 激光雷达slamlad源码解析 参考解析LSD-SLAM笔记 优秀lad算法分析 代码分析 安装 非ros改造算法数学基础tracking optimizationThreadLoop线程 分析等lsd...
2018-06-17 21:52:10 4741
tvm节点属性更新方案
2024-02-23
onnx计算图优化 计算图匹配 计算图融合 layerNorm融合 groupNorm融合
2024-02-23
python tensorflow 深度学习 学习示例程序
2018-05-22
python 机器学习
2018-05-22
libconfig 配置文件使用示例程序
2018-05-22
ros 工业机器人培训 程序
2018-05-22
点云pcl库学习 官方demo示例教程 原理解析代码注释
2018-05-08
opencv 3.1 官方demo示例教程 原理加注释
2018-05-08
ORB_SLAM2代码注释原理解析
2018-05-08
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人