自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(49)
  • 收藏
  • 关注

转载 【转】Verilog代码优化之case语句

【转自】https://blog.csdn.net/hanghang121/article/details/23449467/Verilog代码优化之case语句       题记:那天做完13路脉冲计数并写入dual RAM模块的设计后组长看了我的资源占用,吃惊的说怎么占用资源这么少啊,以为我偷工减料了。呵呵,其实这个也是一直困扰初学者的一个课题,可综合的verilog是一个,最优化的代...

2019-01-10 16:47:54 1053

转载 【1】verilog十大基本功——阻塞赋值与非阻塞赋值

 原帖见: dancia《高手也搞不清楚的十项基本功》http://www.socvista.com/bbs/search.php?searchid=11&orderby=lastpost&ascdesc=desc&searchsubmit=yes   前言:阻塞与非阻塞赋值是 Verilog 语言中最基本的部分,也是让大部分 Verilog 新手最困惑的地方...

2018-11-06 15:39:19 460

原创 【1】verilog十大基本功——阻塞赋值与非阻塞赋值

原帖见:dancia《高手也搞不清楚的十项基本功》http://www.socvista.com/bbs/search.php?searchid=11&orderby=lastpost&ascdesc=desc&searchsubmit=yes  前言:阻塞与非阻塞赋值是Verilog 语言中最基本的部分,也是让大部分Verilog 新手最...

2018-11-06 15:06:49 3068

原创 【1】verilog十大基本功——阻塞赋值与非阻塞赋值_一只神秘的大金毛_新浪博客...

原帖见:dancia《高手也搞不清楚的十项基本功》http://www.socvista.com/bbs/search.php?searchid=11&orderby=lastpost&ascdesc=desc&searchsubmit=yes前言:阻塞与非阻塞赋值是Verilog 语言中最基本的部分,也是让大部分Verilog 新手最困惑的地方。关...

2018-11-06 15:06:49 196

转载 Latex图片表格混排

我的文章中要求一幅图片和一个表格并列排在同一行上,并且表格和图形都带有标题,在各自的正下方。模版将图形和表格都是居中的。我试着用了minipage环境{figure环境+tabular环境},但是\caption{}只能在table下应用,总之图形和表格都好处理,就是他们各自的标题总搞不定!不知哪位高手遇到过这种情况,教我一下!万分感谢【解决方案】minipage 環境,裏...

2018-10-21 13:12:57 3772

原创 Latex图片表格混排_一只神秘的大金毛_新浪博客

我的文章中要求一幅图片和一个表格并列排在同一行上,并且表格和图形都带有标题,在各自的正下方。模版将图形和表格都是居中的。我试着用了minipage环境{figure环境+tabular环境},但是\caption{}只能在table下应用,总之图形和表格都好处理,就是他们各自的标题总搞不定!不知哪位高手遇到过这种情况,教我一下!万分感谢【解决方案】minipage...

2018-10-21 13:12:57 451

原创 【转】BloomFilter布隆滤波器

转自https://blog.csdn.net/zq602316498/article/details/40660235在日常生活中,包括在设计计算机软件时,我们经常要判断一个元素是否在一个集合中。   比如在字处理软件中,需要检查一个英语单词是否拼写正确(也就是要判断 它是否在已知的字典中);在FBI,一个嫌疑人的名字是否已经在嫌疑名单上;在网络爬虫里,一个网址是...

2018-09-23 20:24:58 274

原创 【转】BloomFilter布隆滤波器_一只神秘的大金毛_新浪博客

转自https://blog.csdn.net/zq602316498/article/details/40660235在日常生活中,包括在设计计算机软件时,我们经常要判断一个元素是否在一个集合中。 比如在字处理软件中,需要检查一个英语单词是否拼写正确(也就是要判断 它是否在已知的字典中);在FBI,一个嫌疑人的名字是否已经在嫌疑名单上;在网络爬虫里,一个网址是否被访问过等等。...

2018-09-23 20:24:58 168

转载 【转】Bloom Filter 布隆滤波器

转自https://blog.csdn.net/zq602316498/article/details/40660235在日常生活中,包括在设计计算机软件时,我们经常要判断一个元素是否在一个集合中。    比如在字处理软件中,需要检查一个英语单词是否拼写正确(也就是要判断 它是否在已知的字典中);在 FBI,一个嫌疑人的名字是否已经在嫌疑名单上;在网络爬虫里,一个网址是否被访问过等等。最直...

2018-09-23 20:24:32 325

原创 Verilog语法笔记_基本概念

语法经常记混淆,忘掉细节,记录一下一些易错和遗忘的地方。 一、模块相当于函数 —— module//语法格式 module <模块名> (<模块端口列表>);。。。<模块内容、功能>;。。。endmodule //ripple_carry_counter(脉动进位计数器)的例子module ripple_car...

2018-08-04 15:38:57 450

原创 Verilog语法笔记_基本概念_一只神秘的大金毛_新浪博客

语法经常记混淆,忘掉细节,记录一下一些易错和遗忘的地方。一、模块相当于函数 —— module//语法格式module <模块名> (<模块端口列表>);。。。<模块内容、功能>;。。。endmodule//ripple_carry_counter(脉动进位计数器)的例子module ripple_carry_counter (...

2018-08-04 15:38:57 91

原创 【ISCA17】SCNN:AnAcceleratorforCompressed-sparseConvolutionalNeuralNetworks

主要设计了一个可以高效处理稀疏化CNN的高效硬件架构,主要思想就是跳过weight和activation中有0的乘法的情况。以达到加速(cycle)和降低功耗的效果。 以下按照原文结构,大致概括一下文章的脉络。 ABSTRACT本文设计了一个Sparse CNN (SNN)的加速器硬件架构,通过设计一种压缩的数据流模式,同时探索了weight和activation在硬件中的稀疏...

2018-08-02 16:03:47 1673 1

原创 【ISCA17】SCNN:AnAcceleratorforCompressed-sparseConvolutionalNeuralNetworks_一只神秘的大金毛_新浪博客...

主要设计了一个可以高效处理稀疏化CNN的高效硬件架构,主要思想就是跳过weight和activation中有0的乘法的情况。以达到加速(cycle)和降低功耗的效果。以下按照原文结构,大致概括一下文章的脉络。ABSTRACT本文设计了一个SparseCNN (SNN)的加速器硬件架构,通过设计一种压缩的数据流模式,同时探索了weight和activation在硬件中的稀...

2018-08-02 16:03:47 640 1

原创 【ICLR2018】《SparsityWinogradCNN》

一、Introduction1、想要结合两种方法:Winograd 和 pruning。2、CNN的乘法数量:AlexNet 1.1x10^9;-&gt; 1.6x10^10。3、文章的两个思路:把ReLU操作移到Winograd变换的后面;在变换之后进行pruning。二、Related Work卷积的线性性质:Cong &amp; Xiao (2014...

2018-08-02 15:54:18 217

原创 【FPGA17】EvaluatingFastAlgorithmsforConvolutionalNeuralNetworksonFPGAs

算法如图,比较直观。 一、硬件架构设计需要解决如下问题:memorybandwidth。存储读取数据功耗和速度称为瓶颈,速度与conv硬件处理部分不匹配。所以文中很老套的方法,通过line buffer来复用每个tile交叠的部分(垂直和水平都有交叠的部分)。 1、整体架构所有数据(input feature map, filter)都存在外部存储上。有多...

2018-08-02 15:37:52 965

原创 【FPGA17】EvaluatingFastAlgorithmsforConvolutionalNeuralNetworksonFPGAs_一只神秘的大金毛_新浪博客...

算法如图,比较直观。一、硬件架构设计需要解决如下问题:memorybandwidth。存储读取数据功耗和速度称为瓶颈,速度与conv硬件处理部分不匹配。所以文中很老套的方法,通过line buffer来复用每个tile交叠的部分(垂直和水平都有交叠的部分)。1、整体架构所有数据(input feature map, filter)都存在外部存储上。有多通道(M)的in...

2018-08-02 15:37:52 300

原创 【韩松】Deep Gradient Comression

《Deep Gradient Compression》作者韩松,清华电子系本科,StanfordPhD,深鉴科技联合创始人。主要的研究方向是,神经网络模型压缩以及硬件架构加速。 论文链接:https://arxiv.org/pdf/1712.01887.pdf本篇文章发表在 ICLR 2018,韩松之前有一系列模型压缩的研究,比如其博士毕业论文《EFFICIENT...

2017-12-25 13:51:54 1766

原创 【韩松】Deep Gradient Comression_一只神秘的大金毛_新浪博客

《Deep Gradient Compression》作者韩松,清华电子系本科,StanfordPhD,深鉴科技联合创始人。主要的研究方向是,神经网络模型压缩以及硬件架构加速。论文链接:https://arxiv.org/pdf/1712.01887.pdf本篇文章发表在 ICLR 2018,韩松之前有一系列模型压缩的研究,比如其博士毕业论文《EFFICIENT METHODS...

2017-12-25 13:51:54 376

原创 【CS231n】十五、深度学习的高效算法和硬件设计

一、大纲emmm,硬件及算法加速部分是博主实验室的主要研究领域,总算可以多说点体会而不是疯狂翻译和贴图了。主讲人是韩松,清华电子系本科,Stanford Phd,深鉴科技创始人之一,主要工作在深度学习的算法和硬件。内容主要分为四个部分(2x2):算法优化(训练、推理),硬件优化(训练、推理)。也是科研的四个大方向。二、第一部分:Algorithms ...

2017-12-11 11:25:57 515

原创 【CS231n】十五、深度学习的高效算法和硬件设计_一只神秘的大金毛_新浪博客...

一、大纲emmm,硬件及算法加速部分是博主实验室的主要研究领域,总算可以多说点体会而不是疯狂翻译和贴图了。主讲人是韩松,清华电子系本科,Stanford Phd,深鉴科技创始人之一,主要工作在深度学习的算法和硬件。内容主要分为四个部分(2x2):算法优化(训练、推理),硬件优化(训练、推理)。也是科研的四个大方向。二、第一部分:Algorithms for Effi...

2017-12-11 11:25:57 116

原创 【何凯明】非局部连接网络 Non-local Neural Network

《Non-local Neural Network》一、主要贡献1.提出了一种非局部连接(Non-localoperations)的计算块 (buildingblock),用于处理视频和图像的长程依赖关系(long-rangedependency);2.在视频数据集Kinetics andCharadesdatasets,目前最优(对比2D或3D卷积网...

2017-12-07 14:40:02 1611

原创 【何凯明】非局部连接网络 Non-local Neural Network_一只神秘的大金毛_新浪博客...

《Non-local Neural Network》一、主要贡献1.提出了一种非局部连接(Non-localoperations)的计算块 (buildingblock),用于处理视频和图像的长程依赖关系(long-rangedependency);2.在视频数据集Kinetics andCharadesdatasets,目前最优(对比2D或3D卷积网络);3.图像...

2017-12-07 14:40:02 228

原创 【百度、NVIDIA】混合精度训练 Mixed Precision Training

《Mixed Precision Training》思路如图1,简单说,权值用32位保存,然后训练过程中截断为16位,而后weight和activation都用FP16来计算,最后更新还是使用FP32的权值。两种方法来控制半精度的信息损失。一、保存一个单精度浮点的权值备份。在训练过程中舍入到半精度。(加速训练?减少硬件开销?但是没有减少存储的参数量)二、适当...

2017-12-07 14:38:05 1081

原创 【百度、NVIDIA】混合精度训练 Mixed Precision Training_一只神秘的大金毛_新浪博客...

《Mixed Precision Training》思路如图1,简单说,权值用32位保存,然后训练过程中截断为16位,而后weight和activation都用FP16来计算,最后更新还是使用FP32的权值。两种方法来控制半精度的信息损失。一、保存一个单精度浮点的权值备份。在训练过程中舍入到半精度。(加速训练?减少硬件开销?但是没有减少存储的参数量)二、适当地缩放损失结果...

2017-12-07 14:38:05 142

原创 【CS231n】十四、深度强化学习

一、概览1、什么是强化学习?2、马尔科夫决策过程。3、Q-学习。4、策略梯度(Policy Gradients)二、强化学习1、概念:强化学习,假设有一个代理人(Agent,CS中的一个概念,下简写为Agn)和其相应的环境(Environment,下简写为Env)。若Env给Agn一个状态(statest),则Agn给Env一个反馈动作(Action...

2017-11-24 16:15:51 394

原创 【CS231n】十四、深度强化学习_一只神秘的大金毛_新浪博客

一、概览1、什么是强化学习?2、马尔科夫决策过程。3、Q-学习。4、策略梯度(Policy Gradients)二、强化学习1、概念:强化学习,假设有一个代理人(Agent,CS中的一个概念,下简写为Agn)和其相应的环境(Environment,下简写为Env)。若Env给Agn一个状态(statest),则Agn给Env一个反馈动作(Actionat)。而后En...

2017-11-24 16:15:51 68

原创 【图文教程】搭建私人Git仓库

服务器git使用说明(服务器M40:192.168.124.12) 1.     找到本地客户端(自己的电脑)的ssh公钥。a)     Linux系统在根目录(~)下,使用命令ls–a既可以看到隐藏文件夹.ssh。 b)     .ssh文件夹里面的.pub后缀的文件即本地客户端的公钥。 c)     复制公钥的内容: d...

2017-11-20 21:24:40 627

原创 【图文教程】搭建私人Git仓库_一只神秘的大金毛_新浪博客

服务器git使用说明(服务器M40:192.168.124.12)1.找到本地客户端(自己的电脑)的ssh公钥。a)Linux系统在根目录(~)下,使用命令ls–a既可以看到隐藏文件夹.ssh。b).ssh文件夹里面的.pub后缀的文件即本地客户端的公钥。c)复制公钥的内容:d)假...

2017-11-20 21:24:40 52

原创 【CS231n】十三、生成模型(Generative Models)

一、概览二、生成模型定义:无监督学习的一个核心问题,给定具有特定密度分布的数据,想要生成同样密度分布的数据。分类:三、PixelRNN 和 PixelCNN(1)首先定义一个likelihood函数,(2)PixelRNN的方法:从角落的一个像素开始向周围的像素推理,每一个像素的likelihood由周围的决定。问题在于是串行生成,速度很慢。...

2017-11-16 14:28:29 696

原创 【CS231n】十三、生成模型(Generative Models)_一只神秘的大金毛_新浪博客

一、概览二、生成模型定义:无监督学习的一个核心问题,给定具有特定密度分布的数据,想要生成同样密度分布的数据。分类:三、PixelRNN 和 PixelCNN(1)首先定义一个likelihood函数,(2)PixelRNN的方法:从角落的一个像素开始向周围的像素推理,每一个像素的likelihood由周围的决定。问题在于是串行生成,速度很慢。(3)Pix...

2017-11-16 14:28:29 199

原创 【CS231n】十一、计算机视觉的一些问题:分割、定位、检测

1、语义分割(Semantic Segmentation)给图像的每一个像素(pixel)分入一个类别,每个类别有相应的语义或者标签。分类但不区分实例(instances),比如两只重叠的猫,所有的像素都归为 cat 一类。使用CNN来完成,结构有一些变化,如下:这里需要讨论一下的不同于CNN的操作:(1)上采样 upsampling——Unpooling ...

2017-09-25 16:26:34 220 1

原创 【CS231n】十一、计算机视觉的一些问题:分割、定位、检测_一只神秘的大金毛_新浪博客...

1、语义分割(Semantic Segmentation)给图像的每一个像素(pixel)分入一个类别,每个类别有相应的语义或者标签。分类但不区分实例(instances),比如两只重叠的猫,所有的像素都归为 cat 一类。使用CNN来完成,结构有一些变化,如下:这里需要讨论一下的不同于CNN的操作:(1)上采样 upsampling——Unpooling 反池化这样做...

2017-09-25 16:26:34 81

原创 【CS231n】十、RNN框架学习笔记

1、基本介绍(1)想法:之前的网络都是前馈(数据流向一个方向)的类型,现在想要让网络的有更多的自由度。而网络的搭建,可以有各种各样复杂的方式:比如输出为可变多维向量,输入为多维可变向量(例文本text、video),多入多出(MachineTranslation),多维输入对应多维输出(video classification on frame level)...

2017-09-18 10:21:18 433

原创 【CS231n】十、RNN框架学习笔记_一只神秘的大金毛_新浪博客

1、基本介绍(1)想法:之前的网络都是前馈(数据流向一个方向)的类型,现在想要让网络的有更多的自由度。而网络的搭建,可以有各种各样复杂的方式:比如输出为可变多维向量,输入为多维可变向量(例文本text、video),多入多出(MachineTranslation),多维输入对应多维输出(video classification on frame level)(2)数学抽象...

2017-09-18 10:21:18 57

原创 【CS231n】九、CNN架构学习笔记

1、需要学习的一些结构2、奠基性的结构——LeNet-5LeCun在90年代,用于手写数字分类。其数据集MNIST,是深度学习常用的入门训练数据。MNIST数据集的官网是Yann LeCun's website。3、AlexNet(1)背景介绍2012年ImageNet冠军,Hinton的学生,这个事件影响巨大。(2)基本框架基本框架和Le...

2017-09-14 15:51:04 308 1

原创 【CS231n】九、CNN架构学习笔记_一只神秘的大金毛_新浪博客

1、需要学习的一些结构2、奠基性的结构——LeNet-5LeCun在90年代,用于手写数字分类。其数据集MNIST,是深度学习常用的入门训练数据。MNIST数据集的官网是Yann LeCun's website。3、AlexNet(1)背景介绍2012年ImageNet冠军,Hinton的学生,这个事件影响巨大。(2)基本框架基本框架和LeNet-5没有本...

2017-09-14 15:51:04 120

原创 【官方文档】一、MNIST机器学习入门

第一篇做过纸质版笔记,所以这边就直接搬运了教材:http://wiki.jikexueyuan.com/project/tensorflow-zh/tutorials/mnist_beginners.html1、什么是MNIST?就好比编程入门有HelloWorld,机器学习入门有MNIST。MNIST是一个入门级的计算机视觉数据集,它包含各种手写数字图片:...

2017-09-08 16:43:24 133

原创 【官方文档】一、MNIST机器学习入门_一只神秘的大金毛_新浪博客

第一篇做过纸质版笔记,所以这边就直接搬运了教材:http://wiki.jikexueyuan.com/project/tensorflow-zh/tutorials/mnist_beginners.html1、什么是MNIST?就好比编程入门有HelloWorld,机器学习入门有MNIST。MNIST是一个入门级的计算机视觉数据集,它包含各种手写数字图片:它也包含每...

2017-09-08 16:43:24 112

原创 【CS231n】八、深度学习软硬件介绍

课程内容提炼:CPU 和 GPU 硬件知识深度学习框架:Caffe / Caffe2Theano / TensorFlowTorch / PyTorch1、CPU &amp; GPU总结来说就是,(众所周知)GPU适合做深度学习。GPU,主要用NVIDIA。GPU深度学习库,NVIDIA独占  CUDA(cuDNN)。OpenCL,支持多种硬件,AMD...

2017-09-08 10:11:56 318

原创 【CS231n】八、深度学习软硬件介绍_一只神秘的大金毛_新浪博客

课程内容提炼:CPU 和 GPU 硬件知识深度学习框架:Caffe / Caffe2Theano / TensorFlowTorch / PyTorch1、CPU & GPU总结来说就是,(众所周知)GPU适合做深度学习。GPU,主要用NVIDIA。GPU深度学习库,NVIDIA独占 CUDA(cuDNN)。OpenCL,支持多种硬件,AMD给出了OpenC...

2017-09-08 10:11:56 66

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除