- 博客(169)
- 资源 (6)
- 收藏
- 关注
原创 论文解析——Manticore: A 4096-core RISCV Chiplet Architecture for Ultra-efficient Floating-point Computing
Manticore:一个用于超高效浮点计算的4096个riscv核的chiplet架构
2024-04-01 15:47:36 874
原创 Nvidia GPU系列产品分析
Nvidia的GPU发展了30多年,已经逐渐形成了消费级、专业级、AI加速等不同计算任务的GPU系列。纵观Nvidia的GPU发展历程,其不断迭代的GPU架构以及性能强劲的GPU互联技术成了Nvidia始终站在市场顶峰的决胜法宝。
2024-03-25 10:42:18 1022
原创 从电影《沙丘》说起——对人工智能的思考
之前看《沙丘》电影,里面有一类角色叫门泰特,这类人大脑可以飞快地运算,在电影设定里是替换人工智能、机器运算的存在。男主保罗也是这类型的人,但他可能基因更强大,吸食了香料后,他的大脑运算能力更强,甚至可以预测未来。作为一个计算机硅农,对这个有趣的设定挺感兴趣的,我想根据自己的理解理一理门泰特能预测未来的合理性,进而小小地科普一下人工智能对我们的意义,也欢迎各位喜欢科幻电影或计算机领域的童鞋一起探讨。
2024-03-17 21:43:27 955
原创 论文解析——Application Defined On-chip Networks for Heterogeneous Chiplets: An Implementation Perspective
应用定义片上网络的异构chiplet:实现前景。先进的2.5D和3D集成技术已经使得chiplet组合系统成为大芯片设计的一个替代,产业界的偏好是对chiplet系统最好的反应,领先的公司基于成本和可扩展的考虑已经在该领域采取行动。
2024-03-07 21:18:56 1029
原创 论文解析——Ascend: a Scalable and Unified Architecture for Ubiquitous Deep Neural Network Computing
昇腾:一种用于DNN计算的可扩展的统一架构
2024-03-01 11:54:54 832
原创 片上网络NoC
片上网络将报文交换的思想引入芯片内部通信机制中,尽管片上网络和片外网络具有一定相似性,但二者在延迟、功耗和面积等方面有本质区别。片上网络要与计算核一起竞争芯片宝贵的功耗和面积资源。为了在有限的功耗和面积开销下获得较高的性能,设计者更应关注片上网络的优化,包括底层逻辑实现的优化,网络层路由和流控的优化,以及面向高层编程模式的优化。
2024-02-26 18:11:26 857
原创 论文解析——Review of chiplet-based design: system architecture and interconnection
本文主要介绍了当前主要chiplet系统的分解方案及其优劣,对异构chiplets系统的互连拓扑做了详细分析,介绍了chiplets间的死锁原因和解锁策略,同时对不同chiplets系统的封装方案也做了辅助介绍,也特别强调了架构-封装设计的协同。整体来说,是一篇对chiplets架构设计做了全面论述的好文章。
2024-02-25 21:22:27 1087
原创 论文解析——In-DRAM Bulk Bitwise Execution Engine
很多应用都严重依赖逐位操作计算。在已有的系统中机型批量逐位操作需要处理器在内存通道上传输大量的数据,因此需要高延迟、内存带宽和能耗。在这篇文章中,我们介绍了Ambit,一种完全在主存中进行批量逐位操作(bulk bitwise operation)的机制,通过基于DRAM的内部的架构和模拟操作可以获得低成本、高性能和低功耗的效果。
2024-01-16 14:54:47 352
原创 论文解析——Debunking the 100X GPU vs. CPU Myth: An Evaluation of Throughput Computing on CPU and GPU
揭穿GPU相比于CPU 100倍性能的神话:一次CPU和GPU上的吞吐量计算的评估
2024-01-15 21:33:37 821
原创 FPGA开发设计
FPGA是可编程逻辑器件的一种,本质上是一种高密度可编程逻辑器件。FPGA的灵活性高、开发周期短、并行性高、具备可重构特性,是一种广泛应用的半定制电路。
2024-01-12 16:57:30 1713
原创 鲲鹏920的架构分析
本文信息主要来源于书籍《鲲鹏处理器架构与编程》以及论文《Kunpeng 920: The First 7-nm Chiplet-Based 64-Core ARM SoC for Cloud Services》 *笔者已然写了一篇上述论文的分析博客,但尚觉论文内容对chiplet架构描述不够清晰,因此查阅《鲲鹏处理器架构与编程》一书,借此文以记录补充内容。由于书是2020年出版,论文是由鲲鹏设计团队于2021年发表,很多命名、表述不相一致,鄙人觉得以论文描述为主。
2023-11-11 10:48:11 1364
原创 论文解析——Kunpeng 920: The First 7-nm Chiplet-Based 64-Core ARM SoC for Cloud Services
鲲鹏920是海思基于ARM架构设计的第二代服务器处理器。利用大量的chiplets以及hybrid工艺技术,鲲鹏920在处理不同负载的同时获取截稿的成效。通过这些灵活的chiplet的重组可以构建新的设计。鲲鹏系列处理器混合各类技术来提升效率,消除瓶颈,提升价值和性能。其关键特征如下:支持向量扩展的超标量架构为高性能应用场景赋能;通过一致性cache子系统将多核基于超低延迟、非阻塞、bufferless的ring设计集成进单chiplet中;
2023-11-10 23:01:55 840
原创 论文解析——Implementing Precise Interrupts in Pipelined Processors
当一条指令执行结束另一条指令开始前,如果保存的进程状态和程序执行的顺序模型相关时,中断要求非常精确。在一个流水线处理器中,由于上一条指令已经完成,下一条指令也许会被初始化,因此中断的精确控制通常是很困难的。本文描述和评估了在流水线处理器中的对精确中断问题的解决方案。首先将描述精确中断问题,然后将详细描述第一个解决方案。第一个是强制指令按照架构顺序完成和修改处理器状态,其他的四种将允许指令以任意的序完成,但是将需要额外的硬件,以致于当中断发生时,精确的状态很难恢复。所有的方法将在并行流水下讨论。
2023-11-01 13:09:22 201
原创 论文解析——Pioneering Chiplet Technology and Design for the AMD EPYC™ and Ryzen™ Processor Families
本文详细解释了推动AMD使用chiplet技术的挑战,产品开发的技术方案,以及如何将chiplet技术从单处理器扩展到多个产品系列。
2023-10-10 22:27:52 410
原创 2023年第二届HiPChips解读
The 2nd International Workshop on High Performance Chiplet and Interconnnect Architectures (HiPChips)
2023-09-26 17:02:44 264
原创 2022年第一届HiPChips解读
High Performance Chiplet and Interconnect Architectures,2022年6月19日,第一届会议(连同第49界ISCA会议)于美国纽约举行。
2023-09-11 22:56:44 476
installer.rar
2020-04-13
DC200809.rar
2020-04-12
scl_V10.9.3.rar
2020-04-12
Sigma Delta ADC matlab全系统仿真.zip
2020-01-12
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人