自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(33)
  • 收藏
  • 关注

原创 基于MindStudio完成ResNeXt101_32x8d开发

点击Add Python SDK后,将弹出下图所示的界面,点击左侧的SSH Interpreter,如下图所示,首先选择使用哪一个Deployment,这是刚刚我们配置过的。点击 Change。下一步,设置项目目录映射关系,点击Mappings,然后选择本地的项目目录和远程的项目目录(最好是提前创建好文件夹),接下来跑代码的时候MindStudio会保证这两个目录文件的同步。模型转换主要分为两步,第一步是将原有的pth模型转换为通用的onnx模型,第二步是将onnx模型转化为npu适用的om模型。

2022-12-19 18:09:57 292

原创 基于MindStudio完成SPNASNet_100开发

除此之外,MindStudio具有远端环境,运行任务在远端实现,对于近端的个人设备的要求不高,用户交互体验很好,可以让我们随时随地进行使用。点击Add Python SDK后,将弹出下图所示的界面,点击左侧的SSH Interpreter,如下图所示,首先选择使用哪一个Deployment,这是刚刚我们配置过的。下一步,设置项目目录映射关系,点击Mappings,然后选择本地的项目目录和远程的项目目录(最好是提前创建好文件夹),接下来跑代码的时候MindStudio会保证这两个目录文件的同步。

2022-12-18 11:43:23 125

原创 使用MindStudio进行xlnet模型训练

先看第 1 行,因为在新的排列方式中 1 在最后一个,根据从左到右 AR 方式,1 就能看到 234 全部,于是第一行的 234 位置是红色的(没有遮盖掉,会用到),以此类推。具体实现方式是,通过随机取一句话的一种排列,然后将末尾一定量的词给“遮掩”(和 BERT 里的直接替换 “[MASK]” 有些不同)掉,最后用 AR 的方式来按照这种排列依次预测被“遮掩”掉的词。我们可以发现通过随机取排列(Permutation)中的一种,就能非常巧妙地通过 AR 的单向方式来习得双向信息了。

2022-12-12 20:55:59 119

原创 使用MindStudio进行xlm模型训练

(mBERT)在各种跨语言的我们的模型被称为 XLM-R,在各种跨语言的基准测试中,XLM-R 明显优于多语言 BERT(mBERT),包括在 XNLI 上的平均准确率+14.6%,在 MLQA 上的平均 F1 得分+13%,以及+2.6%。XLM-R、在低资源语言上的表现特别好,在 XNLI 上提高了 15.7%的准确率。作者在一百种语言上训练了一个基于 Transformer 的屏蔽式语言模型,使用超过 2TB 的CommonCrawl 过滤数据,对一百种语言进行了训练。

2022-12-12 20:54:50 141

原创 使用MindStudio进行squeezebert模型训练

基于 BERT 的编码器中的每个块都有一个具有 3 个 PFC 层的自注意模块, 以及另外 3 个称为前馈网络层(FFN1,FFN2 和 FFN3)的 PFC 层。在自我注意模块的所有 PFC 层以及 FFN2 和 FFN3 层中,使用 G = 4 的分组卷积。已经说明了如何使用卷积在自我注意网络中实现昂贵的 PFC 层,可以将有效的分组卷积合并到自我注意网络中。通常包含在卷积层中(注意,G = 1 的分组卷积与普通卷积是相同的)。和类似的自注意网络的 PFC 层,而不改变网络的数值性质或行为。

2022-12-12 20:53:04 39

原创 使用MindStudio进行roberta模型训练

git clone {repository_url} # 克隆仓库的代码cd {repository_name} # 切换到模型的代码仓目录git checkout {branch/tag} # 切换到对应分支。git reset --hard {commit_id} # 代码设置到对应的 commit_id(可选)整个模型的结构还是依照了 BERT 的骨架,采用了 Transformer 以及 GELU 激活函数。cd {code_path} # 切换到模型代码所在路径,若仓库下只有该模型,则无需切换。

2022-12-12 20:50:33 111

原创 使用MindStudio进行reformer模型训练

随后,Reformer 根据类别重排序列,使在一个类别的 query 在序列中是相邻的。最后,Reformer 将序列分成若干子序列,在每段子序列上执行局部自注意力,得到每个 query 的自注意力表示,并还原序列的顺序。Reformer 将原序列分成若干子序列,在每段子序列上执行 FFN,因此减少了中间表示的大小,从而缓解处理长序列时显存不足的问题。从注意力模块得到的序列的中间表示在 FFN 中做了一次线性变换之后,会使得这个中间表示的词嵌入维度大幅升高,这一操作非常消耗显存容量。列长度非常长时,一个。

2022-12-12 20:33:26 47

原创 使用MindStudio进行mpnet模型训练

这些模型,如 BERT,通常是在大规模的语料上经过精心设计的预训练任务,然后在下游任务上进行微调,以提高准确率。其中,BERT 中采用的是 Masked Language Modeling(MLM)和 XLNet 中采用的 Permuted Language Modeling(PLM)是两种具有代表性的预训练任务。因此,微软亚洲研究院的研究人员继去年提出 MASS 用于语言生成后, 又提出了一种全新的预训练模型 MPNet,它继承了 MLM 和 PLM 的优点,避免了它们的局限性。

2022-12-12 20:31:46 124

原创 使用MindStudio进行mobilebert模型训练

(“task-specifically”),这些工作的一般流程是首先将预训练的 BERT 模型在具体任务中进行 fine-tune,然后再进行蒸馏来获得小模型。BERT 在 NLP 领域的地位是举足轻重的,其预训练模型,在多种下游任务的迁移工作中都能给出非常好的效果。但于此同时,BERT 也受困于其庞大的模型参数和较慢的运行速度, 尤其是在于一些资源受限的移动端部署任务中,BERT 的实际应用是非常受限的。在预训练的阶段来进行知识蒸馏,获得一个压缩版的小 BERT(mobileBERT),能够达到可。

2022-12-12 20:29:34 88

原创 使用MindStudio进行mbart模型训练

与从头开始训练的多语言模型相比,从预训练的模型开始与从头开始训练的多语言模型相比,从预训练的模型开始,包含了大量未标记的单语言数据的好处,这对资源少的语言特别重要。SQuAD2.0 组合了 SQuAD1.1 中的 10 万个问题,并增加了超过 5 万个无法回答的问题, 这些问题由众包工作者以对抗(adversarially)的方式设计,看起来与可回答的问题相似。这是一个阅读理解数据集,由众包工作者在一组维基百科文章上提出的问题组成,其中每个问题的答案都是相应文章中的一段文 本,某些问题可能无法回答。

2022-12-12 20:28:38 219

原创 使用MindStudio进行longformer模型训练

基于 Transformer 的模型无法处理长序列,因为它们的自注意力操作,它的序列长度是之前的四倍。Longformer 的注意力机制是对标准自我注意力的直接替代替换了标准的自我注意,并结合了局部窗口式注意力和 任务驱动的全局注意力。开发运行场景(共部署形态):在昇腾 AI 设备上安装 MindStudio、Ascend-cann-toolkit 开发套件包、npu-firmware 安装包、npu-driver 安装包和 AI 框架(进行模型训练时需要安装)。optim,前后处理等与论文基本一致。

2022-12-12 20:26:34 150

原创 使用MindStudio进行ibert模型训练

iBERT 模型是 RoBERTaibert-roberta-base 的仅整数量化版本,并在本文中进行了介绍。特别是,I-BERT 将Transformer 架构(例如,MatMul、GELU、Softmax 和 LayerNorm)中的所有浮点运算替换为非常近似的整数运算。然后可以将通过量化感知微调搜索的最佳模型参数导出(例如,到TensorRT),用于模型的仅整数部署。整个模型的结构还是依照了 BERT 的骨架,采用了 Transformer 以及 GELU 激活函数。

2022-12-11 20:35:51 130

原创 使用MindStudio进行funnel模型训练

Funnel-Transformer 提出另一种简单但有效的提高 Transformer 处理长序列效率的方法: 随着模型加深,使用池化操作压缩在序列方向上的长度,让模型变窄,从而节约高层的参数量,直到最后得到单个向量(或几个,取决于任务)。为此,本文又在最后加上一个 Decoder,将最后得到的单个向量上采样,从而恢复到原来的序列长度。这样一来,将相当于压缩了整个模型的中间部分,而保持开始和结束层的长度不变,也就可以像原始 Transformer 一样用于各类任务了。

2022-12-11 20:34:16 96

原创 使用MindStudio进行Flaubert模型训练

MindStudio 是一套基于华为自研昇腾 AI 处理器开发的 AI 全栈开发工具平台,该 IDE 上功能很多,涵盖面广,可以进行包括网络模型训练、移植、应用开发、推理运行及自定义算子开发等多种任务。MindStudio 除了具有工程管理、编译、调试、运行等功能外,还能进行性能分析,算子比对,可以有效提高工作人员的开发效率。除此之外,MindStudio 还具有远端环境,运行任务可在远端实现,对于近端的个人设备要求不高,用户交互体验很好, 可以让我们随时随地进行使用。

2022-12-11 20:32:27 55

原创 使用MindStudio进行deberta模型训练

在 BERT 中,输入层中的每个 token 都是用一个向量表示的,这个向量是 token 嵌入和句子嵌入以及位置嵌入的简单求和,而在 DeBERTa 中,每个 token 都是用两个向量表示的,分别对内容和位置进行编码,根据 token 的内容和相对位置,利用分散矩阵计算 token 之间的注意权值。Disentangled attention:比如 deep 和 learning 这两个词,当它们相连出现在一起的时候,其之间的依赖性会更强,而当它们出现在不同句子里,其之间依赖性就不强。

2022-12-11 20:30:49 159

原创 使用MindStudio进行convbert模型训练

MindStudio 是一套基于华为自研昇腾 AI 处理器开发的 AI 全栈开发工具平台,该 IDE 上功能很多,涵盖面广,可以进行包括网络模型训练、移植、应用开发、推理运行及自定义算 子开发等多种任务。MindStudio 除了具有工程管理、编译、调试、运行等功能外,还能进行性能分析,算子比对,可以有效提高工作人员的开发效率。除此之外,MindStudio 还具有远端环境,运行任务可在远端实现,对于近端的个人设备要求不高,用户交互体验很好,可以 让我们随时随地进行使用。

2022-12-11 20:29:23 179

原创 使用MindStudio进行canine模型训练

MindStudio 是一套基于华为自研昇腾 AI 处理器开发的 AI 全栈开发工具平台,该 IDE 上功能很多,涵盖面广,可以进行包括网络模型训练、移植、应用开发、推理运行及自定义算 子开发等多种任务。MindStudio 除了具有工程管理、编译、调试、运行等功能外,还能进行性能分析,算子比对,可以有效提高工作人员的开发效率。除此之外,MindStudio 还具有远端环境,运行任务可在远端实现,对于近端的个人设备要求不高,用户交互体验很好,可以 让我们随时随地进行使用。

2022-12-11 20:26:06 112

原创 使用MindStudio进行camembert模型训练

MindStudio 是一套基于华为自研昇腾 AI 处理器开发的 AI 全栈开发工具平台,该 IDE 上功能很多,涵盖面广,可以进行包括网络模型训练、移植、应用开发、推理运行及自定义算 子开发等多种任务。MindStudio 除了具有工程管理、编译、调试、运行等功能外,还能进行性能分析,算子比对,可以有效提高工作人员的开发效率。除此之外,MindStudio 还具有远端环境,运行任务可在远端实现,对于近端的个人设备要求不高,用户交互体验很好,可以 让我们随时随地进行使用。

2022-12-11 20:23:50 67

原创 使用MindStudio进行big_bird模型训练

MindStudio 提供您在 AI 开发所需的一站式开发环境,支持模型开发、算子开发以及应用开发三个主流程中的开发任务。,MindStudio 集成了 Profiling 性能调优、编译器、MindX SDK 的应用开发、可视化 pipeline 业务流编排等工具,为开发者提供了图形化的集成开发环境,通过 MindStudio 能够进行工程管理、编译、调试、性能分析等全流程开发,能够很大程度提高开发效率。集成了训练可视化、脚本转换、模型转换、精度 比对等工具,提升了网络模型移植、分析和优化的效率。

2022-12-11 20:17:08 127

原创 使用MindStudio进行bart模型训练

MindStudio 是一套基于华为自研昇腾 AI 处理器开发的 AI 全栈开发工具平台,该 IDE 上功能很多,涵盖面广,可以进行包括网络模型训练、移植、应用开发、推理运行及自定义算子开发等多种任 务。MindStudio 除了具有工程管理、编译、调试、运行等功能外,还能进行性能分析,算子比对,可以有效提高工作人员的开发效率。除此之外,MindStudio 还具有远端环境,运行任务可在远端实现,对于近端的个人设备要求不高,用户交互体验很好,可以让我们随时随地 进行使用。

2022-12-11 20:12:20 95

原创 使用MindStudio进行albert模型训练

MindStudio 是一套基于华为自研昇腾 AI 处理器开发的 AI 全栈开发工具平台,该 IDE 上功能很多,涵盖面广,可以进行包括网络模型训练、移植、应用开发、推理运行及自定义算子开发等多种任 务。MindStudio 除了具有工程管理、编译、调试、运行等功能外,还能进行性能分析,算子比对,可以有效提高工作人员的开发效率。除此之外,MindStudio 还具有远端环境,运行任务可在远端实现,对于近端的个人设备要求不高,用户交互体验很好,可以让我们随时随地 进行使用。需将代码仓下载到本地。

2022-12-11 20:06:21 52

原创 使用MindStudio进行Mindx模型st-gcn开发

本图文案例通过复现MindX SDK口罩识别应用,详细展示了通过MindStudio进行MindX SDK应用开发的全流程,内容包含MindStudio部署安装、MindX SDK工程创建、动态骨架识别应用模型代码展示、pipeline功能介绍和Modelarts训练展示。MindX SDK应用复现:分享应用复现流程和代码,并解释关键代码构成和逻辑 作者:Arrier9527 https://www.bilibili.com/read/cv18690592 出处:bilibili。1.1 案例开发目标。

2022-09-20 14:59:53 90

原创 使用MindStudio进行Mindx模型InceptionResnetV2开发

本图文案例通过复现Mindx高性能预训练模型InceptionResnetV2训练推理,详细展示了通过MindStudio进行Mindx高性能预训练模型InceptionResnetV2训练推理的全流程,内容包含MindStudio部署安装、利用MindStudio进行Modelarts训练,SDK推理和Mxbase推理。开发流程:MindX SDK推理业务的不同流程,以及MindX SDK的特色可视化流程编排。MindX SDK应用复现:复现SDK推理和Mxbase推理。1.2 案例内容重点技术环节。

2022-09-20 14:58:25 104

原创 使用MindStudio进行Mindx模型vnet开发

本图文案例通过复现Mindx高性能预训练模型vnet训练推理,详细展示了通过MindStudio进行MindX SDK应用开发的全流程,内容包含MindStudio部署安装、MindX SDK工程创建、modelarts训练、pipeline功能介绍等。开发流程:Mindx高性能预训练模型的训练推理需要首先通过华为云平台的Modelarts进行训练得到精度达标的权重,使用SDK服务器将模型冻结成推理用文件,使用SDK应用进行推理和MxBase插件进行推理复现。1.2 案例内容重点技术环节。

2022-09-20 14:57:14 390

原创 使用MindStudio进行Mindx模型SpansNet100开发

本图文案例通过复现Mindx高性能预训练模型SpansNet100训练推理,详细展示了通过MindStudio进行Mindx高性能预训练模型SpansNet100训练推理的全流程,内容包含MindStudio部署安装、利用MindStudio进行Modelarts训练,SDK推理和Mxbase推理。开发流程:MindX SDK推理业务的不同流程,以及MindX SDK的特色可视化流程编排。MindX SDK高性能预训练模型SpansNet100训练推理:解释关键训练推理代码构成。1.1 案例开发目标。

2022-09-20 14:56:05 84

原创 基于MindStudio实现SOLOV2实例分割开发

本图文案例通过复现MindX SDK SOLOV2实例分割算法,详细展示了通过MindStudio进行MindX SDK应用开发的全流程,内容包含MindStudio部署安装、MindX SDK工程创建、SOLOV2模型代码展示、pipeline功能介绍以及常见问题等。开发流程:MindX SDK推理业务的不同流程,以及MindX SDK的特色可视化流程编排。创建应用工程:MindX SDK应用工程创建流程,以及不同工程类型的差别。MindX SDK SOLOV2实例分割关键代码:解析代码内容,突出重点。

2022-09-20 14:54:59 142

原创 AscendCL应用使用Profiling工具进行性能调优

本图文、视频案例实现了AscendCL样例应用的编译和执行,详细展示了通过MindStudio使用Profiling工具对AscendCL应用进行性能调优,内容包含MindStudio部署安装、AscendCL工程创建、Profiling工具配置、Profiling性能数据采集、Profiling性能数据分析……Profiling工具配置:MindStudio中Profiler工具介绍、依赖工具的安装、用户权限的配置。AscendCL应用使用Profiling工具进行性能调优。

2022-09-20 14:54:13 168

原创 使用MindStudio进行MindX SDK插件开发全流程

MindStudio是一套基于华为自研昇腾AI处理器开发的AI全栈开发工具平台,该IDE上功能很多,涵盖面广,可以进行包括网络模型训练、移植、应用开发、推理运行及自定义算子开发等多种任务。本图文案例通过复现MindX SDK插件开发,详细展示了通过MindStudio进行MindX SDK插件开发的全流程,内容包含MindStudio部署安装、MindX SDK工程创建、插件代码展示、pipeline功能介绍。开发流程:MindX SDK推理业务的不同流程,以及MindX SDK的特色可视化流程编排。...

2022-08-30 17:10:10 353

原创 使用MindStudio进行anchor-free模型推理介绍

通过MindStudio工具实现SDK应用开发可分为基础开发与深入开发两个阶段,通常情况下用户关注基础开发即可,基础开发主要包含如何通过现有的插件构建业务流并实现业务数据对接,采用模块化的设计理念,将业务流程中的各个功能单元封装成独立的插件,通过插件的串接快速构建推理业务。MindStudio是一套基于华为自研昇腾AI处理器开发的AI全栈开发工具平台,该IDE上功能很多,涵盖面广,可以进行包括网络模型训练、移植、应用开发、推理运行及自定义算子开发等多种任务。配置环境,安装MindStudio。......

2022-08-30 17:09:09 215

原创 使用MindStudio进行后处理插件开发介绍

通过MindStudio工具实现SDK应用开发可分为基础开发与深入开发两个阶段,通常情况下用户关注基础开发即可,基础开发主要包含如何通过现有的插件构建业务流并实现业务数据对接,采用模块化的设计理念,将业务流程中的各个功能单元封装成独立的插件,通过插件的串接快速构建推理业务。本图文案例通过复现MindX SDK后处理插件开发,详细展示了通过MindStudio进行MindX SDK应用开发的全流程,内容包含MindStudio部署安装、MindX SDK工程创建、应用代码展示、pipeline功能介绍。...

2022-08-30 17:08:00 358

原创 【经验分享】基于PyTorch框架TBE-TIK开发

随着深度学习的广泛应用,大量的深度学习框架及深度学习硬件平台应运而生,但不同平台的神经网络模型难以在其他硬件平台便捷的运行,无法充分利用新平台的运算性能。https://bbs.huaweicloud.com/forum/thread-0231971387196350187-1-1.html 作者:Arrier9527 https://www.bilibili.com/read/cv18347704 出处:bilibili。TVM的架构详细介绍请参考https://tvm.apache.org/。...

2022-08-29 16:54:00 80

原创 【经验分享】基于Tensorflow框架TBE-TIK开发

随着深度学习的广泛应用,大量的深度学习框架及深度学习硬件平台应运而生,但不同平台的神经网络模型难以在其他硬件平台便捷的运行,无法充分利用新平台的运算性能。https://bbs.huaweicloud.com/forum/thread-0277971384480550188-1-1.html 作者:Arrier9527 https://www.bilibili.com/read/cv18347648 出处:bilibili。TVM的架构详细介绍请参考https://tvm.apache.org/。...

2022-08-29 16:50:45 540

原创 使用MindStudio进行Pytorch离线推理全流程

使用MindStudio进行Pytorch离线推理全流程

2022-07-11 19:34:24 685 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除