Bring Your Own Codegen to TVM
504.69 KB
19 页
0 评论
语言 | 格式 | 评分 |
---|---|---|
英语 | .pdf | 3 |
摘要 | ||
文档介绍了如何将自定义代码生成器集成到TVM框架中,包括实现构建逻辑、运行时分发器以及标注和分割图表等内容。用户可以通过实现外部函数或图级注释器,将支持的算子或子图划分到自定义代码生成器。文档还提供了相关代码示例和开发步骤,以帮助用户在TVM中集成自定义硬件加速器或优化算子。 | ||
AI总结 | ||
《Bring Your Own Codegen to TVM》文档总结如下:
### 核心内容概述
本文档介绍了如何将自定义代码生成(Codegen)集成到 Apache TVM 中,特别是在运行时实现子图的分割与分发执行。该方法适用于设计深度学习芯片的场景,帮助芯片厂商更好地支持复杂模型,同时提升性能。
### 问题背景
- 深度学习芯片通常针对常用操作器(如 Conv2D、Dense、ReLU 等)进行优化,但难以支持新操作器(如 Non Maximum Suppression, NMS)。
- TVM 支持部分芯片不支持的操作器,如何充分利用 TVM 的能力是关键。
### 解决方案概述
- **实现构建逻辑**:自定义代码生成工具,生成目标设备的二进制文件或库。
- **实现运行时分发器**:在 TVM 运行时分发子图到自定义代码生成的执行引擎中。
- **运行时路径**:在 `src/runtime/contrib/ |
P1
P2
P3
P4
P5
P6
P7
P8
P9
P10
P11
P12
下载文档到本地,方便使用
- 可预览页数已用完,剩余
7 页请下载阅读 -
文档评分