Spacemit Triton 内测活动圆满结束,在此,我们对所有参与本次内测活动的开发者表示诚挚感谢
现将优秀作品集中展示,并附获奖通知:
获奖投稿
Spine-Triton初体验–30分钟上手第一个例程
Spine-Triton编写融合算子和测量性能
Spine-Triton查看kernel的汇编代码——矩阵乘法没用上矢量指令
Spine-Triton查看MLIR代码——iFlow解读编译流程并示例矢量指令
Spine-Triton理解编译流程——iFLOW解析spine-triton代码库
Spine-Triton编译器bug——常数乘法双重错误
Spine-Triton编译器bug——tt.mlir to linalg.mlir
作者@ riple
GEMM计算性能PK:用Spine Triton写了一个smt-gemm Triton Kernel以及和官方的smt-mm Triton Kernel的性能对比测试
作者@ Eddle
以上优秀开发者围绕 算子实现、性能分析、IR 解析、编译器 Bug 反馈 等多个方向进行了深入探索,产出了大量高质量技术内容,对 Spacemit Triton 的持续优化提供了重要参考。
评选结果与获奖公示
一等奖
论坛账号: riple
在本次内测中,riple 围绕 Spine-Triton 编译器与算子实现进行了系统性、持续性的深入研究,提出并定位多个高价值编译器 Bug。
研发团队评价:
您提出的bug及性能调试需求对我们帮助很大。在第一个版本的Spacemit Triton中,矩阵化、向量化的模式需要一定的写法才能生效,当然更灵活的向量化以及前端DSL无感也是必要的,相关版本已经在路上了,以及在即将到来的K3上,您将可以体验到更完整的triton编程体验
恭喜 riple 获得一等奖,赢得 MUSEBOOK 笔记本电脑一台!
优胜奖
论坛账号: 1765487659
帖子: Spine-Triton Attention Implementation
研发团队评价:
您对Spacemit Triton优化矩阵乘的IR编译路线做了完整的解释,并提出了很多IR细节的问题,后续Spacemit Triton新版本时将会一一解答,并且,针对micro tile这个寄存器级别的超参数,将会以更简单的方式提供,同时保留细节操作的可能性
论坛账号: Eddle
帖子: GEMM计算性能PK:用Spine Triton写了一个smt-gemm Triton Kernel以及和官方的smt-mm Triton Kernel的性能对比测试
- 实现自定义 smt-gemm Kernel
- 与官方 smt-mm Kernel 进行了系统性能对比
- 提出了 自动分块与自动调优 的建设性思路
研发团队评价:
自动分块找最优实现这个想法很棒,同时社区中也存在一些Triton AutoTune的实践,我们也考虑把自动调优结合硬件微架构信息这类特性加入到未来的Spacemit Triton中
恭喜以上两位开发者获得优胜奖,进迭周边礼盒1份!
请获奖者在12月30日12:00前通过以下方式联系我们确认寄送信息:
企业微信:函
添加时请备注论坛id,并附上联系方式
再次致谢所有参与者
每一篇投稿都是对RISC-V生态的珍贵贡献,期待在进迭时空后续的开发者活动中再见!

