是不是给kernel加上@libentry()会减少JIT的时间?在这个trace中,可以看到20次重复测试中的第一次时间超长,就是JIT编译kernel造成的。
Spine-Triton查看kernel的汇编代码——矩阵乘法没用上矢量指令发现了剩余19次重复测试时间长的原因:没有使用矢量/矩阵指令。不清楚您给出的FlagGems参考是否解决了这个问题?
容我安装好了FlagGems运行一下看看。谢谢!
是不是给kernel加上@libentry()会减少JIT的时间?在这个trace中,可以看到20次重复测试中的第一次时间超长,就是JIT编译kernel造成的。
Spine-Triton查看kernel的汇编代码——矩阵乘法没用上矢量指令发现了剩余19次重复测试时间长的原因:没有使用矢量/矩阵指令。不清楚您给出的FlagGems参考是否解决了这个问题?
容我安装好了FlagGems运行一下看看。谢谢!