基于进迭K1开发板环境,对RVV向量指令,如果依次设置LMUL为1,2,4,8目前看到,LMUL>1,即从1到2 性能提升很大;但是从2开始,到4,8相差不大。这个有人知道原因吗。主要是用RVV进行向量点积运算。如下图所示,两个向量大小都是65536维,元素一个向量全是1.0f, 另外一个向量全是2.0f,vls表示有效的vl值,now是计算结果。
K1的核X60,是个双发顺序处理器 ,你的结论是对的
基于进迭K1开发板环境,对RVV向量指令,如果依次设置LMUL为1,2,4,8目前看到,LMUL>1,即从1到2 性能提升很大;但是从2开始,到4,8相差不大。这个有人知道原因吗。主要是用RVV进行向量点积运算。如下图所示,两个向量大小都是65536维,元素一个向量全是1.0f, 另外一个向量全是2.0f,vls表示有效的vl值,now是计算结果。
K1的核X60,是个双发顺序处理器 ,你的结论是对的