[问答]

RK3588 RedeceMax OP在CPU上运行耗时过大怎么解决

问答对人有帮助，内容完整，我也想知道答案 0 问题描述及复现步骤: 在简单的自定网络结构中，需要实现(B, C, H, W) 降维成 (B, C, W) 使用ReduceMax OP + Reshape OP来实现此功能，发现ReduceMax OP是在CPU上运行的，耗时很大（约140ms）。在rk3588开发板上实测结果如下： D RKNN: [11:25:59.947] ID OpType DataType Target InputShape OutputShape DDR Cycles NPU Cycles Total Cycles Time(us) MacUsage(%) RW(KB) FullName D RKNN: [11:25:59.947] 0 InputOperator INT8 CPU \ (1,10,32,10000) 0 0 0 4 \ 5000.00 InputOperator:voxels_input D RKNN: [11:25:59.947] 1 ConvRelu INT8 NPU (1,10,32,10000),(64,10,1,1),(64) (1,64,32,10000) 811751 200000 811751 3871 6.89 25001.50 Conv:Conv_0 D RKNN: [11:25:59.947] 2 ReduceMax INT8 CPU (1,64,32,10000) (1,64,1,10000) 0 0 0 139036 \ 20625.00 ReduceMax:ReduceMax_2 D RKNN: [11:25:59.947] 3 Reshape INT8 CPU (1,64,1,10000),(4) (1,64,10000,1) 0 0 0 1048 \ 1250.03 Reshape:Squeeze_3_2reshape D RKNN: [11:25:59.947] 4 OutputOperator INT8 CPU (1,64,10000,1) \ 0 0 0 40 \ 625.00 OutputOperator:pillar_features D RKNN: [11:25:59.947] Total Operator Elapsed Time(us): 143999 --- 另外，采用Maxpool替换ReduceMax OP，同样发现在CPU上运行，耗时很大（约130ms）。在rk3588开发板上实测结果如下： D RKNN: [13:11:54.589] ID OpType DataType Target InputShape OutputShape DDR Cycles NPU Cycles Total Cycles Time(us) MacUsage(%) RW(KB) FullName D RKNN: [13:11:54.589] 0 InputOperator INT8 CPU \ (1,10,32,10000) 0 0 0 4 \ 5000.00 InputOperator:voxels_input D RKNN: [13:11:54.589] 1 ConvRelu INT8 NPU (1,10,32,10000),(64,10,1,1),(64) (1,64,32,10000) 811751 200000 811751 3873 6.89 25001.50 Conv:Conv_0 D RKNN: [13:11:54.589] 2 MaxPool INT8 CPU (1,64,32,10000) (1,64,1,10000) 0 0 0 130099 \ 20625.00 MaxPool:MaxPool_2 D RKNN: [13:11:54.589] 3 Reshape INT8 CPU (1,64,1,10000),(4) (1,64,10000,1) 0 0 0 779 \ 1250.03 Reshape:Squeeze_3_2reshape D RKNN: [13:11:54.589] 4 OutputOperator INT8 CPU (1,64,10000,1) \ 0 0 0 28 \ 625.00 OutputOperator:pillar_features D RKNN: [13:11:54.589] Total Operator Elapsed Time(us): 134783 --- 请问能否优化，使得reducemax op在NPU上运行，提高速度。另外，为何使用maxpool op是在CPU上运行而非NPU？ 0
2022-8-24 17:15:31　　评论淘帖0 邀请回答您可以邀请以下用户，快速回答问题 × liutiefu 该类别下有 26 个回答。邀请回答 tigerwang711 该类别下有 20 个回答。邀请回答 ze55me 该类别下有 20 个回答。邀请回答杀狼000 该类别下有 19 个回答。邀请回答 zhuzb0754 该类别下有 19 个回答。邀请回答冰箱洗衣机该类别下有 18 个回答。邀请回答 YYXIAO 该类别下有 18 个回答。邀请回答河神大人该类别下有 17 个回答。邀请回答 mede1001 该类别下有 17 个回答。邀请回答安德森大该类别下有 17 个回答。邀请回答 CDCNKA 该类别下有 17 个回答。邀请回答 jjll652 该类别下有 17 个回答。邀请回答熊本熊该类别下有 16 个回答。邀请回答 YOYOOO 该类别下有 16 个回答。邀请回答麻酱该类别下有 16 个回答。邀请回答世态薄凉该类别下有 16 个回答。邀请回答 musicalboy 该类别下有 15 个回答。邀请回答万航渡路该类别下有 15 个回答。邀请回答 wuli北该类别下有 15 个回答。邀请回答五斤麻辣油该类别下有 15 个回答。邀请回答举报李红相关推荐 • RK3588J和RK3588是什么关系？ 3931 • RK3588 Android无法编译Package模块是怎么回事 3155 • 怎样去解决RK3588编译kernel的问题呢 3712 • RK3566/RK3588/RV1109芯片具有哪些参数特性？ 4693 • 如何在rk3588j上使用uboot命令行测试pwm驱动呢？ 1490 • 请问一下rk3588可以安装数据库吗？ 3543 • RK3588显示kworker +rcu_gp占用系统完全失控是何原因 1706 • 如何调用RK3588的NPU资源？ 3922 • RK3588 video engine 1001 • 如何让RK3588芯片支持HDMI0接口输出为8K分辨率呢 4868 1个回答

答案对人有帮助，有参考价值 0 你好像用错工具了，3588 应该使用二代的工具，rknn-toolkit2-v1.3.0，你用的是一代

2022-8-24 17:15:52 评论举报王英