相比于 LLM 大模型推理,CV 端侧任务的推理优化方向:
The 21st International Conference on Embedded Wireless Systems and Networks (EWSN'24), 2024.05.13.
贡献:
结论:在 Cifar-10 进行图像分类
BNN 优势:
BNN 劣势:
Origin(256x256) HT(256x256) SR(512x512) Model Size: 1.36MB 5.24MB
综上:Conv 的时延占比最高,其次是 Add 算子。
尝试部署 Onnx 的 Int8 量化,失败:Ort 找不到它自己量化过的算子。。。