求助,如何利用OpenCL实现神经网络加速推理
之前尝试过网络结构、模型量化/剪枝来加速神经网络运算,现在才接触到FPGA并行计算的特性并利用OpenCL来实现加速运算。刚上手,卡在了模型参数提取并送入FPGA当中运算这一步,在线求解。我的新手操作如下:
http://i2.tiimg.com/702072/099c8ed67241a461.png
训练神经网络
http://i2.tiimg.com/702072/30d308a5142dc201.png
然后得到的模型
后面参数提取和输入FPGA好像有点错乱了。。。。。。
页:
[1]