[feature request] GPU runtime support #59

yuekaizhang · 2023-03-31T08:27:02Z

这个项目太硬核了。大佬有兴趣支持一下gpu的runtime吗？或者在 fastertransformer里面支持一下 paraformer 或者 k2的模型？类型下面wenet这样的
https://github.com/NVIDIA/FasterTransformer/tree/main/examples/cpp/wenet
https://github.com/NVIDIA/FasterTransformer/tree/main/src/fastertransformer/models/wenet

chenkui164 · 2023-03-31T10:05:35Z

您好，像这样手写推理会比onnx+tensorrt推理快么？感觉onnx+不同的Providers方式，更加合理些。

yuekaizhang · 2023-03-31T10:18:32Z

您好，像这样手写推理会比onnx+tensorrt推理快么？感觉onnx+不同的Providers方式，更加合理些。

cpu上的话，不确定这个手写推理有没有onnx快。gpu上的话，手写推理是最快的，也就是FasterTransformer这种形式，利用onnx去支持gpu的推理，远没有手写的快。 onnx + tensorrt的话，只要手写的没有大问题，一般也是手写的快。这也是为啥会有fastertransformer这种项目

chenkui164 · 2023-03-31T10:42:52Z

好的，感谢。paraformer模型在CPU上确实比不过ONNX，在优化就涉及到CPU底层的内容了，有点优化不动了。我先看看wenet的GPU实现，学习下。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[feature request] GPU runtime support #59

[feature request] GPU runtime support #59

yuekaizhang commented Mar 31, 2023

chenkui164 commented Mar 31, 2023

yuekaizhang commented Mar 31, 2023

chenkui164 commented Mar 31, 2023

[feature request] GPU runtime support #59

[feature request] GPU runtime support #59

Comments

yuekaizhang commented Mar 31, 2023

chenkui164 commented Mar 31, 2023

yuekaizhang commented Mar 31, 2023

chenkui164 commented Mar 31, 2023