Improve the performance of model prediction of transformers model

nielsr · November 24, 2021, 11:01am

One can export the model to ONNX, apply quantization, etc.

Topic		Replies	Views
Speed up the prediction in transformers models 🤗Transformers	0	663	November 23, 2021
Optimize response time of model output 🤗Transformers	0	674	December 23, 2021
Pegasus Inference for production usecase Beginners	6	1564	February 26, 2021
Fast CPU Inference On Pegasus-Large Finetuned Model -- Currently Impossible? Beginners	4	2532	March 1, 2021
Inference speed between pipelines and Heads 🤗Transformers	0	311	April 3, 2023