CPU based Bert question answering model

Mamoon November 18, 2021, 7:59am 1

What is the best question answering model with minimum CPU latency? If I want to quantize the model what are the best approaches? Any reference link ?

Topic		Replies	Views
How to improve model latency using quantization Beginners	0	325	December 27, 2021
[Help] GPU with query answering 🤗Transformers	0	334	November 25, 2020
Question and Answering run time 🤗Transformers	1	289	September 24, 2020
Optimize response time of model output 🤗Transformers	0	687	December 23, 2021
Advice to speed and performance 🤗Transformers	4	7269	December 7, 2020

CPU based Bert question answering model

Related topics