Inference slows down after restrictions

prajjwal1 · March 22, 2021, 4:23pm

Earlier I was using generate without length_penalty and no_repeat_ngram_size, and after using these two params, inference has slowed down significantly (more than 2x). Is this the intended behaviour here ?

Topic		Replies	Views
Length_penalty not influencing results (Bart, Pegasus) 🤗Transformers	1	837	December 8, 2020
Inference API detailed request Beginners	5	2372	September 11, 2020
Model.generate() is extremely slow while using beam search 🤗Transformers	2	5464	July 24, 2022
Output token lengths of smaller models 🤗Transformers	0	515	October 30, 2023
Recommended way to perform batch inference for generation 🤗Transformers	0	2554	March 6, 2021

Inference slows down after restrictions

Related topics