How to parallelize model.generate?

berkayberabi · January 24, 2021, 11:15pm

Hi,

I am using model.generate() on the T5 model. I have a for loop where I iterate over the samples one by one. As expected, it is too slow. I know that trainer class has trainer.predict() method but then I can not apply beam decoding right?

I also know that I can pass batches to tokenizer and model.generate() and speed up the training but then still I will have to have a for loop where I iterate over the batches, right?

Is there a way to parallize the generation while using beam strategy and other stuff that model.generate provides?

sgonzalezsilot · September 7, 2022, 7:36am

Hi,

Did you find any good solution?

Thanks.

Topic		Replies	Views
Model.generate() is extremely slow while using beam search 🤗Transformers	2	5404	July 24, 2022
Using model.generate() in parrellel / faster? Beginners	0	365	October 11, 2023
Multiple gpu not properly parallelized during model.generate() 🤗Transformers	4	1629	October 9, 2022
Can trainer.predict() return multiple generations for each sample? 🤗Transformers	2	763	January 18, 2022
Transformer generate function got low GPU utilization 🤗Transformers	1	831	December 18, 2022

How to parallelize model.generate?

Related topics