Where to set the batch size for text generation?

yulgm · September 17, 2022, 3:40am

I trained a model and now I’m trying to generate data using batches.

I have the following script, and I always run out of memory.

Where do I change the batch size parameter? (i.e. how many texts to decode at a time?)

or is there another way to decode a long list of input texts?

batch = tokenizer(
    df['original_txt'].tolist(), 
    truncation=True,
    padding='longest',
    max_length=80, 
    return_tensors="pt"
    ).to(device)

generated = model.generate(
    **batch, 
    max_length=80, 
    no_repeat_ngram_size = 3
    )

#generates the full output list of all results
derived_summaries = tokenizer.batch_decode(generated, skip_special_tokens=True)

Topic		Replies	Views
Results of model.generate are different for different batch sizes of the decode-only model Beginners	6	6007	April 14, 2024
Add generator to Keras Text Generation Beginners	0	602	March 11, 2022
Batch_decode does not give the correct output as generate 🤗Transformers	0	299	March 17, 2022
[T5] How to control the lenth of the generated summaries 🤗Transformers	0	34	July 26, 2024
Issue with max_length 🤗Transformers	1	2466	September 27, 2020

Where to set the batch size for text generation?

Related topics