T5 decoder predicting tokens even after hitting end of sequence token, i.e </s>

nielsr · February 26, 2024, 2:46pm

No that seems correct, so the model has generated the end of sequence token (with ID=1), after which generation stops. One usually provides skip_special_tokens=True as well to the batch_decode method in order to skip special tokens (like end of sequence, or padding tokens):

generated_text = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]

Topic		Replies	Views
SEBIS{URGENT},ValueError: You have to specify either decoder_inputs or decoder_inputs_embeds Models	3	1207	January 1, 2021
[Urgent] trainer.predict() and model.generate creates totally different predictions 🤗Transformers	4	6934	February 1, 2021
T5 forward pass versus generate, latter outputs non-sense Beginners	8	2914	March 25, 2021
What to use for the target input in the decoder for autoregressive usage 🤗Transformers	5	4140	September 16, 2021
T5 tokenizer's post-processor is suboptimal for truncated sequences for seq2seq finetuning 🤗Transformers	0	336	July 5, 2023

T5 decoder predicting tokens even after hitting end of sequence token, i.e </s>

Related topics