Seq2SeqTrainingAguments

qqqube · January 26, 2023, 2:43pm

I’m a little confused about the purpose of predict_with_generate. My training losses are always better when I set this to true but I’m under the impression that it’s not supposed to affect training at all.

Also, if I do not specify a compute_metrics function in the Seq2SeqTrainer but keep predict_with_generate set to True, are the training/validation losses computed differently?

Topic		Replies	Views
Using Seq2SeqTrainer for decoders? 🤗Transformers	0	86	December 25, 2024
What does "generate_with_predict=True" actually do? 🤗Transformers	3	9823	July 28, 2021
How does generation work with compute_metrics Intermediate	0	370	December 9, 2023
Seq2SeqTrainer produces error during validation when using T5 🤗Transformers	0	137	March 18, 2024
Trainer vs seq2seqtrainer 🤗Transformers	4	15058	November 15, 2024

Seq2SeqTrainingAguments

Related topics