Eval Loss spike Seq2seq Trainer Resume from Checkpoint

MillyXXX · June 22, 2021, 2:42pm

I ran Trainer.train(resume_from_checkpoint = True). The eval loss spiked from 1.x to 5.x, but training loss is decreasing consistently, any possible reasons for this? Thanks

Topic		Replies	Views
Resume training from checkpoint Beginners	1	3037	January 5, 2023
Cannot Resume Training Beginners	1	1375	December 15, 2020
Saving eval loss for every evaluation/saved checkpoint with Trainer 🤗Transformers	2	2732	October 4, 2021
Training Reproducibility when resuming from checkpoint 🤗Transformers	0	349	September 30, 2022
Evaluate model at saved checkpoint 🤗Transformers	0	1295	June 22, 2021

Eval Loss spike Seq2seq Trainer Resume from Checkpoint

Related topics