Shockingly Incorrect Evaluate Function in Huggingface API

Sayan01 · November 2, 2023, 4:08pm

Two different accuracy, one from manual evaluation and one using huggingface’s trainer function. They are completely different. I am shocked

muellerzr · November 2, 2023, 4:25pm

You are calling drop_last in your eval dataloader, which in general you should never do. Does not doing so fix this?

Topic		Replies	Views
Huggingface Trainer eval while training 🤗Transformers	1	741	December 31, 2022
Evaluation metrics 🤗Transformers	1	2018	November 16, 2020
I am getting bad performance when evaluating on Huggingface test dataset (GLUE dataset) 🤗Transformers	0	299	October 26, 2021
Eval Steps after warm-up 🤗Transformers	0	253	August 7, 2021
Trainer .evaluate() method returns one less prediction, but training runs fine (GPT-2 fine-tuning) Beginners	2	1817	November 14, 2022