Metric while training and after one are different

dimka11 · November 23, 2022, 12:34pm

I train model via transformers Trainer.
metrics log:

`StepTraining LossValidation LossF1`
`1000.2453000` `.1961280.925541`
`2000.1796000` `.3073770.900455`
`3000.1672000` `.2677220.903617`
`4000.0719000` `.1359580.959697`
`5000.1298000` `.2042290.948185`
`6000.0349000` `.2202260.943453`
`7000.0753000` `.2094510.941723`
`8000.0617000` `.1527000.946293`
`9000.0511000` `.1243610.959392`
`10000.0469000` `.1567110.959658`
`11000.0770000` `.1678610.955440`
`12000.0807000` `.1479730.971185`
`13000.0389000` `.1390290.962280`
`14000.0441000` `.1545020.967336`

After training the best model was loaded, from log:

Loading best model from ./results_swin/checkpoint-1200 (score: 0.9711846590298694).

I make predict on validation part of the dataset, which I did use while training as eval_dataset:

val_preds = trainer.predict(dataset['test'])
val_preds.metrics['test_f1']

And metric is so small:

0.957392790742415

Why did that happened?

Topic		Replies	Views
Evaluation results (metric) during training is different from the evaluation results at the end 🤗Transformers	4	3224	September 26, 2022
Trainer predict or evaluate returns zero for metrics 🤗Transformers	0	55	July 11, 2024
Metrics for Training Set in Trainer 🤗Transformers	11	26534	March 14, 2025
Trainer API to log both Training and Validation Metrics 🤗Transformers	2	1680	July 1, 2021
[HELP] Model Evaluation for NER yields different results (sklearn vs metric.compute()) 🤗Transformers	3	2720	January 31, 2023

Metric while training and after one are different

Related topics