CUDA out of memory when using Trainer with compute_metrics

vishakha-lall · June 25, 2025, 4:57am

For anyone stuck with this problem in the case of Vision Transformers, here’s the corresponding function.

def preprocess_logits_for_metrics_fn(logits_tuple, labels):
     # Unpack logits tuple
    cls_logits = logits_tuple[1]
    box_preds = logits_tuple[2]

    # Detach and move to CPU (important for memory and multiprocessing)
    cls_logits = cls_logits.detach().cpu()
    box_preds = box_preds.detach().cpu()

    return (cls_logits, box_preds), labels

to be used in the Trainer as

trainer = Trainer(
    model=model,
    args=training_args,
    train_dataset=dataset["train"],
    eval_dataset=dataset["val"],
    processing_class=image_processor,
    data_collator=collate_fn,
    compute_metrics=eval_compute_metrics_fn,
    preprocess_logits_for_metrics=preprocess_logits_for_metrics_fn,
)

Topic		Replies	Views
Transformer Trainer no response when evaluate with compute_metrics 🤗Transformers	1	149	September 12, 2024
Cuda out of memory during evaluation but training is fine 🤗Transformers	12	17208	February 20, 2025
Adding compute_metrics produces Cuda OutOfMemoryError Beginners	0	125	May 22, 2024
Cuda out of memory while using Trainer API Beginners	1	1760	October 20, 2021
CUDA Out Of Memory when training a DETR Object detection model with compute_metrics 🤗Transformers	0	90	November 9, 2024

CUDA out of memory when using Trainer with compute_metrics

Related topics