CUDA Out of Memory Error When Training Specific Layers

Pankaj8922 · November 2, 2024, 3:07am

If reducing ‘max_len’ doesn’t resolve the issue, then try enabling gradient checkpointing (in the correct sequence)

# Enable gradient checkpointing
model.gradient_checkpointing_enable()

# Freeze all parameters first
for param in model.parameters():
    param.requires_grad = False

# Unfreeze specific layers
layers_to_unfreeze = list(range(33, 39))
for i in layers_to_unfreeze:
    for param in model.model.layers[i].parameters():
        param.requires_grad = True

Topic		Replies	Views
Training out of memory 🤗Transformers	0	231	July 18, 2024
Mistral-7B-v0.1 finetuning results in Out-of-Memory after some iterations Models	2	1205	January 19, 2024
Out of memory error when using trainer & output_hidden_states 🤗Transformers	0	711	January 10, 2023
CUDA Out of Memory while fine-tuning even with LoRA Models	6	3390	April 12, 2024
CUDA Out of Memory Error SFTTrainer 🤗Transformers	1	175	February 16, 2025

CUDA Out of Memory Error When Training Specific Layers

Related topics