Setting requires_grad=False seems not saving GPU memory usage

sbchoi · January 18, 2024, 7:43am

related to this topic,

from transformers import (
AutoModelForObjectDetection,
)
model = AutoModelForObjectDetection.from_pretrained(
‘jozhang97/deta-swin-large’,
)
for n, i in model.model.backbone.named_parameters():
# i.eval()
i.requires_grad = False
model.model.level_embed.requires_grad = False

However, training with transformers trainer is not reducing GPU memory. Both requires_grad = False give both 23GB usage of VRAM.
Any recommendation? Or is this related accelerate?

Topic		Replies	Views
Trainer() and required_grad=false 🤗Transformers	1	279	January 18, 2024
How to freeze layers while fine-tuning? 🤗Transformers	2	220	May 16, 2025
Gradual Unfreezing support for Fine tuning models 🤗Transformers	3	3943	August 26, 2020
Increasing VRAM Usage with Transformers Trainer Leads to OOM on GPUs 🤗Transformers	2	1076	March 29, 2024
No benefit from turning on gradient_checkpointing: True 🤗Transformers	1	174	October 24, 2024

Setting requires_grad=False seems not saving GPU memory usage

Related topics