Freeze Deberta Layers

alejopaullier · August 5, 2023, 10:03pm

I am trying to freeze deberta-v3-small layers. I first froze 4 blocks with:

NUM_FROZEN_LAYERS = 83 # <--- This index correspond to last layer of block 4

for i,(name, param) in enumerate(list(model.named_parameters())\
                                 [0:NUM_FROZEN_LAYERS]):
    param.requires_grad = False

This works fine. However, I later wanted to freeze 6 blocks (up to layer number 115) and the following error was raised:

RuntimeError: element 0 of tensors does not require grad and does not have a grad_fn

I played around and found out that after layer number 103 this error starts appearing. This layer is model.encoder.layer.6.attention.self.value_proj.weight.

This looks very random. Does anyone know why is this happening and if there is another way to freeze certain blocks? Maybe I am not doing it the right way.

Topic		Replies	Views
Freezing layers with SFTTrainer Intermediate	2	268	March 8, 2025
How to freeze some layers of BertModel Beginners	8	17523	August 25, 2022
Freezing layers when using gradient checkpointing 🤗Transformers	0	707	March 20, 2022
How to freeze layers while fine-tuning? 🤗Transformers	2	136	May 16, 2025
Distributed fine-tuning with frozen embedding layers Beginners	0	910	August 16, 2022

Freeze Deberta Layers

Related topics