Trainer and TrainingArguments - gradual unfreezing

petarulev · May 10, 2022, 3:44pm

Hello!
Since further pre-training BERT might suffer from catastrophic forgetting, I am wondering, is it possible to use gradual unfreezing somehow with the Trainer module? I could do it with PyTorch and a classical training loop, but I was looking if you already have it implemented in the Trainer class.

petarulev · May 11, 2022, 8:58am

or TrainingArguments class.

muhtasham · August 25, 2022, 10:52am

I think you can add SkipConnection to avoid Catastrophing forgetting in for ex BERT. It should be possible by subclassing and modifying main class, but I don’t know how to do that

class BertForMultilabelSequenceClassification(BertForSequenceClassification):
....

Topic		Replies	Views
How to freeze layers using trainer? Beginners	11	31976	May 26, 2024
Gradual Unfreezing support for Fine tuning models 🤗Transformers	3	3933	August 26, 2020
The point of using pretrained model if I don't freeze layers Beginners	1	8514	May 31, 2023
Freezing layers when using gradient checkpointing 🤗Transformers	0	709	March 20, 2022
Finetuning Bert to adapt to the newly added class 🤗Transformers	0	81	June 22, 2024

Trainer and TrainingArguments - gradual unfreezing

Related topics