How calculate loss.backward() in MLM by PyTorch

MahdiA · December 29, 2021, 10:43pm

I am going to train an MLM model by pytorch, but in the training part, I do not know how to calculate the
loss.backward.

model_name = "distilbert-base-uncased"

model = AutoModelForMaskedLM.from_pretrained(model_name, max_length=256,  return_dict=True)

model.train()
device = torch.device("cpu")

for epoch in range(epochs):
    loop = tqdm(dataloader)
    for batch in loop:
        optimizer.zero_grad()
        
        input_ids = batch['input_ids'].to(device)
        labels = batch['labels'].to(device)
        attention_mask = batch['attention_mask'].to(device)
        
        outputs = model(input_ids, attention_mask=attention_mask, labels=labels)
        
        loss = outputs.loss
        loss.backwards()
        optimizer.step()

@lewtun

lewtun · January 21, 2022, 2:29pm

Hey @MahdiA what you have looks pretty close - I think you just need loss.backward() instead of loss.backwards()

Does that solve your issue?

Topic		Replies	Views
How loss is calculated in MLM training 🤗Transformers	0	847	April 1, 2022
Trainer code for token-wise prediction model Intermediate	0	436	June 6, 2022
Question about loss computing in training masked-language-model Beginners	0	327	March 17, 2022
How to build a classifier on top of trained MLM Beginners	0	357	June 3, 2022
Masked language modeling loss 🤗Transformers	1	4578	August 13, 2020

How calculate loss.backward() in MLM by PyTorch

Related topics