KeyError: 'loss' when fine-tuning a Transformer model

ryedida · February 20, 2022, 8:44pm

I am trying to fine tune a transformer model on my own unlabeled corpus of text. My code for doing this is:

from datasets import load_dataset
from transformers import BertTokenizerFast
from transformers import AutoModel
from transformers import TrainingArguments
from transformers import Trainer
import glob
import os


base_path = '../data/'
model_name = 'bert-base-uncased'
max_length = 512
checkpoints_dir = 'checkpoints'

if not os.path.exists(checkpoints_dir):
    os.mkdir(checkpoints_dir)

tokenizer = BertTokenizerFast.from_pretrained(model_name, do_lower_case=True)


def tokenize_function(examples):
    return tokenizer(examples['text'], padding='max_length', truncation=True, max_length=max_length)


dataset = load_dataset('text',
        data_files={
            'train': f'{base_path}train.txt',
            'test': f'{base_path}test.txt',
            'validation': f'{base_path}valid.txt'
        }
)

print('Tokenizing data. This may take a while...')
tokenized_dataset = dataset.map(tokenize_function, batched=True)
train_dataset = tokenized_dataset['train']
eval_dataset = tokenized_dataset['test']

model = AutoModel.from_pretrained(model_name)

training_args = TrainingArguments(checkpoints_dir)

trainer = Trainer(model=model, args=training_args, train_dataset=train_dataset, eval_dataset=eval_dataset)
trainer.train()

However, I get KeyError: 'loss' when running the code at trainer.train(). How do I fix this?

beneyal · February 20, 2022, 9:25pm

Hello!

Make sure your dataset has a "labels" column, otherwise the Trainer won’t recognize the labels and won’t calculate a loss.

ryedida · February 20, 2022, 9:36pm

Thanks for the swift reply, @beneyal! I don’t have labels in my data, since my end goal is to simply fine-tune the weights and use it for multiple tasks (but primarily for generating embeddings). How can I achieve that?

beneyal · February 20, 2022, 9:43pm

No problem, you’re very welcome!

Even if you just want to fine-tune the embedding weights, you need some kind of labelled dataset so that a loss will be calculated and the errors propagated. If you don’t have a labelled dataset for some specific downstream task, you can always go for Masked Language Modeling or Causal Language Modeling pre-training routines.

ryedida · February 21, 2022, 5:30pm

Thanks a lot! Using the MLM tutorials helped me fix this!

vinrok · July 11, 2022, 11:10am

Hi @ryedida,

Could you please guide me on this? I am also facing the same issue and I am using MLM method.

Here is the link - Google Colab

Thanks.

ryedida · July 12, 2022, 2:36am

Here is my final code; hopefully, this helps you out.

vinrok · July 12, 2022, 8:12pm

Hi @ryedida,

I am really grateful for your timely response but what to do after that?

As I want to perform semantic search based on the embeddings obtained by training model on my custom dataset.

Kindly guide me.

Thanks.

Topic		Replies	Views
Why am I getting KeyError: 'loss'? Beginners	9	16461	March 17, 2023
`KeyError: 'eval_loss'` when using Trainer with BertForQA 🤗Transformers	7	7340	September 14, 2022
KeyError: 'loss' during Fine Tuning bert-base-italian-cased for QA Beginners	3	1321	June 8, 2021
KeyError: 'test' when trying to divide a custom dataset into train and test for fine-tuning 🤗Transformers	0	559	July 22, 2022
Loss error for bert token classifier Beginners	11	502	December 4, 2021

KeyError: 'loss' when fine-tuning a Transformer model

Related topics