Api and parameters change from transofrmers 2.5.1 to 3.5.1 for GPT2

vikasRajashekar · January 4, 2021, 12:05pm

I am trying to use the code built-in version 2.5.1 with the following code:

Step1: Add special tokens and update the model
model -->GPT2DoubleHeadsModel
tokenizer–> GPT2Tokenizer

ATTR_TO_SPECIAL_TOKEN = {'bos_token': '<bos>', 'eos_token': '<eos>', 'pad_token': '<pad>',
                         'additional_special_tokens': ['<speaker1>', '<speaker2>']}
orig_num_tokens = len(tokenizer.encoder)
num_added_tokens = tokenizer.add_special_tokens(ATTR_TO_SPECIAL_TOKEN) 
if num_added_tokens > 0:
    model.resize_token_embeddings(new_num_tokens=orig_num_tokens + num_added_tokens)

And Training using the following code:

(lm_loss), (mc_loss), *_ = model(
            input_ids, token_type_ids=token_type_ids, mc_token_ids=mc_token_ids,
            mc_labels=mc_labels, lm_labels=lm_labels
        )

Now my question is:

When I look at the current documentation the parameters lm_labels seems to be changed to labels,
Also the way GPT2 model returns loss is different.
Is the API for adding new tokens still valid for 3.5.1 ?
How do I find these?

Topic		Replies	Views
GPT2Tokenizer not putting bos/eos token Intermediate	3	5476	March 31, 2024
Can't load tokenizer with added special tokens 🤗Transformers	0	824	March 29, 2022
Importance of ignoring special tokens in loss function Beginners	0	950	December 1, 2022
How to efficiently tokenize unknown tokens in GPT2 Intermediate	0	1009	January 12, 2022
2 possible bugs for adding new tokens to T5 🤗Transformers	3	1318	June 25, 2024

Api and parameters change from transofrmers 2.5.1 to 3.5.1 for GPT2

Related topics