Generate method during finetuning

aclifton314 · July 27, 2020, 5:58pm

I am inheriting a mode pre-trained model:

class GPT2FinetunedWithNgrams(GPT2LMHeadModel):
    @timer
    def __init__(self, config, model_tokenizer=None):
        super().__init__(config)
        self.tokenizer = GPT2Tokenizer.from_pretrained('gpt2', padding_side='right')
        self.tokenizer.pad_token = self.tokenizer.eos_token

and in the forward method during finetuning, I need to generate sequences from this model being finetuned:

def forward(
            self,
            input_ids=None,
            past=None,
            attention_mask=None,
            token_type_ids=None,
            position_ids=None,
            head_mask=None,
            inputs_embeds=None,
            labels=None,
            use_cache=True,
    ):
    beam_output = self.generate(
                           input_ids,
                           max_length=50,
                           num_beams=5,
                           early_stopping=True)
#Pass beam_output to different loss function and return loss

My question is, will using the generate method use the weights for the current model that is being finetuned or will it use static weights from some other GPT2 model?

Topic		Replies	Views
Loading finetuned model to generate text 🤗Transformers	12	3325	August 7, 2023
Encoder Decoder Model gives same generation results after finetuning 🤗Transformers	2	664	August 4, 2022
EncoderDecoderModel loaded from pre-trained checkpoints fails when calling generate 🤗Transformers	5	608	June 20, 2024
Issue with finetuning a seq-to-seq model 🤗Transformers	30	3962	August 11, 2022
Weird error when trying to generate response from fine-tuned model Beginners	1	206	April 2, 2024

Generate method during finetuning

Related topics