Repetitive words in model output

tempdeltavalue · December 18, 2024, 11:46am

import torch 
from transformers import GPT2Tokenizer, GPT2LMHeadModel

model_name = "gpt2" #output_dir #
tokenizer = GPT2Tokenizer.from_pretrained(model_name, padding_side='left', add_eos_token=True) #gpt2
llm_model = GPT2LMHeadModel.from_pretrained(model_name) # gpt2
device = torch.device('cuda')
llm_model.to(device)

tokenizer.pad_token = tokenizer.eos_token

# Configure the model
llm_model.config.pad_token_id = tokenizer.eos_token_id
llm_model.config.eos_token_id = tokenizer.eos_token_id
llm_model.config.vocab_size = llm_model.config.vocab_size + len(tokenizer.get_added_vocab())
llm_model.resize_token_embeddings(len(tokenizer))
llm_model.config.pad_token_id = tokenizer.pad_token_id

print(tokenizer.eos_token_id)

result

github issue

tempdeltavalue · December 18, 2024, 1:02pm

Topic		Replies	Views
GPT2 returns sequence of <\|endoftext\|> after finetuning 🤗Transformers	2	248	January 31, 2024
Generating [PAD] tokens during GPT2 inference Intermediate	0	1423	August 22, 2022
GPT-2 trained models output repeated "!" Beginners	2	2797	December 20, 2021
Infinity output from gpt2 model? Beginners	2	153	June 22, 2024
P-tuned Phi-2 produces open ended, repeating, responses Beginners	2	177	May 24, 2024

Repetitive words in model output

Related topics