Infinity output from gpt2 model?

HuangLED · June 22, 2024, 6:16am

New to hugging face. Trying to use gpt2 model to generate some text, why the following code yields infinity result?

chatgpt says it might due to EOS not correct. I tried a few but does not help.

import torch
from transformers import GPT2LMHeadModel, GPT2Tokenizer

model = GPT2LMHeadModel.from_pretrained(“gpt2”, torchscript=True).eval()

tokenizer

tokenizer = GPT2Tokenizer.from_pretrained(“gpt2”)
in_text = “Lionel Messi is something”
in_tokens = torch.tensor(tokenizer.encode(in_text))

inference

#token_eos = torch.tensor([198]) # line break symbol
token_eos = torch.tensor([50256])
out_token = None
i = 0
with torch.no_grad():
while out_token != token_eos:
logits, _ = model(in_tokens)
out_token = torch.argmax(logits[-1, :], dim=0, keepdim=True)
in_tokens = torch.cat((in_tokens, out_token), 0)
text = tokenizer.decode(in_tokens)
print(f’step {i} input: {text}', flush=True)
i += 1

out_text = tokenizer.decode(in_tokens)
print(f’ Input: {in_text}‘)
print(f’Output: {out_text}’)

arnoldmatt · June 22, 2024, 2:17pm

Hey HuangLED,

It looks like your code might be getting stuck in an infinite loop because out_token may never match token_eos. You can try adding a maximum iteration limit to your loop to prevent it from running indefinitely. Here’s a modified version of your loop:

max_iterations = 100  # or any suitable number
i = 0
while out_token != token_eos and i < max_iterations:
    logits, _ = model(in_tokens.unsqueeze(0))  # Add batch dimension
    out_token = torch.argmax(logits[0, -1, :], dim=0, keepdim=True)
    in_tokens = torch.cat((in_tokens, out_token), 0)
    text = tokenizer.decode(in_tokens)
    print(f'step {i} input: {text}', flush=True)
    i += 1

HuangLED · June 22, 2024, 6:28pm

Thanks for the discussion, Matt.

I am not sure if it is the right thing to do. A hard cut off like this, will just lead to an incomplete sentence at last.

That does not seem a nature response to get I assume?

Topic		Replies	Views
GPT2 returns sequence of <\|endoftext\|> after finetuning 🤗Transformers	2	251	January 31, 2024
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation Beginners	5	46237	September 24, 2024
Text Generation using GPT2 Beginners	3	708	April 26, 2024
Repetitive words in model output Models	1	52	December 18, 2024
[Help appreciated] GPT2 Finetuning results in Only Padding output 🤗Transformers	2	1613	June 5, 2023

Infinity output from gpt2 model?

tokenizer

inference

Related topics