Text Generation using GPT2

ainoob101 · March 21, 2021, 4:56am

I am trying to generate text using GPT2. I am using the code snippet at https://huggingface.co/transformers/quickstart.html (reproduced below). Unfortunately, it gives an error

import torch

tokenizer = GPT2Tokenizer.from_pretrained("gpt2")
model = GPT2LMHeadModel.from_pretrained('gpt2')

generated = tokenizer.encode("The Manhattan bridge")
context = torch.tensor([generated])
past = None

for i in range(100):
print(i)
output, past = model(context, past=past)
token = torch.argmax(output[..., -1, :])

generated += [token.tolist()]
context = token.unsqueeze(0)
sequence = tokenizer.decode(generated)

print(sequence)

Error is in the line token = torch.argmax(output[0, -1, :]), saying that TypeError: string indices must be integers. Can someone please help me out?

baldwindc · April 26, 2023, 12:45am

2 years late, but did you find a solution?

ainoob101 · April 26, 2024, 4:41am

No, unfortunately I didn’t…

ImranzamanML · April 26, 2024, 11:16am

Please use this code for the text generation. make sure you have transformer and torch is installed.

pip install torch
pip install transformers

import torch
from transformers import GPT2Tokenizer, GPT2LMHeadModel

tokenizer = GPT2Tokenizer.from_pretrained("gpt2")
model = GPT2LMHeadModel.from_pretrained("gpt2")
generated = tokenizer.encode("The Manhattan bridge", return_tensors='pt')
output_sequences = model.generate(
    input_ids=generated,
    max_length=150,  
    num_return_sequences=1,
    no_repeat_ngram_size=2,
    temperature=0.7,
    top_k=50,
    top_p=0.95,
    pad_token_id=tokenizer.eos_token_id
)

text = tokenizer.decode(output_sequences[0], skip_special_tokens=True)
print(text)

Note: You can fine tune the parameters for the best answer specially temperature.
Hope at least you got answer even after 3 years
I just look your post and thought to answer you.

Topic		Replies	Views
IndexError: index out of range in self - Text Generation with GPT2 Beginners	2	5792	November 27, 2023
Is it possible to generate GPT2 output without an input prompt text Beginners	5	4410	March 14, 2021
Model.generate() -- IndexError: too many indices for tensor of dimension 2 Beginners	3	6096	November 4, 2021
Error on later checkpoint when doing generation using TextGenerationPipeline 🤗Transformers	1	929	August 8, 2023
Infinity output from gpt2 model? Beginners	2	153	June 22, 2024

Text Generation using GPT2

Related topics