Text generation AI models generating repeated/duplicate text/sentences. What am I doing incorrectly? Hugging face models - Meta GALACTICA

anon89001014 · November 19, 2022, 8:52pm

Whole day I have worked with available text generation models

Here you can find list of them : Models - Hugging Face

I want to generate longer text outputs, however, with multiple different models, all I get is repetition.

What am I missing or doing incorrectly?

I will list several of them

Freshly released meta GALACTICA - facebook/galactica-1.3b · Hugging Face

The code example

from transformers import AutoTokenizer, OPTForCausalLM

tokenizer = AutoTokenizer.from_pretrained("facebook/galactica-1.3b")
model = OPTForCausalLM.from_pretrained("facebook/galactica-1.3b", device_map="auto")

 
input_text = "The benefits of deadlifting\n\n"
input_ids = tokenizer(input_text, return_tensors="pt").input_ids.to("cuda")

outputs = model.generate(input_ids,new_doc=False,top_p=0.7, max_length=1000)
print(tokenizer.decode(outputs[0]))

The generated output

Facebook opt - facebook/opt-350m · Hugging Face

The tested code

from transformers import GPT2Tokenizer, OPTForCausalLM

model = OPTForCausalLM.from_pretrained("facebook/opt-350m")
tokenizer = GPT2Tokenizer.from_pretrained("facebook/opt-350m")

prompt = "The benefits of deadlifting can be listed as below:"
inputs = tokenizer(prompt, return_tensors="pt")

# Generate
generate_ids = model.generate(inputs.input_ids, max_length=800)
tokenizer.batch_decode(generate_ids, skip_special_tokens=True, clean_up_tokenization_spaces=False)[0]

The generated output

ThomasG · January 16, 2023, 9:10pm

Does anyone have any solutions to suggest here?

Topic		Replies	Views
Text Generation, adding random words, weird linebreaks & symbols at random Beginners	5	982	May 24, 2021
Prevent repeat tokens in GPT2LMHeadModel text generation with max_new_tokens=1 Beginners	0	1115	November 19, 2021
Hugging Face Inference API returning short generated text with GPT-2 model Beginners	3	1709	July 18, 2023
How to generate multiple text completions per prompt (like vLLM) using HuggingFace Transformers Pipeline without triggering an error? Beginners	4	2614	May 12, 2024
Text Generation output keep repeat input sentences. Am I missing somethings Beginners	3	921	May 31, 2024

Text generation AI models generating repeated/duplicate text/sentences. What am I doing incorrectly? Hugging face models - Meta GALACTICA

Related topics