Repetitive Generations

Chahnwoo · April 29, 2024, 12:54am

What are some ways to reduce repetitive generations (same phrase repeated over and over) in large language models?

Here are some of the details on what I’ve tried so far:

Currently using the LangChain integration of VLLM
Tried generation parameters like frequency_penalty and presence_penalty without much luck
Currently using the default greedy sampling method of generation (not using beam search)
Fine-tuned a pre-trained language model for question-answering (QLoRA)
- Set labels for fine-tuning data by masking everything but the ideal generations
Korean model

Is there maybe a way of fine-tuning LLMs to guide them away from repetitive generations?

If anyone has any tips or tricks that I could try, I would appreciate any help.

Topic		Replies	Views
Text generation, LLMs and fine-tuning Beginners	0	1692	December 8, 2022
Repetitive Answers From Fine-Tuned LLM Models	9	1141	March 28, 2025
Primer on Fine Tuning Text generation models (like GPT) Intermediate	0	1386	November 14, 2022
Prevent repeat tokens in GPT2LMHeadModel text generation with max_new_tokens=1 Beginners	0	1115	November 19, 2021
Seeking Advice on Fine-Tuning LLMs for Generating Documents Beginners	1	119	February 15, 2025