Ensure sentence completion at "."

ffer · March 31, 2023, 11:18am

Hello I’m trying to avoid output truncation during text summarization. I’ve been tuning parameters of the .generate() function such as max_length, num_beams, early_stopping…

I found out I could use StoppingCriteriaList class to specify that I want to stop generation when a dot (.) is generated but apparently this is ignored since I sometimes get an output with two sentences (ending in dot). This is my code so far:

from transformers import StoppingCriteriaList

def my_stopping_criteria(output):
    if output!=None:
        if "." in output["generated_text"]:
            return True
        
stopping_criteria = StoppingCriteriaList([lambda self, output: my_stopping_criteria(output)])

inputs = tokenizer(texto, return_tensors="pt").input_ids
outputs = model.generate(inputs, max_length = 1000, stopping_criteria=stopping_criteria, num_beams = 3, no_repeat_ngram_size=2, early_stopping=False)
tokenizer.decode(outputs[0],skip_special_tokens=True)

In the end I simply want my output not being truncated. Does anyone know how to achieve that while doing text summarization?

Topic		Replies	Views
Ensure the sentence is complete during generation 🤗Transformers	6	7058	July 28, 2025
Output truncation of summaries models 🤗Transformers	0	441	March 30, 2023
How to set stopping criteria in model.generate() when a certain word appears 🤗Transformers	3	3721	February 18, 2024
How to stop after generating "###" in transformers? Beginners	0	852	May 3, 2023
Implimentation of Stopping Criteria List Beginners	24	30397	January 24, 2025

Ensure sentence completion at "."

Related topics