Stopping criteria for Llama2 70b

anishAlapattu · July 25, 2023, 9:50am

I have used the following code for defining the stopping criteria for Llama2

from transformers import StoppingCriteria, StoppingCriteriaList

# define custom stopping criteria object
class StopOnTokens(StoppingCriteria):
    def __call__(self, input_ids: torch.LongTensor, scores: torch.FloatTensor, **kwargs) -> bool:
        for stop_ids in stop_token_ids:
            if torch.eq(input_ids[0][-len(stop_ids):], stop_ids).all():
                return True
        return False

stopping_criteria = StoppingCriteriaList([StopOnTokens()])

This is my stop_list = ['\nHuman: ', ‘\n```\n’, '\nAI: ', ‘\nQuestion’]
However to my question “Who is the CEO of Meta?”, llama2 doesn’t stop on any of these stop tokens.
Also attaching the code for conversion of tokens to longtensor

stop_token_ids = [tokenizer(x, return_tensors='pt')['input_ids'].squeeze() for x in stop_list]
stop_token_ids
stop_token_ids = [torch.LongTensor(x).to(device) for x in stop_token_ids]
stop_token_ids

Any help is appreciated! Thanks!

nghiemhnlp · October 19, 2023, 5:07pm

I think you have to add “add_special_token=False” to restrict the tokenization to the phrases only.

crouchcd · January 3, 2024, 11:11pm

Adding a link to add_special_tokens docs for reference. This fixed my problem, thanks!

Topic		Replies	Views
Implementing StoppingCriteria for Code Generating Transformers 🤗Transformers	2	2977	January 4, 2024
StoppingCriteria not working Beginners	0	220	November 30, 2023
Implimentation of Stopping Criteria List Beginners	24	30310	January 24, 2025
Stopping criteria for batch 🤗Transformers	7	4163	April 5, 2024
Stopping generation before max_new_tokens 🤗Transformers	0	791	June 1, 2023

Stopping criteria for Llama2 70b

Related topics