How to set 'max_length' properly when using pipeline?

not-lain · November 18, 2024, 11:23pm

prompt = 'What is the answer of 1 + 1?'
pipe = pipeline(
            "text-generation",
            tokenizer=tokenizer,
            model=model,
            do_sample=True,
            truncation=True,
            padding='max_length',
            num_return_sequences=2,
            temperature=1.0,
            num_beams=1,
            max_length=1024,
            max_new_tokens=512,
        )
messages = [
    {"role": "user", "content": prompt},
]
-ret = pipe(messages)
+ret = pipe(messages, max_length= 1024)

also pretty sure all of these prameters are used in the generation and not in the initialization

Topic		Replies	Views
Pipeline max_length 🤗Transformers	2	3826	February 23, 2024
Tokenizer behaviour with pipeline 🤗Tokenizers	0	923	August 1, 2023
Issue with max_length 🤗Transformers	1	2467	September 27, 2020
Limit max # of tokens for inference in pipeline? Beginners	0	1080	April 7, 2023
Getting error even after setting the max_length Beginners	1	2057	November 30, 2023

How to set 'max_length' properly when using pipeline?

Related topics