How do I increase max_new_tokens

Wi1 · August 19, 2023, 1:15am

@gkrishnan I’m late to the post but you can always manually pass in the model/pipeline:

from transformers import pipeline, AutoModelForCausalLM, AutoTokenizer
from langchain.llms import HuggingFacePipeline

model = AutoModelForCausalLM.from_pretrained(model_path)
tokenizer = AutoTokenizer.from_pretrained(model_path)
gen = pipeline('text-generation', model=model, tokenizer=tokenizer, max_new_tokens=200)

llama_llm = HuggingFacePipeline(pipeline=gen)

Topic		Replies	Views
Confused about max_length and max_new_tokens 🤗Transformers	7	35487	September 5, 2024
Token restriction via the Huggin face API Beginners	1	126	October 16, 2024
"What’s the Difference Between max_length and max_new_tokens?" 🤗Transformers	0	551	September 5, 2024
How to set 'max_length' properly when using pipeline? 🤗Transformers	4	1342	November 18, 2024
Error when increasing max_length for tokenizer - OverflowError: out of range integral type conversion attempted 🤗Transformers	0	465	April 18, 2024

How do I increase max_new_tokens

Related topics