Number of tokens (2331) exceeded maximum context length (512) error.Even when model supports 8k Context length

Professor-Hunt · November 15, 2023, 8:48pm

This worked for me:

llm = AutoModelForCausalLM.from_pretrained("TheBloke/zephyr-7B-beta-GGUF", 
                                           model_file="zephyr-7b-beta.Q5_K_M.gguf", 
                                           model_type="mistral", 
                                           gpu_layers=50,
                                           max_new_tokens = 1000,
                                           context_length = 6000)

No warnings output.

Topic		Replies	Views
Fine tuned Mistral 7B inference issue for >4k context length token with transformer 4.35+ 🤗Transformers	0	546	December 11, 2023
Scaling Mistral-7B on AWS SageMaker With Multiple Replica Endpoints Intermediate	0	615	January 19, 2024
Setting up Mistral on Inferentia2 with higher number of tokens Beginners	0	36	September 25, 2024
ValidationError: Max token limit(>=1) reached for finetuned models Amazon SageMaker	3	723	December 28, 2023
LLM with 1048k hosted on sagemaker Amazon SageMaker	0	34	September 11, 2024

Number of tokens (2331) exceeded maximum context length (512) error.Even when model supports 8k Context length

Related topics