Error loading finetuned llama2 model while running inference

guiba44 · August 24, 2023, 8:57am

Did you manage to run it with your own data ? I encountered the error reported in this thread when trying to deploy mine QLoRA trained LLaMA2 13B deployment error on Sagemaker using text generation inference image - #12 by rycfung…

[EDIT] I managed to run it on my own model: for a Llama2 13B, you need to deploy on an ml.g5.12xlarge (which is a bit weird considering you can run inference on a notebook deployed on ml.g5.2xlarge ).

Topic		Replies	Views
ValueError: Could not load model /opt/ml/model with any of the following classes: (<class 'transformers.models.auto.modeling_auto.AutoModelForCausalLM'>, <class 'transformers.models.llama.modeling_llama.LlamaForCausalLM'>) Amazon SageMaker	0	399	March 13, 2024
QLoRA trained LLaMA2 13B deployment error on Sagemaker using text generation inference image Amazon SageMaker	14	2993	August 18, 2023
Inference failed for FLAN-UL2(20B) on SageMaker Amazon SageMaker	6	2179	April 4, 2023
Error hosting endpoint when deploying model Amazon SageMaker	2	3079	March 27, 2024
Sagemaker deployment fails for local llama2 model Amazon SageMaker	3	2305	August 17, 2023

Error loading finetuned llama2 model while running inference

Related topics