Error when deploying GPT4-Alpaca on Sagemaker via HF model hub

philschmid · June 7, 2023, 12:17pm

This will not work for gpt4-x-alpaca-13b-native-4bit-128g since it requires the GPTQ package. Therefore you need to create a custom infernece.py script and add the latest transforemrs version + gptq with a requirements.txt

Topic		Replies	Views
Vicuan error on Sagemaker Amazon SageMaker	3	844	October 23, 2024
Deployment issue on Sagemaker Amazon SageMaker	16	3401	October 4, 2023
Getting error in the inference stage of Transformers Model (Hugging Face) 🤗Transformers	0	790	October 11, 2022
Error loading finetuned llama2 model while running inference Amazon SageMaker	27	4874	September 20, 2023
Error hosting endpoint when deploying model Amazon SageMaker	2	3108	March 27, 2024

Error when deploying GPT4-Alpaca on Sagemaker via HF model hub

Related topics