Deploying Huggingface Sagemaker Models with Elastic Inference

philschmid November 8, 2022, 6:59am 22

you can check out this blog post on how to compile and deploy models to Inferentia: Accelerate BERT inference with Hugging Face Transformers and AWS Inferentia

1 Like

Topic		Replies	Views
Inference failed for FLAN-UL2(20B) on SageMaker Amazon SageMaker	6	2166	April 4, 2023
About the Amazon SageMaker category Amazon SageMaker	25	4102	August 5, 2021
Deploying TheBloke/Luna-AI-Llama2-Uncensored-GGML Amazon SageMaker	0	844	September 11, 2023
Emotion Model: Additional inference parameter not processed in Sagemaker inferentia instance Amazon SageMaker	1	278	July 17, 2023
How do I deploy a hub model to SageMaker and give it a GPU (not Elastic Inference)? Amazon SageMaker	4	3380	February 15, 2022