How to deploy Sagemaker Multi-model Endpoints on GPU?

CarlosAndrea · December 14, 2023, 1:23pm

Hello,

I’m trying to deploy Multi-model Endpoints by following : AWS-SageMaker-Examples/03_MultiModelEndpointWithHuggingFace/huggingface-sagemaker-multi-model-endpoint.ipynb at main · vinayak-shanawad/AWS-SageMaker-Examples · GitHub

I can deploy each model separately either on CPU or GPU.
I can deploy both model on a multi-model Endpoints on CPU, but as soon as I try to deploy them on GPU I get the following error :

ClientError: An error occurred (ValidationException) when calling the CreateModel operation: Your Ecr Image 763104351884.dkr.ecr.eu-central-1.amazonaws.com/huggingface-pytorch-inference:1.13.1-transformers4.26.0-gpu-py39-cu117-ubuntu20.04 does not contain required com.amazonaws.sagemaker.capabilities.multi-models=true Docker label(s)

Any help would be appreciated !

Topic		Replies	Views
When to use SageMaker multi model endpoint Amazon SageMaker	3	2742	November 16, 2022
Aws sagemaker multimodel endpoint Amazon SageMaker	1	950	February 2, 2023
Model works but MultiDataModel doesn't Amazon SageMaker	10	1110	August 18, 2021
Sagemaker multimodel endpoint Amazon SageMaker	1	480	February 2, 2023
How do I deploy a hub model to SageMaker and give it a GPU (not Elastic Inference)? Amazon SageMaker	4	3391	February 15, 2022

How to deploy Sagemaker Multi-model Endpoints on GPU?

Related topics