Serveless memory problem when deploy Wav2Vec2 with custom inference code

diegoseto · May 26, 2022, 7:09pm

I’m providing the model via s3

from sagemaker.huggingface.model import HuggingFaceModel
from sagemaker.serializers import DataSerializer

# create Hugging Face Model Class
huggingface_model = HuggingFaceModel(
	transformers_version='4.17.0',
	pytorch_version='1.10.2',
	py_version='py38',
	model_data='s3://sagemaker-us-east-2-094463604469/model.tar.gz',
	role=role, 
)

Topic		Replies	Views
Deploying Open AI's whisper on Sagemaker Amazon SageMaker	54	16200	April 12, 2024
How to deploy Whisper for other languages to Sagemaker? Amazon SageMaker	0	307	February 5, 2024
Sagemaker Serverless Inference Amazon SageMaker	22	9021	May 22, 2024
Inference failed for FLAN-UL2(20B) on SageMaker Amazon SageMaker	6	2166	April 4, 2023
How to create Wav2Vec2 With Language model 🤗Transformers	15	5988	May 5, 2023

Serveless memory problem when deploy Wav2Vec2 with custom inference code

Related topics