Serveless memory problem when deploy Wav2Vec2 with custom inference code

philschmid · May 26, 2022, 8:03am

Are you providing the model via s3 uri or hub configuration. You have to provide it via s3://path as model_data since the hub configuration is not loading the kenlm model.

Topic		Replies	Views
Deploying Open AI's whisper on Sagemaker Amazon SageMaker	54	16200	April 12, 2024
How to deploy Whisper for other languages to Sagemaker? Amazon SageMaker	0	307	February 5, 2024
Sagemaker Serverless Inference Amazon SageMaker	22	9021	May 22, 2024
Inference failed for FLAN-UL2(20B) on SageMaker Amazon SageMaker	6	2166	April 4, 2023
How to create Wav2Vec2 With Language model 🤗Transformers	15	5988	May 5, 2023

Serveless memory problem when deploy Wav2Vec2 with custom inference code

Related topics