Serveless memory problem when deploy Wav2Vec2 with custom inference code

philschmid · May 23, 2022, 7:58pm

I think this wouldn’t solve the missing KenLM model. What you could do is use os.system('install kenlm') at the top of your inference.py to install it on start up (needs to finish under 2 min/ i am not sure what the behavior is for serverless)

Topic		Replies	Views
Deploying Open AI's whisper on Sagemaker Amazon SageMaker	54	16200	April 12, 2024
How to deploy Whisper for other languages to Sagemaker? Amazon SageMaker	0	307	February 5, 2024
Sagemaker Serverless Inference Amazon SageMaker	22	9021	May 22, 2024
Inference failed for FLAN-UL2(20B) on SageMaker Amazon SageMaker	6	2166	April 4, 2023
How to create Wav2Vec2 With Language model 🤗Transformers	15	5988	May 5, 2023

Serveless memory problem when deploy Wav2Vec2 with custom inference code

Related topics