Serveless memory problem when deploy Wav2Vec2 with custom inference code

diegoseto · May 19, 2022, 3:34pm

No, i mean the use of a language model to boosting wav2vec2 decoding as described by @patrickvonplaten here How to create Wav2Vec2 With Language model, but in Amazon Sagemaker (serveless). In this topic @philschmid suggested using custom inference script, but i’m having problems as mentioned above.

There is another option to use a language model without a custom inference script?

Topic		Replies	Views
Sagemaker Serverless Inference for LayoutLMv2 model Amazon SageMaker	17	4401	June 15, 2022
Transformers 4.9.0 on SageMaker Amazon SageMaker	12	1978	March 25, 2022
Inference failed for FLAN-UL2(20B) on SageMaker Amazon SageMaker	6	2181	April 4, 2023
Deploying Open AI's whisper on Sagemaker Amazon SageMaker	54	16252	April 12, 2024
How to deploy Whisper for other languages to Sagemaker? Amazon SageMaker	0	309	February 5, 2024

Serveless memory problem when deploy Wav2Vec2 with custom inference code

Related topics