Serveless memory problem when deploy Wav2Vec2 with custom inference code

diegoseto · May 23, 2022, 8:32pm

I tried this but i’m still getting the same result.

inference.py:

import os
from transformers import pipeline

os.system('install kenlm')

def model_fn(model_dir):

    pipe = pipeline('automatic-speech-recognition', model_dir, chunk_length_s = 10)
    
    return pipe

Topic		Replies	Views
Deploying Open AI's whisper on Sagemaker Amazon SageMaker	54	16200	April 12, 2024
How to deploy Whisper for other languages to Sagemaker? Amazon SageMaker	0	307	February 5, 2024
Sagemaker Serverless Inference Amazon SageMaker	22	9021	May 22, 2024
Inference failed for FLAN-UL2(20B) on SageMaker Amazon SageMaker	6	2166	April 4, 2023
How to create Wav2Vec2 With Language model 🤗Transformers	15	5988	May 5, 2023

Serveless memory problem when deploy Wav2Vec2 with custom inference code

Related topics