Fairseq MMS HuggingFace model deployment

sane-pike · June 13, 2023, 1:44pm

I have been trying to deploy the Fairseq MMS model onto AWS Sagemaker and I keep running into error code: 500 when trying to predict the asr for an audio file.

The detailed error:

An error occurred (ModelError) when calling the InvokeEndpoint operation: Received server error (500) from primary with message "{
  "code": 500,
  "type": "InternalServerException",
  "message": "Worker died."
}

My driver code:

# initialize model
huggingface_model = HuggingFaceModel(
    transformers_version='4.26.0',
    pytorch_version='1.13.1',
    py_version='py39',
    env=hub,
    role=role, 
)

# deploy model
predictor = huggingface_model.deploy(
    initial_instance_count=1, # number of instances
    instance_type='ml.m5.xlarge' # ec2 instance type
)
 
# add serializer for audio files   
predictor.serializer = DataSerializer(content_type='audio/x-audio')

audio_path="test.flac"

# read audio file
with open("test.flac", "rb") as f:
    data = f.read()

#transcribe
predictor.predict(data)

The error occurs at predictor.predict(data)

oonyalo · November 23, 2023, 4:30am

Did you resolve this? I have a very similar issue.

Topic		Replies	Views
Modelerror when deploying openchat3.5 Amazon SageMaker	0	223	April 2, 2024
Getting error in the inference stage of Transformers Model (Hugging Face) 🤗Transformers	0	781	October 11, 2022
Calling Sagemaker Endpoint for fine-tuned summarization model Amazon SageMaker	15	5068	March 22, 2024
Deploying a conversational pipeline on AWS Amazon SageMaker	9	4294	July 13, 2023
Deploying Open AI's whisper on Sagemaker Amazon SageMaker	54	16161	April 12, 2024

Fairseq MMS HuggingFace model deployment

Related topics