Deploying Open AI's whisper on Sagemaker

sohoha · November 4, 2022, 8:29am

@thusken
According to this notebook, you should specify DataSerializer to serialize data.

hub = {
	'HF_MODEL_ID':'openai/whisper-base',
	'HF_TASK':'automatic-speech-recognition'
}


# create Hugging Face Model Class
huggingface_model = HuggingFaceModel(
    model_data = s3_location,
	transformers_version='4.17.0',
	pytorch_version='1.10.2',
	py_version='py38',
	env=hub,
	role=role, 
)

# deploy model to SageMaker Inference
audio_serializer = DataSerializer(content_type='audio/x-audio')
predictor = huggingface_model.deploy(
	initial_instance_count=1, # number of instances
	instance_type='ml.m5.xlarge', # ec2 instance type
    serializer=audio_serializer
)

Based on that issue, you can use serializers.

The Hugging Face inference toolkit supports all the transformers pipelines with their default inputs. The Toolkit implements several serializers to parse binary data, e.g., audio or images to the matching format for the transformers pipeline, e.g., PIL or np.

So, for inference below code worked in my environment.

audio_path = "sample1.flac"

res = predictor.predict(data=audio_path)
print(res)

Topic		Replies	Views
Modelerror when deploying openchat3.5 Amazon SageMaker	0	223	April 2, 2024
Keep getting error '400' status code Amazon SageMaker	0	369	February 29, 2024
Cannot invoke sagemaker endpoint, keep getting OS error Amazon SageMaker	3	2842	February 2, 2024
Getting ModelError when trying to interact with deployed fine-tuned (LoRA/PEFT) model via Amazon API Gateway and AWS Lambda Amazon SageMaker	3	1671	July 21, 2023
Fairseq MMS HuggingFace model deployment Amazon SageMaker	1	743	November 23, 2023

Deploying Open AI's whisper on Sagemaker

Related topics