Payload too large for Async Inference on Sagemaker

philhd · June 9, 2023, 7:04am

For AsyncInference there is another very important configuration required to prevent the 413 error.


env={
        'MMS_MAX_REQUEST_SIZE': '2000000000',
        'MMS_MAX_RESPONSE_SIZE': '2000000000',
        'MMS_DEFAULT_RESPONSE_TIMEOUT': '900'
    }

HuggingFaceModel(env=env …)

@philschmid
would be nice to have it mentioned in the documentation

Topic		Replies	Views
Deploying Open AI's whisper on Sagemaker Amazon SageMaker	54	16202	April 12, 2024
Async TEI Deployment Cannot Handle Requests greater than 2mb Amazon SageMaker	2	97	November 4, 2024
Curl parameters for aws-whisper-large inference end point? Amazon SageMaker	2	1123	October 17, 2022
Sagemaker serverless endpoint deployment error (Image size greater than support size)) Amazon SageMaker	3	1236	July 21, 2023
Using Inference API with large audio files Beginners	4	1185	September 16, 2022

Payload too large for Async Inference on Sagemaker

Related topics