How to deploy a T5 model to AWS SageMaker for fast inference?

philschmid · January 25, 2022, 7:27pm

@pierreguillou when using generative models it is not guaranteed that the output is always exactly the same. Especially when converting the model to a ONNX Model.

What different output are you seeing? Are you using the same tranformers version?

Topic		Replies	Views
Deploying open llm - google/flan-t5-large model on AWS inferentia2 Amazon SageMaker	0	441	September 14, 2023
Deploying T5-style models via Sagemaker Endpoint: 'T5LayerFF' object has no attribute 'config' Amazon SageMaker	5	1465	November 7, 2022
Help for inference.py code Amazon SageMaker	10	4003	March 8, 2022
Inference Hyperparameters Amazon SageMaker	29	4839	October 8, 2021
Deploying Open AI's whisper on Sagemaker Amazon SageMaker	54	16201	April 12, 2024

How to deploy a T5 model to AWS SageMaker for fast inference?

Related topics