Inference Hyperparameters

philschmid · September 16, 2021, 6:15am

Not providing them for Inference will definitely increase the inference speed, since the input won’t be padded and be used as it is.
@Oigres since the underlying original model was properly pre-trained on 512 tokens it should perform decently well Yes.
You can add it into your model.tar.gz but I would do some tests in advance before deploying.

Topic		Replies	Views
Predict function ignore parameters Amazon SageMaker	8	1173	January 28, 2022
How are the inputs tokenized when model deployment? Amazon SageMaker	13	4278	September 3, 2021
How to deploy a T5 model to AWS SageMaker for fast inference? Amazon SageMaker	13	5795	February 28, 2022
Deploying Open AI's whisper on Sagemaker Amazon SageMaker	54	16200	April 12, 2024
About the Amazon SageMaker category Amazon SageMaker	25	4102	August 5, 2021

Inference Hyperparameters

Related topics