How are the inputs tokenized when model deployment?

philschmid · September 2, 2021, 3:39pm

You can learn more about the Inference Toolkit here: Deploy models to Amazon SageMaker

In addition to the Hugging Face Inference Deep Learning Containers, we created a new Inference Toolkit for SageMaker. This new Inference Toolkit leverages the pipelines from the transformers library to allow zero-code deployments of models, without requiring any code for pre- or post-processing.

Meaning the parameters key supports all optional parameters of the transformers pipelines: Pipelines

Topic		Replies	Views
Inference Hyperparameters Amazon SageMaker	29	4838	October 8, 2021
Access Tokenizer from Sagemaker BART Endpoint Amazon SageMaker	4	1002	November 29, 2022
Errors: Batch transform on fine-tuned models Amazon SageMaker	4	1576	May 4, 2023
Deploying Open AI's whisper on Sagemaker Amazon SageMaker	54	16200	April 12, 2024
Access tokenizer from within predict_fn Amazon SageMaker	7	1032	January 14, 2022

How are the inputs tokenized when model deployment?

Related topics