How are the inputs tokenized when model deployment?

philschmid · September 2, 2021, 1:52pm

Which tokenization step do you mean for training or inference?

For training, the tokenization is done in the preprocessing in the notebook.
For inference, the tokenization is done in the sagemaker-huggingface-inference-toolkit and the toolkit leverages the transformers pipeline.

Topic		Replies	Views
Inference Hyperparameters Amazon SageMaker	29	4905	October 8, 2021
Access Tokenizer from Sagemaker BART Endpoint Amazon SageMaker	4	1027	November 29, 2022
Access tokenizer from within predict_fn Amazon SageMaker	7	1044	January 14, 2022
ClientErro:400 when using batch transformer for inference Amazon SageMaker	11	2249	January 13, 2022
Errors: Batch transform on fine-tuned models Amazon SageMaker	4	1593	May 4, 2023