Inference API for Tokenizers

cta2106 · November 17, 2022, 4:59pm

Hi everyone,

I’m trying to deploy my backend on Heroku and running into the 500 MB slug size limit because my code downloads two tokenizers from Huggingface.

Is there an API endpoint that I can ping to tokenize the same way you can do inference?

For reference, the two tokenizers are BertTokenizerFast.from_pretrained('bert-base-uncased') and SentenceTransformer( 'multi-qa-MiniLM-L6-cos-v1' )

Thanks!

Topic		Replies	Views
Serverless Inference API Token Limits/Settings Beginners	2	189	November 26, 2024
How are the inputs tokenized when model deployment? Amazon SageMaker	13	4278	September 3, 2021
What token settings are used on the Hosted inference API 🤗Hub	1	708	November 4, 2022
Does AutoTokenizer uploads data to HuggingFace 🤗Tokenizers	0	200	October 25, 2023
Train Retry Tokenizer 🤗Tokenizers	0	223	April 18, 2023

Inference API for Tokenizers

Related topics