AutoTokenizer is very slow when loading llama tokenizer

coincheung · May 31, 2023, 2:38am

Code is like this:

    tokenizer = LlamaTokenizer.from_pretrained('decapoda-research/llama-13b-hf', use_fast=True)
    tokenizer.save_pretrained('./llama_tok')

    tokenizer = LlamaTokenizer.from_pretrained('./llama_tok/') # very fast to load
    tokenizer = AutoTokenizer.from_pretrained('./llama_tok/') # very slow to load

What is the cause of this and how could I fix it please?

asbljy · June 22, 2023, 10:34pm

I also found this issue.

reece124 · October 31, 2023, 5:39am

Same issue here also for loading Vicuna tokenizers. Got it workaround by replacing AutoTokenizer with LlamaTokenizer.

Topic		Replies	Views
Unable to load tokenizer 🤗Transformers	3	63	February 14, 2025
Convert slow XLMRobertaTokenizer to fast one 🤗Transformers	3	1192	August 26, 2024
Cannot load tokenizer for llama2 🤗Tokenizers	6	7152	September 13, 2024
Loading a locally saved model is very slow 🤗Transformers	1	3737	July 10, 2024
Llama 2 10x slower than LLaMA 1 🤗Transformers	1	724	November 7, 2023

AutoTokenizer is very slow when loading llama tokenizer

Related topics