Problem with AutoTokenizer

agnavale · June 23, 2024, 3:03pm

from transformers import AutoTokenizer, AutoModelForSeq2SeqLM

model_path = "./raphael"
tokenizer = AutoTokenizer.from_pretrained(model_path)
model = AutoModelForSeq2SeqLM.from_pretrained(model_path)

# Example prompts
prompts = [
    "What is your name?",
    "Who are you?",
    "Do you know Raphael",
]

# Tokenize and generate responses
for prompt in prompts:
    inputs = tokenizer(prompt, return_tensors="pt")
    input_ids = inputs["input_ids"]
    outputs = model.generate(input_ids, max_length=100)
    response = tokenizer.decode(outputs[0], skip_special_tokens=True)
    print(f"Prompt: {prompt}")
    print(f"Response: {response}\n")

This my code when using AutoTokenizer. and It gives error. Exception: Error while initializing BPE: Token _</w> out of vocabulary
but same program works fine when I use BlenderbotSmallTokenizer in place of AutoTokenizer.

from transformers import BlenderbotSmallForConditionalGeneration, BlenderbotSmallTokenizer

model_path = "./raphael"
model = BlenderbotSmallForConditionalGeneration.from_pretrained(model_path)
tokenizer = BlenderbotSmallTokenizer.from_pretrained(model_path)

What is exactly the problem?

agnavale · June 24, 2024, 7:37am

Is it even possible to write errorless code for this library. I’m always getting some or the other errors. tired of all this shit.

Topic		Replies	Views
Cant load deberta tokenizer Beginners	0	687	March 27, 2021
T0 Tokenizer Throws Error 🤗Transformers	1	754	November 1, 2021
Using a fixed vocab.txt with AutoTokenizer? 🤗Tokenizers	1	2345	September 13, 2021
ValueError: Tokenizer class ByT5Tokenizer does not exist or is not currently imported Model cards	2	5552	June 7, 2021
Issue with sentencepiece tokenizer 🤗Transformers	2	2060	July 25, 2022

Problem with AutoTokenizer

Related topics