Error Training Vision Encoder Decoder for Image Captioning

lewtun · November 20, 2021, 10:28am

Great detective work @seanbenhur ! I think that adding the BOS token is the cause of the problem and you can resize the embedding layer as follows:

model.resize_token_embeddings(len(tokenizer))

Does resizing the embedding layer solve the problem?

Topic		Replies	Views
Finetuning Vision Encoder Decoder Models with huggingface causes ValueError: expected sequence of length 11 at dim 2 (got 12) Beginners	0	493	March 12, 2023
Unable to use model.generate for Vision encoder decoder model Beginners	3	1127	March 6, 2024
Using EncoderDecoderModel 🤗Transformers	4	1075	October 28, 2021
FlaxVisionEncoderDecoderModel decoder_start_token_id Beginners	1	453	January 13, 2022
How can i implement custom model to use Seq2SeqTrainer class 🤗Transformers	0	444	November 8, 2023