BERT2RND EncoderDecoderModel predicts random words for Translation tasks

salma-elshafey · May 30, 2022, 6:03pm

Hello! I am using the EncoderDecoderModel for translating from Arabic to English by initializing the encoder with pretrained AraBERT checkpoint (a BERT model pre-trained on Arabic language) and a randomly initialized decoder. However, the BLEU score does not improve at all throughout the evaluation after each epoch, and the predicted sentences are very random and do not make sense.
bleu scores

Can anybody please help me? Here’s my colab notebook for the code: Google Colab

Topic		Replies	Views
EncoderDecoderModel for Machine Translation 🤗Transformers	0	441	May 21, 2022
Fine-tuning BERT for Machine Translation Models	0	725	May 21, 2022
EncoderDecoderModel converts classifier layer of decoder Beginners	2	531	October 26, 2021
Can we use a random state Bert model in BertGeneration? 🤗Transformers	0	411	June 14, 2023
Warm-starting encoder-decoder models using EncoderDecoderModel always giving an empty string after fine-tuning 🤗Transformers	0	113	March 25, 2024

BERT2RND EncoderDecoderModel predicts random words for Translation tasks

Related topics