Facing an error in Bert NLP "At most 4 tokens in tensor([ 2, 2, 2, 2, 44763, 44763, 2, 44763]) can be equal to eos_token_id: 2. Make sure tensor([ 2, 2, 2, 2, 44763, 44763, 2, 44763]) are corrected."

Huzaifa · May 6, 2021, 12:00pm

I was having trouble with TensorFlow after training a Bert model in a Jupyter notebook.
It works fine on a Jupyter notebook but does not on another Ubuntu server where I am using trained model files. The error I’m facing is below:

At most 4 tokens in tensor([ 2, 2, 2, 2, 44763, 44763, 2, 44763]) can be equal to eos_token_id: 2. Make sure tensor([ 2, 2, 2, 2, 44763, 44763, 2, 44763]) are corrected.

We have finetuned our BERT model for text2text generation. It is working fine on the Jupyter notebook. But when I use the same trained model on another server of Ubuntu, then it shows the issue. This is my first post, so please bear with me.
My output generation code is:

from simpletransformers.seq2seq import Seq2SeqModel
#logging.basicConfig(level=logging.INFO)
#transformers_logger = logging.getLogger("transformers")
#transformers_logger.setLevel(logging.ERROR)
model = Seq2SeqModel(
    encoder_decoder_type="bart", encoder_decoder_name="PATHOFMODEL",use_cuda=False,
)
while True:
    original = input("Enter text to paraphrase: ")
    to_predict = [original]

    preds = model.predict(to_predict)

    print("---------------------------------------------------------")
    print(original)

    print()
    print("Predictions >>>")
    for pred in preds[0]:
        print(pred)

    print("---------------------------------------------------------")
    print()

Here’s the complete issue on StackOverflow.
https://stackoverflow.com/q/67195582
Someone told me to change the TensorFlow version. I tried it. It worked for one day. After that, I faced the same problem again.

Topic		Replies	Views
ValueError: too many values to unpack (expected 2) when using BertTokenizer 🤗Transformers	6	8450	July 13, 2021
Token classification on custom BERT and data Intermediate	2	1498	December 28, 2020
How to use transformers&tensorflow for batch inference Beginners	0	522	August 20, 2021
Key error: 0 in DataCollatorForSeq2Seq for BERT Beginners	10	3978	March 13, 2024
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation Beginners	5	45886	September 24, 2024

Facing an error in Bert NLP "At most 4 tokens in tensor([ 2, 2, 2, 2, 44763, 44763, 2, 44763]) can be equal to eos_token_id: 2. Make sure tensor([ 2, 2, 2, 2, 44763, 44763, 2, 44763]) are corrected."

Related topics