Longformer Tensorflow Int32 vs Int64 error

uniflow · September 4, 2022, 6:27am

I am trying an example of fine-tuning longformer and got the error of

TypeError: Input 'updates' of 'TensorScatterUpdate' Op has type int32 that does not match type int64 of argument 'tensor'.

Not sure what’s going on. Here is my code example. Any help would be great. Thank you very much!


from transformers import LongformerTokenizer, TFLongformerForSequenceClassification
from datasets import Dataset

import tensorflow as tf
import pickle
import numpy as np

tokenizer = LongformerTokenizerFast.from_pretrained('allenai/longformer-base-4096')
model = TFLongformerForSequenceClassification.from_pretrained('allenai/longformer-base-4096', num_labels=2, gradient_checkpointing=True)
model.compile(
optimizer=tf.keras.optimizers.Adam(learning_rate=5e-5),
loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
metrics=tf.metrics.SparseCategoricalAccuracy(),
)

my_dict = {'text': ["random text 1", "random text 2", "random text 3"],
'label': np.array([0, 0, 1], dtype=np.int64)}

dataset = Dataset.from_dict(my_dict)

tokenizer = LongformerTokenizer.from_pretrained('allenai/longformer-base-4096')

def tokenize_function(examples):
return tokenizer(examples["text"], padding="max_length", truncation=True)

tokenized_datasets = dataset.map(tokenize_function, batched=True)

small_train_dataset = tokenized_datasets.shuffle(seed=42)

from transformers import DefaultDataCollator

data_collator = DefaultDataCollator(return_tensors="tf")

tf_train_dataset = small_train_dataset.to_tf_dataset(
columns=["attention_mask", "input_ids", "token_type_ids"],
label_cols=["labels"],
shuffle=True,
collate_fn=data_collator,
batch_size=8,
)

model.fit(tf_train_dataset, batch_size=1)

Topic		Replies	Views
TFLongformer Shape Error 🤗Transformers	2	681	December 31, 2021
Expected scalar type Long but found Float using Trainer for BertForTokenClassification Beginners	6	4006	April 22, 2021
Model doesn't accept int32 Beginners	0	101	April 29, 2024
Self-made Longformer doesn't take more than 512 token 🤗Transformers	0	463	January 5, 2022
Strange error when using the Longformer (HuggingFace developers, please reply) 🤗Transformers	8	1804	October 12, 2020

Longformer Tensorflow Int32 vs Int64 error

Related topics