Why the checkpoint of old version of BERT can not be used for BERT with new version?

haoyuw · March 22, 2023, 5:44am

Hi,

I try to train a bert-base-uncased model on MNLI dataset. I download a checkpoint(old version of BERT, maybe v2.) which is finetuned on MNLI from “ishan/bert-base-uncased-mnli · Hugging Face”. However, when I use v4. BERT to load the checkpoint, its performance is very low.

I load the checkpoint using the following code:

model = AutoModelForSequenceClassification.from_pretrained(
model_args.model_name_or_path,
from_tf=bool(“.ckpt” in model_args.model_name_or_path),
config=config,
cache_dir=model_args.cache_dir,
revision=model_args.model_revision,
use_auth_token=True if model_args.use_auth_token else None,
)
model.load_state_dict(torch.load(“./checkpoint/pytorch_model.bin”), strict=False)

Topic		Replies	Views
Save bert-base-uncased model as checkpoint 🤗Transformers	0	262	February 22, 2023
Issue with converting my own BERT TF2 checkpoint to PyTorch and loading the PyTorch model for training 🤗Transformers	0	536	February 25, 2021
Loading pytorch_pretrained_bert models with transformers Beginners	2	1898	April 29, 2021
Convert tensorflow tokenclassifier checkpoint to pytorch 🤗Transformers	2	908	January 2, 2022
Unable to load checkpoint after finetuning Intermediate	5	4619	February 21, 2024

Why the checkpoint of old version of BERT can not be used for BERT with new version?

Related topics