Overlapping data between pre-training and fine-tuning stages

fozyurt · October 8, 2021, 5:50pm

Hi

I am currently pre-training a RoBERTa model for my own data. If some part of the data that is used for language modeling task during the pre-training process is also used in fine-tuning process, does this cause a biased results at the end of the fine-tuning process ?

Topic		Replies	Views
Roberta Pre-training models being inconsistent across epochs Models	0	275	July 21, 2023
Does order of training data matter when fine-tuning a BERT or RoBERTa model? Beginners	0	443	August 31, 2022
Cannot fine-tune RobertaForQA on SQuAD-like dataset? Beginners	0	273	November 15, 2021
Fine-tuned pre-trained Roberta model on different labels 🤗Transformers	0	636	April 7, 2022
Fine-tuning process - dataset update training Beginners	1	175	March 7, 2024

Overlapping data between pre-training and fine-tuning stages

Related topics