Costumizing MASKed tokens

svallejovera · August 18, 2023, 3:29pm

Hello,

I want to further pre-train a RoBERTa model using a customized set of masked tokens (e.g., masking a percentage of high information words or never masking stopwords). Is there a way to do this?

This post asked a similar question, but there is no answer:

bk073 · September 27, 2023, 6:23pm

Were you able to solve it?

Topic		Replies	Views
How to pre-train a model using a custom mask strategy? 🤗Transformers	0	347	May 2, 2022
Sequence masking 🤗Transformers	0	379	April 25, 2022
Further pre-training the tokenizer? 🤗Tokenizers	0	821	April 30, 2022
Fine tune a saved model with custom tokenizer 🤗Transformers	3	2964	December 15, 2020
Challenges Achieving Satisfactory Accuracy in Fine-Tuning RoBERTa on a Custom Masked Token Prediction Dataset 🤗Transformers	2	300	March 4, 2024

Costumizing MASKed tokens

Related topics