Pretrained language model that enables non-autoregressive generation

patrickvonplaten · June 29, 2021, 2:45pm

Great! Think it’s very much feasible to implement conditional random fields on top of BERT - cool idea!

Regarding pretraining:
PreTraining BERT in English requires quite some time since the English dataset is so massive. Maybe just fine-tuning it makes sense in a first step ? Or further pre-training an already pre-trained English-BERT on some specific data?

Very much looking forward to this project

Topic		Replies	Views
PreTrain RoBERTa from scratch in Portuguese Flax/JAX Projects	16	2406	October 4, 2021
Pre-train ALBERT from scratch for Persian/Farsi language Flax/JAX Projects	5	1397	July 10, 2021
PreTrain T5 for Italian 🇮🇹 Flax/JAX Projects	3	615	July 7, 2021
PreTrain Swahili Flax model Flax/JAX Projects	9	406	June 30, 2021
PReTrain RoBERTa from scratch in Norwegian Flax/JAX Projects	2	878	June 28, 2021

Pretrained language model that enables non-autoregressive generation

Related topics