Chapter 1 questions

mkarlos · August 15, 2023, 10:10pm

Hi. I have a quick question regarding sequence-to-sequence models. At the end of the video, it shows that these models can be constructed by combining encoder models(e.g. BERT) and decoder models(e.g. GPT).
I was wondering, how can RoBERTa (encoder-only model) be used both as an encoder and decoder?

Topic		Replies	Views
Chapter 7 questions Course	119	10411	July 10, 2025
Bert2bert translator? 🤗Transformers	6	44	August 28, 2025
Chapter 3 questions Course	149	10532	August 29, 2025
Encoder-Decoder model only generates bos_token's [<s><s><s>] Models	17	3176	December 6, 2022
EncoderDecoderModel for token classification 🤗Transformers	0	194	October 29, 2022

Chapter 1 questions

Related topics