T5 Temperature-scaled mixing

JanVythikowski March 18, 2022, 1:57pm 1

For multi-task learning T5 uses temperature scaled mixing. Does this uses 100% examples of all tasks and we will have some duplicates examples?

Topic		Replies	Views
Can we fine-tune T5 for multiple tasks? 🤗Transformers	0	630	January 24, 2023
T5 finetuning metrics not improving 🤗Transformers	1	341	June 20, 2023
Retrain T5 using unsupervised learning with MLM 🤗Transformers	0	250	May 21, 2023
Finetuning T5 on translation task 🤗Transformers	0	490	September 10, 2021
How is T5 pretrained? 🤗Transformers	3	511	July 12, 2021