Creating distillated version of gelectra-base model

Orialpha · April 5, 2022, 10:25pm

Hello all, i am trying to create distill version of gelectra-base model. For training a student model optimizer has to be defined, as per paper i used Adam optimizer but the losses are not looking good. So anyone have idea about optimizer.

Topic		Replies	Views
Distillation: create student model from a different base model than teacher 🤗Transformers	9	2127	October 14, 2020
Non fine-tuned Pegasus models Models	0	339	June 22, 2021
Distilbert customize model 🤗Transformers	0	217	July 24, 2022
How to extract the "student" model after distillation? Beginners	2	879	October 19, 2020
Knowledge Distillation of SentenceTransformer - problems making it work Beginners	0	1073	April 9, 2022

Creating distillated version of gelectra-base model

Related topics