Using hyperparameter-search in Trainer

lewtun December 7, 2021, 8:20am 82

Hey @dunalduck0 one usually just tracks the loss or perplexity for GPT-like models. You can compute the losses by adapting the evaluation code in this example

Topic		Replies	Views
There is always something going wrong with hyper parameter tuning 🤗Transformers	4	1983	September 1, 2021
Hyperparameter search with wandb 🤗Transformers	1	233	July 28, 2024
Trainer.Hyperparameter_search() Trials did not complete. How to optimize parameters with ray tune? Beginners	0	941	January 10, 2023
Trainer.hyperparameter_search doesn't work for me Beginners	2	518	December 22, 2020
Hyper params search for model config 🤗Transformers	0	173	February 22, 2024

Using hyperparameter-search in Trainer

Related topics