Using hyperparameter-search in Trainer

Calin · August 3, 2022, 3:25am

The strange results are actually results of the inability of the network to learn anything because of the learning rate, which is very high in your cases as you can see.

Transformers need a much lower finetuning learning rate (e.g 5e-5)

Topic		Replies	Views
There is always something going wrong with hyper parameter tuning 🤗Transformers	4	1983	September 1, 2021
Hyperparameter search with wandb 🤗Transformers	1	233	July 28, 2024
Trainer.Hyperparameter_search() Trials did not complete. How to optimize parameters with ray tune? Beginners	0	941	January 10, 2023
Trainer.hyperparameter_search doesn't work for me Beginners	2	518	December 22, 2020
Hyper params search for model config 🤗Transformers	0	173	February 22, 2024

Using hyperparameter-search in Trainer

Related topics