Not able to minimize loss during finetuning

llm-finetune · February 26, 2024, 7:17am

Hi, I am trying to finetune Qwen/Qwen1.5-0.5B with mlabonne/guanaco-llama2-1k dataset using huggingface transformer. My tried various combinations of hyperparameters but loss graph is still showing zigzag.

Any guidance here would be appreciated.

Topic		Replies	Views
Hyperparameter Optimization of end-to-end pretraining + fine tuning Beginners	0	481	September 12, 2021
Fine-tune a Hugginface model with only loss function(without labels)? Beginners	0	405	October 18, 2021
How to Optimize Fine-tuning in Hugging Face Transformers? Beginners	0	333	March 5, 2024
Finetuning sentence embedding model with SageMaker - how to compute loss? Amazon SageMaker	9	3942	December 21, 2022
Finetune different language pair on pretrained translation model Models	1	949	May 26, 2022

Not able to minimize loss during finetuning

Related topics