Which parameter is causing the decrease in Learning rate every epoch?

NDugar · December 21, 2021, 6:53pm

Hey, I have been trying to train my model on mnli and the learning rate seems to keep decreasing for no reason. Can someone help me? -

train_args = TrainingArguments(
    output_dir=f'./resultsv3/output',
    logging_dir=f'./resultsv3/output/logs',
    learning_rate=3e-6,
    per_device_train_batch_size=4,
    per_device_eval_batch_size=4,
    num_train_epochs=4,
    load_best_model_at_end=True,
    metric_for_best_model="accuracy",
    fp16=True,
    fp16_full_eval=True,
    evaluation_strategy="epoch",
    save_strategy = "epoch",
    save_total_limit=5,
    logging_strategy="epoch",
    report_to="all")

def compute_metrics(eval_pred):
	predictions, labels = eval_pred
	predictions = np.argmax(predictions, axis=1)
	return metric.compute(predictions=predictions, references=labels)

trainer = Trainer( 
    model=model,
    tokenizer=tokenizer,
    args=train_args,
    data_collator=data_collator,
    train_dataset=encoded_dataset_train,  
    eval_dataset=encoded_dataset_test,
    compute_metrics=compute_metrics
)

which parameter is causing the decrease in Learning rate every epoch?

osanseviero · December 21, 2021, 9:38pm

The learning_rate parameter is just the initial learning rate, but it is usually changed during training.

You can find the default values of TrainingArguments at Trainer. You can see that lr_scheduler_type is linear by default.

As specified in its [documentation(Optimization), linear creates a schedule with a learning rate that decreases linearly from the initial learning rate after an initial warmup period.

NDugar · December 21, 2021, 9:53pm

Ok thank you for your answer. Can tell me whether the way
mentioned here microsoft/deberta-v2-xxlarge-mnli · Hugging Face also uses linear as scheduler type?

Topic		Replies	Views
Training loss changes as we change learning rate Beginners	0	296	December 16, 2023
How to adjust the learning rate after N number of epochs? Beginners	1	779	August 10, 2021
Trainer: How to find the best learning rate? Beginners	0	1133	February 23, 2023
Why such a learning rate value? 🤗Transformers	3	2990	November 23, 2021
How to check or manually control the learning rate used in training? 🤗Transformers	1	8021	May 6, 2022

Which parameter is causing the decrease in Learning rate every epoch?

Related topics