Negative Kl values during PPO training (TRL library)

naviiiid · April 28, 2024, 8:29am

Hey everyone!
I am trying to train my model using PPO trainer from TRL library. However I receive negative kl values. any Idea where might have gone wrong?
The configs:
generation_kwargs = {
“do_sample”:True,
“top_k”:9,
“max_length”:1024,
“top_p”:0.9,
}

dataset = train_dataset

ppo_config = {“mini_batch_size”: 1,
“batch_size”: 1,
“learning_rate”: 1.41e-5,
}
ppo_trainer = PPOTrainer(config, model, tokenizer = tokenizer, dataset = dataset)

Topic		Replies	Views
Unstable PPO training: Highly negative KL divergence and highly positive average ratio of batch on LLMs 🤗Transformers	0	362	October 27, 2024
How do I fix this error when training in TRL with QLora and PPO? Intermediate	0	409	April 13, 2024
PPOTrainer: Output generated during training different than that during inference 🤗Transformers	1	437	January 27, 2024
Negative KL-divergence RLHF implementation Intermediate	1	1598	May 13, 2024
Finetune Llama with PPOTrainer 🤗Transformers	2	900	September 29, 2023

Negative Kl values during PPO training (TRL library)

Related topics