Why does the falcon QLoRA tutorial code use eos_token as pad_token?

maxolotl · August 25, 2023, 12:10am

It seems like you know a lot about how this works. So, if setting tokenizer.pad_token = tokenizer.eos_token causes falcon to infinitely generate text up to the cutoff point, how do you stop this from happening? Do you have time to provide a code snippet? All I can think of is:

raw_pad_token = “<pad>”
processed_token = tokenizer(raw_pad_token)
tokenizer.pad_token = processed_token

But based on this thread, this isn’t enough to work

Topic		Replies	Views
How to actually use padding in Lllama Tokenizers 🤗Transformers	2	4907	June 16, 2023
Llama2 pad token for batched inference Models	7	15555	March 31, 2024
Padding Token Missing from LLaMA Models	1	149	April 17, 2025
How to set the Pad Token for meta-llama/Llama-3 Models Models	6	11616	August 29, 2024
Gemma-2 & Phi-3 SFT nuances Models	0	106	September 18, 2024

Why does the falcon QLoRA tutorial code use eos_token as pad_token?

Related topics