Context window decreased after finetuning?

piotr-ai · November 4, 2023, 11:37am

Hello,
I did fine tune a model with 4k window using tokenizer with max_length=512 because of memory usage.
Now the fine tuned model doesn’t generate anything after 512. Is that expected?

Topic	Replies	Views
Tokenizer effect on the fine-tuning Research	364	October 6, 2023
Finetuning model with smaller sequence size and Dmodel Models	337	April 15, 2021
Output token lengths of smaller models 🤗Transformers	499	October 30, 2023
Adding too many tokens breaks tokenizer 🤗Tokenizers	296	March 12, 2024
Issues with Finetuning QuestionAnswer model Beginners	360	May 27, 2021

Context window decreased after finetuning?

Related topics