Does setting max_seq_length to a too large number for fine tuning LLM using SFTTrainer affects model training?

Ka4on · November 15, 2023, 2:39am

Hi, i was trying to finetune mistral 7B model using a custom dataset. I was just wondering if setting a too large max_seq_length will affect the training and lead to a bad fine-tuned model performance.

To my understanding, the seq_length should be the tokenized text length, right? So too big a sequence length might lead too many paddings, but i wonder whether it will affect fine-tuning except for more memory usage.

Many thanks!

brando · December 6, 2024, 7:45pm

I also want to know, did you find an answer?

Topic		Replies	Views
Llama 2 & 8K Training 🤗Transformers	0	726	August 4, 2023
Max Seq Lengths Beginners	1	567	December 6, 2024
Model_max_length error in some models 🤗Transformers	0	199	April 1, 2024
Optimizing LLM Training with Variable Sequence Lengths: Impact on Model Performance Beginners	0	99	July 16, 2024
Fine tune with different max_length Beginners	2	484	June 16, 2022

Does setting max_seq_length to a too large number for fine tuning LLM using SFTTrainer affects model training?

Related topics