How to resume training from lora checkpoint

ankitMLAI · July 4, 2024, 12:08pm

model / tokenizer= “Mistral model”

checkpoint_path = “model/checkpoint-1000”

lora_r = 16
lora_alpha = 64
lora_dropout = 0.1
lora_target_modules = [
“q_proj”,
“up_proj”,
“o_proj”,
“k_proj”,
“down_proj”,
“gate_proj”,
“v_proj”,
]

peft_config = LoraConfig(
    r=lora_r,
    lora_alpha=lora_alpha,
    lora_dropout=lora_dropout,
    target_modules=lora_target_modules,
    bias="none",
    task_type="CAUSAL_LM",
)
training_arguments = TrainingArguments(
    per_device_train_batch_size=1,
    gradient_accumulation_steps=32,
    optim="paged_adamw_32bit",
    logging_steps=1,
    learning_rate=1e-4,
    fp16=True,
    max_grad_norm=0.3,
    num_train_epochs=10,
    save_steps=100,
    evaluation_strategy="steps",
    eval_steps=0.2,
    warmup_ratio=0.05,
    save_strategy="steps",
    group_by_length="steps",
    output_dir=OUTPUT_DIR,
    report_to="tensorboard",
    save_safetensors=True,
    lr_scheduler_type="cosine",
    seed=42,
)

trainer = SFTTrainer(
model=model,
train_dataset=train_dataset[‘train’],
eval_dataset=val_dataset[‘train’],
peft_config=peft_config,
dataset_text_field=“text”,
max_seq_length=1024,
tokenizer=tokenizer,
args=training_arguments,

)

Topic		Replies	Views
Loading Lora models after trainning Beginners	1	3285	June 24, 2024
How do I resume training a finetuned model from the epoch it has ended Beginners	3	849	October 31, 2024
Training loop for LoRA 🤗Transformers	3	270	September 18, 2024
Cannot Resume Training Beginners	1	1375	December 15, 2020
Resume training from checkpoint Beginners	1	3039	January 5, 2023

How to resume training from lora checkpoint

Related topics