Finetuning using transformers

AmanRai7 · May 26, 2023, 4:38pm

hi, i am trying to finetune a sequence to sequence model.

heres my code snippet for calculating loss and iterating over the responses. but for some reason the outputs are blank. i am not sure if there is something wrong in the code or something else.

epochs = 10
for epoch in range(epochs):
  for i in range(dataset_size):
    temp = tokenized_input_text[i]
    outputs = model(**temp.to("cuda:0"))
    logits = outputs.logits[0]
    labels = tokenized_output_text[i][0]
    loss = lossfct(logits,labels.to("cuda:0"))
    model.train()
    loss.backward()
    optimizer.step()
    optimizer.zero_grad(set_to_none=True)

i suspect something is wrong in the last four line porbably cause i dont know much hoe to use then.
any help would be apreciated.

Topic		Replies	Views
Loss in a Seq2Seq task 🤗Transformers	0	159	June 5, 2024
Encoder Decoder Model gives same generation results after finetuning 🤗Transformers	2	659	August 4, 2022
GPT2 returns sequence of <\|endoftext\|> after finetuning 🤗Transformers	2	250	January 31, 2024
Fine-tuning seq2seq: Helsinki-NLP 🤗Transformers	4	2273	December 8, 2020
Finetuning GPT2 with user defined loss Beginners	56	16097	July 23, 2023

Finetuning using transformers

Related topics