Need help with gpt2 model

tuti123 · July 9, 2023, 11:14am

I am finetuning gpt2 model to answer questions with given faq.json.
Code -

import torch
from torch.utils.data import Dataset, DataLoader
from transformers import GPT2LMHeadModel, GPT2Tokenizer, GPT2Config

class FAQDataset(Dataset):
def init(self, data_file, tokenizer):
self.tokenizer = tokenizer
self.inputs =
self.targets =

    with open(data_file, 'r') as file:
        lines = file.readlines()
        
        for i in range(0, len(lines)-1, 2):
            question = lines[i].strip()
            answer = lines[i+1].strip()
            self.inputs.append(question)
            self.targets.append(answer)

def __len__(self):
    return len(self.inputs)

def __getitem__(self, index):
    inputs = self.tokenizer.encode(self.inputs[index], add_special_tokens=True)
    targets = self.tokenizer.encode(self.targets[index], add_special_tokens=True)
    return torch.tensor(inputs), torch.tensor(targets)

Load the GPT-2 tokenizer and model

tokenizer = GPT2Tokenizer.from_pretrained(‘gpt2’)
model = GPT2LMHeadModel.from_pretrained(‘gpt2’)

Load the training dataset

dataset = FAQDataset(‘faq.txt’, tokenizer)

Define the training parameters

batch_size = 4
num_epochs = 3
learning_rate = 1e-5

Create the data loader

data_loader = DataLoader(dataset, batch_size=batch_size, shuffle=True)

Set the model in training mode

model.train()

Define the optimizer and the loss function

optimizer = torch.optim.AdamW(model.parameters(), lr=learning_rate)
criterion = torch.nn.CrossEntropyLoss(ignore_index=tokenizer.pad_token_id)

Fine-tune the model

for epoch in range(num_epochs):
total_loss = 0

for inputs, targets in data_loader:
    optimizer.zero_grad()

    # Forward pass
    outputs = model(inputs, labels=targets)
    loss = criterion(outputs.logits.view(-1, tokenizer.vocab_size), targets.view(-1))

    # Backward pass and optimization
    loss.backward()
    optimizer.step()

    total_loss += loss.item()

avg_loss = total_loss / len(data_loader)
print(f"Epoch {epoch+1}/{num_epochs}, Loss: {avg_loss}")

Save the fine-tuned model

model.save_pretrained(‘fine-tuned-gpt2’)
tokenizer.save_pretrained(‘fine-tuned-gpt2’)

prompt -

import torch
from transformers import GPT2LMHeadModel, GPT2Tokenizer

Load the fine-tuned model and tokenizer

model = GPT2LMHeadModel.from_pretrained(‘fine-tuned-gpt2’)
tokenizer = GPT2Tokenizer.from_pretrained(‘fine-tuned-gpt2’)

Set the model to evaluation mode

model.eval()

User input

user_question = “What is your refund policy?”

Generate the answer using the fine-tuned model

input_ids = tokenizer.encode(f"Q: {user_question}\nA:", return_tensors=‘pt’)
output = model.generate(input_ids, max_length=100, num_return_sequences=1)
generated_answer = tokenizer.decode(output[:, input_ids.shape[-1]:][0], skip_special_tokens=True)

print(generated_answer)

Answer generated is !!! !!!

Any help please?

Topic		Replies	Views
Fine tuning gpt2 for question answering Beginners	3	12190	March 29, 2024
Error: Fine-tune GPT2 model for question answer task 🤗Transformers	1	802	June 16, 2023
Fine tuning GPT2 on persona chat dataset outputs gibberish Models	1	2747	April 14, 2021
I have problem with teaching GPT-2 large model (774m) with transformers Models	2	816	March 1, 2023
GPT-2 full python tokenizer example for Q/A finetuning Beginners	1	904	December 27, 2022