Storing and restoring GPT-J model

rajib76 · October 27, 2021, 5:34pm

Hi,
I am trying to save and later restore the GPT-J models as shown below. But I am getting an error

AttributeError: ‘BaseModelOutputWithPast’ object has no attribute ‘logits’

Any help with this will be much appreciated

Saving the model

from transformers import GPTJModel, GPTJConfig

print('---start---')
config = GPTJConfig.from_pretrained("EleutherAI/gpt-j-6B")
model = GPTJModel(config)
model.save_pretrained("my-gpt-j-model")

from transformers import AutoTokenizer

print('---start---')
tokenizer = AutoTokenizer.from_pretrained("EleutherAI/gpt-j-6B")
tokenizer.save_pretrained("my-gpt-j-tokenizer")

Restoring and using the model

This piece of code is throwing the error

from transformers import AutoTokenizer
from transformers import GPTJModel

#gpt_config = GPTJConfig.from_pretrained("my-gpt-j-model")
gpt_model = GPTJModel.from_pretrained("my-gpt-j-model")
t=gpt_model.eval()
print(t)
input_text = "Hello my name is Blake and"

tokenizer = AutoTokenizer.from_pretrained("my-gpt-j-tokenizer")
input_ids = tokenizer.encode(str(input_text),return_tensors='pt')

output=gpt_model.generate(
    input_ids,
    do_sample=True,
    max_length=20,
    top_p=0.7,
    top_k=0,
    temperature=1.0,
)
print(tokenizer.decode(output[0],skip_special_tokens=True))

petermills · September 20, 2022, 7:29pm

Is there a solution to this? I’ve also encountered it.

Ironman0907 · May 8, 2024, 6:08pm

Have you fixed the problem?

I am having the same kind of problem

Please help me

nielsr · May 8, 2024, 7:19pm

Hi,

This is because you’re using GPTJModel to generate text, whereas you should be using GPTJForCausalLM.

This is because xxxModel classes in the Transformers library usually don’t include a task-specific head on top, they only output hidden states (features).GPTJForCausalLM on the other hand adds a language modeling head on top of GPTJModel, which is what you need.

Topic		Replies	Views
GPT-J training from scratch error Beginners	0	515	March 18, 2023
Is it possible to get logits when using gpt-j in float16 precision Models	0	370	March 13, 2023
Tokenizer Saving Issues, Wrapper Issues and Push to Hub issues Beginners	3	1494	May 12, 2024
Language training on a model Beginners	1	402	August 27, 2023
Transformers for GPT 4 🤗Transformers	1	1827	August 4, 2023

Storing and restoring GPT-J model

Related topics