Using .generate() with CodeParrot

j3m · March 13, 2023, 12:14pm

I’m trying to run prediction using CodeParrot. I’d like to use generate() because pipeline is too high-level but __call__ is too low-level:

import transformers
from   transformers import AutoTokenizer, AutoModelForCausalLM, GenerationConfig
  
tokenizer = AutoTokenizer.from_pretrained("codeparrot/codeparrot")
model = AutoModelForCausalLM.from_pretrained("codeparrot/codeparrot")

config = GenerationConfig(
    max_new_tokens=50
)

inputs = tokenizer("def hello_world():", return_tensors="pt")
outputs = model.generate(
    inputs=inputs.input_ids,
    generation_config=config
)

print(tokenizer.decode(outputs[0]))

but I get:

ValueError: If `eos_token_id` is defined, make sure that `pad_token_id` is defined.

This makes no sense to me. Isn’t generate() supposed to basically do the work for me? I can run inference manually with this model without having to change model details like the vocabulary… so how come generate() isn’t able to figure it out?

nelsonspbr · April 15, 2023, 5:58pm

Having the same problem. It seems to be related to using GenerationConfig. Passing parameters directly to generate works fine.

nelsonspbr · April 15, 2023, 6:02pm

Doing this solved the problem for me, although it still feels like a bug related to GenerationConfig:

config = transformers.GenerationConfig() 
config.eos_token_id = var.tokenizer.eos_token_id

output_ids = var.model.generate(
  input_ids,
  generation_config = config,
)

0sunfire0 · June 30, 2023, 2:30pm

This should fix your issue

generation_output = model.generate(
input_ids=input_ids,
pad_token_id=tokenizer.eos_token_id,
generation_config=generation_config

Topic		Replies	Views
EncoderDecoderModel Generation with Specified EOS Token Beginners	0	290	March 15, 2021
SEBIS{URGENT},ValueError: You have to specify either decoder_inputs or decoder_inputs_embeds Models	3	1209	January 1, 2021
Generate method during finetuning Beginners	6	1955	July 30, 2020
Converting logits to string without .generate() Beginners	0	633	February 13, 2023
Always output generation config in terminal Models	1	255	November 15, 2023

Using .generate() with CodeParrot

Related topics