Argmax of Generation Probabilities doesn't match with Generated Sequence Tokens

SifatMd · April 29, 2021, 5:04pm

I am using BART model to make a chatbot. I am doing the following to generate response from the model:

    generated_output = model.generate(
                    input_ids = input_ids,
                    attention_mask = mask,
                    output_scores=True, return_dict_in_generate=True
                )

But, the sequence generated from the ‘sequences’ field:

gen_tokens = generated_output['sequences']
gen_tokens_seq = [tokenizer.decode(g, skip_special_tokens = True) for g in gen_tokens]

And the one generated from argmax(scores)

num_generated_tokens = len(generated_output['scores'])
for i1 in range(0, num_generated_tokens, 1):
    temptensor = generated_output['scores'][i1][0] 
    gen_id = torch.argmax(temptensor).item()
    gen_ids.append(gen_id)
gen_ids = torch.tensor(gen_ids)
gen_ids = gen_ids.view(1, -1)
gen_ids_seq = [tokenizer.decode(g, skip_special_tokens = True) for g in gen_ids]

are not the same. I need the logit vector for the generated sequence of tokens by model.generate(), but it’s not returning what I expect it to return. What can I do to get the logit values for the “sequence” returned by model.generate()?

SifatMd · April 29, 2021, 6:10pm

Okay I think I found it.

I had to set

num_beams=1, do_sample=False

manually inside model.generate() to get the correct logit values. These values are set by default according to huggingface documentation, but still, I had to manually set them.

Please correct me if I am wrong on this.

Thanks.

Sev777 · May 10, 2024, 10:46am

Hi, I found the “stopping criteria” in model.generate will convert some tokens_id to 0, but when you use the gen_id = torch.argmax(temptensor).item() will not, does it will influence the output?

Topic		Replies	Views
How to get probability of the first generated token? Beginners	2	1674	July 18, 2020
Logits from generate and model call different 🤗Transformers	2	929	January 26, 2025
How to get 'sequences_scores' from 'scores' in 'generate()' method Beginners	6	6235	May 2, 2023
How to generate a sequence using inputs_embeds instead of input_ids? 🤗Transformers	4	8434	April 17, 2022
How can I obtain the logits via model.generate()? 🤗Transformers	2	2578	October 8, 2024

Argmax of Generation Probabilities doesn't match with Generated Sequence Tokens

Related topics