Is resize_token_embeddings available to the FlaxPreTrainedModel?

kylemai · August 25, 2022, 8:31am

It seems that resize_token_embeddings now is not available in FlaxPreTrainedModel although in the source-code of its subclass, for example modeling_flax_gpt2.py, include “resizing the input embeddings”:
GPT2_START_DOCSTRING = r"“”

This model inherits from [`FlaxPreTrainedModel`]. Check the superclass documentation for the generic methods the
library implements for all its model (such as downloading or saving, resizing the input embeddings, pruning heads
etc.)

kylemai · August 25, 2022, 9:54am

I implement this function like below, whether this is correct or not ? Assume that new_size is always greater than old_size as we often call this function when we add more tokens to tokenizer.

def resize_token_embeddings(model, new_size, rnd_key):
    if model.config.vocab_size == new_size:
        return
    model.config.vocab_size = new_size
    params = model.params
    params = unfreeze(params)
    old_embeddings = params['transformer']['wte']['embedding']
    old_size = old_embeddings.shape[0]
    dim = old_embeddings.shape[1]
    initializer = jax.nn.initializers.normal(stddev=model.config.initializer_range)
    new_embeddings = initializer(rnd_key, (new_size, dim))
    new_embeddings = new_embeddings.at[:old_size].set(old_embeddings)
    params['transformer']['wte']['embedding'] = new_embeddings
    params = freeze(params)
    model.params = params

Topic		Replies	Views
Resize embeddings on Peft model Intermediate	4	598	May 12, 2025
Equivalent of `inputs_embeds` for `FlaxGPT2Model` 🤗Transformers	0	252	August 12, 2021
How to get word embeddings for Flax model? Flax/JAX Projects	1	1018	August 25, 2022
Saving Manually Resized Embeddings for a Pretrained Bert Model (I believe I am asking this correctly) Beginners	0	107	November 7, 2024
T5x Model Checkpoint Surgery Flax/JAX Projects	0	923	April 13, 2023

Is resize_token_embeddings available to the FlaxPreTrainedModel?

Related topics