How do I change image size and patch size in Tensorflow

MuawizC · December 14, 2023, 8:01am

Hi all, I want to change the patch embedding layer of my ViT model for differently sized images on tensorflow. I get the following error.

TypeError: Dimension value must be integer or None or have an __index__ method, got value '(12, 16)' with  type '<class tuple>'

I use the following code.

!pip install -q tensorflow==2.13.0
!pip install -q transformers==4.36.0

import transformers
import tensorflow
import keras

model_name = "google/vit-base-patch16-224"
config = transformers.ViTConfig.from_pretrained(model_name)
config.image_size=(12,16)
model = transformers.TFViTForImageClassification.from_pretrained(model_name, config=config)

This is not an issue on the pytorch version of HuggingFaces.

How do I solve this issue?

Topic		Replies	Views
Changing resolution of transformer models for training 🤗Transformers	0	649	September 2, 2022
Fine tuning image transformer on higher resolution Beginners	11	8002	May 1, 2024
Is it possible to train ViT with different number of patches in every batch? (Non-square images dataset) Models	3	3075	May 1, 2024
Pyramid Vision Transformer: Issue with input image size larger than 224 px 🤗Transformers	0	1575	September 15, 2023
InvalidArgumentError with vit-base-patch16-224 model? Models	7	2013	April 20, 2024

How do I change image size and patch size in Tensorflow

Related topics