Detr vs TableTransformer models have same layers but detr doesn't learn

Sajan · July 11, 2023, 8:06am

I tried loading weights of TableTransformerForObjectDetection in Detr model and training it but that does not learn anything (Ran for 10 epochs, 50000 samples, f1 score remains 0), but the model learns fine if I use TableTransformerForObjectDetection class to load the weights (same training configurations as DETR).

AFAIK, the table transformer model is a DETR model only and checking the weights, the only difference is a layernorm in model encoder {'model.encoder.layernorm.bias', 'model.encoder.layernorm.weight'}. Does this minor difference warrant such drastic difference?

The model I am using is microsoft/table-transformer-structure-recognition

Topic		Replies	Views
Using TableTransformer in Standalone Mode Without Hugging Face Hub Access 🤗Transformers	1	52	March 17, 2025
Using detr with custom backbone Models	3	657	December 6, 2024
Running Pretrained Models Locally - TableTransformers Beginners	0	197	May 23, 2024
How to prevent Transformers from deleting task-head? Beginners	4	1197	July 29, 2022
Specifying backbone learning rate for retraining DETR Beginners	0	540	April 21, 2023

Detr vs TableTransformer models have same layers but detr doesn't learn

Related topics