Swin transformer hidden states( feature map) different

Dreamer312 · May 18, 2022, 10:52am

from transformers import AutoFeatureExtractor, SwinModel
import torch
from PIL import Image
import requests

url = "http://images.cocodataset.org/val2017/000000039769.jpg"
image = Image.open(requests.get(url, stream=True).raw)

feature_extractor = AutoFeatureExtractor.from_pretrained("microsoft/swin-base-patch4-window7-224")
model = SwinModel.from_pretrained("microsoft/swin-base-patch4-window7-224", output_hidden_states=True)

inputs = feature_extractor(image, return_tensors="pt")

with torch.no_grad():
    outputs = model(**inputs)

last_hidden_states = outputs.last_hidden_state
hidden_states = outputs.hidden_states

print(hidden_states[-1].equal(last_hidden_states))
False

Hi, I am using a Swin transformer to extract features or hidden states in NLP,
I think the last_hidden_state should be same as the hidden_state[-1], while it outputs False. Is there anything I missed?

nielsr · November 3, 2022, 9:02am

Hi,

In this case you haven’t specified output_hidden_states=True in the forward of the model. Hence output.hidden_states will be None.

Topic		Replies	Views
Hidden_states Transformers for computer vision 🤗Transformers	0	425	July 21, 2022
Using trasnsformer to get image features 🤗Transformers	3	3336	March 20, 2024
Hidden states embedding tensors 🤗Transformers	5	4009	July 22, 2023
Feature extraction pipeline Vs model hidden states Beginners	1	1593	February 7, 2021
MaskedLMOutput does not have last_hidden_state 🤗Transformers	0	1627	May 27, 2021

Swin transformer hidden states( feature map) different

Related topics