Is BERT document embedding model?

adorkin · November 2, 2021, 2:37pm

Such models output representations for each token in context of other tokens to the left and to the right of it. You need to aggregate these representations somehow to obtain a single vector representing a document. A common approach is to average vectors of each token, for example. I’d suggest using sentence transformers for this purpose.

Topic		Replies	Views
The inputs into BERT are token IDs. How do we get the corresponding input token VECTORS? Beginners	10	17927	September 15, 2022
Generate raw word embeddings using transformer models like BERT for downstream process Beginners	9	40103	October 4, 2021
BERT and GPT2 embedding questions Beginners	2	1541	December 28, 2022
Word, sentence or long context embedding? Beginners	0	369	March 8, 2024
Training BERT for word embedding Beginners	17	14546	November 12, 2022

Is BERT document embedding model?

Related topics