Wav2vec - <s></s> tokens

bhemmat · January 18, 2022, 8:07pm

The wav2vec2.0 base 960h model never seems to return a beginning of sentence or end of sentence token (or ’ or unknown, so far)–using greedy decoding. Is that expected? I can’t seem to find this discussed anywhere. Or am I just feeding in audio that is too difficult for the model to determine the eos/bos? If so, can someone provide a counter-example?

Topic		Replies	Views
Wav2vec2 results vary depending on far away prefix len Models	0	186	September 30, 2023
Ideas to correct Wav2Vec2 transcription results Beginners	1	1001	May 11, 2021
Using Padding for ASR models 🤗Transformers	0	325	December 16, 2022
Wav2vec2 not converging when finetuning 🤗Transformers	7	2535	June 15, 2021
Wav2vec2 finetuning and language model Beginners	0	213	October 1, 2023

Wav2vec - <s></s> tokens

Related topics