Pre-training MMS-300M with a new language

Tirthankar · July 9, 2023, 1:42am

I can successfully pre-train patrickvonplaten/wav2vec2-base-v2 with a new language unlabeled wav corpus by following the steps outlined in https://github.com/huggingface/transformers/tree/main/examples/pytorch/speech-pretraining on a single GPU A100.

However, when I want to use it with patrickvonplaten/mms-300 or facebook/wav2vec2-xls-r-300m, it gives error at accelerator.backward(loss).

RuntimeError: handle_0 INTERNAL ASSERT FAILED at “…/c10/cuda/driver_api.cpp”:15, please report a bug to PyTorch.

Any pointer to the resolution of this would be great.

Topic		Replies	Views
Wav2VecForPreTraining - Not able to run trainer.train() Beginners	3	680	October 19, 2021
[STT] Using huggingface pretrained models but different results =>Wav2Vec2 vs PatrickDemo 🤗Transformers	0	445	December 27, 2021
Pretrain facebook/wav2vec2-base Models	3	1123	October 14, 2022
Pre-training for Wav2Vec2-XLSR via Huggingface Models	15	5348	November 5, 2024
Wav2Vec2 Fine Tuning Models	0	257	December 21, 2023