Language detection with Whisper

loretoparisi · June 5, 2024, 5:43pm

Doing like

processor = WhisperProcessor.from_pretrained("openai/whisper-base")
        model = WhisperForConditionalGeneration.from_pretrained("openai/whisper-base")
        tokenizer = WhisperTokenizer.from_pretrained("openai/whisper-base")

        input_features = processor(audio, return_tensors="pt", sampling_rate=16000).input_features
language_name = detect_language_tokens(model, tokenizer, input_features, {'en', 'zh'})

I get the error

AttributeError: 'Tensor' object has no attribute 'additional_special_tokens'

Topic		Replies	Views
How to set language in Whisper pipeline for audio transcription? 🤗Transformers	2	9693	June 22, 2023
How to set audio language in Whisper Pipeline? 🤗Transformers	6	7194	December 2, 2024
How to fine-tune whisper on unsupported language? Beginners	1	256	October 12, 2024
Ways to detect language of the given text? Models	5	6254	June 19, 2021
Speech language detection using Wave2vec 2.0 🤗Transformers	3	1501	March 24, 2021

Language detection with Whisper

Related topics