Whisper on long audio files -- support for chunking?

jens-simon · October 19, 2022, 5:50pm

The transformer library supports chunking (concatenation of multiple segments) for transcribing long audio files with Wav2Vec2, as described here: Making automatic speech recognition work on large files with Wav2Vec2 in 🤗 Transformers

The OpenAI repository contains code for chunking with Whisper: whisper/transcribe.py at main · openai/whisper · GitHub

Is chunking with Whisper supported in the transformers library?

Hannan · December 28, 2022, 11:22am

Is there any update for this issue?

MLLife · April 21, 2023, 7:14am

any update on this? @sanchit-gandhi please help

sanchit-gandhi · April 21, 2023, 6:48pm

Topic		Replies	Views
Speech recognition processing max_length Beginners	9	377	October 19, 2024
Wav2vec2 for long audiofiles Beginners	2	4121	March 18, 2022
How to use Whisper from huggingface for ASR DeepSpeed	0	539	June 21, 2023
Support for ASR inference on longer audiofiles or on live transcription? 🤗Transformers	2	473	April 21, 2023
Wav2vec2 and whisper ASR live streaming Models	1	762	May 15, 2023