🤗Transformers

Topic	Replies	Views	Activity
Trainer errors out when concatenating different sequence length batches with distributed training and IterableDataset 🤗Transformers	0	204	October 2, 2023
Image to text model that can take an additional text input 🤗Transformers	1	282	October 2, 2023
What is the right way of developing my own model based on a pretrained transformer? 🤗Transformers	1	506	October 2, 2023
Positional encoding error in RoBERTa 🤗Transformers	1	339	October 2, 2023
Boosting the speed of a translation model Helsinki-NLP/opus-mt-en-ar 🤗Transformers	0	749	October 2, 2023
Dino2 for classification has wrong number of labels 🤗Transformers	2	474	October 2, 2023
Finetuning cost estimator formula 🤗Transformers	0	521	October 1, 2023
How to use run_classification.py to fine tuning bert in imdb? 🤗Transformers	0	297	October 1, 2023
How to add new language to NLLB tokenizer in Huggingface? 🤗Transformers	2	1952	September 30, 2023
ValueError: too many values to unpack (expected 2) in text summarization. Possibly due to nested lists? 🤗Transformers	1	1759	September 29, 2023
Trainer.train() seems to finish almost instantly 🤗Transformers	0	521	September 29, 2023
Flan T5 fine tuning error 🤗Transformers	0	524	September 29, 2023
Finetune Llama with PPOTrainer 🤗Transformers	2	898	September 29, 2023
How to pass `min_length` parameter in generate? 🤗Transformers	1	342	September 29, 2023
Understanding the docoder attention weights in the Fusion-in-Decoder method 🤗Transformers	0	375	September 29, 2023
Q&A evaluation: Mismatch in the number of predictions (775) and references (835) 🤗Transformers	4	3267	September 28, 2023
Is there way to convert the Donut model to openvino format 🤗Transformers	0	172	September 28, 2023
Batched generation_config/kwargs for the `transformers.generation.utils.generate` function 🤗Transformers	0	193	September 28, 2023
Convert torch tensor to String Representation Value 🤗Transformers	1	3552	September 28, 2023
Use custom model for mask filling using pipeline 🤗Transformers	0	340	September 27, 2023
Costumizing MASKed tokens 🤗Transformers	1	243	September 27, 2023
Conversational pipeline by huggingface transformer taking too long to generate output 🤗Transformers	0	843	September 27, 2023
Vall-e and Vall-e X implementation 🤗Transformers	0	398	September 27, 2023
Debugging the compute_loss function for custom dice loss in binary segmentation tasks 🤗Transformers	0	404	September 27, 2023
Avoid installation of pytorch with transformers for onnx inference 🤗Transformers	0	132	September 26, 2023
How does attention key/value caching work with models that have learned absolute position embeddings? 🤗Transformers	0	1366	September 26, 2023
Error with DataCollator for SpeechT5 🤗Transformers	2	389	September 26, 2023
Rouge-L score in Trainer huggingface 🤗Transformers	1	2045	September 25, 2023
Best transformer model to check grammar 🤗Transformers	0	325	September 24, 2023
How to turn off text streamer to repeat prompt in the output? 🤗Transformers	0	328	September 23, 2023