🤗Transformers

Topic	Replies	Views	Activity
Training fails on multiple gpu throwing cuda runtime errors 🤗Transformers	0	922	September 30, 2022
Training Reproducibility when resuming from checkpoint 🤗Transformers	0	354	September 30, 2022
Problem in loading an old sentence classification roberta model generated using transformer version 3.0.2 with new library 🤗Transformers	0	644	September 30, 2022
GLUE-STS Finetune Error 🤗Transformers	0	394	September 30, 2022
Problems with a custom model using a transformer base model in the evaluation phase (eval_strategy) 🤗Transformers	0	856	September 30, 2022
Useful compute_metrics functions for perplexity 🤗Transformers	0	641	September 29, 2022
How to change the Text embedder(Layoutlmv2Tokenizer) in LayoutLMv2 model? 🤗Transformers	3	522	September 29, 2022
M2M100 training does not improve model performance 🤗Transformers	0	303	September 29, 2022
Constant output predictions on test data 🤗Transformers	0	509	September 29, 2022
ELECTRA TF2 => PT Convert Problem 🤗Transformers	0	224	September 28, 2022
Multi-instance transformers 🤗Transformers	0	245	September 27, 2022
Evaluation results (metric) during training is different from the evaluation results at the end 🤗Transformers	4	3256	September 26, 2022
Speeding up Tokenization on large text corpus 🤗Transformers	0	446	September 26, 2022
RuntimeError: cannot reshape tensor of 0 elements into shape [-1, 0] because the unspecified dimension size -1 can be any value and is ambiguous 🤗Transformers	1	8338	September 26, 2022
How to take ensemble of T5ForConditionalGeneration? 🤗Transformers	0	284	September 25, 2022
New Layer in BERT 🤗Transformers	0	200	September 25, 2022
Further train a fine tuned wav2vec model 🤗Transformers	2	535	September 25, 2022
How to parallelize model in order version 🤗Transformers	0	221	September 24, 2022
GPT-J generating chatbot response 🤗Transformers	2	2686	September 23, 2022
Why is transformer decoder always generating output of same length as gold labels? 🤗Transformers	0	574	September 23, 2022
Create a Few Shots NER 🤗Transformers	0	997	September 22, 2022
How to generate text with T5Model other than T5ForConditionalGeneration? 🤗Transformers	0	301	September 22, 2022
How can I train M2M-100 or NLLB-200 on my parallel bilingual corpus? 🤗Transformers	0	793	September 22, 2022
Fine-Tuning DeBERTa Produces Non-Results 🤗Transformers	3	3132	September 21, 2022
How to map generated characters to tokens? 🤗Transformers	0	484	September 21, 2022
T5 model fine-tuning in the stsb dataset generates wrong outputs 🤗Transformers	2	934	September 21, 2022
Why model.generate does encoding multiple times 🤗Transformers	1	565	September 20, 2022
Baseline vs language-specific finetuned model for multilingual speech recognition 🤗Transformers	0	314	September 20, 2022
Can Mac M1 GPU be used to train HappyGeneration 🤗Transformers	0	609	September 20, 2022
Load a cached custom model in offline mode 🤗Transformers	1	10418	September 19, 2022