🤗Transformers

Topic	Replies	Views	Activity
About finetuning whisper 🤗Transformers	0	211	May 5, 2023
Why is Reformer's Vocab Size So Small? 🤗Transformers	0	268	May 5, 2023
Using Trainer at inference time 🤗Transformers	9	15980	May 4, 2023
Mirroring Huggingface S3 to download models/tokenizers 🤗Transformers	2	3485	May 4, 2023
Trainer gives error after 1st epoch when using F1 score 🤗Transformers	0	523	May 4, 2023
How to use PEFT approach to do Prompt Tuning on DollyV2 model 🤗Transformers	0	768	May 4, 2023
Fine-tune CLIPSeg with (image, mask) dataset 🤗Transformers	3	1889	May 4, 2023
How to merge LoRa weights with base model? 🤗Transformers	0	1312	May 3, 2023
Why I am getting no accuracy for the trainer.train() result of roberta text classification model 🤗Transformers	0	153	May 2, 2023
Facebook BART Fine-tuning - Transformers CUDA error: CUBLAS_STATUS_NOT_INITIALIZE 🤗Transformers	4	1768	May 2, 2023
How to train a T5 model to learn a programming language? 🤗Transformers	0	499	May 2, 2023
Masked language model for BART (Not BERT) 🤗Transformers	5	1513	July 5, 2022
Hyperparameter tuning using Trainer not getting same performance 🤗Transformers	0	280	May 1, 2023
BioGPT causal language model with unexpected error 🤗Transformers	0	332	May 1, 2023
Overall accuracy in Finetuning dslim/bert-base-NER with custom dataset and labels gets only up to ~0.15 using seqeval 🤗Transformers	2	514	May 1, 2023
Trainer.train() is stuck 🤗Transformers	5	7449	May 1, 2023
Tokenizer.from_pretrained calls stuck forever 🤗Transformers	0	647	April 30, 2023
FlashAttention or equivalent? 🤗Transformers	0	914	April 30, 2023
Trainable weights in automodel and comparison with lora 🤗Transformers	0	221	April 28, 2023
Unable to train token classification model 🤗Transformers	0	298	April 27, 2023
Script to Fine-Tune FLAN UL2 🤗Transformers	1	298	April 27, 2023
Model did not return a loss --- but why? 🤗Transformers	0	748	April 27, 2023
Do automatically generated attention masks ignore padding? 🤗Transformers	4	16728	March 8, 2022
Can Similarity Sentence Returns the Similarity Content? 🤗Transformers	0	325	April 27, 2023
Finetuning T5-large on Multiple GPUs 🤗Transformers	0	1098	April 26, 2023
Whisper identified the wrong language 🤗Transformers	0	357	April 26, 2023
Fine Tuning a model for Prompt Engineering 🤗Transformers	0	930	April 26, 2023
transformers.Tokenizer produce unexpected results 🤗Transformers	0	208	April 26, 2023
How to get all prefixes for T5? 🤗Transformers	0	192	April 26, 2023
Exclude words from GPT-2 generate( ) 🤗Transformers	3	1768	April 26, 2023