🤗Transformers

Topic	Replies	Views	Activity
Interrupting run to trigger checkpoint? 🤗Transformers	0	6	December 13, 2024
Not able to access after login through hugging face hub in google colab 🤗Transformers	1	135	December 13, 2024
Solution for Fine Tuning the Blip Model 🤗Transformers	0	91	December 13, 2024
In SpeechSeq2Seq models, is it possible to pass decoder_input_ids for each sample during the training time using huggingface Trainer? 🤗Transformers	0	27	December 12, 2024
How to Load Llama-3.3-70B-Instruct Model in Float8 Precision? 🤗Transformers	1	280	December 11, 2024
LLama 3.1 torch.compile & static cache 🤗Transformers	2	281	December 9, 2024
Padding side in instruction fine-tuning using SFTT 🤗Transformers	1	1386	December 9, 2024
Transformers Pretrained model import 🤗Transformers	3	382	December 9, 2024
CUDA error: device-side assert triggered on device_map="auto" 🤗Transformers	4	1612	December 8, 2024
Pretrain model not accepting optimizer 🤗Transformers	30	4677	December 7, 2024
How to use I-JEPA for image classficiation 🤗Transformers	4	1917	December 6, 2024
Albert pre-train convergence problem 🤗Transformers	1	631	December 6, 2024
DDP error for LoRA SFT 🤗Transformers	1	163	December 5, 2024
Trainer is not saving all layers when fine-tuning Llama with P-Tuning 🤗Transformers	0	45	December 5, 2024
Understanding GPT-2 logits 🤗Transformers	0	56	December 5, 2024
How to log Trainer's training progress bars into a file 🤗Transformers	2	1767	December 5, 2024
Transformer's Trainer Memory shared Error 🤗Transformers	3	490	December 5, 2024
Transformer's trainer runtime error 🤗Transformers	1	81	December 5, 2024
Higher loss when resuming training from LLAMA 1B checkpoint 🤗Transformers	1	99	December 5, 2024
Sequence Classification on StableLMEpochConfig 🤗Transformers	0	27	December 4, 2024
Target {} is out of bounds 🤗Transformers	5	8792	December 3, 2024
Russian documentation review 🤗Transformers	0	62	December 3, 2024
How to use ViT MAE for image classification? 🤗Transformers	4	2280	December 3, 2024
How to set audio language in Whisper Pipeline? 🤗Transformers	6	6709	December 2, 2024
Compute VRAM size for Text2Text text generation 🤗Transformers	0	44	December 1, 2024
Continous increase in Memory usage 🤗Transformers	12	1089	December 1, 2024
Pre-training DeBERTaV2 - config questions 🤗Transformers	7	1255	December 1, 2024
The CPU memory usage becomes very small during model inference 🤗Transformers	0	44	November 30, 2024
Using huggingface as a hosting / CDN for a pretrained model 🤗Transformers	0	119	November 29, 2024
Reproducible model between SetFit Versions? 🤗Transformers	5	84	November 29, 2024