🤗Transformers

Topic	Replies	Views	Activity
Not able to access after login through hugging face hub in google colab 🤗Transformers	1	156	December 13, 2024
Solution for Fine Tuning the Blip Model 🤗Transformers	0	99	December 13, 2024
In SpeechSeq2Seq models, is it possible to pass decoder_input_ids for each sample during the training time using huggingface Trainer? 🤗Transformers	0	32	December 12, 2024
How to Load Llama-3.3-70B-Instruct Model in Float8 Precision? 🤗Transformers	1	305	December 11, 2024
LLama 3.1 torch.compile & static cache 🤗Transformers	2	338	December 9, 2024
Padding side in instruction fine-tuning using SFTT 🤗Transformers	1	1772	December 9, 2024
Transformers Pretrained model import 🤗Transformers	3	1010	December 9, 2024
CUDA error: device-side assert triggered on device_map="auto" 🤗Transformers	4	1664	December 8, 2024
Pretrain model not accepting optimizer 🤗Transformers	30	4827	December 7, 2024
How to use I-JEPA for image classficiation 🤗Transformers	4	2006	December 6, 2024
Albert pre-train convergence problem 🤗Transformers	1	634	December 6, 2024
DDP error for LoRA SFT 🤗Transformers	1	204	December 5, 2024
Trainer is not saving all layers when fine-tuning Llama with P-Tuning 🤗Transformers	0	45	December 5, 2024
Understanding GPT-2 logits 🤗Transformers	0	78	December 5, 2024
How to log Trainer's training progress bars into a file 🤗Transformers	2	1839	December 5, 2024
Transformer's Trainer Memory shared Error 🤗Transformers	3	805	December 5, 2024
Transformer's trainer runtime error 🤗Transformers	1	109	December 5, 2024
Higher loss when resuming training from LLAMA 1B checkpoint 🤗Transformers	1	123	December 5, 2024
Sequence Classification on StableLMEpochConfig 🤗Transformers	0	27	December 4, 2024
Target {} is out of bounds 🤗Transformers	5	8821	December 3, 2024
Russian documentation review 🤗Transformers	0	63	December 3, 2024
How to use ViT MAE for image classification? 🤗Transformers	4	2349	December 3, 2024
How to set audio language in Whisper Pipeline? 🤗Transformers	6	7007	December 2, 2024
Compute VRAM size for Text2Text text generation 🤗Transformers	0	46	December 1, 2024
Continous increase in Memory usage 🤗Transformers	12	1476	December 1, 2024
Pre-training DeBERTaV2 - config questions 🤗Transformers	7	1280	December 1, 2024
The CPU memory usage becomes very small during model inference 🤗Transformers	0	53	November 30, 2024
Using huggingface as a hosting / CDN for a pretrained model 🤗Transformers	0	141	November 29, 2024
Reproducible model between SetFit Versions? 🤗Transformers	5	102	November 29, 2024
Task_type parameter of LoraConfig 🤗Transformers	6	16855	November 28, 2024