🤗Transformers

Topic	Replies	Views	Activity
How to train my model on multiple GPU 🤗Transformers	2	2054	March 6, 2024
Saving checkpoint is too slow with deepspeed DeepSpeed	5	2893	March 6, 2024
CUDA out of memory on multi-GPU 🤗Transformers	1	2675	March 6, 2024
Extracting logits from vision language models at inference time 🤗Transformers	0	147	March 6, 2024
Training arguments modification and tuning 🤗Transformers	0	211	March 5, 2024
How to increase the width of hidden linear layers in Mistral 7B model? 🤗Transformers	1	285	March 5, 2024
Self-attention extraction from Long T5 🤗Transformers	0	247	March 5, 2024
SDPA attention in e.g. Llama does not use fused accelerations 🤗Transformers	0	846	March 5, 2024
Fine-tuning for Specific Medical Domains to Reduce Loss Stagnation 🤗Transformers	0	301	March 5, 2024
Fine-tuning LLM for regression yields low loss during training but not in inference? 🤗Transformers	2	4608	March 4, 2024
Challenges Achieving Satisfactory Accuracy in Fine-Tuning RoBERTa on a Custom Masked Token Prediction Dataset 🤗Transformers	2	317	March 4, 2024
Transformer pipeline load local pipeline 🤗Transformers	8	9173	March 4, 2024
Minimal OS Linux requirements to run transformers 🤗Transformers	0	185	March 4, 2024
Reproducible Results? 🤗Transformers	0	361	March 3, 2024
Pre-tokenization vs. mini-batch tokenization and TOKENIZERS_PARALLELISM warning 🤗Transformers	2	7654	March 3, 2024
BART learns well, loss decreases, but prediction output is weird 🤗Transformers	2	197	March 3, 2024
How can I prompt Llama to only use my provided context? 🤗Transformers	1	1668	March 2, 2024
How set EncoderDecoderModel.config? 🤗Transformers	1	213	March 2, 2024
Transformers error module not found see the image and pls tell solution 🤗Transformers	0	177	March 2, 2024
Running GGUF model files using Auto classes 🤗Transformers	2	2439	March 2, 2024
Usage issue regarding Mistral 🤗Transformers	0	452	March 1, 2024
Barkmodel not intialising with flash_attention_2 🤗Transformers	0	273	March 1, 2024
Best way to perform paragraph embeddings? 🤗Transformers	1	471	March 1, 2024
[On model.fit()]: TypeError: Exception encountered when calling layer 🤗Transformers	5	3700	March 1, 2024
TRL Library (how to load the reward model and calculate score from some prompt answer pairs) 🤗Transformers	0	286	February 29, 2024
Best LLM to pretrain? 🤗Transformers	0	840	February 29, 2024
DataCollator uses Tokenizer while having BatchEncodings? 🤗Transformers	0	139	February 29, 2024
Label 0 for MaskFormer Semantic Segmentation- Custom dataset 🤗Transformers	0	129	February 29, 2024
Overcoming Overfitting in Transformer Fine-Tuning? 🤗Transformers	0	466	February 29, 2024
Wav2Vec Classification on Labeled Data 🤗Transformers	0	95	February 28, 2024