🤗Transformers

Topic	Replies	Views	Activity
Using the specific loss of a dataset as the early stopping metric 🤗Transformers	0	245	March 13, 2024
Using multiple GPUs for zero-shot-classification's pipeline with bart-large-mnli model 🤗Transformers	0	228	March 13, 2024
Why do I get different embeddings when I perform batch encoding in huggingface MT5 model? 🤗Transformers	2	656	March 12, 2024
T5 omits some characters 🤗Transformers	1	121	March 12, 2024
PPOTrainer: KeyError: 'quant_storage' 🤗Transformers	0	172	March 12, 2024
Struggle with finetuneing flan-t5-xxl using deepspeed DeepSpeed	3	853	March 12, 2024
Using UDOP for layout analysis 🤗Transformers	7	985	March 12, 2024
Bert attention mask question 🤗Transformers	4	1225	March 11, 2024
Cannot Download Dolly Due to 'OSError: Distant resource does not seem to be on huggingface.co (missing commit header).' 🤗Transformers	1	308	March 11, 2024
CUDA out of memory when training mt5-XL 🤗Transformers	1	244	March 11, 2024
Set batch instead of full train dataset on Trainer 🤗Transformers	1	372	March 11, 2024
Perceiver io : Is there any way to specify the query tensor 🤗Transformers	1	169	March 11, 2024
Gradient Checkpointing with external values 🤗Transformers	0	84	March 11, 2024
CLIP-like models do not support .add_adapter method 🤗Transformers	1	176	March 10, 2024
Uncaught ReferenceError: window is not defined. While using Huggingface Transformers.js clientside inference 🤗Transformers	2	554	March 10, 2024
AutoTrain error with Sequential data on evaluation loop 🤗Transformers	3	316	March 10, 2024
Using TFBertTokenizer with tf.data.Dataset 🤗Transformers	3	303	March 10, 2024
Merging two models 🤗Transformers	1	716	March 9, 2024
Jax and flax version used for the new gemma models 🤗Transformers	1	279	March 9, 2024
How to pass input to a Reward Model and make sense of its output? 🤗Transformers	1	396	March 8, 2024
Has anyone come across BERT fine-tuned for CLM task? 🤗Transformers	0	84	March 8, 2024
Deepspeed inference stage 3 + quantization DeepSpeed	0	1012	March 8, 2024
Custom tokenizer: finetune model or retrain model? 🤗Transformers	1	974	March 8, 2024
How to Decode InputIDs back to String in LayoutLMV3 🤗Transformers	2	1372	March 8, 2024
Fine-tunning llama2 with multiple GPU hugging face trainer 🤗Transformers	8	3390	March 7, 2024
No Simple way to add a ValueHead on top of existing HuggingFace Model while Preserving all PreTrainedModel Functionalities? 🤗Transformers	0	165	March 7, 2024
Batch_size, seq_length = input_shape ValueError: too many values to unpack (expected 2) Transformer Sentence Similarity Classification 🤗Transformers	16	1137	March 8, 2024
How does compute/resource allocation work for hyperparam search? 🤗Transformers	0	106	March 7, 2024
Auto Model for Sequence Classification take more than 20 minutes to classify a single sequence 🤗Transformers	3	262	March 7, 2024
We are facing the above error, i give code, please debug the code to correct manner 🤗Transformers	0	242	March 7, 2024