🤗Transformers

Topic	Replies	Views	Activity
Tokenizer train_new_from_iterator hanging for several models 🤗Transformers	0	149	March 16, 2024
I am following a hugging face guide for fine tuning whisper but I run into error when training 🤗Transformers	0	168	March 15, 2024
Is it ok to have max_length greater than context_length of the model 🤗Transformers	0	309	March 15, 2024
Release timeline for 4.39.0 / mamba? 🤗Transformers	0	199	March 14, 2024
Error while using LILT model "index out of range in self" 🤗Transformers	5	700	March 14, 2024
Quantizing a model on M1 Mac for qlora 🤗Transformers	0	1604	March 14, 2024
`seq_classif_dropout = 0.2` what is the use of adding dropout after the classification network 🤗Transformers	0	103	March 14, 2024
Conceptual question: Early loading of the model defeats the purpose of deepspeed! DeepSpeed	0	158	March 14, 2024
How to fine-tune a Mistral-7B model for machine translation? 🤗Transformers	1	355	March 13, 2024
Customizing model architecture from predefined models 🤗Transformers	0	347	March 13, 2024
What model-pairs are supported by the assistant decoding generation in Huggingface AutoModelForCausalLM? 🤗Transformers	1	178	March 13, 2024
Poor Results with FAISS Index on RAG System 🤗Transformers	0	602	March 13, 2024
Implementation suggestion my use case 🤗Transformers	0	143	March 13, 2024
Using the specific loss of a dataset as the early stopping metric 🤗Transformers	0	235	March 13, 2024
Using multiple GPUs for zero-shot-classification's pipeline with bart-large-mnli model 🤗Transformers	0	224	March 13, 2024
Why do I get different embeddings when I perform batch encoding in huggingface MT5 model? 🤗Transformers	2	595	March 12, 2024
T5 omits some characters 🤗Transformers	1	121	March 12, 2024
PPOTrainer: KeyError: 'quant_storage' 🤗Transformers	0	172	March 12, 2024
Struggle with finetuneing flan-t5-xxl using deepspeed DeepSpeed	3	846	March 12, 2024
Using UDOP for layout analysis 🤗Transformers	7	964	March 12, 2024
Bert attention mask question 🤗Transformers	4	1192	March 11, 2024
Cannot Download Dolly Due to 'OSError: Distant resource does not seem to be on huggingface.co (missing commit header).' 🤗Transformers	1	296	March 11, 2024
CUDA out of memory when training mt5-XL 🤗Transformers	1	237	March 11, 2024
Set batch instead of full train dataset on Trainer 🤗Transformers	1	370	March 11, 2024
Perceiver io : Is there any way to specify the query tensor 🤗Transformers	1	165	March 11, 2024
Gradient Checkpointing with external values 🤗Transformers	0	84	March 11, 2024
CLIP-like models do not support .add_adapter method 🤗Transformers	1	168	March 10, 2024
Uncaught ReferenceError: window is not defined. While using Huggingface Transformers.js clientside inference 🤗Transformers	2	545	March 10, 2024
AutoTrain error with Sequential data on evaluation loop 🤗Transformers	3	308	March 10, 2024
Using TFBertTokenizer with tf.data.Dataset 🤗Transformers	3	288	March 10, 2024