🤗Transformers

Topic	Replies	Views	Activity
Darshan Hiranandani : Freezing Layers in ALBERT for Fine-Tuning: Feasible with TensorFlow? 🤗Transformers	0	13	December 27, 2024
Can I resume training from a model that's been pushed to the hub? 🤗Transformers	1	23	December 27, 2024
Errors when trying to fine-tune OpenLLaMA using Trainer API 🤗Transformers	1	369	December 26, 2024
Inference without gradient computation? 🤗Transformers	2	6938	December 26, 2024
Wav2vec2 finetuning custom dataset 🤗Transformers	2	2440	December 25, 2024
Using Seq2SeqTrainer for decoders? 🤗Transformers	0	80	December 25, 2024
Shoud we add position embeddings to Values 🤗Transformers	0	7	December 24, 2024
BERT MLM - 80% [MASK], 10% random words and 10% same word - how does this work? 🤗Transformers	0	1184	May 12, 2022
Is it possible to freeze certain layer in ALBERT for Fine Tune? 🤗Transformers	0	27	December 24, 2024
FlavaModel multimodal_embeddings shape and text_embeddings shape is not match 🤗Transformers	0	15	December 23, 2024
How to separate Multi-head weight from q, k, v matrices? 🤗Transformers	0	18	December 22, 2024
Onnx, Error: Failed to load model because protobuf parsing failed 🤗Transformers	1	1699	December 21, 2024
Fine-tuning whisper on sound-event-detection dataset 🤗Transformers	0	84	December 20, 2024
The model trained in PyTorch produces inconsistent predictions for the same image when processed individually versus in a batch 🤗Transformers	4	48	December 20, 2024
How to Ensure Each Process Reads Its Own Dataset and Trains Correctly When Using Trainer？ 🤗Transformers	0	15	December 20, 2024
How to count input tokens in vision model? 🤗Transformers	4	598	December 19, 2024
Could not load model meta-llama/Llama-2-7b-chat-hf with any of the following classes 🤗Transformers	22	49439	December 19, 2024
Ensure the sentence is complete during generation 🤗Transformers	5	7029	December 19, 2024
Unbelievable Error: Help ME! 🤗Transformers	6	833	December 18, 2024
Most effiecient way to move padding tokens to the right side of a tensor? 🤗Transformers	2	113	December 18, 2024
How to beat LSTM in time series regression preferably with transformer? 🤗Transformers	0	82	December 17, 2024
Transformers.js Chat Completion on SmolLM2 using 🤗Transformers	0	63	December 17, 2024
Using IterableDataset with Trainer - `IterableDataset' has no len() 🤗Transformers	7	14343	December 17, 2024
Qwen based AI assistant randomly having an absolute, utter, complete 'mental breakdowns'?? (Inference API) 🤗Transformers	2	109	December 17, 2024
KV caching for varying length texts 🤗Transformers	1	150	December 16, 2024
Positional encoding 🤗Transformers	3	179	December 16, 2024
Repeated training runs out of GPU memory 🤗Transformers	3	241	December 16, 2024
Index out of range in transformer summarization 🤗Transformers	2	99	December 16, 2024
What loss type should be used to train vision-llm with auto regression style? 🤗Transformers	1	98	December 15, 2024
CUDA out of memory when using Trainer with compute_metrics 🤗Transformers	24	45657	December 13, 2024