🤗Transformers

Topic	Replies	Views	Activity
Order of execution of Top-K, Top-P sampling along with temperature 🤗Transformers	1	3890	October 31, 2023
Evaluatation of the gradients of class probabilities and logits with respect to attention layer and hidden states 🤗Transformers	0	363	October 30, 2023
BEiT Semantic Segmentation Model Performance Low 🤗Transformers	0	148	October 30, 2023
How to override model.generate() 🤗Transformers	1	991	October 30, 2023
Batching large csv for embedding 🤗Transformers	0	552	October 30, 2023
Output token lengths of smaller models 🤗Transformers	0	505	October 30, 2023
'T5ForConditionalGeneration' object has no attribute '_prune_heads' 🤗Transformers	1	2492	October 30, 2023
Fine-tuning to google/tapas-base-finetuned-wtq to an italian dataset 🤗Transformers	2	1440	October 28, 2023
Tensorboard files not uploading 🤗Transformers	0	188	October 28, 2023
Error finding processor's image class. Loading based on pattern matching with feature extractor 🤗Transformers	11	12642	October 27, 2023
Will it be learned properly if tokens listed in one dimension are reshaped in the form of (batch, seq_len) and inputted into the transformer xl model? 🤗Transformers	0	169	October 27, 2023
The `use_auth_token` argument is deprecated and will be removed in v5 of Transformers 🤗Transformers	4	5107	October 27, 2023
Does anyone have an idea how we can run llama2 with multiple GPUs? 🤗Transformers	1	1280	October 26, 2023
Tensor size mismatch when using Informer 🤗Transformers	0	631	October 25, 2023
What is the correct way to provide sequence bias to the pipeline for automatic-speech-recognitio task using Whisper Model 🤗Transformers	0	454	October 25, 2023
Security Policy 🤗Transformers	0	186	October 25, 2023
How to build email subject, body generations like chatGPT 🤗Transformers	1	486	October 25, 2023
Training loss is not decreasing using TFBertModel 🤗Transformers	4	5798	October 24, 2023
Tokenizers How do you extract concatenated entity words from B-ORG and I-ORGs etc 🤗Transformers	0	108	October 24, 2023
SpecAugment on Wav2Vec2 feature encoder outputs 🤗Transformers	0	419	October 24, 2023
Pretrain own model 🤗Transformers	0	271	October 23, 2023
Track number of tokens seen during training in wandb with Trainer API 🤗Transformers	2	1278	October 23, 2023
How can I load opt-175b model 🤗Transformers	0	196	October 23, 2023
No cuda support for asr pipeline 🤗Transformers	0	265	October 20, 2023
Does loading in 4bit override an 8bit model? 🤗Transformers	0	697	October 20, 2023
Unable to use Constrained beam search with google/flan-t5-base 🤗Transformers	1	381	October 20, 2023
Fine Tuning Segformer on Custom Dataset, getting negative loss 🤗Transformers	1	537	October 20, 2023
Trainer: log token count 🤗Transformers	0	247	October 19, 2023
Potential bug with beam search + eos_token_id 🤗Transformers	1	654	October 19, 2023
XLA Integration for TensorFlow Models 🤗Transformers	0	142	October 19, 2023