🤗Transformers

Topic	Replies	Views	Activity
Train results for text classification 🤗Transformers	0	152	November 22, 2023
Why is the average length of generated summaries during Hugging Face text summarization training much smaller than the actual average length of the training data? 🤗Transformers	1	415	November 20, 2023
Greedy decoding produces empty output 🤗Transformers	2	1229	November 22, 2023
Wav2Vec2 Speech Pre-Training After a few epochs the contrastive loss was decreased to zero and the model stopped changing 🤗Transformers	2	749	November 21, 2023
Fine-tuning a language model on domain specific embeddings 🤗Transformers	1	1138	November 21, 2023
Tensorflow Fine Tuning Notebook - MRPC dataset 🤗Transformers	0	124	November 21, 2023
Using an image's text and image's embedding from clip with FAISS 🤗Transformers	2	2356	November 21, 2023
Fine Tuning Falcon7B with QLora 🤗Transformers	5	1087	November 21, 2023
Distributed training on just cpu on a single node 🤗Transformers	0	164	November 21, 2023
How could protein language models generate outputs for natural language input texts? 🤗Transformers	4	420	November 21, 2023
What does LoRA do to model by default? DeepSpeed	0	540	November 21, 2023
T5 submission fails on OpenLLM leaderboard 🤗Transformers	0	163	November 21, 2023
Mistral from Huggingface is slow 🤗Transformers	0	1151	November 19, 2023
Transformer.JS in React-Native Application 🤗Transformers	1	2965	November 20, 2023
Visualbert lower accuracy in validation dataset 🤗Transformers	0	190	November 20, 2023
Sharding Models for Inference 🤗Transformers	0	161	November 19, 2023
Batch Transform with strategy='MultiRecord' returns only one line 🤗Transformers	0	404	November 19, 2023
Can anyone recommend a good STT model that is well suited to work on with tensorflow-metal on the M1 Mac? 🤗Transformers	0	326	November 19, 2023
Highlighting important tokens for input into LLM 🤗Transformers	0	240	November 18, 2023
How to plot models using torchviz or hiddenlayer 🤗Transformers	3	8580	November 18, 2023
Using Lora for inference 🤗Transformers	1	693	November 18, 2023
Training with class weights 🤗Transformers	5	2994	November 18, 2023
Bert Model: IndexError: too many indices for tensor of dimension 2 🤗Transformers	0	768	November 17, 2023
MLFlow and Optuna 🤗Transformers	5	1743	November 17, 2023
Distributed inference for long strings 🤗Transformers	0	167	November 17, 2023
Allow for next sequence token in a given tokenizer. Phi 1.5 🤗Transformers	0	172	November 16, 2023
Is it possible to push_to_hub at every checkpoint? 🤗Transformers	2	1121	November 16, 2023
Attention_mask missing from generate() output 🤗Transformers	0	198	November 16, 2023
Pipeline inference with Dataset api 🤗Transformers	5	12062	November 15, 2023
Running out of System RAM while loading BLIP2 on Colab? 🤗Transformers	0	394	November 15, 2023