🤗Transformers

Topic	Replies	Views	Activity
Pytorch NLP model doesn’t use GPU when making inference 🤗Transformers	5	14237	January 5, 2024
Informer For Prediction, Need help! 🤗Transformers	4	1031	January 5, 2024
Finetuned Donut model taking too much time on local machine for inference , around 5 minutes 🤗Transformers	3	961	January 4, 2024
How much data to train a language model from scratch? 🤗Transformers	1	753	January 4, 2024
RuntimeError: Sizes of tensors must match except in dimension 2. Expected size 8 but got size 64 for tensor number 1 in the list 🤗Transformers	1	1243	January 4, 2024
`return_overflowing_tokens` with something like total_max_length 🤗Transformers	0	556	January 4, 2024
Implementing StoppingCriteria for Code Generating Transformers 🤗Transformers	2	3019	January 4, 2024
Mixtral bad FP16 performance DeepSpeed	0	521	January 3, 2024
Additional loss logging 🤗Transformers	1	665	January 4, 2024
Stopping criteria for Llama2 70b 🤗Transformers	2	2907	January 3, 2024
Inference with VitMAE by providing a mask 🤗Transformers	0	291	January 3, 2024
How to manually add noise to embeddings for RoBERTa? 🤗Transformers	2	923	January 3, 2024
How to use llava with huggingface 🤗Transformers	5	5633	January 3, 2024
Error occuring during usig .to_tf_dataset() 🤗Transformers	6	914	January 3, 2024
How can I speed up the setfit model 🤗Transformers	0	575	January 2, 2024
How to input system message and file prompt to Bloom 🤗Transformers	0	178	January 2, 2024
Comparing the performances of GPTs with deep learning in the field of binary files and their related reports 🤗Transformers	0	140	January 2, 2024
Multimodal LLM with Image and Text sequentially in its prompt 🤗Transformers	2	12455	January 1, 2024
CUDA out of memory when using the trainer model_init 🤗Transformers	0	250	December 31, 2023
Finetuned whisper model translating instead of transcribing 🤗Transformers	2	743	December 31, 2023
How to run Phi-1_5 on cpu? 🤗Transformers	1	634	December 30, 2023
Colab CUDA OOM using Llama-2-7b-chat-hf even with 40GPU RAM 🤗Transformers	0	910	December 29, 2023
In Colab, the part I gave below gives errors in all codes. Please can you help? 🤗Transformers	4	356	December 29, 2023
ValueError: model.embed_tokens.weight doesn't have any device set 🤗Transformers	5	6754	December 29, 2023
How to chunk a text such that it's exactly the max size of models input? 🤗Transformers	0	1896	December 29, 2023
Pegasus Tokenizer Error 🤗Transformers	5	4227	December 29, 2023
How to run Text Generation model (GPT2) on Transformers-cli serve? 🤗Transformers	0	217	December 29, 2023
Choosing save_steps value and getting the best checkpoint 🤗Transformers	0	242	December 28, 2023
Text2Speech model pushed to Hub as Text2Audio 🤗Transformers	2	195	December 28, 2023
Llama 2 support for AutoModelForQuestionAnswering 🤗Transformers	5	1905	December 27, 2023