🤗Transformers

Topic	Replies	Views	Activity
Looking for help converting transformers to ONNX with HF Optimum 🤗Transformers	0	279	November 9, 2023
Reasoning Distillation with Huggingface Trainer 🤗Transformers	0	244	November 8, 2023
An extra space appears before the entities recognised with RoBERTa fine-tuned for Token Classification 🤗Transformers	0	158	November 8, 2023
Adapter-transformers vs transformers 🤗Transformers	1	123	November 8, 2023
How can i implement custom model to use Seq2SeqTrainer class 🤗Transformers	0	444	November 8, 2023
The size of tensor a (146) must match the size of tensor b (1214) at non-singleton dimension 1 🤗Transformers	0	380	November 8, 2023
Rag model set up 🤗Transformers	0	697	November 7, 2023
Llama 2 10x slower than LLaMA 1 🤗Transformers	1	729	November 7, 2023
How can one visualize the Cross-Attention of a VisionEncoderDecoderModel? 🤗Transformers	2	2003	November 7, 2023
Should I use .map(processor) or define tokenizer=processor? 🤗Transformers	0	173	November 7, 2023
Convert OpenAI whisper transformer model to Quantized tflite model 🤗Transformers	1	2402	November 7, 2023
The num_return_sequences parameter in model.generate does not return unique outputs 🤗Transformers	0	392	November 6, 2023
Error with get_peft_model() and PromptTuningConfig 🤗Transformers	1	1551	November 6, 2023
I want to use bert model weight to train a gpt model how is that possible 🤗Transformers	0	151	November 4, 2023
Context window decreased after finetuning? 🤗Transformers	0	190	November 4, 2023
Fine tunning llama2 with multiple GPUs and Hugging face trainer 🤗Transformers	1	3495	November 3, 2023
Chatbot in offline mode using when using langchain.HuggingFaceImbeddings 🤗Transformers	0	4844	November 3, 2023
SegformerImageProcesser only supports uint8 masks 🤗Transformers	0	135	November 2, 2023
Shockingly Incorrect Evaluate Function in Huggingface API 🤗Transformers	1	168	November 2, 2023
0% accuracy when finetuning from certain models. [CLS] token embeddings not learned 🤗Transformers	1	614	November 2, 2023
Regarding the data input injected into transformer_xl or transformer models 🤗Transformers	0	88	November 2, 2023
Steraming Inference without TGI 🤗Transformers	0	352	November 2, 2023
Is it possible to evaluate generations/output while fine-tuning a LLM? 🤗Transformers	2	753	November 1, 2023
How to restrict training to one GPU if multiple are available, co 🤗Transformers	4	14470	November 1, 2023
Train LoRA adapters on Multiple Datasets in Parallel for llama7B 🤗Transformers	0	986	November 1, 2023
Abnormal large value of MobileBert's <cls> embed 🤗Transformers	0	123	November 1, 2023
Ġ token inserted by ByteLevelBPETokenizer 🤗Transformers	0	565	November 1, 2023
Optimum-neuron example script fails on trainium instance 🤗Transformers	0	266	November 1, 2023
Beam Search without `model.generate` 🤗Transformers	0	205	November 1, 2023
Embedding layer or last hidden_hidden_state 🤗Transformers	0	215	November 1, 2023