🤗Transformers

Topic	Replies	Views	Activity
SFTTrainer Class 🤗Transformers	0	127	October 11, 2023
Onnx export functionality failure for facebook/opt-2.7b with optimum CLI 🤗Transformers	0	337	October 11, 2023
Pix2struct based model ddp code conversion DeepSpeed	1	312	October 11, 2023
Text Input Sequence Error 🤗Transformers	2	1142	October 11, 2023
I want to implement ToT tree of thoughts framework by using open source langauge model 🤗Transformers	0	365	October 11, 2023
I want to perform conversational /dialogue summarization on customer agent data(call center). Which model should i fine tune or any pretrained model is available 🤗Transformers	1	554	October 11, 2023
Using Hugging Face’s models on multiple computers 🤗Transformers	0	320	October 10, 2023
Flan-T5 with Tensorflow-Serving 🤗Transformers	0	417	October 9, 2023
How to minimize memory consume when loading from pretrained models? 🤗Transformers	0	347	October 9, 2023
How to load after calling trainer.model.push_to_hub() on a fine tuned model? 🤗Transformers	1	908	October 9, 2023
When using SGD: RuntimeError: element 0 of tensors does not require grad and does not have a grad_fn 🤗Transformers	0	1909	October 9, 2023
Intermediate features from a Huggingface pretrained model 🤗Transformers	0	335	October 8, 2023
Tried to download Mistral 7B but got an error message 🤗Transformers	3	13469	October 8, 2023
torch.cuda.OutOfMemoryError when evaluate while traning 🤗Transformers	0	515	October 8, 2023
Can I use sentence-transformers with tensorflow? 🤗Transformers	1	350	October 8, 2023
Trained a tokenizer from scratch but problem when loading 🤗Transformers	0	484	October 8, 2023
Qunatized model with LORA takes much more GPU memory than the un-quantized model with LORA for the (E-5-Large Embedding Transformer) 🤗Transformers	4	1781	October 8, 2023
TrainingArgument 🤗Transformers	3	8252	October 8, 2023
Customising pretrained SegFormer 🤗Transformers	4	1580	October 6, 2023
LiLT not returning words when ocr_=True 🤗Transformers	0	118	October 6, 2023
Test data size error in TimeSeriesTransformer 🤗Transformers	0	237	October 5, 2023
How to sample from the validation set when using Trainer? 🤗Transformers	4	1920	October 5, 2023
Jupyter notebook hangs when creating TrainingArguments 🤗Transformers	0	314	October 5, 2023
Finetuned llama7b model is 5x slower than hugingface raw model 🤗Transformers	2	1527	October 5, 2023
Info about insertion of "distillation_token" into the audio spectrogram transformer class 🤗Transformers	0	182	October 4, 2023
Compatibility of transformers version 4.11.1 with Python 3.11 🤗Transformers	0	2154	October 4, 2023
Speed up beam search for item generation DeepSpeed	1	955	October 4, 2023
Sequence numerical clasification 🤗Transformers	1	932	October 3, 2023
Evaluating on MMLU while finetuning using Trainer 🤗Transformers	0	805	October 3, 2023
Example script for VideoMAEForPreTraining 🤗Transformers	0	146	October 3, 2023