🤗Transformers

Topic	Replies	Views	Activity
Gradient through image processor 🤗Transformers	0	356	September 5, 2023
Segment Anything model fine-tuning use in a pipeline 🤗Transformers	1	866	September 5, 2023
XLNET trainer.predict() RuntimeError: Input tensor at index 1 has invalid shape DISTRIBUTED METRICS 🤗Transformers	1	658	September 5, 2023
429 Error from Amazon SageMaker Classic Notebook 🤗Transformers	2	923	September 5, 2023
LoRA vs QLoRA finetuning performance on llama2 🤗Transformers	0	2869	September 4, 2023
Problem with RWKV training when autocast and GradScaler both enabled 🤗Transformers	0	313	September 4, 2023
Train a t5 model 🤗Transformers	1	253	September 4, 2023
RuntimeError: stack expects each tensor to be equal size, but got [12] at entry 0 and [35] at entry 1 🤗Transformers	2	6015	September 3, 2023
Casual LM on GLUE dataset 🤗Transformers	0	144	September 2, 2023
Regarding Training a Task Specific Knowledge Distillation model 🤗Transformers	8	3442	September 2, 2023
Pipeline cannot infer suitable model classes from NadavShaked/d_nikud23 🤗Transformers	0	280	September 2, 2023
Langchain not changing pipeline's model to Llama-2-7b-hf 🤗Transformers	1	1452	September 2, 2023
LLaMA-2: CPU Memory Usage with ‘low_cpu_mem_usage=True’ and ‘torch_dtype=“auto”’ flags 🤗Transformers	0	3337	September 1, 2023
Idefics TCO monthly cost 🤗Transformers	0	115	August 31, 2023
Model connection timed out, even on simple requests DeepSpeed	0	306	August 31, 2023
Text classifier is trained incorrectly using BERT transformers (f1 = 0) for a certain amount of dataset 🤗Transformers	2	832	August 31, 2023
Token classification - learning_rate can not be changed 🤗Transformers	0	189	August 31, 2023
Fetching all parameters from the checkpoint at /xx/xxx/llama/70B. Killed 🤗Transformers	1	638	August 31, 2023
I used a trainer to pretraining a BertForMaskedLM model, but the training loss always be zero 🤗Transformers	0	236	August 31, 2023
How to fix this runtime error in this Databricks distributed training tutorial workbook 🤗Transformers	0	1081	August 30, 2023
TrainingArguments now Immutable. Why? 🤗Transformers	4	651	August 30, 2023
XML Transformation - One Format to Another 🤗Transformers	0	381	August 30, 2023
Batch inference using open source LLMs 🤗Transformers	1	2047	August 30, 2023
How to re-tokenize the training set in each epoch? 🤗Transformers	2	296	August 30, 2023
Llama2 finetuning for summarization mlsum 🤗Transformers	0	450	August 29, 2023
What's a good value for pad_to_multiple_of? 🤗Transformers	3	6005	August 29, 2023
Replace roberta embedding with bge_base embedding in layoutlmv3 🤗Transformers	0	117	August 29, 2023
SegformerFeatureExtractor - Feature extractor not returning the label object 🤗Transformers	0	360	August 29, 2023
Trainer class does not read in labels 🤗Transformers	0	447	August 29, 2023
Does autogpt-q require float16? 🤗Transformers	0	385	August 28, 2023