Hugging Face Forums

Topic	Replies	Views	Activity
Fine tune Meta-Llama-3.1-8B OOM error after the 1st training step Models	0	155	September 6, 2024
Using Pony models with diffusers Beginners	2	480	September 5, 2024
How to fine-tune "openai-gpt" model for sequence classification? 🤗Transformers	3	1319	September 5, 2024
Is HF Trainer checkpointing usable? Community Calls	0	18	September 5, 2024
Learning Rate Scheduler Distributed Training 🤗Accelerate	6	2076	September 5, 2024
Json dump format for load_dataset 🤗Datasets	5	21256	September 5, 2024
How Can I Use Hugging Face Models with the "Exact Address Finder" Tool for More Accurate Location-Based Text Predictions? Beginners	0	69	September 5, 2024
Continued pre-training Models	0	533	September 5, 2024
Higer Education Pricing Course	5	2723	September 5, 2024
Inpainting texture to another image-to-image 🧨 Diffusers	0	105	September 5, 2024
When using greedy decoding on a causal LM, how does `generate` handle tie-breaking between logits? 🤗Transformers	0	12	September 5, 2024
Why does `generate` in `LlamaForCausalLM` give me _slightly_ lower logits than __call__? 🤗Transformers	1	134	September 5, 2024
Can't get an SSL secure Uvicorn server Spaces	0	27	September 5, 2024
I just learned about Diffusers and I have few questions Beginners	4	630	September 5, 2024
"What’s the Difference Between max_length and max_new_tokens?" 🤗Transformers	0	553	September 5, 2024
safetensors_rust.SafetensorError: Error while deserializing header: HeaderTooSmall 🤗Hub	1	1213	September 5, 2024
How to continue training with HuggingFace Trainer? 🤗Transformers	4	8408	September 5, 2024
Git LFS files in Spaces Spaces	0	110	September 5, 2024
Google/gemma-2-2b-it Crashes in Google colab Models	0	48	September 5, 2024
Regarding Diffusion for Audio Course	0	24	September 5, 2024
Running Llama model in Google colab Models	5	831	September 5, 2024
Confused about max_length and max_new_tokens 🤗Transformers	7	35502	September 5, 2024
I'm failing to train a vit_base_patch16_224 model for creating high quality embeddings for screenshots Models	0	31	September 5, 2024
Segmentation fault with gradient_checkpointing on multiGPU Beginners	1	896	September 5, 2024
How to continue training a model from where it left off? 🤗Transformers	0	159	September 5, 2024
Dangerous token Beginners	0	23	September 5, 2024
What happened to Qwen GitHub repo? Models	1	83	September 5, 2024
Mask inversion for forge Beginners	2	64	September 4, 2024
Flash attention has no effect on inference 🤗Transformers	7	14449	September 4, 2024
How to Modify UperNetForSemanticSegmentation from 150 Classes to Binary Classes While Retaining Pre-Trained Weights Models	0	47	September 4, 2024