Hugging Face Forums

Topic	Replies	Views	Activity
Finetune LLaMA2 model with datasets missing labels 🤗Transformers	0	372	February 15, 2024
Unable to push to Spaces using VS Code Beginners	0	450	February 15, 2024
When we use any model is the processing happen locally on my system or on external server/gpu Beginners	0	281	February 15, 2024
How to train stable diffusion with different channel number in unet? 🧨 Diffusers	0	238	February 15, 2024
For tuning a classifier head on a pretrained BERT should I use `last_hidden_state` or `outputs[0][:, 0, :]` from the BERT? Beginners	0	177	February 15, 2024
"500 Server error - issubclass() arg 1 must be a class" error on inference api Beginners	0	344	February 15, 2024
Fontconfig error: No writable cache directories Beginners	0	549	February 15, 2024
DDP Program hang/stuck in trainer.predict() and trainer.evaluate() 🤗Accelerate	2	742	February 15, 2024
AI for Low-Budget film making (an experiment) Research	0	433	February 14, 2024
Using Quantization with fp16/bf16 Trainer flag 🤗Transformers	0	671	February 14, 2024
Fine tuned phi2 model loses context once loaded from local Beginners	0	208	February 14, 2024
Inference slower after fine tuning Beginners	2	469	February 14, 2024
Hugging Face and Distributed Training: DDP/DP Implementation Help Needed Intermediate	0	505	February 14, 2024
Source code of transformers models 🤗Transformers	2	1867	February 14, 2024
Using bounding Boxes in Inpainting Beginners	0	414	February 14, 2024
How retrieval loss is calculated in RAG model? 🤗Transformers	0	350	February 14, 2024
How to get the grad norm of a deepspeed-zero3 model after accelerator.prepare() 🤗Accelerate	0	646	February 14, 2024
KV Cache size shrinks during Inference instead of growing. Can someone explain why? 🤗Transformers	0	417	February 14, 2024
"too many values to unpack (expected 4)" but pixel_values dimension is correct 🤗Transformers	2	401	February 14, 2024
New Spaces Are Not Starting Today Spaces	0	208	February 13, 2024
Fine-tuning CodeT5 for Regression Beginners	0	154	February 13, 2024
ValueError: could not broadcast input array from shape (30,512,32128) into shape (30,512) 🤗Transformers	2	2442	February 13, 2024
What is the significance of exposing timesteps in DiffusionPipeline? 🧨 Diffusers	0	303	February 13, 2024
How to do speaker recognition in python? Models	0	336	February 13, 2024
HuggingFace Model Not Found: 'sentence-tranformers/all-MiniLM-L6_v2' Models	0	811	February 13, 2024
Hello, I am getting following error and not able to resolve Beginners	0	122	February 13, 2024
Load checkpoint from Trainer 🤗Transformers	0	578	February 13, 2024
Can't generate my own dataset using load_dataset Beginners	3	441	February 19, 2024
Qwen/Qwen-7B-Chat Models	0	423	February 13, 2024
How to Market Yourself as a Logo Maker Amazon Inferentia & Trainium	0	295	February 13, 2024