Hugging Face Forums

Topic	Views	Activity
🚧 ReTool: PyTorch Implementation of Strategic Tool Use in LLMs (Seeking Collaborators) Research	22	June 1, 2025
This Python class offers a multiprocessing-powered Pool for efficiently collecting and managing experience replay data in reinforcement learning Show and Tell	12	June 2, 2025
Why can padding tokens attend to other tokens in masked self attention? 🤗Transformers	67	November 4, 2024
Questions about classification models Models	31	November 4, 2024
How to use Transformers ViTs with different resolutions like in timm? 🤗Transformers	66	November 14, 2024
BERT token classification / regression question 🤗Transformers	34	November 5, 2024
An idea about LLMs Research	76	November 3, 2024
Low Accuracy in BERT Ensemble Despite Strong Individual Model Performance Beginners	10	May 22, 2025
Which VLM is best for defect detection in images Intermediate	316	November 6, 2024
RAG performance Research	84	November 6, 2024
What should I study in fine-tuning Beginners	18	November 6, 2024
[Network Access Inquiry] Confirming GET-only Requests to huggingface.co for Firewall Whitelisting 🤗Hub	17	June 4, 2025
Diffusers load custom embedding 🧨 Diffusers	45	November 7, 2024
Saving Manually Resized Embeddings for a Pretrained Bert Model (I believe I am asking this correctly) Beginners	101	November 7, 2024
Confusion regarding when to use dict-styled chat dialogue vs. when to format using chat template Intermediate	42	November 6, 2024
Is there any way to fine tuning model with existing embedding? Beginners	15	November 7, 2024
Guidance on Optimizing Text Similarity and Reporting with Transformers and Advanced NLP Techniques 🤗Transformers	33	November 7, 2024
AOTInductor with Llama-3.2-3B-Instruct Intermediate	89	November 14, 2024
Stateful PEFT adapter Intermediate	10	June 5, 2025
Problem with finetuning model whisper Beginners	85	November 7, 2024
Zero-shot finetuning a model for translation Beginners	41	November 7, 2024
Model type: chatglm - unexpected keyword argument 'padding_side' Beginners	387	November 7, 2024
Fully local chatpdf Beginners	194	November 7, 2024
LLama2-7b QA gives unwanted characters in text_output during inference 🤗Transformers	9	November 7, 2024
GPT Memory Structure Experiment — How Did GPT Recognize Me Without Any Stored Memory? Show and Tell	24	June 4, 2025
A lightweight utility for training multiple Keras models in parallel and comparing their final loss and last-epoch time Show and Tell	7	June 5, 2025
List out of range when using boundings boxes in object detection Intermediate	20	November 7, 2024
Creating a custom Multi Task model using a custom config Intermediate	15	November 7, 2024
HighNoon LLM: Revolutionizing Sequence Processing with Hierarchical Spatial Neural Memory for Scalable and Ethical NLP Research	38	June 3, 2025
WandB does not log train loss Beginners	56	November 7, 2024