Error in generating model output: InferenceClient.chat_completion() got an unexpected keyword argument 'last_input_token_count'

John6666 · June 4, 2025, 12:26pm

For example, if you want to use OpenAI’s LLM, I think you need to use OpenAIServerModel instead of InferenceClientModel.

Maybe like this.

from smolagents import CodeAgent, OpenAIServerModel

model = OpenAIServerModel(model_id="gpt-4o", api_base="https://api.openai.com/v1", api_key=os.getenv("OPENAI_API_KEY", None))
agent = CodeAgent(tools=[], model=model)

Topic		Replies	Views
Ai Agents course error in running the Smolagent example Course	14	736	June 2, 2025
Agent wont respond Beginners	6	305	April 26, 2025
TypeError: InferenceClient.text_generation() got an unexpected keyword argument 'token' Beginners	5	27	June 10, 2025
SmolAgents: Try to run Agent with local model (mistral) Beginners	3	367	March 24, 2025
Modelerror when deploying openchat3.5 Amazon SageMaker	0	223	April 2, 2024

Error in generating model output: InferenceClient.chat_completion() got an unexpected keyword argument 'last_input_token_count'

Related topics