Unable to deploy fine tuned model

vinaypri · March 10, 2025, 10:55am

I fine tuned a model using auto train on hugging face. However I am unable to deploy this model as get the following error in deployment. Seems it is not getting the model type during deployment. Any help would be appreciated

Mar 06, 10:49:50 ERROR
fields: {“message”:“Error when initializing model\nTraceback (most recent call last):\n File "/usr/src/.venv/bin/text-generation-server", line 10, in \n sys.exit(app())\n File "/usr/src/.venv/lib/python3.11/site-packages/typer/main.py", line 323, in call\n return get_command(self)(*args, **kwargs)\n File "/usr/src/.venv/lib/python3.11/site-packages/click/core.py", line 1161, in call\n return self.main(*args, **kwargs)\n File "/usr/src/.venv/lib/python3.11/site-packages/typer/core.py", line 743, in main\n return _main(\n File "/usr/src/.venv/lib/python3.11/site-packages/typer/core.py", line 198, in _main\n rv = self.invoke(ctx)\n File "/usr/src/.venv/lib/python3.11/site-packages/click/core.py", line 1697, in invoke\n return _process_result(sub_ctx.command.invoke(sub_ctx))\n File "/usr/src/.venv/lib/python3.11/site-packages/click/core.py", line 1443, in invoke\n return ctx.invoke(self.callback, **ctx.params)\n File "/usr/src/.venv/lib/python3.11/site-packages/click/core.py", line 788, in invoke\n return __callback(*args, **kwargs)\n File "/usr/src/.venv/lib/python3.11/site-packages/typer/main.py", line 698, in wrapper\n return callback(**use_params)\n File "/usr/src/server/text_generation_server/cli.py", line 119, in serve\n server.serve(\n File "/usr/src/server/text_generation_server/server.py", line 315, in serve\n asyncio.run(\n File "/root/.local/share/uv/python/cpython-3.11.11-linux-x86_64-gnu/lib/python3.11/asyncio/runners.py", line 190, in run\n return runner.run(main)\n File "/root/.local/share/uv/python/cpython-3.11.11-linux-x86_64-gnu/lib/python3.11/asyncio/runners.py", line 118, in run\n return self._loop.run_until_complete(task)\n File "/root/.local/share/uv/python/cpython-3.11.11-linux-x86_64-gnu/lib/python3.11/asyncio/base_events.py", line 641, in run_until_complete\n self.run_forever()\n File "/root/.local/share/uv/python/cpython-3.11.11-linux-x86_64-gnu/lib/python3.11/asyncio/base_events.py", line 608, in run_forever\n self._run_once()\n File "/root/.local/share/uv/python/cpython-3.11.11-linux-x86_64-gnu/lib/python3.11/asyncio/base_events.py", line 1936, in _run_once\n handle._run()\n File "/root/.local/share/uv/python/cpython-3.11.11-linux-x86_64-gnu/lib/python3.11/asyncio/events.py", line 84, in _run\n self._context.run(self._callback, *self._args)\n> File "/usr/src/server/text_generation_server/server.py", line 268, in serve_inner\n model = get_model_with_lora_adapters(\n File "/usr/src/server/text_generation_server/models/init.py", line 1592, in get_model_with_lora_adapters\n model = get_model(\n File "/usr/src/server/text_generation_server/models/init.py", line 607, in get_model\n raise RuntimeError(\nRuntimeError: Could not determine model type for /repository revision None”}
target: “text_generation_launcher”
Mar 06, 10:49:50 ERROR
fields: {“message”:“Error when initializing model\nTraceback (most recent call last):\n File "/usr/src/.venv/bin/text-generation-server", line 10, in \n sys.exit(app())\n File "/usr/src/.venv/lib/python3.11/site-packages/typer/main.py", line 323, in call\n return get_command(self)(*args, **kwargs)\n File "/usr/src/.venv/lib/python3.11/site-packages/click/core.py", line 1161, in call\n return self.main(*args, **kwargs)\n File "/usr/src/.venv/lib/python3.11/site-packages/typer/core.py", line 743, in main\n return _main(\n File "/usr/src/.venv/lib/python3.11/site-packages/typer/core.py", line 198, in _main\n rv = self.invoke(ctx)\n File "/usr/src/.venv/lib/python3.11/site-packages/click/core.py", line 1697, in invoke\n return _process_result(sub_ctx.command.invoke(sub_ctx))\n File "/usr/src/.venv/lib/python3.11/site-packages/click/core.py", line 1443, in invoke\n return ctx.invoke(self.callback, **ctx.params)\n File "/usr/src/.venv/lib/python3.11/site-packages/click/core.py", line 788, in invoke\n return __callback(*args, **kwargs)\n File "/usr/src/.venv/lib/python3.11/site-packages/typer/main.py", line 698, in wrapper\n return callback(**use_params)\n File "/usr/src/server/text_generation_server/cli.py", line 119, in serve\n server.serve(\n File "/usr/src/server/text_generation_server/server.py", line 315, in serve\n asyncio.run(\n File "/root/.local/share/uv/python/cpython-3.11.11-linux-x86_64-gnu/lib/python3.11/asyncio/runners.py", line 190, in run\n return runner.run(main)\n File "/root/.local/share/uv/python/cpython-3.11.11-linux-x86_64-gnu/lib/python3.11/asyncio/runners.py", line 118, in run\n return self._loop.run_until_complete(task)\n File "/root/.local/share/uv/python/cpython-3.11.11-linux-x86_64-gnu/lib/python3.11/asyncio/base_events.py", line 641, in run_until_complete\n self.run_forever()\n File "/root/.local/share/uv/python/cpython-3.11.11-linux-x86_64-gnu/lib/python3.11/asyncio/base_events.py", line 608, in run_forever\n self._run_once()\n File "/root/.local/share/uv/python/cpython-3.11.11-linux-x86_64-gnu/lib/python3.11/asyncio/base_events.py", line 1936, in _run_once\n handle._run()\n File "/root/.local/share/uv/python/cpython-3.11.11-linux-x86_64-gnu/lib/python3.11/asyncio/events.py", line 84, in _run\n self._context.run(self._callback, *self._args)\n> File "/usr/src/server/text_generation_server/server.py", line 268, in serve_inner\n model = get_model_with_lora_adapters(\n File "/usr/src/server/text_generation_server/models/init.py", line 1592, in get_model_with_lora_adapters\n model = get_model(\n File "/usr/src/server/text_generation_server/models/init.py", line 607, in get_model\n raise RuntimeError(\nRuntimeError: Could not determine model type for /repository revision None”}
target: “text_generation_launcher”
Mar 06, 10:49:50 ERROR
fields: {“message”:“Error when initializing model\nTraceback (most recent call last):\n File "/usr/src/.venv/bin/text-generation-server", line 10, in \n sys.exit(app())\n File "/usr/src/.venv/lib/python3.11/site-packages/typer/main.py", line 323, in call\n return get_command(self)(*args, **kwargs)\n File "/usr/src/.venv/lib/python3.11/site-packages/click/core.py", line 1161, in call\n return self.main(*args, **kwargs)\n File "/usr/src/.venv/lib/python3.11/site-packages/typer/core.py", line 743, in main\n return _main(\n File "/usr/src/.venv/lib/python3.11/site-packages/typer/core.py", line 198, in _main\n rv = self.invoke(ctx)\n File "/usr/src/.venv/lib/python3.11/site-packages/click/core.py", line 1697, in invoke\n return _process_result(sub_ctx.command.invoke(sub_ctx))\n File "/usr/src/.venv/lib/python3.11/site-packages/click/core.py", line 1443, in invoke\n return ctx.invoke(self.callback, **ctx.params)\n File "/usr/src/.venv/lib/python3.11/site-packages/click/core.py", line 788, in invoke\n return __callback(*args, **kwargs)\n File "/usr/src/.venv/lib/python3.11/site-packages/typer/main.py", line 698, in wrapper\n return callback(**use_params)\n File "/usr/src/server/text_generation_server/cli.py", line 119, in serve\n server.serve(\n File "/usr/src/server/text_generation_server/server.py", line 315, in serve\n asyncio.run(\n File "/root/.local/share/uv/python/cpython-3.11.11-linux-x86_64-gnu/lib/python3.11/asyncio/runners.py", line 190, in run\n return runner.run(main)\n File "/root/.local/share/uv/python/cpython-3.11.11-linux-x86_64-gnu/lib/python3.11/asyncio/runners.py", line 118, in run\n return self._loop.run_until_complete(task)\n File "/root/.local/share/uv/python/cpython-3.11.11-linux-x86_64-gnu/lib/python3.11/asyncio/base_events.py", line 641, in run_until_complete\n self.run_forever()\n File "/root/.local/share/uv/python/cpython-3.11.11-linux-x86_64-gnu/lib/python3.11/asyncio/base_events.py", line 608, in run_forever\n self._run_once()\n File "/root/.local/share/uv/python/cpython-3.11.11-linux-x86_64-gnu/lib/python3.11/asyncio/base_events.py", line 1936, in _run_once\n handle._run()\n File "/root/.local/share/uv/python/cpython-3.11.11-linux-x86_64-gnu/lib/python3.11/asyncio/events.py", line 84, in _run\n self._context.run(self._callback, *self._args)\n> File "/usr/src/server/text_generation_server/server.py", line 268, in serve_inner\n model = get_model_with_lora_adapters(\n File "/usr/src/server/text_generation_server/models/init.py", line 1592, in get_model_with_lora_adapters\n model = get_model(\n File "/usr/src/server/text_generation_server/models/init.py", line 607, in get_model\n raise RuntimeError(\nRuntimeError: Could not determine model type for /repository revision None”}
target: “text_generation_launcher”

John6666 · March 10, 2025, 5:31pm

I think it’s probably related to TGI. It seems that there are many cases where an error occurs due to a different version. If it’s a different library, searching for information on that library will help you troubleshoot.

vinaypri · March 11, 2025, 2:04pm

Could there be some problem in the model output after training? I am unable to use this model on ollama too (after gguf conversion and all steps). I get an error that manifest file is not found on ollama, while ollama list shows the model. Or is there some parameter that I should consider changing in autotrain?

John6666 · March 11, 2025, 3:24pm

The error in Ollama is probably a different issue. If the cause is the same, it’s probably something like the base model settings in README.md (actually a configuration file…) being wrong, or not supporting quantized files, or something like that…

github.com/ollama/ollama

`Error: file does not exist` but it exists

opened 08:14AM - 23 Jul 24 UTC

DevLLM

bug

### What is the issue? Hello, I want to push my model to ollama but I got the e…rror `retrieving manifest` `Error: file does not exist ` but the problem is that I have the file, specifically "C:\Users\User\.ollama\models\manifests\registry.ollama.ai\_\mymodel\latest" and my username is _ (link: [https://ollama.com/_](https://ollama.com/_ ) ), so and I can't change my username """ D:\ollama> ollama create _/mymodel:latest -f Modelfile transferring model data using existing layer sha256:617ba424eabae67d228cf4598d2b18d9656b73c1f8f5bfa974ead81485dad2a5 using existing layer sha256:f5dc666b38fce911ccd916bcb13ea78a8002803fd11d5bb6486c4dd76ab8223f using existing layer sha256:3dddcbf82aec37d515d388e1141900e1530f74f20c5091f64567609a56fe8f43 using existing layer sha256:023c31c9015bbf14d78183c19eec819c3142e791c857bbc3989e53250f00561d using existing layer sha256:c50ad1ef7469cb081d31e4c321e73562e1e657e890a325b4d7214f8988fd1678 using existing layer sha256:6a6636a5d2ef8c1f29444967fb0f17930369d2c53117d39bd3926760d1062230 writing manifest success D:\ollama> ollama list NAME ID SIZE MODIFIED _/mymodel:latest 37dad3f2b9d3 13 GB 18 seconds ago mymodel:latest 37dad3f2b9d3 13 GB 23 minutes ago D:\ollama> ollama push _/mymodel:latest retrieving manifest Error: file does not exist """ ### OS Windows, WSL2 ### GPU Nvidia, Intel ### CPU Intel ### Ollama version 0.2.7

github.com/ollama/ollama

Error: pull model manifest: file does not exist (again)

opened 06:17PM - 10 Sep 24 UTC

closed 01:02AM - 12 Sep 24 UTC

jamiejackherer

bug

### What is the issue? I have read about the Error: pull model manifest: file d…oes not exist issue other sare having but it seems like its a simple typo for everyone else. i'm simply trying to import a gguf file as a model. I create the Modelfile: ``` FROM DarkIdol-Llama-3.1-8B-Instruct-1.0-Uncensored.i1-Q4_K_M.gguf PARAMETER temperature 9 SYSTEM You are Peter from Family Guy, acting as an assistant. ``` if i use the full path to the file it fails completely. the model is in the same directory. i wonder if its because the model is a symlink..? There is little information on this issue and seems I'll be stuck to using models from ollamas library. The basic docs say we can use any model such as gguf's.. ### OS Linux ### GPU Other ### CPU Intel ### Ollama version 0.3.9

John6666 · March 11, 2025, 3:28pm

Hmm…

meganariley · March 11, 2025, 8:19pm

Hi @vinaypri ! It looks like there are two issues with your Inference Endpoint.

There is no specified lora adapter env variables. We have documentation about lora adapters and TGI here: Text-generation-launcher arguments. You can add the env variable in your Endpoint under the ‘Environment’ settings.

There’s also an issue in the base model configuration. We also recommend taking a look at our documentation related to creating models and config files at Create a custom model, as one of the missing attributes is model_type.

Hope this helps!

Topic		Replies	Views
[Announcement] Model Versioning: Upcoming changes to the model hub Models	34	15133	December 4, 2020
Error loading finetuned llama2 model while running inference Amazon SageMaker	27	4823	September 20, 2023
Fined tuned model not deployed with end-points, config.json file missing Models	1	642	October 29, 2023
Deploying Fine-Tune Falcon 40B with QLoRA on Sagemaker Inference Error Amazon SageMaker	29	6877	January 8, 2024
Could not load model with following classes Beginners	0	395	February 22, 2022

Unable to deploy fine tuned model

I fine tuned a model using auto train on hugging face. However I am unable to deploy this model as get the following error in deployment. Seems it is not getting the model type during deployment. Any help would be appreciated

Related topics