Attempt to generate Text, but its to slow

Fichtenholz · July 25, 2024, 3:42pm

I’m currently attempting to learn how to generate text with LLMs.
Unfortunately, it’s running very slowly, and I suspect I may have messed up.
I’m using an Nvidia Tesla M10 (I know, it’s not the latest and greatest ).

Here is my Code:

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM
import transformers

# Update the model name according to Phi-3
phi3_model_name = "unsloth/Phi-3-mini-4k-instruct"

# Load the tokenizer and the model
tokenizer = AutoTokenizer.from_pretrained(phi3_model_name)
model = AutoModelForCausalLM.from_pretrained(phi3_model_name, device_map="auto", load_in_4bit=True)

# Create the text generation pipeline
pipeline = transformers.pipeline(
    "text-generation",
    model=model,
    torch_dtype=torch.float16,  # Specify the PyTorch datatype
    tokenizer=tokenizer,
)

# Loop to obtain and generate text based on user input
while True:
    prompt = "Write text about a fishing boat"
    sequences = pipeline(
        prompt,
        do_sample=True,
        min_length=50,
        max_length=150,
        eos_token_id=tokenizer.eos_token_id,
        pad_token_id=tokenizer.pad_token_id,
        temperature=0.2,
        top_p=0.95,
        top_k=40,
        num_beams=4,
    )

    for sequence in sequences:
        print(sequence['generated_text'])

Edit: might be confusing, but I had promt=input(“…”) in the code. Therefore, while True:

Topic		Replies	Views
Models slow on M1 Pro 16gb Beginners	0	644	December 18, 2023
Llama 2 10x slower than LLaMA 1 🤗Transformers	1	684	November 7, 2023
Logits function too slow 🤗Transformers	0	209	December 19, 2023
Using XLA fast text generation with Pegasus models Intermediate	5	555	August 25, 2022
What does model.generate do I'm not? Beginners	2	2287	July 29, 2024

Attempt to generate Text, but its to slow

Related Topics