Pytorch NLP model doesn’t use GPU when making inference

redrussianarmy · September 16, 2020, 11:48am

Here is the exception and code.

Expected object of device type cuda but got device type cpu for argument #3 ‘index’ in call to _th_index_select

from transformers import AutoTokenizer, AutoModelForQuestionAnswering, pipeline
import torch

BERT_DIR = "savasy/bert-base-turkish-squad"    

tokenizer = AutoTokenizer.from_pretrained(BERT_DIR)
model = AutoModelForQuestionAnswering.from_pretrained(BERT_DIR)
nlp=pipeline("question-answering", model=model, tokenizer=tokenizer)


def infer(question,corpus):
    try:
        ans = nlp(question=question, context=corpus)
        return ans["answer"], ans["score"]
    except:
        ans = None
        pass

    return None, 0

Topic		Replies	Views
Pipeline not using GPU Beginners	0	1538	February 26, 2024
Using GPU with transformers Beginners	4	11708	November 3, 2020
Need help performance issues transformers.AutoModelForCausalLM.from_pretrained( 'mosaicml/mpt-7b-instruct' Beginners	0	934	June 12, 2023
Is Transformers using GPU by default? Beginners	6	155300	December 11, 2023
NLP Pretrained model model doesn’t use GPU when making inference 🤗Transformers	11	10145	March 11, 2022

Pytorch NLP model doesn’t use GPU when making inference

Related topics