Using transformers (BERT, RoBERTa) without embedding layer

patrickvonplaten · December 13, 2020, 9:34pm

Hey,

I’d recommend taking a look at this repo: GitHub - agemagician/CodeTrans: Pretrained Language Models for Source code by @agemagician . This repo uses transformer models for protein sequences if I understand it correctly.

Also, taking a look at those models:

might help. Not sure if there is a notebook on doing protein sequence LM, maybe @agemagician has a good pointer by chance

Topic		Replies	Views
How could protein language models generate outputs for natural language input texts? 🤗Transformers	4	419	November 21, 2023
Transformers with protein data Beginners	0	323	July 6, 2022
PreTrain ProteinBERT from scratch Flax/JAX Projects	5	2319	July 6, 2022
How to Fine-tune Rostlab/prot_t5_xl_uniref50 Model for Sequence Generation Beginners	0	389	April 5, 2023
Unmasker probabilities for all tokens in sequence 🤗Transformers	0	223	December 23, 2022