数万亿碱基 近年来,研究者开发了日益强大的“蛋白质语言模型”,例如前Meta员工开发的ESM-3模型。
ProtDAT 可从多模态数据生成高质量蛋白序列 研究人员设计五种提示模式(仅文本、文本+N 端序列等),并与 ProGen2、ProtGPT2、ProLLaMA 与 ESM-3 对比生成 110,805